小编pan*_*jha的帖子

如何找到hadoop中是否存在文件夹?

我需要找到hadoop中是否存在输入文件夹位置.

我使用以下命令来做同样的事情

 hadoop fs -test -d <folder Location> 
Run Code Online (Sandbox Code Playgroud)

查询不会抛出任何错误,也不会输出任何错误.我检查了正确和错误的位置.我从文档中了解到,如果位置正确,它会输出1.

shell hadoop bigdata

6
推荐指数
1
解决办法
5848
查看次数

无法在弹性beantalk的django应用上安装nltk数据

我在Django应用中使用nltk_tokenize。为此,我需要下载nltk数据,以便可以将其用于阻止。我正在通过Elastic beanstalk在云上部署django应用程序。

现在我包括了

nltk.download('punkt') 
Run Code Online (Sandbox Code Playgroud)

在我的意见中,以便下载所需的数据。但我收到以下错误

[Errno 2] No such file or directory: '/home/wsgi/nltk_data'
Run Code Online (Sandbox Code Playgroud)

正确的方法是什么?

python django nltk amazon-web-services amazon-elastic-beanstalk

3
推荐指数
1
解决办法
643
查看次数

如何在 doc2vec 中找到文档中最相似的术语/单词?

我已经应用 Doc2vec 将文档转换为向量。之后,我在聚类中使用向量并找出与每个集群的质心最近/最相似的 5 个文档。现在我需要找到这些文档中最主要或最重要的术语,以便我可以弄清楚每个集群的特征。我的问题是有什么方法可以找出 Doc2vec 中文档的最主导或最相似的术语/单词。我正在使用 python 的 gensim 包来实现 Doc2vec

python cluster-analysis gensim word2vec doc2vec

0
推荐指数
1
解决办法
2806
查看次数