小编pan*_*jha的帖子

如何找到hadoop中是否存在文件夹？

我需要找到hadoop中是否存在输入文件夹位置.

我使用以下命令来做同样的事情

 hadoop fs -test -d <folder Location>

Run Code Online (Sandbox Code Playgroud)

查询不会抛出任何错误,也不会输出任何错误.我检查了正确和错误的位置.我从文档中了解到,如果位置正确,它会输出1.

shell hadoop bigdata

pan*_*jha

lucky-day

6
推荐指数

1
解决办法

5848
查看次数

无法在弹性beantalk的django应用上安装nltk数据

我在Django应用中使用nltk_tokenize。为此，我需要下载nltk数据，以便可以将其用于阻止。我正在通过Elastic beanstalk在云上部署django应用程序。

现在我包括了

nltk.download('punkt')

Run Code Online (Sandbox Code Playgroud)

在我的意见中，以便下载所需的数据。但我收到以下错误

[Errno 2] No such file or directory: '/home/wsgi/nltk_data'

Run Code Online (Sandbox Code Playgroud)

正确的方法是什么？

python django nltk amazon-web-services amazon-elastic-beanstalk

pan*_*jha

lucky-day

3
推荐指数

1
解决办法

643
查看次数

如何在 doc2vec 中找到文档中最相似的术语/单词？

我已经应用 Doc2vec 将文档转换为向量。之后，我在聚类中使用向量并找出与每个集群的质心最近/最相似的 5 个文档。现在我需要找到这些文档中最主要或最重要的术语，以便我可以弄清楚每个集群的特征。我的问题是有什么方法可以找出 Doc2vec 中文档的最主导或最相似的术语/单词。我正在使用 python 的 gensim 包来实现 Doc2vec

python cluster-analysis gensim word2vec doc2vec

pan*_*jha

lucky-day

0
推荐指数

1
解决办法

2806
查看次数