小编Ren*_*aud的帖子

Gensim:如何将LDA模型生成的主题保存为可读格式(csv,txt等)?

代码的最后部分:

lda = LdaModel(corpus=corpus,id2word=dictionary, num_topics=2)
print lda
Run Code Online (Sandbox Code Playgroud)

bash输出:

INFO : adding document #0 to Dictionary(0 unique tokens)
INFO : built Dictionary(18 unique tokens) from 5 documents (total  20 corpus positions)
INFO : using serial LDA version on this node
INFO : running online LDA training, 2 topics, 1 passes over the supplied corpus of 5 documents, updating model once every 5 documents
WARNING : too few updates, training might not converge; consider increasing the number of passes to improve accuracy …
Run Code Online (Sandbox Code Playgroud)

python lda gensim

8
推荐指数
2
解决办法
2万
查看次数

Jupyter notebook 单元出现故障时播放声音

每当 Jupyter 笔记本单元出现错误时播放声音的任何技巧?

我检查了这个问题,我目前正在使用这样的cellbell

import cellbell

# line magic
%ding my_long_function()
Run Code Online (Sandbox Code Playgroud)

但我不知道在我的一个单元格抛出错误时让它运行(除了将每个单元格包装在 try/catch 子句中)。

我想我需要的是类似于“错误钩子”的东西,类似于保存钩子......

ipython ipython-notebook jupyter-notebook

7
推荐指数
1
解决办法
1988
查看次数

基于开源规则的模式匹配/信息提取框架?

我正在购买一个开源框架,用于编写自然语言语法规则,以便在注释上进行模式匹配.您可以将其视为正则表达式,但匹配令牌而非字符级别.这样的框架应该使匹配标准能够引用附加到输入令牌或跨度的其他属性,以及在操作中修改这些属性.

我知道有三个选项符合此描述:

目前还有其他类似的选择吗?

相关工具

  • 虽然我知道像Antlr这样的通用解析器生成器也可以用于此目的,但我正在寻找更适合自然语言处理或信息提取的东西.
  • UIMA包含一个Regex Annotator插件,用于在XML中声明规则,但似乎是在角色而不是高级对象上操作.
  • 我知道这种任务通常用统计模型来执行,但对于狭窄的结构化域,手工制作规则是有益的.

*使用GExp'规则'实际上是在代码中实现的,但由于我选择包含它的选项很少.

text open-source nlp named information-extraction

6
推荐指数
1
解决办法
1842
查看次数

如何从uima-ruta脚本创建AnalysisEngineDescriptor以在SimplePipeline中使用

我无法在我的简单管道中运行uima ruta脚本.我正在使用下一个库:

  1. Uimafit 2.0.0
  2. Uima-ruta 2.0.1
  3. ClearTK 1.4.1
  4. Maven的

而我正在使用org.apache.uima.fit.pipeline.SimplePipeline:

SimplePipeline.runPipeline(
    UriCollectionReader.getCollectionReaderFromDirectory(filesDirectory), //directory with text files
    UriToDocumentTextAnnotator.getDescription(),
    StanfordCoreNLPAnnotator.getDescription(),//stanford tokenize, ssplit, pos, lemma, ner, parse, dcoref

    AnalysisEngineFactory.createEngineDescription(RUTA_ANALYSIS_ENGINE),//RUTA script

    AnalysisEngineFactory.createEngineDescription(//
        XWriter.class, 
        XWriter.PARAM_OUTPUT_DIRECTORY_NAME, outputDirectory,
        XWriter.PARAM_FILE_NAMER_CLASS_NAME, ViewURIFileNamer.class.getName())
);
Run Code Online (Sandbox Code Playgroud)

我要做的是使用StandfordNLP注释器(来自ClearTK)并应用ruta脚本.目前,一切都运行没有错误,默认的ruta注释被添加到CAS,但我的规则创建的注释没有添加到CAS.

我的脚本是:

PACKAGE edu.isistan.carcha.concern;
TYPESYSTEM org.cleartk.ClearTKTypeSystem; 
DECLARE persistence
Token{FEATURE("lemma","storage") -> MARK(persistence)};
Run Code Online (Sandbox Code Playgroud)

查看带注释的文件: 在此输入图像描述

那里有基本的ruta注释,如"SPACE"或"SW",所以RutaEngine正在创建并添加到管道......

如何正确创建AnalysisEngineDescriptor以运行Ruta脚本?

注意: RUTA_ANALYSIS_ENGINE它是我从RUTA工作台复制的引擎描述符.

java maven uima ruta

5
推荐指数
1
解决办法
912
查看次数

如何配置Amazon EMR流作业以使用EC2 spot实例(Ruby CLI)?

当我使用Amazon Elastic MapReduce(Amazon EMR)创建流媒体作业时,使用Ruby命令行界面,如何指定使用EC2点实例(master除外)?下面的命令正在运行,但它"迫使"我使用至少1个核心实例...

./elastic-mapreduce --create --stream          \
--name    n2_3                             \
--input   s3://mr/neuron/2              \
--output  s3://mr-out/neuron/2          \
--mapper  s3://mr/map.rb         \
--reducer s3://mr/noop_reduce.rb \
--instance-group master --instance-type m1.small --instance-count 1 \
--instance-group core   --instance-type m1.small --instance-count 1 \
--instance-group task   --instance-type m1.small --instance-count 18 --bid-price 0.028
Run Code Online (Sandbox Code Playgroud)

谢谢

amazon-ec2 amazon-web-services amazon-emr elastic-map-reduce

4
推荐指数
1
解决办法
2021
查看次数

什么是UIMA CAS(共同注释结构)的NLTK等价物?

在UIMA中,CAS(通用注释结构)在构建NLP应用程序中起主要作用.它允许将一个组件添加的元数据传递到下一个组件中.例如,来自句子标记器的句子边界可以添加到CAS并由后续的单词标记器使用.

NLTK中的等效数据结构是什么?

nlp nltk uima

3
推荐指数
1
解决办法
568
查看次数

是否可以在即将推出的 mac 应用商店上发布屏幕保护程序?

我们正在开发一款时尚的屏幕保护程序,我们希望将其发布在即将推出的 mac 应用程序商店中。你认为有可能发布屏幕保护程序吗?我们审查了指南草案,但仍然不确定。

谢谢,雷诺

macos app-store appstore-approval

2
推荐指数
1
解决办法
823
查看次数

可以编译Java 8代码库并在Java 6 VM上运行吗?

使用Java 8编译的Java 8代码库是否可以在Java 6 VM上运行?

java java-8

2
推荐指数
1
解决办法
143
查看次数

Apache Mahout中的MySQLJDBCDataModel

任何人都可以在这里发布一个如何在Apache Mahout中使用MySQLJDBCDataModel的例子,包括实例化一个DataSource吗?我想使用DataModel生成Recommendations.使用user_id,task_id和rating已经存在的Databasetable(让我们称之为评级)我只需要知道如何在不创建我自己的DataModel实现的情况下访问这些信息.

提前致谢!

mysql apache mahout

1
推荐指数
1
解决办法
3560
查看次数

Spring批处理运行python代码?

是否可以使用Spring Batch来运行Python程序?Jython不是一个选项(因为依赖于许多Python库).

python spring-batch

1
推荐指数
1
解决办法
1726
查看次数