Naz*_*nin 5 nlp tensorflow syntaxnet
我在Github上的Syntax官方文档之后下载并安装了SyntaxNet .在文档(注释语料库)之后,我试图读取一个由SyntaxNet .conll命名的文件并将wj.conll结果写入,wj-tagged.conll但我不能.我的问题是:
SyntaxNet总是读取.conll文件吗?(不是.txt文件?).我有点困惑,因为我知道SyntaxNet读取.conll文件用于训练和测试过程但我有点怀疑有必要将.txt文件转换为文件.conll以便获得他们的部分演讲和依赖性解析.
如何从文件中读取SyntaxNet(我厌倦了所有可能的方法在GitHub文档中解释有关SyntaxNet的内容并且它对我不起作用)
小智 6
将这些声明行添加到文件末尾的"context.pbtxt".这里"inp"和"out"是syntexnet根目录中的文本文件.
input {
name: 'inp_file'
record_format: 'english-text'
Part {
file_pattern: 'inp'
}
}
input {
name: 'out_file'
record_format: 'english-text'
Part {
file_pattern: 'out'
}
}
Run Code Online (Sandbox Code Playgroud)
将句子添加到要对其进行标记的"inp"文件中,并在下次使用--input和--output标记运行syntaxnet时在shell中指定它们.
只是为了帮助你一点点我粘贴一个示例shell命令.
bazel-bin/syntaxnet/parser_eval \
--input inp_file \
--output stdout-conll \
--model syntaxnet/models/parsey_mcparseface/tagger-params \
--task_context syntaxnet/models/parsey_mcparseface/context.pbtxt \
--hidden_layer_sizes 64 \
--arg_prefix brain_tagger \
--graph_builder structured \
--slim_model \
--batch_size 1024 | bazel-bin/syntaxnet/parser_eval \
--input stdout-conll \
--output out_file \
--hidden_layer_sizes 512,512 \
--arg_prefix brain_parser \
--graph_builder structured \
--task_context syntaxnet/models/parsey_mcparseface/context.pbtxt \
--model_path syntaxnet/models/parsey_mcparseface/parser-params \
--slim_model --batch_size 1024
Run Code Online (Sandbox Code Playgroud)
在上面的脚本中,第一个shell命令的输出(POS标记)用作第二个shell命令的输入,其中两个shell命令由"|"分隔.
| 归档时间: |
|
| 查看次数: |
1268 次 |
| 最近记录: |