我在Github上的Syntax官方文档之后下载并安装了SyntaxNet .在文档(注释语料库)之后,我试图读取一个由SyntaxNet .conll命名的文件并将wj.conll结果写入,wj-tagged.conll但我不能.我的问题是:
SyntaxNet总是读取.conll文件吗?(不是.txt文件?).我有点困惑,因为我知道SyntaxNet读取.conll文件用于训练和测试过程但我有点怀疑有必要将.txt文件转换为文件.conll以便获得他们的部分演讲和依赖性解析.
如何从文件中读取SyntaxNet(我厌倦了所有可能的方法在GitHub文档中解释有关SyntaxNet的内容并且它对我不起作用)
已经下载并培训SyntaxNet,我试图写一个程序,可以打开新的/存在的文件,例如AutoCAD文件,并通过分析文本保存在特定目录中的文件: 打开LibreOffice的文件X.将SyntaxNet的输出视为:
echo "save AUTOCAD file X in directory Y" | ./test.sh > output.txt
Input: save AUTOCAD file X in directory Y
Parse:
save VB ROOT
+-- X NNP dobj
| +-- file NN compound
| +-- AUTOCAD CD nummod
+-- directory NN nmod
+-- in IN case
+-- Y CD nummod
Run Code Online (Sandbox Code Playgroud)
首先,我考虑将解析后的文本更改为XML格式,然后使用语义分析(例如SPARQL)解析XML文件以查找ROOT = save,dobj = X和nummode = Y并编写一个python程序,它可以执行相同的操作在文中
我不知道如果我将解析后的文本更改为XML,然后使用使用查询的语义分析,以便ROOT与其保存的对应函数或脚本 匹配 dobj,在提及的目录中nummode
我有一些想法将python连接到终端与subprocess包但我没有找到任何可以帮助我保存例如AUTOCAD文件或任何其他文件,从终端或我需要编写脚本.sh,与python的帮助?
我对文本的句法和语义分析进行了大量的研究,比如Christian Chiarcos,2011, …