斯坦福词汇化分析器负载模型错误

use*_*214 0 stanford-nlp

我在visual studio 2012下使用C#上的NLP Parser.NuGet安装得很好,可以编译简单的例子.我注意到模型加载器存在问题:

        try
        {
            System.Console.WriteLine(System.IO.File.Exists(full) ? "File exists." : "File does not exist.");
            LexicalizedParser lp = LexicalizedParser.loadModel(full);
            lp.setOptionFlags(new String[] { "-maxLength", "80", "-retainTmpSubcategories" });
            //if (!String.IsNullOrEmpty(fileName))
            //DemoDP(lp, fileName);
            //else
            DemoAPI(lp);
        }
        catch (Exception e)
        {
            System.Console.WriteLine(e.Message);
            throw e;
        }
Run Code Online (Sandbox Code Playgroud)

我得到某种文件读取格式错误:

C:\ NLPTest\bin\x86\Debug\englishPCFG.ser.gz:期待BEGIN块; 拿到 ??

模型文件大约是8 MB,但我不知道这个模型文件的格式.有什么地方我可以下载的官方文件肯定会有效吗?

use*_*214 6

对,我发现了这个问题,因为怀疑是由于模型的旧格式.我做它解决它的方式是:

  • 下载项目文件版本2013
  • 打开名为stanford-parser-3.2.0-models的jar文件
  • 提取englishPCFG.ser.gz
  • 发音abracadabra,没有更多的格式错误

希望它能帮助其他人!