Google N-Gram Web API

Fiv*_*ive 21 asp.net-web-api

我希望在我的项目中使用Google 2克; 但是数据大小使得搜索在速度和存储方面都很昂贵.
是否有可用于此目的的Web-API(使用任何语言)?网站http://books.google.com/ngrams/graph呈现图片,我可以获取数据值吗?

Fiv*_*ive 13

好吧,我得到了一个关于这样做的方法,使用谷歌BigQuery
,因为,三元组在公共领域可用.使用命令行访问为我完成了这项工作.

  • 打开https://bigquery.cloud.google.com/?pli=1,(并接受条款和条件以及所有尚未完成的操作并打开链接),然后在左侧面板中选择"trigrams"在"publicdata:samples"下 (12认同)
  • 另一种选择是名为 [PhraseFinder](http://phrasefinder.io) 的网络服务 (2认同)

Alp*_*aaa 8

我找到了一个很好的选择:Microsoft Web N-Gram

它可以通过不同的方式查询,包括通过REST接口进行直接的GET调用.例如,调用URL:

http://weblm.research.microsoft.com/weblm/rest.svc/bing-body/apr10/1/jp?u={YOUR_TOKEN}&p=red+panda
Run Code Online (Sandbox Code Playgroud)

回报

-9.005
Run Code Online (Sandbox Code Playgroud)

这是短语的对数可能性red panda.

此外,它比Google N-Grams更方便,因为对于给定的短语,它不是简单地输出其绝对频率,而是可以输出其联合概率,条件概率甚至是随后可能出现的最可能的词.

免责声明:我不是微软的员工,我只是觉得我刚刚找到了一个很棒的服务.