我希望在我的项目中使用Google 2克; 但是数据大小使得搜索在速度和存储方面都很昂贵.
是否有可用于此目的的Web-API(使用任何语言)?网站http://books.google.com/ngrams/graph呈现图片,我可以获取数据值吗?
Fiv*_*ive 13
好吧,我得到了一个关于这样做的方法,使用谷歌BigQuery
,因为,三元组在公共领域可用.使用命令行访问为我完成了这项工作.
我找到了一个很好的选择:Microsoft Web N-Gram
它可以通过不同的方式查询,包括通过REST接口进行直接的GET调用.例如,调用URL:
http://weblm.research.microsoft.com/weblm/rest.svc/bing-body/apr10/1/jp?u={YOUR_TOKEN}&p=red+panda
Run Code Online (Sandbox Code Playgroud)
回报
-9.005
Run Code Online (Sandbox Code Playgroud)
这是短语的对数可能性red panda.
此外,它比Google N-Grams更方便,因为对于给定的短语,它不是简单地输出其绝对频率,而是可以输出其联合概率,条件概率甚至是随后可能出现的最可能的词.
免责声明:我不是微软的员工,我只是觉得我刚刚找到了一个很棒的服务.
| 归档时间: |
|
| 查看次数: |
10887 次 |
| 最近记录: |