Nic*_*unt 10 search nlp information-retrieval search-engine nlp-question-answering
我一直想知道这一段时间,我不明白为什么谷歌还没有尝试过 - 或许他们有,我只是不知道它.
是否有一个搜索引擎,你可以输入一个问题,然后给你一个答案,而不是一个结果列表,然后你必须自己搜索,找到你想知道的东西?
例如,这就是我设计系统的方式:
用户的意见:"你去哪里试镜?"
系统输出:"配镜师.确定性:95%"
这将计算如下:
由于互联网的分散性,正确的答案可能会出现多次,特别是对于简单的问题.对于这个特定的例子,系统认识到这个词在结果中不断出现并且几乎肯定是搜索的答案并不太难.
对于更复杂的问题,将显示较低的确定性,并且可能具有不同确定性水平的多个结果.用户还将有机会查看系统计算结果的来源.
该系统的重点在于它简化了搜索.很多时候,当我们使用搜索引擎时,我们只是在寻找一些非常简单或微不足道的东西.返回一长串结果似乎不是回答问题的最有效方式,即使答案几乎肯定隐藏在这些结果中.
只需查看上述问题的Google搜索结果,就可以看到我的观点:http: //www.google.co.uk/webhp?sourceid = chrome-instant&ie = UTF-8& 1&nord = 1#sclient = psy&hl = en&safe =关闭&诺德= 1&站点= webhp&源=马力&q =其中%20do%20you%20go%20to%20get%20your%20eyes%20tested%3F&水溶液=&AQI =&AQL =&OQ =&PBX = 1&FP = 72566eb257565894&FP = 72566eb257565894&离子= 1
给出的结果不会立即回答问题 - 用户需要在找到他们真正想要的答案之前对其进行搜索.搜索引擎是很棒的目录.他们非常善于为您提供有关某个主题的更多信息,或者告诉您在哪里可以找到某项服务,但他们并不善于回答直接问题.
在创建系统时,有许多方面需要考虑 - 例如,在计算结果时必须考虑网站的准确性.
虽然系统应该能够很好地处理简单的问题,但要使其适用于更复杂的问题可能是一项非常重要的任务.例如,常见的误解需要作为一种特殊情况来处理.如果系统发现用户的问题有一个共同的误解作为答案的证据,它应该在提供答案时指出这一点,或者甚至简单地忽略最常见的答案,而不是支持网站提供的指出它的答案.是一种常见的误解.通过比较冲突源的准确性和质量,这一切都必须加以衡量.
这是一个有趣的问题,涉及大量研究,但肯定值得花时间和精力吗?它并不总是正确的,但它可以使用户更快地进行简单的查询.
Joh*_*ann 12
这种系统被称为自动问答(QA)系统或自然语言搜索引擎.不要将其与人类产生答案的社会问答系统混淆.QA是一个研究得很好的领域,近十年的TREC QA轨道出版物证明了这一点,但它是自然语言处理(NLP)领域中比较困难的任务之一,因为它需要广泛的智能(解析,搜索) ,信息提取,共参考,推理).这可以解释为什么现在有相对较少的免费在线系统,其中大多数更像是演示.几个包括:
主要的搜索引擎已经对问答技术表现出兴趣.Eric Scmidt在2011年6月1日的一次采访中表示,Google的新搜索策略是提供答案,而不仅仅是链接."我们可以从字面上计算出正确答案,"施密特说,参考人工智能技术的进步"(来源).
Google Enterprise产品负责人Matthew Goltzbach 表示,"问答是企业搜索的未来." 雅虎还预测,搜索的未来将涉及用户获得实时答案而不是链接.这些大型玩家正在逐步引入QA技术作为其他类型搜索结果的补充,如谷歌的"简答题"所示.
虽然IBM的Jeopardy-Watson在推广回答问题(或答案)的机器方面做了很多工作,但许多现实世界的挑战仍然存在于问答的一般形式.
另请参阅有关开源QA框架的相关问题.
更新: