算法可以检测讽刺

Question

算法可以检测讽刺

cjd*_*jds 36 algorithm nlp

我被要求编写一个算法来检测讽刺,但我在逻辑中遇到了一个缺陷(或似乎是一个).

例如,如果一个人说

A:我喜欢Justin Beiber.你喜欢他吗？

B:是的.当然.我绝对爱他.

现在这可能被认为是讽刺与否,唯一知道的方法似乎是知道B是否严重.

(我不应该深入.我们被给了一堆短语,只是被告知,如果这些是在句子中那么它是讽刺但我感兴趣？)

有什么方法可以解决这个问题吗？或者在讽刺时计算机是否完全卡住了？

(我想它取决于扬声器的音调,但我的输入是文字)

Answer 1

Enn*_*oji 17

看起来有些研究试图这样做,但他们还没有提出一个运行良好的算法.

来自González-Ibáñez,R.等."在Twitter上识别讽刺:仔细看看"

讽刺和讽刺是语言学,心理学和认知科学中充分研究的现象[...].但在文本挖掘文献中,讽刺的自动检测被认为是一个难题[...]并且仅在少数研究中得到了解决.[...]与我们最密切相关的工作是Davidov等人的工作.(2010),其目的是在Twitter和亚马逊产品评论中识别讽刺和非讽刺的话语.在本文中,我们考虑将讽刺性推文与非讽刺性推文区分开来的难度较大的问题

他们得出结论:

也许不出所料,人类评委和机器学习技术都表现不佳.[...]我们的研究结果表明单独的词汇特征不足以识别讽刺,而语用和语境特征值得进一步研究

这是另一篇近期的相关论文:
Reyes,A."从幽默识别到讽刺检测:社交媒体的语言化"

Answer 2

Tim*_*ora 9

...句子由用户撰写.它是2人之间的模拟对话.

用一个短语来检测讽刺几乎是不可能的,但是在上下文中它可能会更加可行.让我们假设你可以解析句子并解释它的字面意义(不是一个简单的任务,但这个问题至少在某种程度上得到了解决).

你现在有来自的背景:

谈话中的所有短语.
另一位发言者的回应.

交叉引用的短语

要利用#1,您可以互相引用所有短语.他们中的任何一个都是直接矛盾吗？

例:

演讲者1:我爱Justin Bieber.你呢？
演讲者2:完全!我爱他.
演讲者1:你最喜欢他的是什么？
演讲者2:他那令人敬畏的音乐!
演讲者1:真的吗？你最喜欢的歌是什么？
演讲者2:来吧,你知道我讨厌他的音乐.

我们知道有两个矛盾的短语,"我爱他!" 和"我讨厌他的音乐".至少有机会发生讽刺.

其他发言者的提问或回复

方法#2可能更有效(或无用......也许讽刺已知,但两方之间未说出口).

例:

演讲者1:Justin Bieber在镇上.我很想见到他.
演讲者2:哈.

另一个例子:

演讲者1:我爱Justin Bieber.你呢？
演讲者2:我床上方有一张巨幅海报.
演讲者1:是的.

通过更详细的说明,您可以应用启发式方法来确定对话在特定短语之后的偏差程度.

演讲者1:我非常喜欢贾斯汀比伯!你是？
_{发言者1发表了强烈声明}
演讲者2:是的,当然.
_{讽刺.我们不知道,但对话中的另一个人确实如此.}

扬声器1现在采取什么方向？他们改变了主题吗？根据对话变得多么尖锐,它可以表明他们对感知到的反应的反应.

总而言之,大部分都需要复杂的处理,我认为最好的准确率非常低.但这是一个引人入胜的问题.

归档时间：	13 年，6 月前
查看次数：	9641 次
最近记录：	13 年，6 月前