科学家设计了检测讽刺比人类更好的算法

认为人们知道你什么时候讽刺?是的,对。

研究表明,我们大多数人认为我们在沟通时比我们实际更好,特别是在在线互动时。例如,2005年的研究发现,收件人只需56%的时间就正确地确定了电子邮件陈述背后的讽刺。此外,即使在电子邮件和口头沟通之间的实际传播讽刺的实际能力大大变化时,参与者也在被理解。

在过去的十年中,数据科学家一直试图开发可以自动检测讽刺的算法。这些计划中的大多数是专注于对消息的文本进行分类,以确定其背后的情感。在至少一项研究中,由UC Berkeley的David Bamman和华盛顿州的Noah A.史密斯大学,计算机展示了比2005年研究中的人类的75%的准确率为75%。

但研究人员发现他们可以通过包括有关讨论的主题的重要背景信息,使目标受众,以及最重要的是作者来使他们的算法更加准确。

Bamman和Smith专注于社交网络平台Twitter上发布的项目,搜索带有Hashtags #sarcasm或#sarcastic的推文,这意味着作者自己展示了他们的意图。科学家分析了讽刺的推文 - 首先单独的文字,然后在考虑附加信息的同时,包括有关作者的详细信息,那么Tweet的指示的观众,如果是回应,那么它正在响应的推文。他们发现,通过包括这样的背景信息,它们的准确度高达85%。

最准确提高的元素是有关作者的信息。显然,“未经证实的,男性,以及美国的时区”,使高音扬声器更有可能是讽刺的。最有可能与讽刺讨论的主题包括电视节目和艺术;和“历史上消极情绪的用户”更有可能是讽刺的。

虽然这种上下文信息没有产生重大增加,但Bamman和史密斯表示,他们的研究表明考虑到这一信息的重要性。 “这进入了心脏,在心中难以识别讽刺 - 不仅适用于计算机,而且对人类也是如此,”指出了Bamman。 “它只需要人们所理解的那么多背景知识。”

他们希望在未来的研究中,他们可以改进他们的探测器更加准确。例如,他们在当前实验中没有考虑的一个因素是,人们更有可能在一些平台上讽刺,而不是其他平台。

Bamman解释了Twitter如何邀请响应,而一些审查网站可能不会。 “这意味着有一种不同类型的动态,这将使模型从一个域中概括到另一个域。”换句话说,数据科学家必须必须考虑正在使用的平台类型并相应地调整数据系统。

Bamman说,情绪分析可能有用,例如,在亚马逊的评论分析时,可以确定审阅者是否真的喜欢产品。 “一件事可以真正干扰那样,”他说,“这个人是否正在讽刺。”

准确的情绪分析对国家安全也有价值。 2014年,秘密服务发布了一个工作订单,要求可以检测社交媒体上的讽刺的分析软件 - 这一想法是识别讽刺的能力将帮助他们从实际紧急情况中辨别笑话。

在打火机笔记中,如果您收到似乎讽刺的电子邮件时,它可能会很好,您可以运行一个快速的探测器,只要肯定。



本新闻稿中的材料来自于始发的研究组织。可以为样式和长度编辑内容。有一个问题? 让我们知道.

订阅

每天早上有一封电子邮件,我们的最新帖子。从医学研究到空间新闻。环境的环境。技术物理学。

感谢您的订阅。

出问题了。