Facebook部署人工智能打击散布仇恨言论和虚假信息

人工智能
2020
05/13
00:56
杨帆
分享
评论

即使在2020年,在Facebook上误入歧途也不是很难。当您单击一些含有误导性信息的链接,您会发现自己身处一个民族主义者的圈子当中,面对一连串的满是仇恨的言论和医学虚假信息。但是,在AI和机器学习系统的帮助下,社交媒体平台正在加速其努力,以防止这种内容传播。

1.jpg

更为糟糕的是,我们不得不应对新冠肺炎大流行,而又没有在非常正确的信息在Facebook上被展示出来。自3月份爆发以来,该公司已经与60个真实性检查组织合作,以解决虚假信息,并已发布临时禁令,停止在平台上销售PPE,洗手液和清洁用品。问题在于,人们可以通过稍微更改广告中的文字或图像然后重新提交,就能轻松地绕开此禁令。例如,两幅图片基本看起来几乎完全相同的情况下,其中有一个图片就是虚假的,但如果使用传统的计算机视觉检测,那么很可能系统崩溃,因为这些机器被设计为查看单个像素而不是整个图像。  


但这就是SimSearchNet的用武之地。该基于卷积神经网络的模型旨在识别几乎相同的图像,从而有助于自动执行人类主持的检查。一旦检查人员将图像标记为包含有关新冠疫情的虚假信息,该信息就会反馈到SimSearchNet中,后者会查找几乎重复的图像,从而让检测人员更好的监管虚假信息。它从本质上扩大了检察人员的检查范围,将他们的决定自动应用于那些虚假图片产生的成千上万(可能是数百万)的数字模块。


在博客中,该公司称已经在四月份期间标记与COVID-19 有关的50000000个信息,删除“超过250万件的内容出售口罩,洗手液,表面消毒湿巾和COVID-的19个测试套件的虚假信息。”  


当然,Facebook的麻烦比新冠肺炎疫情让我们躲到适当地方的时间要长得多。该公司长期以来一直试图遏制在其网站上传播仇恨言论的现象。根据周二发布的另一篇博客,公司代表表示,根据今天发布的“社区标准执行报告”,现在采用人工智能技术主动检测到我们删除的仇恨言论内容中的88.8%,高于上一季度的80.2%。在2020年第一季度,我们对960万条内容采取了行动,这违反了我们的仇恨言论政策,增加了390万条。”


检测仇恨言论绝非易事。可能涉及逐层的细微差别-不仅是需判断信息说了什么,而且还要判断更多的人说了什么,以及显示了什么样的伴随内容(无论是图像,音频还是视频)在它旁边。更难的是正确地识别对仇恨言论的回应,尤其是当那些陈述使用与冒犯性帖子相同的语言时。甚至人类主持人也经常被绊倒。作为回应,Facebook在过去几年中一直在改善其自然语言处理能力,包括可以在大约100种口头语言之间翻译文本的XLM-R,以及有助于对XLM-R之类的对象进行较长时间预训练的模型RoBERTa。使用幅度更多的训练数据。 


该公司甚至在解决仇恨模块。如前所述,将两种类型的内容(即文本和图像)组合在一起会严重阻碍AI将其标识为仇恨语音的尝试。因此,Facebook AI去创建了一个包含多模式示例的完整数据库-使用许可的Getty图像创建了10,000多个专业木星-用它们来训练明天的AI机器人。 


Facebook AI团队在星期二的博客文章中写道:“模型的选择使得严格的单峰分类系统很难正确地对其进行分类。” “我们还专门设计了数据库,以克服人工智能研究中的常见挑战,例如帮助机器学习避免误报的示例。”


为了帮助推动这类机器学习内容审核系统的发展,Facebook与DrivenData合作发起了“仇恨模型挑战赛”。如果您可以编写一个AI以自动识别并标记这些多模式仇恨言论的代码,则可以赚到10,000美元。


THE END
若您喜欢本站文章,请分享给您的朋友们吧。

相关热点

一天,数千件防护服从工厂运出;两天,一条羽绒服生产线成功转产防疫物资;一周,一间数字化车间全面复产……疫情之下...
人工智能
位于佛罗里达州杰克逊维尔市的一项新计划可能会改善这一薄弱环节。日前,由当地一家诊所和交通管理局合作,开始使用完...
人工智能

相关推荐

3