人类和AI合作改进clickbait检测

知识百科2021-10-14 18:14:11
最佳答案宾夕法尼亚州立大学和亚利桑那州立大学的研究人员表示,人和机器有助于训练人工智能-AI模型,其性能优于其他点击诱饵检测器。此外,基于人

宾夕法尼亚州立大学和亚利桑那州立大学的研究人员表示,人和机器有助于训练人工智能-AI模型,其性能优于其他点击诱饵检测器。此外,基于人工智能的新解决方案还可以区分机器或机器人生成的click诱饵标题和人编写的标题之间的区别。

在一项研究中,研究人员要求人们写自己的ClickBait,这是一个有趣但具有误导性的新闻标题,旨在吸引读者点击其他在线故事的链接。研究人员还对机器进行编程,使其产生手动点击。然后,人和机器制作的标题被用作训练点击检测算法的数据。

研究人员今天(8月28日)在2019年IEEE/ACM社会网络分析进展国际会议(ASONAM)上发布了他们的研究成果。研究结果表明,该方法生成的算法在预测点击诱饵标题方面比其他系统高出约14.5%。加拿大温哥华。

该项目的首席研究员、信息科学与技术学院副教授李东原(Dongwon Lee)表示,除了在clickbait检测中的应用,该团队的方法可能有助于提高机器学习性能。Lee还是宾夕法尼亚州立大学网络科学研究所(ICS)的附属机构,该研究所为宾夕法尼亚州立大学的研究人员提供超级计算资源。

Lee说:“这个结果非常有趣,因为我们已经成功证明,机器生成的clickbait训练数据可以反馈到训练管道中,训练各种机器学习模型,从而提高性能。“这是解决监督机器学习基本瓶颈的一步,需要大量高质量的训练数据。”

根据宾夕法尼亚州立大学信息科学与技术学院博士生泰乐的说法,clickbait检测发展的挑战之一是缺乏标签数据。正如人们需要老师和学习指导来帮助他们学习一样,AI模型也需要有标记的数据来帮助他们学习如何建立正确的联系和关联。

“当我们开始这个项目时,我们意识到的一件事是,我们没有很多积极的数据点,”乐说。“为了识别clickbait,我们需要人类标记训练数据。我们需要增加正数据点的数量,以便将来能够训练更好的模型。”

媒体效果学教授、唐纳德P媒体效果研究实验室联合主任詹姆斯P吉米罗(James P. Jimirro)认为,在互联网上很容易找到点击诱饵,点击诱饵的许多变化又增加了一层难度。贝利萨里奥通信研究所和国际科学联合会附属机构。

"有些点击诱饵是列表或列表;有些点击诱饵表示为问题;有些从谁-什么-在哪里-什么时候开始;以及我们多年来在研究中发现的各种其他点击诱饵变体,”桑德说。“因此,找到所有这些clickbait类型的足够样本是一个挑战。即使我们都在抱怨身边的点击量,但当你把它们随处可见并标记出来时,就没有多少数据集了。”

根据研究者的研究,这项研究揭示了人和机器是如何接近创造标题的差异的。与机器生成的点击诱饵相比,人们生成的标题往往在标题中有更多的决定者——比如“哪个”和“哪个”。

训练似乎促成了clickbait创造的不同。例如,训练有素的作家,如记者,往往比其他参与者使用更长的单词和更多的代词。记者也可能用数字开始登上头条。

根据Sundar的说法,研究人员计划利用这些发现来指导他们调查更强大的假新闻检测系统和其他应用。

Sundar说:“对我们来说,clickbait只是构成虚假新闻的众多要素之一,但这项研究是确保我们构建一个良好的clickbait检测系统的有益准备步骤。

为了找到人类点击的作者,研究人员从在线众包网站亚马逊土耳其人那里招募了记者和工人。他们从网站上招募了125名学生和85名工人。参与者首先阅读clickbait的定义,然后被要求阅读一篇约500字的短文。然后要求参与者为每篇文章写一个clickbait标题。

机器生成的clickbait标题是使用称为变分自动编码器或VAE生成模型的机器学习模型开发的,该模型依赖于概率来寻找数据中的模式。

研究人员使用Clickbait Challenge 2017(一个在线点击检测竞赛)来测试他们具有最佳性能的算法和系统。

免责声明:本文由用户上传,如有侵权请联系删除!