AI研究者开源模型解释工具包AllenNLP解读
艾伦人工智能研究所和加州欧文的研究人员发布了AllenNLP解释器,用于解释自然语言处理(NLP)模型的结果。可扩展工具包包括几个解释和可视化组件的内置方法,以及一个使用AllenNLP解释器解释最新NLP模型(包括BERT和RoBERTa)结果的示例。
在arXiv发表的一篇论文中,研究团队更详细地描述了该工具包。AllenNLP解释器使用两种基于梯度的解释方法:重要性图,用于确定输入句子中的每个单词或“标记”对模型预测的贡献程度;与攻击作斗争,试图删除或改变输入中的单词,同时仍然保持模型中相同的预测。这些技术可以用于各种NLP任务和模型架构。这些实现使用一组通用的API和可视化组件,它们为将来开发其他技术和模型支持提供了一个框架。
随着公司越来越多地使用人工智能来自动提供问题的答案,用户想知道为什么人工智能会给出给定的答案。例如,如果在信用卡交易中检测到欺诈,交易是否特别暗示欺诈?
模型如何产生答案的解释对于模型开发人员理解系统在面对新数据时如何一般化的能力也很重要。AllenNLP解释公司的研究员Sameer Singh经常引用这个模型来区分狼和狗,但实际上只是学会了探测雪。
对于一些机器学习算法,解释很简单:比如决策树只是一系列if/then规则。然而,深度学习模型的输出可能更难解释。
Singer之前的工作包括LIME,它使用线性近似来解释更复杂模型的预测。AllenNLP解释器使用基于梯度的方法,可以衡量输入特征对输出的影响。由于计算该梯度是深度学习训练的关键组成部分,因此这些方法可以应用于任何深度学习模型。
虽然这些技术是通用的,但是AllenNLP解释器是为NLP设计的。自然语言处理系统的输入是一个文本串,通常是一个句子或整个文档,然后文本被解析成它的组成词或标签。AllenNLP解释包括一个显著性图表,显示每个标记对模型预测的贡献;一个用例可能是解释一个句子中的哪些单词导致他们的情绪被分为积极的或消极的。
该工具包还包括两个对策,展示了更改输入中的标签如何影响输出。首先,HotFlip,用其他单词替换斜率最高的输入单词,直到模型输出发生变化。另一种攻击是输入缩减,在不改变输出的情况下,反复删除斜率最小的单词。这导致输入文本“通常没有意义,但会导致高置信度预测”。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
最新文章
- DNF搬砖最佳宠物搭配指南
- DNF白金徽章变现攻略:如何巧妙出售白金徽章
- 寒潮蓝色预警:近两日最低气温 0℃线南压至江南南部至贵州南部和云南北部一带
- DNA 纳米机器人:可改造人造细胞,推动合成生物学发展
- 新型巨型里德伯原子成为精准量子温度计
- 《生化危机9》重大爆料:里昂确定回归主角,吉尔缺席引热议
- 广东:到 2027 年 绿色低碳循环经济体系基本建成
- 2024 财年美国对外军售额创历史新高:背后的战略与影响
- 离子阱量子计算在近年实现双码纠错
- 这次与肯德基的全新联动,星铁再次硬控玩家热情?
- 新年多城土地市场回温:杭州单价地王纪录 3 个月内两度被打破,民企恢复拿地
- 扎克·克雷格执导新版《生化危机》电影,发行权引多家大公司激烈争夺
- 广东:积极推进煤炭消费控制,全力构建以新能源为主体的新型电力系统
- 广东:到 2027 年,全力构建绿色低碳循环经济体系
- 长三角铁路春运再创佳绩:昨日发送旅客 310.2 万人次
- 海通策略:2025 年政策见效下市场望步入基本面驱动新阶段,结构上科技制造确定性更强
- 《最终幻想14》水晶世界青魔法师职业任务全攻略
- 上海:推出乡村振兴领域优秀博士后创新计划,打造高潜力创新人才‘储备库’
- 春节机票价格跳水至百元,航司退差价政策各异引关注
- 浙江:到 2030 年,LNG 年接收能力达 4250 万吨
- 上海:启动乡村振兴博士后创新计划,打造高潜力人才‘蓄水池’
- 币界网晚讯速递:SHIB币价攀升至0.00002044美元,日内涨幅达2.10%
- 不知火舞《街霸6》惊艳换衣秀,细节之处尽显匠心,玩家为之痴狂
- 中国汽车:奋力争夺超豪华市场入场券