AI研究者开源模型解释工具包AllenNLP解读
艾伦人工智能研究所和加州欧文的研究人员发布了AllenNLP解释器,用于解释自然语言处理(NLP)模型的结果。可扩展工具包包括几个解释和可视化组件的内置方法,以及一个使用AllenNLP解释器解释最新NLP模型(包括BERT和RoBERTa)结果的示例。
在arXiv发表的一篇论文中,研究团队更详细地描述了该工具包。AllenNLP解释器使用两种基于梯度的解释方法:重要性图,用于确定输入句子中的每个单词或“标记”对模型预测的贡献程度;与攻击作斗争,试图删除或改变输入中的单词,同时仍然保持模型中相同的预测。这些技术可以用于各种NLP任务和模型架构。这些实现使用一组通用的API和可视化组件,它们为将来开发其他技术和模型支持提供了一个框架。
随着公司越来越多地使用人工智能来自动提供问题的答案,用户想知道为什么人工智能会给出给定的答案。例如,如果在信用卡交易中检测到欺诈,交易是否特别暗示欺诈?
模型如何产生答案的解释对于模型开发人员理解系统在面对新数据时如何一般化的能力也很重要。AllenNLP解释公司的研究员Sameer Singh经常引用这个模型来区分狼和狗,但实际上只是学会了探测雪。
对于一些机器学习算法,解释很简单:比如决策树只是一系列if/then规则。然而,深度学习模型的输出可能更难解释。
Singer之前的工作包括LIME,它使用线性近似来解释更复杂模型的预测。AllenNLP解释器使用基于梯度的方法,可以衡量输入特征对输出的影响。由于计算该梯度是深度学习训练的关键组成部分,因此这些方法可以应用于任何深度学习模型。
虽然这些技术是通用的,但是AllenNLP解释器是为NLP设计的。自然语言处理系统的输入是一个文本串,通常是一个句子或整个文档,然后文本被解析成它的组成词或标签。AllenNLP解释包括一个显著性图表,显示每个标记对模型预测的贡献;一个用例可能是解释一个句子中的哪些单词导致他们的情绪被分为积极的或消极的。
该工具包还包括两个对策,展示了更改输入中的标签如何影响输出。首先,HotFlip,用其他单词替换斜率最高的输入单词,直到模型输出发生变化。另一种攻击是输入缩减,在不改变输出的情况下,反复删除斜率最小的单词。这导致输入文本“通常没有意义,但会导致高置信度预测”。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
最新文章
- 求K233次列车(15车厢的座位号)
- 能链综合能源港里的充电站为何成为香饽饽
- 鸡蛋怎么做比较有营养(鸡蛋怎么做比较好吃)
- lol手游霞怎么出装(LOL新英雄霞与洛逆羽霞如何出装霞怎么出装)
- 穿越火线什么时候上架(穿越火线什么时候能玩)
- 北比臼舅怎么读(北比臼日怎么读)
- 创世之柱任务有什么用(创世之柱任务怎么做)
- 徐磊的歌曲(写给你的歌 徐磊乐演唱作品)
- 广州市经济适用住房准购证明怎么办理(如何取得广州市经济适用住房准购证明)
- 王者里的百里玄策怎么玩(王者荣耀百里玄策怎么玩好百里玄策介绍)
- 荡漾意思是(荡漾的漾什么意思)
- 永和豆浆和永和大王有什么关系(永和大王和永和豆浆有什么区别)
- 血尿酸(血尿)
- 中国新歌声各季冠军(中国新歌声第一季冠军亚军分别是谁)
- 微信红包有语音红包吗(微信红包新玩法语音红包)
- 蚊子会被雨砸死吗(蚊子会被热死吗)
- 电脑上免费的录屏软件有哪些(电脑上免费的录屏软件哪个好)
- 2017世界杯赛程表时间(2018世界杯赛程时间表2018世界杯赛程安排)
- cz3790航班几点到珠海(今天的航班cz3740到达珠海是几点)
- 鸡蛋羹水开后蒸多长时间(鸡蛋羹水开后蒸几分钟)
- 微博ip属地以运营商为准什么意思(微博ip属地以运营商为准什么意思)
- 进出口贸易实务教程复习(进出口贸易实务教程)
- 最好的hdmi线有什么牌子好(哪个牌子的的HDMI线更好)
- 平均发电增益高达6.91%!国电电力天津30MW光伏电站晶科N型TOPCon发电数据出炉