首页>动态 >内容

AI胶囊系统实现最先进的图像分类结果

动态2021-08-27 22:04:40
最佳答案 人工智能最重要的理论家、最近的图灵奖获得者——向学生Sara Sabour和Nicholas Frosst提出了一个名为CapsNet的机器学习架构,这是一

人工智能最重要的理论家、最近的图灵奖获得者——向学生Sara Sabour和Nicholas Frosst提出了一个名为CapsNet的机器学习架构,这是一种通过判别训练的多层方法,实现了最先进的技术。基于流行基准的图像分类性能。在他们最初工作的后续工作中,辛顿、萨布尔和牛津机器人研究所的研究人员本周详细介绍了胶囊网络的一个版本,该版本在无监督分类任务中赢得了领先的算法。

他们的工作描述在一篇发表在Arxiv.org预印服务器上的论文中(“堆叠胶囊自动编码器”)。

对于不熟悉的人来说,胶囊系统通过几何解释其相关部分的有组织集合来理解物体。针对各种对象属性(如位置、大小和色调)单独激活的一组数学函数(胶囊)被添加到卷积神经网络(通常用于分析视觉图像的人工智能模型)中,它们的一些输出被重用以形成更“稳定”的高阶胶囊表示。由于这些表示在整个过程中保持不变,胶囊系统可以使用它们来识别对象,即使当视点改变时,例如,当交换或转换组件的位置时。

关于胶囊系统的另一个独特之处,他们注重路线。像所有深度神经网络一样,胶囊的功能被安排在互连层,从输入数据中传输“信号”,并缓慢调整每个连接的突触强度-重量。(这是他们如何提取特征并学习如何进行预测。然而,在胶囊的情况下,权重是根据前一层函数预测下一层输出的能力来动态计算的。

Hinton和他的同事最近的研究工作是研究一种神经编码器,它可以查看图像样本,并试图消除物体的存在和姿态。它使用解码器进行训练,解码器使用混合的姿势预测来预测已经找到的图像部分的姿势(由自动编码器分割),并将每个图像像素建模为由变换部分做出的混合预测。然后在未标注的数据上学习胶囊系统,将已有的向量(数学表示)聚集在一起,捕捉整个物体与部分之间的空间关系。

合著者指出,对象胶囊的存在概率向量更有可能形成紧密聚类,为每个紧密聚类分配一个类将对街景房号数据集(A)进行无监督分类,从而产生最高级的结果。来自谷歌街景图像的超过600,000个门牌号的真实图像数据集)。此外,该实现导致了MNIST(手写数字语料库)的几乎最先进的结果,并进一步提高了少于300个参数的性能。

免责声明:本文由用户上传,如有侵权请联系删除!