谷歌的VideoBERT算法可以一次预测未来的烹饪视频
动态2021-08-23 14:02:38
最佳答案 谷歌有限责任公司(Google LLC)今天推出了VideoBERT,这是一种人工智能,可以像人类一样观看视频的一部分,并推断未来几秒钟内会发生什么
谷歌有限责任公司(Google LLC)今天推出了VideoBERT,这是一种人工智能,可以像人类一样观看视频的一部分,并推断未来几秒钟内会发生什么。
需要非常复杂的算法,才能让计算机具备从视觉场景中理解并得出正确结论的能力。然而,对于谷歌研究人员来说,挑战不是构建算法,而是找到足够的数据进行训练。机器学习模型必须吸收大量信息才能理解甚至基本概念,通常必须手动准备信息。
对于VideoBERT来说,这是不可行的,因为教模型如何预测未来事件需要更多的示例视频,这些视频可以由谷歌研究人员手动组装。他们还必须为每个片段的每个单独帧编写描述,以便人工智能可以跟踪正在发生的事情。于是,团队提出了一个替代方案:免费教学视频。
在展示如何烹饪煎蛋或填充轮胎的视频中,演示者通常会解释执行任务时的每一步,并逐帧讲述研究人员用来替换他们应该做的事情的描述,否则它就是为人工智能创建的。该团队编辑了100多万个剪辑,涵盖了烹饪和园艺等类别。然后,他们将它们输入VideoBERT,教模型如何跟踪常见活动的进度。
训练结束后,模特被放上了一段从未见过的烹饪视频。当视频片段显示一碗面粉和可可粉的视频片段时,VideoBERT巧妙地预测这些配料会被放入烤箱,变成布朗尼或蛋糕。研究人员还试图利用算法的观察技术从视频中提取食谱,厨师在视频中解释了如何烹饪牛排。
谷歌开发的训练视频伯特的方法最终可以在更严肃的应用中找到用处。例如,如果自动驾驶汽车能够在接下来的几秒钟内准确预测附近车辆的位置,它们可能会变得更加安全。对于在人类工人附近工作的无人机和工业机器人来说,这一愿景也可能是一项重要资产。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
最新文章
- 求K233次列车(15车厢的座位号)
- 能链综合能源港里的充电站为何成为香饽饽
- 鸡蛋怎么做比较有营养(鸡蛋怎么做比较好吃)
- lol手游霞怎么出装(LOL新英雄霞与洛逆羽霞如何出装霞怎么出装)
- 穿越火线什么时候上架(穿越火线什么时候能玩)
- 北比臼舅怎么读(北比臼日怎么读)
- 创世之柱任务有什么用(创世之柱任务怎么做)
- 徐磊的歌曲(写给你的歌 徐磊乐演唱作品)
- 广州市经济适用住房准购证明怎么办理(如何取得广州市经济适用住房准购证明)
- 王者里的百里玄策怎么玩(王者荣耀百里玄策怎么玩好百里玄策介绍)
- 荡漾意思是(荡漾的漾什么意思)
- 永和豆浆和永和大王有什么关系(永和大王和永和豆浆有什么区别)
- 血尿酸(血尿)
- 中国新歌声各季冠军(中国新歌声第一季冠军亚军分别是谁)
- 微信红包有语音红包吗(微信红包新玩法语音红包)
- 蚊子会被雨砸死吗(蚊子会被热死吗)
- 电脑上免费的录屏软件有哪些(电脑上免费的录屏软件哪个好)
- 2017世界杯赛程表时间(2018世界杯赛程时间表2018世界杯赛程安排)
- cz3790航班几点到珠海(今天的航班cz3740到达珠海是几点)
- 鸡蛋羹水开后蒸多长时间(鸡蛋羹水开后蒸几分钟)
- 微博ip属地以运营商为准什么意思(微博ip属地以运营商为准什么意思)
- 进出口贸易实务教程复习(进出口贸易实务教程)
- 最好的hdmi线有什么牌子好(哪个牌子的的HDMI线更好)
- 平均发电增益高达6.91%!国电电力天津30MW光伏电站晶科N型TOPCon发电数据出炉