YouTube如何做到即时影像置换背景Google不藏私开源给你用
Google研究团队开源在Tensorflow中实作的语意影像切割(Semantic Image Segmentation)模型DeepLab-v3+,包括Google Pixel 2和Pixel 2XL手机上的肖像模式(Portrait Mode),以及YouTube为影片即时去背换背景功能,都是这项技术的应用。
Google研究软体工程师Liang-Chieh Chen以及Yukun Zhu表示,语意影像切割的主要目的,就是为每个画素指定语意标籤,诸如路、天空、人或是狗等物体,不少的程式需要这样的功能,像是合成景深(Synthetic Shallow Depth-of-field)效果,应用在手机Pixel 2和Pixel 2XL上提供的肖像模式(Portrait Mode),能自动模糊人物的背景,作出类似单眼相机的景深效果。
另外,在多数摄影App都会提供的即时影像切割(Video Segmentation),例如最近在YouTube发表的新功能,为影片即时去背换背景的功能,也是语意影像切割的应用。
DeepLab-v3+在Tensorflow上实作,使用部署于伺服器端的卷积神经网路(CNN)骨干架构,以获取最佳的结果。除了程式码之外,研究团队也同时公开了Tensorflow模型训练以及评估程式,以及使用Pascal VOC 2012与Cityscapes资料集训练的模型。
DeepLab-v3+技术是基于三年前的DeepLab模型,期间改进了卷积神经网路特徵萃取器、物体比例塑模以及同化前后内容的技术,再加上进步的模型训练过程,还有软硬体的升级,从DeepLab-v2到DeepLab-v3,直到现在发表的DeepLab-v3+,让效果一代比一代好。
DeepLab-v3+是由DeepLab-v3扩充而来,研究团队增加了解码器模组,能够细化分割结果,能够更精準的处理物体的边缘,并进一步将深度卷积神经网路应用在空间金字塔池化(Spatial Pyramid Pooling,SPP)和解码器上,大幅提升处理物体大小以及不同长宽比例的能力,最后得到强而有力的语意分割编码解码器网路。
Liang-Chieh Chen以及Yukun Zhu特别提到,随着软硬体的升级,建构在卷积神经网路上的现代语意图像分割功能,可以达到的水準已经远远超过5年前的想像。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
最新文章
- DNF搬砖最佳宠物搭配指南
- DNF白金徽章变现攻略:如何巧妙出售白金徽章
- 寒潮蓝色预警:近两日最低气温 0℃线南压至江南南部至贵州南部和云南北部一带
- DNA 纳米机器人:可改造人造细胞,推动合成生物学发展
- 新型巨型里德伯原子成为精准量子温度计
- 《生化危机9》重大爆料:里昂确定回归主角,吉尔缺席引热议
- 广东:到 2027 年 绿色低碳循环经济体系基本建成
- 2024 财年美国对外军售额创历史新高:背后的战略与影响
- 离子阱量子计算在近年实现双码纠错
- 这次与肯德基的全新联动,星铁再次硬控玩家热情?
- 新年多城土地市场回温:杭州单价地王纪录 3 个月内两度被打破,民企恢复拿地
- 扎克·克雷格执导新版《生化危机》电影,发行权引多家大公司激烈争夺
- 广东:积极推进煤炭消费控制,全力构建以新能源为主体的新型电力系统
- 广东:到 2027 年,全力构建绿色低碳循环经济体系
- 长三角铁路春运再创佳绩:昨日发送旅客 310.2 万人次
- 海通策略:2025 年政策见效下市场望步入基本面驱动新阶段,结构上科技制造确定性更强
- 《最终幻想14》水晶世界青魔法师职业任务全攻略
- 上海:推出乡村振兴领域优秀博士后创新计划,打造高潜力创新人才‘储备库’
- 春节机票价格跳水至百元,航司退差价政策各异引关注
- 浙江:到 2030 年,LNG 年接收能力达 4250 万吨
- 上海:启动乡村振兴博士后创新计划,打造高潜力人才‘蓄水池’
- 币界网晚讯速递:SHIB币价攀升至0.00002044美元,日内涨幅达2.10%
- 不知火舞《街霸6》惊艳换衣秀,细节之处尽显匠心,玩家为之痴狂
- 中国汽车:奋力争夺超豪华市场入场券