Google更新云端语音转文字服务听写电话的错误率减少54%
继上个月发表云端文字转语音(Cloud Text-to-Speech)服务之后,Google在周一(4/9)更新了云端语音转文字(Cloud Speech-to-Text)服务,提供全新的影片及电话转录模型,也新增了自动化标点符号功能。相较于原本的电话模型,新的强化版电话转录模型(enhanced phone_call model)让语音辨识的错误率减少了54%。
Google于2016年发表的Cloud Speech-to-Text原名为Cloud Speech API,可辨识包括中文在内的逾120种语言,本周则是该服务建立以来最大规模的改版,它提供了4种客製化模式,包括命令与搜寻(command_and_search)、电话(phone_call)、影片(video)与预设(default),其中,电话模型适用于基于8khz取样率记录的电话内容,而预设模型则多用在音质较好、时间较长、取样率高于16khz以上的音频,使用者可依照不同的使用情境选择适用的模型,以顺利将语音转换成文字。(来源:Google)
Google Cloud AI产品经理Dan Aharon表示,有许多云端供应商利用客户的请求来改善相关服务,但基于资料及隐私保护的立场,Google并不打算採用这样的作法,取而代之的是推出业界首创的「选择加入计画」( opt-in program),让客户主动提供资料供Google纪录与分析,而首个成品就是强化版电话转录模式,该计画成功地让Cloud Speech-to-Text的电话转录服务减少了54%的错误。
至于新的影片模式则可用来将影片中的语音转换成文字,或是转录同时有多人开讲的语音,该模式所使用的机器学习技术与YouTube自动化字幕背后的技术雷同,相较于原本的预设模式,影片模式的转录错误率也降低了64%。
不管是强化版的语音模式或影片模式现在都只支援英文,预计很快就会扩张至其它语言。
除了全新的语音及影片模式之外,新版的Cloud Speech-to-Text还準备在将语音转成文字之后,自动加入标点符号,以让文字更容易阅读,目前该模式仍属于测试阶段,可提供逗点、句号或问号等标点符号的建议。
除了影片模式每15秒的收费为0.012美元之外,其它模式的费用皆为每15秒0.006美元,为了推广全新的影片模式,截至今年5月31日可享用每15秒0.006美元的优惠价。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
最新文章
- DNF搬砖最佳宠物搭配指南
- DNF白金徽章变现攻略:如何巧妙出售白金徽章
- 寒潮蓝色预警:近两日最低气温 0℃线南压至江南南部至贵州南部和云南北部一带
- DNA 纳米机器人:可改造人造细胞,推动合成生物学发展
- 新型巨型里德伯原子成为精准量子温度计
- 《生化危机9》重大爆料:里昂确定回归主角,吉尔缺席引热议
- 广东:到 2027 年 绿色低碳循环经济体系基本建成
- 2024 财年美国对外军售额创历史新高:背后的战略与影响
- 离子阱量子计算在近年实现双码纠错
- 这次与肯德基的全新联动,星铁再次硬控玩家热情?
- 新年多城土地市场回温:杭州单价地王纪录 3 个月内两度被打破,民企恢复拿地
- 扎克·克雷格执导新版《生化危机》电影,发行权引多家大公司激烈争夺
- 广东:积极推进煤炭消费控制,全力构建以新能源为主体的新型电力系统
- 广东:到 2027 年,全力构建绿色低碳循环经济体系
- 长三角铁路春运再创佳绩:昨日发送旅客 310.2 万人次
- 海通策略:2025 年政策见效下市场望步入基本面驱动新阶段,结构上科技制造确定性更强
- 《最终幻想14》水晶世界青魔法师职业任务全攻略
- 上海:推出乡村振兴领域优秀博士后创新计划,打造高潜力创新人才‘储备库’
- 春节机票价格跳水至百元,航司退差价政策各异引关注
- 浙江:到 2030 年,LNG 年接收能力达 4250 万吨
- 上海:启动乡村振兴博士后创新计划,打造高潜力人才‘蓄水池’
- 币界网晚讯速递:SHIB币价攀升至0.00002044美元,日内涨幅达2.10%
- 不知火舞《街霸6》惊艳换衣秀,细节之处尽显匠心,玩家为之痴狂
- 中国汽车:奋力争夺超豪华市场入场券