AI企业对于数据的应用需求逐渐开始分化

知识百科2021-10-14 18:06:32
最佳答案毫无疑问,数据量的飙升是AI行业爆发的原因之一。很快,我们可以发现,收集、整理、清洗和标注数据,然后发送给AI企业进行模型训练,已经成

毫无疑问,数据量的飙升是AI行业爆发的原因之一。很快,我们可以发现,收集、整理、清洗和标注数据,然后发送给AI企业进行模型训练,已经成为一条顺畅的产业链。

长期以来,数据服务一直处于粗放、原始的状态,甚至有“数据农场”的说法:数据服务从业者从各种公共数据集或移动互联网产品中获取数据,雇佣大量廉价劳动力,以几乎零门槛的形式做简单的清理和标记工作,比如在一张照片中查看天空在哪里,地球在哪里。最后,将这些粗糙的数据放入神经网络的黑箱中。

但现在,我们看到这种情况正在发生变化,AI企业对数据的应用需求也逐渐变得不同。过去粗放的处理模式已经不能满足他们的需求,搅动了AI数据服务市场,潮水也从奔涌到平静,让泥沙沉淀,让清水上涨。云测量下的AI数据服务品牌“云测量数据”的出现就是一个典型案例。

这一次我们采访了云数据总经理贾宇航,听他讲述他眼中的数据服务之战。

汹涌澎湃的数据服务战场。

如果数据是AI的养料,那么养料的营养含量自然决定了AI的强弱。算法的准确性、对不同环境的适应性等几乎都来自于原始数据的积累。

首先要改变的是AI行业。清华大学发布的《2018年中国人工智能发展报告》显示,去年中国人工智能产业市场规模达到237亿元,同比增长67%。预计2019年中国人工智能产业增速将高达75%。

产业规模的爆发式增长意味着竞争将进一步加剧。面对这种竞争,AI企业对数据的需求必然会发生变化。

例如,企业渴望更详细和定制的数据。

真实的环境总是比实验室里的想法更复杂。要提供一个更有基础和差异化的模型,仅仅依靠基于移动互联网或众包用户数据收集的数据显然是不够的。只有通过定制化的数据采集,才能不断深入人无我的细节和场景,从而不断提升技术价值,在洪流中站稳脚跟。

例如,企业渴望获得更专业、更垂直的数据。

随着AI技术深入到每一个细分领域,大量的数据标注工作都要由专业人员来完成。比如医学图像数据的标注,以及对工业生产线上各种材料的理解。这些不再像过去那样通过聚集一群普通人来完成。相反,需要行业内的专业人员来处理。如何满足这些需求,是数据服务企业和AI企业都在思考的问题。

以及企业日益增长的数据安全需求。

除了数据隐私等常规的数据安全要求外,为了突破现有模型的限制,一些企业开始开发自己的硬件,走向多模态集成。或者,如上所述,收集一些定制的专业数据。此时,这些数据将成为企业构建自身核心壁垒的发展方向。此后,数据安全成为重中之重。

另一方面,AI数据服务企业也是如此。

AI服务企业意识到越来越多的AI企业对数据的准确性、安全性和标注效率提出了更多的要求,AI企业开始倾向于与大公司合作,对数据服务企业进行尽职调查,建立供应商名单等等。这意味着数据服务企业必须加强技术能力,促进管理的正规化,以满足新的需求。

战争的号角已经吹响。这场战争决定了AI数据服务企业的生存,也是他们争取上游的重要机会。

云测量数据的作战逻辑。

云测数据是数据企业的代表,他们在中场战役中越来越出色。

移动互联网时代初期,云测试从移动APP测试为切入点进入企业服务领域,为移动互联网应用在真实场景中的使用保驾护航;在人工智能时代,云测旗下的AI数据服务品牌“云测数据”正在帮助各大企业获取接近真实场景的精准数据,帮助AI在真实场景落地。

对于AI企业来说,自建数据处理团队可以满足需求,但资金成本和技术门槛相对较高。数据行业常见的众包模式,比如亚马逊Mechanical Turk,可以在平台上完成大量的数据,但面对定制化的场景数据却无能为力。

云测量数据针对的是定制数据市场,并打磨出一套自己的逻辑:

一是通过产业链延伸,满足企业丰富的业务需求。

云调研数据显示,当AI企业对算法落地的要求越来越高时,需要更多贴近真实场景的数据来满足需求。贾宇航提到,对于现阶段安防或金融所要求的人脸识别的安全等级,互联网积累的数据和众包收集的数据不足以支撑其需求,多维度、精细化的数据,如各种光照条件下各种角度的人脸数据,才是最好的良药。面对这种情况,数据企业有必要延伸产业链,进行定制化的数据采集。除了安防领域和金融领域,云测数据还将涉及到辅助驾驶场景中驾驶员的表情、新零售场景中人们的服装穿着、智慧生活中的说话人唤醒词、智能行业中的质检和巡检等场景。覆盖了目前大部分落地场景。

二是注重人才培养和提升。

标注精准程度。

意识到定制化数据对于AI企业的重要性后,云测数据开始注重对于从业人员素质的培养和提高,不仅自建数据基地,对标注员进行标注技巧的教学培训,也在各个涉足行业进行专业知识积累,以确保标注人员对所从事标注任务的理解。如涉及交规和行车经验的自动驾驶数据标注,云测数据就找来了由驾龄丰富的标注管理人员进行对员工提供定期讲解,而其他行业,也逐渐开始需要“老司机“的介入,去提升数据精度。

第三, 死守安全底线。

最后最重要的,还有安全。首先云测数据的核心价值观是让企业拥有数据,构建企业的核心竞争壁垒,为此数据的安全性是一项核心指标。为了保证人们的数据隐私安全,云测数据不仅在硬件和操作系统上采取了加密措施,封死USB接口、采用内网浏览器端操作标注数据、保证所有参与工作的员工只能操作数据,不能获取数据,且每次标注任务交付数据结果后,都会销毁数据。不仅保护数据隐私,也保证了AI企业的利益。

中场战事改变了什么:AI数据服务产业的下一幕

贾宇航告诉我们,云测数据的发展目标,就是在更多细分领域中,做到领域知识积累更深厚,数据更精准,数据更安全。拥有了这三项应战能力,云测数据就可以在数据服务赛道中精准的抓住变革中的机会。解决AI企业想要依靠独有专业数据提升技术能力,又无力建立数据团队的问题。

我们同样关心的,是中场战事之后,数据服务产业会出现怎样的走向?

在接受采访时,贾宇航向我们提到了一个有趣的事实:目前他们服务的甲方,除了一些科技巨头以外,还有不少传统企业。

这一事实侧面反映出,参与AI的企业越来越多,类型也越来越丰富。其中会有对技术一无所知的小型传统企业,会有扎根于农业、化工等等某一极其细分行业的企业,同时也会有依赖丰富的数据累积对AI技术精益求精的科技巨头。他们对于数据类型的需求也会越来越细化、专业和垂直。在这种趋势之下,数据与算法之间的产业分工会逐渐走向明晰。或许数据企业需要“把手伸得更长”,才能更好的为他们提供服务。

相信在中场战事这一转折点之后,数据服务行业会从单纯的拼劳动力,演变成拼技术、拼专业、拼垂直。

对于数据服务产业来说,这也是一个不断洗牌的过程。产业发展行程过半,真正的竞争才刚刚来临。数据服务产业作为AI的“源头”,在历经优胜劣汰之后,也给予AI发展更强大的动力。

免责声明:本文由用户上传,如有侵权请联系删除!