数据决定人工智能前景,Testin 云测助力产业落地
发布时间:2019-12-16 14:10来源: 网络整理没有好的数据,人工智能就没有未来。
虽然早在2017年,“AI元年”的噱头就已经打响,但直到近期,业界才终于承认,各项技术纷纷实现落地的2019年,才是名副其实的“AI元年”。在“互联网”成为传统产业的今天,基于各项AI技术实现的无人驾驶、智慧家居、新零售等新概念争先恐后出现,而物流、制造业等传统产业也没有落后于时代潮流,纷纷寻求借助AI进行产业升级,拥抱智能化,而在势不可挡的智能化大潮前,始终藏在幕后构建技术地基、协助技术实现落地支撑的数据标注服务,在其中扮演了关键性的重要角色,是AI行业里真正的“隐形关键”。
在过去,数据标注行业很少出现在人们的视野中,但业内却有着相同的共识:没有好的数据,AI就没有未来。
这句话并不夸张。目前为止,我们所看到的人工智能,已经跳脱出枯燥单一的计算,转化为以深度神经网络为主的新智能体系,而深度神经网络对于数据有很强的依赖性,所以,凭借对体量庞大的结构化和半结构化数据进行高效率的深度分析,挖掘隐性知识,AI系统才能将海量、复杂、多源的语音、图像和视频数据转化为机器可识别的、具有明确语义的信息,借此进行机器的自主学习。而不够精准却足量的数据,则会让AI的识别学习系统产生混乱和误差。在谷歌发布的CNN报告中,就提到一个严重的问题:自动驾驶车辆的识别系统难以分辨黑色人种和同为灵长类的大猩猩,所以相比白种人、黄种人,黑色人种的辨别率会低10%,——如果采用更多的、经过精密标注过的数据,这样的误差可以很大程度的缓解。
其实,在自动驾驶领域,精准海量的数据标注,价值不仅仅体现在识别上,在逐渐成为汽车标配的辅助驾驶方面,数据标注也有很强的存在感。在辅助驾驶过程中,有一个关键功能叫做驾驶员疲劳检测,通过视觉识别的方式监测驾驶员的状态,识别是否分神,是否在打电话,是否在打瞌睡,而在辅助驾驶的过程中,驾驶员也极有可能出现注意力不集中的情况。在更细致精密的数据标注介入后,识别系统被赋予了一系列能力,比如疲劳监测系统、危险动作监测系统等,在用户享受便利的同时,能使得公路驾驶更加安全,解决了这样的问题,自动驾驶和辅助驾驶才得以广泛推广和应用。
在高科技产业的实际落地中,数据的重要性有目共睹,而在助力传统产业智能化方面,数据标注也有着广阔的赋能前景。一个非常容易被感知到的变化是,我们在致电银行、通信运营商,或者接到他们的服务电话时,会发现很多坐席人员变成了AI语音助手,能够精准识别天南海北的方言提出的疑问,这要归功于数据标注在方言识别上的突破,使得坐席人员可以从简单的问题中或通知性沟通中解放出来,将精力专注于服务更棘手的特殊问题,不仅提高了话务人员的工作效率,也减轻了机械性人工的投入。
“不仅是要服务高新技术产业,扶持和赋能传统产业的智能化升级,也是我们的使命,通过高纯净度的数据标注服务,无论是高科技产业,还是传统产业,都能获得智慧升级的机会。”Testin云测旗下AI数据服务(数据标注采集)品牌——云测数据总经理贾宇航这样说道。
创新和技术改造传统数据标注虽然不如科技公司光鲜亮丽赚足眼球,数据标注行业一直巧居幕后默默无闻。根据2018年智研发布的《2019-2025年中国数据标注与审核行业市场专项分析研究及投资前景预测报告》显示,近几年,数据标注与审核行业快速发展,2018年市场规模已达到52.55亿元,而在这样的增量市场中,大批看到了企业需求的从业者疯狂涌入,使得整个行业出现良莠不齐的情况,数据粗放、混乱、复用的情况屡见不鲜,在贾宇航看来,这样的数据导入到机器学习中,结果是得不偿失的。
“AI发展和数据标注产业是一个鸡生蛋,蛋生鸡的逻辑,如果数据不够纯净,就像人吃了坏掉的食物,只会产生病状,不能起到吸收利用的作用。用到机器学习中,就会破坏AI的数据学习体系,产生大的误差,而误差产生后,后续的自主学习又会产生偏离,形成恶性循环。”
面对这样的问题,云测数据做出了一系列的应对措施。