高尚大的人工智能背后:真的只是单调、枯燥和密集劳动吗?
发布时间:2019-09-24 17:41来源: 网络整理有一位网友总结道:任何华丽成果的背后,都是一条非常枯燥的创作之路,比如一副健美、健壮的好皮囊背后,一定是每天撸铁,上千次地锻炼而成,还有精致时尚的 iPhone手机,背后则是富士康工人历经上百个组装步骤完成的。现如今,人工智能AI技术正在大热,华丽丽的最高端技术,几乎能酝酿出新一轮的科技革命,但普通人很难想象到,在AI系统建制完成前,也需要大量重复、枯燥的密集劳动,最典型的工作就是给数据贴标签。众所周知,人工智能涉及的领域非常广泛,有着琳琅满目的分支,其中,Machine learning是一个比较热门的项目,同样也是需要花费大量基础劳动维护的项目。
Machine learning顾名思义就是机器向人类学习,更准确的说法,则是“人类要教会机器”,是靠着上万次的重复劳动教会它们的。
总得来说,人工智能有两个重要的支柱,一个是海量的数据、大大的数据;另一个则是高精度算法,显然,算法需要一小撮的天才来编辑和优化,而海量的大数据,除了机器本身的收集能力之外,还需要大量的人工操作,给相关的数据贴上固定的标签。
海量数据,为什么依靠人工来贴标签?
在电子信息时代以前,因缺乏合适的记忆载体,大自然的数据和人类的行为,绝大多数是没有被记录和保存的。现在,随着移动互联网的发展,信号无处不在,手机又是随身携带的,以至于,我们的任何行为都会被记录下来,形成或有价值或无价值的数据,如微信会记录下用户每天的步数,还给他们弄个排名,以刺激其加强锻炼;网络购物则会知晓消费者的喜好,从而在合适的时间推送出合适的商品;滴滴打车常年追踪着乘客经常去哪里,一来二去就能计算出一些“打车最佳路线”等等,但显然,单凭借这些自然地、无意识的数据,还远远达不到人工智能的远景目标,依旧需要大量的人工来“制造”数据。
毫无疑问,未来人工智能应用最广泛的领域,就是那些基于“经验”的领域,比如中医领域,无论它多么神秘或者高深莫测,本质上就是“不太复杂”的大数据:神农氏尝百草,就是收集数据的过程,而古代治疗疑难杂症,就是要不断地尝试,直到找到可以治愈疾病的良药,在可预见的未来,有很大一部分的医疗诊断,都会交给人工智能,机器扫描病人之后,只需要从数据库中找到对应症状即可,但在人工智能足够聪明之前,人类需要先将“数据传授给机器”,如印度的一位女工,拿到一段结肠的医疗视频之后,会利用自己的专业知识寻找到其中的“息肉”,即大肠中可能导致癌症的小肿块,看起来有点像黏糊糊的痘痘。当她们找到息肉时,就用电脑鼠标和键盘标记,在这个“凸起”周围,画一个机器能识别的圆圈,之后,当人工智能扫描到这个圆圈时,就能做出判断:恩,这就是息肉。
简单来说,数据标签就是可以让机器识别的符号,而人类劳动在其中的贡献就是把这种标签和实际内容关联到一起。
从业内人士披露的内幕来看,很多AI智能系统都需要重复、单调地“机器训练”计划,也即通过人工劳动使数据变得更有价值,算法变得更加精明,因如此做法常常会涉及到隐私范畴,很少有人工智能企业愿意主动承认“自己正这么干”呢,按照这个推测,用户常用的软件都有可能进行如此单调的“密集劳动”,如现在的地图已然非常“精准”,是一个智能化的软件,不仅能精准定位到龙城大街或者深南大道之类的主干线,连一些弯弯曲曲的羊肠小道以及临时修路搭建起来的简易房都能识别清楚,笔者相信,这一定是源于“标记工人”的日常劳作和实时更新,还有,我们常用的智能输入法,几乎囊括了全部的人类词汇,显然,那些格言、诗词、网络流行语,甚至错别字,单凭人工智能自己学习显然是不够的,而是靠着日积月累的人工服务,要知道,把一本辞海吞掉,真不是一件简单的事情…
基于以上描述,笔者由衷地相信:人工智能再怎么发展也要依赖自然人类的智慧,最起码现阶段是这样的,同样地,我们也可以推论出:给数据贴标签,或者说数据维护工作,已经是一个非常庞大的产业链,且对技能的要求非常低,正野蛮生长。
人工智能带来失业潮,焦虑可休矣?