新疆都市报 > 科技 > 互联网 >

高尚大的人工智能背后:真的只是单调、枯燥和

发布时间:2019-09-12 09:54来源: 未知

有一位网友总结道:任何华丽成果的背后,都是一条非常枯燥的创作之路,比如一副健美、健壮的好皮囊背后,一定是每天撸铁,上千次地锻炼而成,还有精致时尚的 iPhone手机,背后则是富士康工人历经上百个组装步骤完成的。现如今,人工智能AI技术正在大热,华丽丽的最高端技术,几乎能酝酿出新一轮的科技革命,但普通人很难想象到,在AI系统建制完成前,也需要大量重复、枯燥的密集劳动,最典型的工作就是给数据贴标签。众所周知,人工智能涉及的领域非常广泛,有着琳琅满目的分支,其中,Machine learning是一个比较热门的项目,同样也是需要花费大量基础劳动维护的项目。

 

 

Machine learning顾名思义就是机器向人类学习,更准确的说法,则是“人类要教会机器”,是靠着上万次的重复劳动教会它们的。

总得来说,人工智能有两个重要的支柱,一个是海量的数据、大大的数据;另一个则是高精度算法,显然,算法需要一小撮的天才来编辑和优化,而海量的大数据,除了机器本身的收集能力之外,还需要大量的人工操作,给相关的数据贴上固定的标签。

海量数据,为什么依靠人工来贴标签?

在电子信息时代以前,因缺乏合适的记忆载体,大自然的数据和人类的行为,绝大多数是没有被记录和保存的。现在,随着移动互联网的发展,信号无处不在,手机又是随身携带的,以至于,我们的任何行为都会被记录下来,形成或有价值或无价值的数据,如微信会记录下用户每天的步数,还给他们弄个排名,以刺激其加强锻炼;网络购物则会知晓消费者的喜好,从而在合适的时间推送出合适的商品;滴滴打车常年追踪着乘客经常去哪里,一来二去就能计算出一些“打车最佳路线”等等,但显然,单凭借这些自然地、无意识的数据,还远远达不到人工智能的远景目标,依旧需要大量的人工来“制造”数据。

毫无疑问,未来人工智能应用最广泛的领域,就是那些基于“经验”的领域,比如中医领域,无论它多么神秘或者高深莫测,本质上就是“不太复杂”的大数据:神农氏尝百草,就是收集数据的过程,而古代治疗疑难杂症,就是要不断地尝试,直到找到可以治愈疾病的良药,在可预见的未来,有很大一部分的医疗诊断,都会交给人工智能,机器扫描病人之后,只需要从数据库中找到对应症状即可,但在人工智能足够聪明之前,人类需要先将“数据传授给机器”,如印度的一位女工,拿到一段结肠的医疗视频之后,会利用自己的专业知识寻找到其中的“息肉”,即大肠中可能导致癌症的小肿块,看起来有点像黏糊糊的痘痘。当她们找到息肉时,就用电脑鼠标和键盘标记,在这个“凸起”周围,画一个机器能识别的圆圈,之后,当人工智能扫描到这个圆圈时,就能做出判断:恩,这就是息肉。