2019中国人工智能峰会:百度飞桨助力产业智能化
发布时间:2019-07-01 22:36来源: 网络整理中新网7月1日电 近日,2019中国人工智能峰会(CAIS 2019)在南京举办,大会以“智能+拥抱未来”为主题,汇聚人工智能领域学术界、产业界众多领袖及代表,探讨中国人工智能的现在与未来。百度AI技术平台体系执行总监、深度学习技术与应用国家工程实验室副主任吴甜受邀出席“AI的开源与开放”高峰论坛并发表主题演讲,阐述了全球软件开源开放的现状,以及中国首款自主研发的深度学习平台飞桨(PaddlePaddle)的核心优势和推动产业智能化的实践与成果。
开源开放是人工智能的热点之一,促进了全球人工智能相关技术及产业生态的繁荣,成为产业智能化的重要推动力。吴甜介绍,全球软件开源开放呈上升趋势,中国在其中的贡献越来越大。软件开源开放正在加速全球化,相互协作也趋向全球化;人工智能的快速发展推动开源软件生态系统越来越繁荣;在开源社区中,公司和机构的相关开源项目贡献日渐增长;开源软件已成为一种重要的软件和互联发展模式。“开源和开放平台对于人工智能与产业深度融合有重要意义”,吴甜表示,人工智能技术与产业结合产生价值,涉及到多技术整合、能力复用、产业链打通,以及产业和国家安全等关键要素。显而易见,自主研发的人工智能开源开放平台,是持续推动人工智能发展、加快产业智能化进程,促进我国科技创新与产业变革的重要力量。
“本轮人工智能热潮,离不开深度学习技术的持续突破和广泛应用。这其中,深度学习框架是核心基础,重要性不言而喻。”吴甜表示,深度学习框架是智能时代的操作系统,基于操作系统会有大量的应用产生,对人工智能的创新有巨大的帮助。百度打造的国内唯一功能完备的深度学习平台飞桨(PaddlePaddle)正在推动人工智能发展,加快中国产业智能化进程。
吴甜介绍,飞桨是集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,囊括支持面向真实场景应用、达到工业级应用效果的模型,以及针对大规模数据场景的分布式训练能力、支持多种异构硬件的高速推理引擎等。
首先,飞桨核心框架层开放了开发、训练、预测的一整套能力,并开源70多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐、语音几大核心技术领域,飞桨成为官方支持模型最多的深度学习平台。面向工业应用的中文NLP工具集--飞桨自然语言处理模型库(PaddleNLP),将自然语言处理领域的多种模型在任务层用一套共享骨架代码实现,网络使用更加灵活。飞桨模型库推出了在中文NLP任务上表现全面领先的中文语义表示模型——ERNIE,大幅增强了模型语义表示能力,在实际应用中效果显著。飞桨提供的视频识别工具集,则覆盖了主流实用的序列建模算法与端到端视频识别模型,为开发者提供解决视频分类、视频定位等一系列应用技术方案。
针对大规模稀疏特征,飞桨设计并开放了大规模稀疏参数服务器,适用于超大规模数据、海量特征和自膨胀、高频率模型迭代的应用场景。同时,针对工业级数据处理,飞桨开放了分布式样本Shuffle、分布式文件系统IO支持,多种语言IO组件灵活嵌入等能力。
模型部署是深度学习应用落地、发挥价值的重要步骤。飞桨提供了完整的端到端全流程部署方案,并持续扩展对各类硬件的支持。在此基础上,飞桨提供性能全面领先的底层加速库和推理引擎,近期发布的飞桨服务端部署库(Paddle Serving)支持服务器端的快速部署。
在工具组件层,飞桨提供了迁移学习(PaddleHub)、强化学习(PARL)、自动化网络结构设计(AutoDL Design)等工具和组件,满足开发者灵活、高效地研发深度学习应用的诉求。其中,飞桨自动化网络结构设计组件基于深度学习设计深度学习,已经全面超过人类专家设计的效果。
在服务平台中,飞桨为没有深度学习技术基础的开发者提供了零门槛定制化训练和服务平台EasyDL,帮助开发者基于自定义的图片、对话和声音等数据实现自动加工和训练,快速完成部署。此外,一站式实训开发平台AI Studio,为开发者提供更加完善便捷的编程环境;EasyEdge端计算模型生产平台支持多种深度学习框架与网络结构,可适配主流的大多数芯片与操作系统。
源于产业实践的开源深度学习平台飞桨,已经在各行各业的产业智能化进程中发挥越来越大的价值。吴甜以“AI招聘官”为例,介绍了基于飞桨打造的人岗智能匹配系统为企业招聘带来的成本收益。“AI招聘官”充分借助飞桨在中文NLP领域的模型优势,可以进行更好的人岗匹配,企业HR邀约面试成功率可提高5倍,职位推荐准确率提升50%。