新疆都市报 > 科技 > 智能 >

产业智能化大潮来袭 王海峰揭秘百度AI大生产平

发布时间:2019-10-28 10:26来源: 网络整理

  中新网10月27日电 10月26日,第九届中国智能产业高峰论坛(CIIS2019)在西安开幕。本届峰会以“驱动未来,智能无界”为主题,海内外知名人工智能学者、企业代表等参与峰会,围绕人工智能技术创新和在各场景中的应用展开研讨。百度首席技术官、ACL/CAAI 会士王海峰出席峰会,并发表题为《AI大生产平台推动产业智能化》的演讲,全面介绍百度如何通过探索顶尖AI技术、打造AI大生产平台,助力产业智能化发展。

产业智能化大潮来袭 王海峰揭秘百度AI大生产平

  王海峰介绍,人类经历的前三次工业革命中,驱动工业革命的核心技术都表现出很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征。当前,我们正身处以AI为核心驱动力量的新一轮科技革命和产业革命浪潮之中,AI正将人类社会带入智能时代。

  作为国内投入最早、技术最强、布局最完整的AI领军企业,百度持续研发领先的AI核心技术,并积极建设AI大生产平台,推动应用落地,促进产业智能化的发展。百度人工智能技术多年积累和产业实践的集大成——百度大脑,实现了AI能力与应用场景融合创新,已升级为“软硬一体AI大生产平台”。

  在数据和算力的基础上,百度大脑“软硬一体AI大生产平台”以飞桨深度学习平台为基础技术底座,打通了人工智能产业化应用落地相关的全部流程,包括深度学习平台、通用AI能力、定制化训练平台、部署与集成,以及应用的技术解决方案,同时有完整的AI安全体系保障,实现了AI技术的标准化、自动化、模块化,推动产业智能化。

  人工智能的发展离不开算力的支撑。百度大脑的AI计算架构,通过芯片、连接、系统和调度的协同设计和技术创新,提供百万TOPS的强大算力,并紧密结合百度飞桨训练与推理框架,提供面向算法优化的极致效率。

  芯片是算力层面被关注的焦点。百度自研云端通用AI处理器——百度“昆仑”,针对语音、自然语言处理、图像等专门进行了优化,同等性能下将成本降低了10倍。此外,百度打造了远场语音交互芯片百度“鸿鹄”,“鸿鹄”芯片按照车规级标准打造,采用HiFi4自定义指令集,双核DSP核心,具备超大内存,包含TCMCacheSRAM,而且能耗极低,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。

  底层的芯片和上层的应用之间,还需要操作系统承接。在智能时代,深度学习框架向下对接硬件、芯片,向上承接各种业务模型、行业应用,起到承上启下的作用,是“智能时代的操作系统”。百度在多年深度学习和人工智能技术的积累和产业实践的基础上,打造了自主可控的飞桨产业级深度学习开源开放平台。飞桨平台核心技术领先,具备开发便捷的产业级深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、开源开放覆盖多领域的产业级模型库四大领先技术;飞桨平台集深度学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体,是功能完备、全面开源开放的产业级深度学习平台。王海峰介绍,基于飞桨的EasyDL等服务平台,企业和开发者即使不懂深度学习,也可以训练出满足应用需求的模型,加速AI的应用落地。

  以飞桨为基础技术底座,百度大脑的AI核心技术持续取得创新突破,保持世界领先水平。

  语音技术领域,百度大脑的流式多级截断注意力模型(SMLTA)使识别准确率提升15%-20%。王海峰现场展示了基于SMLTA中英文混合识别能力,这一能力目前已在的百度输入法上大规模应用;风格迁移的语音合成技术把声音中的音色、风格、情感等不同元素解耦分离,独立组合,灵活控制合成的声音,只需录制20句话,就可以制作一个人的专属声音。基于此技术,百度上线了全球首个地图语音定制功能,为用户带来了前所未有的个性化体验。

  在视觉技术方面,基于图像技术、人脸人体技术和视频分析技术,百度已经形成适用于不同应用场景的技术矩阵,如OCR文字识别、车辆识别、物体识别、风格转化,以及人脸检测、人脸对比、驾驶行为检测、人流量统计等,在机械制造、金融、医疗、教育等领域得到广泛的应用。而通过3D和AR的手段,已经实现人脸、手势、环境、肢体多维度的技术突破,可用于一体化人机交互等创新应用。

  综合应用语音和视觉技术,机器可以自动合成虚拟形象。百度大脑的虚拟形象合成技术,首先对语音信号和视频信号进行识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,合成一个虚拟形象。