亲测讯飞输入法五大黑科技 原来人工智能无处不在
发布时间:2020-05-28 17:55来源: 网络整理提到手机输入法,大多数人都不陌生,一款好用的手机输入法,不仅能提高沟通的效率,也会大大提升使用手机其他功能的方便程度。在科技不断革新的当下,手机输入法也在不断革新自己的技术。语音识别见长的讯飞输入法就是其中一员,将大数据以及语音识别、图像识别等AI技术运用在手机输入法中。接下来让我们一起来了解下 “黑科技”是如何在讯飞输入法上大展身手的。
黑科技一:语音输入一分钟400字,准确率达98%
首先,讯飞输入法“1分钟400字”,飞一般的打字速度彻底颠覆了人们对手机打字的认知。这背后是20年来,科大讯飞对核心技术的深度理解和科学应用,实现了“把中文语音技术做到全球最好”的小目标。
从尝鲜语音输入到“一旦用了就离不开”,其原因在于超高语音识别率,特别是讯飞输入法通用语音识别率高达98%。得益于科大讯飞创新研发的“记忆增强的多通道全端到端语音识别框架”,简单来说就是能够完全将前端语音处理过程深度学习化,并使用深度卷积神经网络和后端识别模型进行混合训练,大大提高语音识别效果。即使小声说话也能精准识别,噪声等诸多不确定复杂场景,依然能够保持超高识别率,极大拓展了语音输入的外延。
黑科技二:支持23种方言输入和9种外语与中文互译
在普通话语音输入的基础上,讯飞输入法洞察用户需求,率先推出方言语音输入,支持粤语、四川话、东北话、闽南语等23种方言,用最熟悉的家乡话就能快速打字,惠及更多地域用户,这不单单是依靠大数据,更少不了硬核的方言识别技术。
值得一提的是,在中文输入之外,讯飞输入法还支持英、日、韩、俄等多国语言输入,将手机输入效率进化到一个新的层次。面向极富有挑战的中英混输场景,讯飞输入法采用Code-Switching 方案,使混合输入识别率大幅提升。
这一方面要靠通过多方言共享方式训练的Multi-lingual多语言建模技术,另一方面要靠GlobalPhone全球音素集,这项技术从声学层面的相似性来统一各方言的音素定义,使方言“语图谱”模型进一步精进,从而使方言识别效果有效提升。
多语种互译功能则对技术提出了更大的挑战性,以中英互译为例,讯飞输入法基于对抗样本训练方法提出融合副语言特征的“高鲁棒性语音翻译技术”,并在模型中结合特定技术,有效提高了最终翻译结果。无论快捷翻译、随声译、面对面翻译以及文字扫描翻译,覆盖诸多场景,并支持9种外语与中文互译。从现在开始,外语沟通,从未如此简单!
黑科技三:无论是拼音输入还是手写输入,都能做到一气呵成
随着产品更新迭代,讯飞输入法的拼音输入也焕发新的活力。凭借新一代拼音识别引擎和大数据A.I.算法,重点优化词与词的关系网络,使得输入结果与你“心有灵犀”。
作为行业头部输入法,讯飞输入法内置百万词库实时更新,拥有超高候选词首选率,再复杂的专业词汇也能快速匹配。在个性化输入上,讯飞输入法内置强大的智能纠错能力,减少错拼、误触现象。此外,基于对未来“智慧输入”场景的预判,讯飞输入法通过海量行为数据训练优化拼音模型,进一步提升智能纠错、中英混输、上下文联想的能力。
手写是当前主流输入方式之一,更是一种文化传承,因此拥有一批拥趸者。为了提升手写输入效率,讯飞输入法基于空间注意力机制的端到端思想,独家打造出超强OCR识别引擎,支持两万多类中文字符、52类英文字符、10类阿拉伯数字以及100多种特殊符号,也就是说行书、草书、生僻字、数字符号一气呵成,让手写写出“愉悦感”。
黑科技四: 升级OCR引擎 新一代扫描输入神器
在效率输入方面,讯飞输入法为行业做好了表率。研发的文字扫描功能,无论图片、书籍、手写体,都能轻松转成电子档。