科大讯飞副总裁章继东表示:“过去十年里,讯飞输入法秉持着技术顶天,引领语音交互落地的理念,不断革新产品,努力让让亿万用户高效输入,乐享沟通。下一个十年,随着5G和AIoT时代的到来,讯飞输入法将继续以过硬的技术实力直面行业发展的挑战与机遇,不断提高语音输入的行业天花板。“
技术顶天,引领语音交互落地
作为科大讯飞智能语音技术的典型应用,2010年诞生以来,讯飞输入法围绕提升输入效率这一核心目标,发力核心技术攻关,完善输入法的用户体验。
活动现场,章继东分享了过去十年讯飞输入法技术发展:2010年,讯飞输入法1.0版本将隐马尔可夫模型成功应用于语音识别系统中,让输入效率提升了3倍;2012年,讯飞输入法率先将深度神经网络DNN技术应用于语音识别,使识别效果达到业界领先水平; 2018年推出了Hybrid CNN语音识别引擎,大幅提升中英混合输入效果……在A.I.驱动和大数据积累下,讯飞输入法实现了从单一识别率提升到全场景输入覆盖的迭代。
截至目前,讯飞输入法的日语音交互次数超过10亿次,语音输入累计服务设备超过5亿台,语音用户占比超过70%,在市场中证明了其核心技术竞争力。
让技术更有温度
在大多数人眼里,语音输入仅仅是一个产品功能或者一种输入方式,其实语音输入还搭建起一座座通往无国界、无地域、无障碍的“桥梁”。
2017年,讯飞输入法发起“方言保护计划”公益行动,通过智能语音技术保护方言,短短几个月超过80万人参与;截至目前,方言库的珍贵语料近140万条,并通过A.I.语言复制实现23种方言识别。目前,讯飞输入法是持方言识别最多的输入法。
今年疫情爆发期间,讯飞输入法更是紧急上线“武汉话转普通话”功能,强力助力武汉抗疫,成为战疫语言服务团的“王牌应用”。
此外,讯飞输入法还连续3年发起“和我一起看见”信息无障碍公益行动,将业界领先的A.I.技术应用到无障碍模式上,依托无障碍语音输入、表情输入等丰富功能,讯飞输入法铺设了通向互联网世界的“盲道”,满足1700多万视障群体对无障碍输入个性化、多元化的功能需求,让视障群体可以在不同场景下都能快速、顺畅地使用。
活动现场,讯飞输入法还获得了中国盲人协会颁发的无障碍认证证书,成为首款通过中国盲人协会认证的输入法产品。
182字准确识别仅用时17.81秒
沙龙现场,中文普通话最快语速吉尼斯世界纪录保持者方清平用讯飞输入法快语速输入挑战《木兰辞》。根据现场公证员公布的数据,方清平用17.81秒时间读出182字。在观众几乎听不清的语速下,讯飞输入法准确无误识别出来并自动添加标点。根据方清平现场挑战记录看,讯飞输入法做到1分钟识别613个字,并且识别准确率达到100%。
其后,科大讯飞消费者BG副总裁严亚路为方清平颁发了讯飞输入法快语速体验官的认证证书。
这一挑战也展现极限语速条件下,讯飞输入法真正做到了说的有多快,识别就有多快的效果。一直以来,讯飞输入法希望借助背后强大的A.I.技术力量,为广大用户解决各种复杂场景下的输入需求,让每一个人都能高效输入,乐享沟通。
讯飞输入法10.0:更快更强大
活动现场,科大讯飞输入法业务部总经理程坤还为大家展示了讯飞输入法最新发布的10.0版本。这一版本搭载了“动态自适应编解码语音识别引擎”,令通用语音识别率在98%基础上再获重大突破。新增的唇形辅助输入,提高嘈杂环境及近距离多人说话的识别效果。
另一方面是大幅优化领域词的识别,最直观的感受是,输入法会帮你更精准的匹配游戏、医疗、旅游、购物等不同的场景词汇,更懂你的表达。
“输入效率并不是终点,效率之上,输入法作为大众款产品更应满足多样化的表达,适应复杂的输入环境,”程坤补充道。
除了语音功能边界的拓展,讯飞输入法10.0版本还基于“免切换”的理念,首家实现英文单词连续手写,即在输入面板既可以手写汉字也可以直接手写完整的英文单词。至此,讯飞输入法已实现语音、拼音、手写多种方式的中英文输入免切换。
下一个十年
新十年,讯飞输入法将目光投向5G和AIoT领域,在讯飞看来,未来的输入法不仅仅是文字、表情、符号的输入工具,而是提供应用于各种设备终端、全链条交互的智能服务。
“十年磨剑,再赴征程”,讯飞输入法将凭借顶天的技术持续引领产品创新,同时也在不断探索更前沿、更创新的输入,通过A.I持续赋能为用户带来更多价值。