首页 >民生图片

第四波人工智能浪潮科大讯飞从赋能行业走向

2018-09-08 17:05:47 | 来源: 民生图片

第四波人工智能浪潮 科大讯飞从赋能行业走向消费者

当前,人工智能正以前所未有的速度引领科技浪潮。除了颠覆行业,已经有越来越多的产品结合人工智能,集成了机器学习、计算机视觉、自然语言、语音识别等前沿科技。科大讯飞作为首批国家四大人工智能创新平台之一,不断赋能行业同时逐步走向消费者。技术顶天,掌握源头核心技术并处于全球领先;应用落地,让技术转化为大众切实可感受的产品。这是讯飞的价值观坚守。如今,其AI核心技术开始深入各产业路径,向核心节点迈进。

科大讯飞准备如何跟消费者走得更近呢?11月15日,科技部公布了首批国家人工智能开放创新平台名单,科大讯飞与BAT一同成为AI四支国家队,再一次确认了其在语音人工智能平台上的霸主地位;11月22日早盘,科大讯飞市值突破千亿大关。这似乎达成了科大讯飞的小目标。

作为BATI一个层级的企业以及看涨的股价,都让讯飞从幕后走向了舆论的聚光灯下。不可避免的,科大讯飞受到舆论的关注和压力。在一些人看来,与高市值相比,科大讯飞强于技术、规模够大,但速度太慢。讯飞也注意到了这个问题,但讯飞的看法是,如果要做出改变,不是要离钱更近,而是要离消费者更近,要通过科技创新成为行业生态的核心节点。今年胡郁代表讯飞在外多次分享,除了介绍讯飞在人工智能上的思考以外,发言重点绕不开两个关键词科技创新,消费者业务。

关于商业模式上的思考,胡郁在今年的一次公开演讲里说了这么一番话,很耐人寻味,他说,一个公司能够赚到多少钱,跟你的努力程度有关系,但跟你公司在整个商业系统中的位置有绝对的关系。只有成为商业生态系统中的核心节点 (Keystone),整合各种资源并带动整个系统的发展,实现共赢,才能够成为真正伟大而有影响力的公司。

在这一场呈现加速发展的人工智能浪潮中,聚焦点落在个体,关注到消费者,说明胡郁正在考虑如何优化讯飞的商业结构,特别是打通通向最终消费群体这条通路。而这条路,是一个科技创新型企业的必经之路。

看看几十年前的英特尔和微软

第四波人工智能浪潮科大讯飞从赋能行业走向

,最初都只是围绕为IBM提供技术的幕后角色。但真正成就两家公司的,则是它们积极的推广普通消费者可以认知并感受到的业务后,也就是我们熟悉的intel inside和Win95。

这对今天的中国科技企业同样具有启发,在中国大市场环境里,想做一个永远在幕后、纯而又纯、美而又美的科技创新性企业(就像讯飞)实在是太难了。因为有时候你要开拓的市场里你就是绝对的前沿,只有你自己才能理解如何把科技创新变成商业价值。

再看看苹谷微,目前至少在中文语音的人工智能技术上,这三家都不如科大讯飞,这是业内公认的。但不同的是,它们业务都离消费者更近,也有强大的赚钱能力和品牌号召力。讯飞的强势在哪?行业应用上的不断拓展,在前沿探索方面屡获佳绩。我们今天在中国使用的几乎所有语音技术也基于讯飞的赋能,比如国家教育系统里的语音评测,几乎陪伴每个人的高德地图里明星语音导航也源于讯飞的语音合成技术。这就是讯飞的底气,但现在的讯飞显然意识到仅仅靠技术支持来开展业务还是不够的,它要离消费者更近,要自己或通过行业赋能,直接地为消费者输出价值。

众所周知,讯飞已经是语音识别和人工智能方面的老大,但要进军消费级市场就一定能成功?不妨看看刚刚成立一年的讯飞消费者事业群。

2016年底,讯飞面向消费者推出了讯飞晓译翻译机,讯飞万物互联输入法,讯飞家庭智能盒子超脑魔盒、讯飞飞鱼助理等一系列产品。到了2017年,消费者事业群进行了更深层次的商业逻辑梳理,用四大场景的说法,升级了以前的单品策略。

未来是属于会主动思考从而更懂每个用户的终端产品,胡郁最近在世界互联大会上说到。而这一切需要基于一个核心的人机交互系统AIUI。虽然还不是一个响当当的名字,但已经在基础语音语种识别基础上支持主动式对话、语种自适应、多模态交互、个性化识别等进阶能力,这些能力决定了当消费者与机器对话时,你的体验能够有多好,也将赋能翻译、移动、车载、家庭四大场景。

京东上,讯飞晓译翻译机产品的评价数已超过6300条,满意度98%,远超过其他产品。在今年11月刚推出了晓译翻译机1.0+的升级版。很多人都觉得奇怪,为什么用智能可以实现的功能,要单做一个产品。其实,这就是典型的消费电子的产品逻辑,在面对典型、刚性的需求上,只要用户体验够好,专用产品比通用产品能够更深地切入市场,也能更快地进行针对性的迭代。

与智能音箱类产品不同,翻译产品需要解决的是能否快速翻译?翻译效果是否准确?翻译后的语句朗读是否足够本地化?这更偏向于智能语音综合能力的集成创新,对源头语音的识别和理解,乃至合成语音的专业考验。而从2011年开始,第一个将神经络技术应用于智能语音领域、积累智能语音的有效大数据的讯飞而言,显然是有备而来。除了做到利用源头创新技术实现多场景识别,1.0+的讯飞晓译翻译机实现了离线翻译、多语言、一键求助,满足用户在络不佳、场景变化下的个性化需求。一键求助能够在3秒内和紧密联系人或讯飞客服中心相连接,从而获得帮助。

又比如移动场景,市面上几乎所有支持中文语音输入的输入法,后台上基本都是讯飞技术支持。目前讯飞输入法已经拥有5亿用户,1.2亿月活,98%通用场景准确率。但有一个问题,就是在中文语音输入肯定会面对同音字的问题,加上一些标点符号或特殊字词的问题,我们常常要手动去语音输入的词句,大大降低了语音输入的效率。这也成了讯飞的产品经理聚焦用户体验后发现的又一个突破口。于是讯飞输入法诞生了一种叫『语音智适应』的黑科技,它基于用户对识别结果的修正,即时优化用户个性化语言模型,一次修改后,输入法就能记住你的输入习惯,进行自动矫正。

猜你喜欢