手机AI战场,三星GalaxyS9的Bixby视觉如何实现降维攻击?
2018-05-18 17:15:36
  • 0
  • 1
  • 2

文/王新喜

据市场研究公司Canalys发布的一份新的报告显示,在2018年第一季度,中国智能手机销量从去年同期的1.14亿部狂减了21%,减少到了9100万部。随着智能手机整体陷入颓势,手机厂商将AI能力作为手机迭代创新、增强用户体验、驱动用户换机的关键点,越来越多的厂商在发布新机的时候,都会围绕着智能AI的卖点侃侃而谈,AI正在成为手机的标配。

都在玩AI概念,但AI的能力不仅仅体现在拍照

但是当下许多国产手机厂商的AI能力更多停留在拍照层面的优化,比如华为Mate10、荣耀V10以及iPhone X的AI摄影能力体现在识别、动作捕捉、光影分析、AR以及美颜等多个方面。

比如美图手机、红米Note5,小米Mix2S等厂商主打“AI摄影”与美颜的卖点,但在这背后,由于仅仅搭载了基于算法的“AI应用”或者“AI滤镜”,缺少了硬件底层的AI芯片的支持,更多只是实现了普通的美颜算法的功能。有业内人士一针见血的指出,这些能力说白了可以下载一个拍照APP就能实现,和曾经流行的很多概念或技术一样,对有些厂商而言,AI不过是另一个华丽的营销包装罢了。

三星Bixby站在更高维度上 视觉识别实现差异化破局

而语音助手则是各厂商将AI技术落地的关键形态。目前无论是亚马逊的Alexa、微软Cortana、苹果Siri等,互联网巨头推出的AI智能助理都主打的是语音识别。虽然语音识别是主流,但其中各厂商表现差别巨大。其中,苹果的Siri语音技术表现已经落后于其他几家巨头。针对Siri在苹果HomePod语音识别表现。Loup Ventures曾做了一项测试,共询问了782个问题,HomePod只答对了52.3%,在整个测试中排名倒数第一。Thinknum分析师约书亚·弗洛林格指出,Siri被认为落后于亚马逊的Alexa、谷歌的Google Assistant和微软的Cortana“已经不是什么秘密”。

而从众多国产手机的“AI助理”来看,基本可以实现在手机上轻松帮用户实现发短信、设置闹钟、查询天气等功能,它们往往是通过接入第三方技术的语音助手来支持语音识别搜索、照片识别美化、语音拨号、开启一些系统自带应用等功能。

而反观三星,目前它不只是支持应用开启等简单语音识别,而且还支持应用内的深度、连续的应用内的语音命令。包括支持如电话,相册,时间等大部分原生应用以及微信,微博、QQ、淘宝等在内的众多第三方应用。举个例子,当我对Siri和Bixby说“打开微信给xx发个红包”或帮我扫共享单车”或“把我刚拍的照片发送到微博或朋友圈”,Siri会瞬间懵逼,而Bixby可以快速执行命令。Bixby更接近人工智能的定义——真实对话交流,有效执行人的指令,解放了人的双手。

但尽管三星AI语音识别力压群雄,三星Bixby的视觉识别能力才是其与市面上其他语音助手截然不同的最大的亮点。Bixby不仅仅包含语音识别,还包含视觉,主页,提醒等功能,可以完成语音、视觉、触摸、文本控制等多种交互方式,用户可以自由切换并且结合进行操作。

在今天,大多数厂商的AI拍照功能可以识别出是花还是景物、并对不同景物进行优化,比如说荣耀10可以自动完成取景框中各类物体的识别,可以识别出天空、植物、动物、人等不同要素。但这种识别能力更多停留在静态化的照片优化层面,没有与现实世界达成交流与互动。

而三星S9的人工智能平台Bixby当前已经做到了通过摄像头结合增强现实技术和深度学习技术,用户只需在打开Bixby视觉,用摄像头对准现实中的物品,相关信息便会迅速浮现在屏幕之上,这在目前所有的厂商中,是独一无二的功能存在。

如果说三星Bixby的视觉识别更接近真正的人工智能表现,或许就在于它这种结合增强现实技术和深度学习技术体现出来的高实用价值。三星Bixby目前主要有9种摄影模式,包括文字、美食、美颜、购物、图片搜索、二维码等,目前新增了美妆、搜题、红酒识别等功能。

也就是说,AI视觉识别可以帮助用户迅速认知周遭环境,如前所述,打开Bixby视觉,用摄像头对准想了解的对象,即能迅速显示该物品的相关信息,实现一些实用的功能包括实时翻译、货币汇率换算、美妆、识别红酒等商品的价格与品牌等,也可以进行视觉识别购物。即用户可以通过Bixby视觉识别与现实世界达成连接,为手机带来了更为丰富的线下应用场景扩展。

比如说,如果你在国外出差,语言不通,这时三星Bixby的实时翻译功能就可以完美解决你人在异乡的各种烦恼,包括点餐、识别路标,货币汇率换算等。比如在出国旅游或者购物过程中碰到不懂的文字,可以用摄像头扫描外文,Bixby视觉即可识别翻译进行语言的转换,并将翻译好的文字呈现屏幕中原文的位置。

目前,Bixby可识别10种语言,并将其翻译成27种外语。而通过街景的相机视窗,也可以快速定位自己所在位置。另外,如果看到一件自己喜欢的物品时,只需用Bixby扫一下便能准确判断出物品的信息和在电商售卖的价格,也可以即刻完成下单。

甚至当你拿到一份纸质文件,想要把里面的内容分享给别人或者转发到朋友圈,只需用Bixby扫一下便能将其中的文本内容提取出来进行编辑分享。

也就是说,三星Bixby不仅能通过语音交互让用户更加便捷的操控手机,还能通过摄像头来帮助用户更加高效的与世界连接,这种“看图识物”的智能化视觉识别在关键时刻的实用价值完整契合了消费者线下场景的各种消费心理与需求。在这里,摄像头相当于一双能够智能识别的眼睛,快速识别、接收现实世界的各种信息,扩展了AI的移动化应用场景。

多数厂商依赖第三方语音技术,而AI助手依赖自研有什么好处?

之所以三星能达成这种长板能力的突破,在于它将软硬件技术掌控在自己手里做到了一体化优化。我们看到,2017年手机出货量全球前十的公司以及国内的一些手机厂商,多数手机厂商采取合作的模式使用第三方的语音技术。

从之前某业内人士盘点整理的2017年全球TOP10出货手机语音助手盘点可以看出,在手机厂商的AI能力与语音助手技术来源方面,多数厂商均是依赖第三方语音技术的接入——华为小E、联想乐语音的语音技术源于科大讯飞、vivo是技术用的是百度DuerOS、LG的语音技术源自于谷歌,小米的小爱同学的语音技术用的是DuerOS/搜狗知音、猎户星座等。手机厂商唯有三星Bixby、苹果Siri在语音助手方面做到了自研。

而AI语音技术依赖自研有什么好处?其一,是技术掌控在自己手里,可以按照研发节奏与用户需求不断迭代创新。其二,可以确保软硬件更好的融合,做出差异化创新,当前三星Bixby功能的实现是Bixby人工智能平台与摄像头深度集成,针对相机的优化、硬件传感器和系统软件的多方面的调试与融合的结果。而许多厂商如果依赖第三方厂商则在技术上受制于第三方大厂,难以做到软硬件深度融合集成创新。

目前来而在AI这一轮的竞争中,三星与苹果目前是站在第一阵营的竞争维度上。但当前苹果也没有在视觉智能识别层面有动作与突破,三星抢占了该领域的话语权。

三星Bixby通过AI的视觉识别长板实现降维攻击?

综上所述,在AI战场上,三星与其他厂商所布局的AI语音助手不同的是,不仅仅是在语音智能化识别能力层面更为凸显,在视觉化识别层面也走的更深,不仅能听、能通过语音交流,而更能通过视觉、触控等方式与外界实体沟通识别,帮助用户理解它所需要的信息。

目前三星S9的Bixby视觉所实现的“会看”这一能力几乎是当前所有厂商缺失的短板,这让三星站在一个更高的技术维度上——为用户提供高效准确的执行、反馈与识别能力(Bixby语音功能)、更加数字化与实用性的虚拟现实呈现(Bixby视觉功能),更加综合的信息展现等,关键是,Bixby具备情景感知与自我学习能力——可以通过机器学习,更懂并自动适应用户,想用户之所想。三星Bixby正在逐步接近目前最人们理想中人工智能技术所应有的体验。

某种程度上,三星Bixby通过视觉识别提高了AI的门槛,从更高的维度实现降维攻击——手机厂商能有的语音识别我有而且做的更好,但视觉AI识别则是更高维度更具杀伤力的武器,它达成了人无我有独树一帜的存在。而这种技术也契合消费者快捷与世界发生连接、解决消费识别与需求痛点的能力。

面对三星Bixby视觉识别技术,手机厂商该有危机感吗?

从未来趋势来看,随着技术的发展与即将到来的5G时代,智能AI技术将会迎来一个高爆发时期,而5G时代更高的传输速率,更大的接入容量,更低的网络时延,可以为AI技术提供了更好的应用土壤,包括增强现实(AR)技术在手机上获得更好的体验,也会产生新的机会与应用场景——包括用AI来识别文字和商品、景物等能力可能给诸多手机应用带来新的机会,比如图片分类、物体识别等可以用于自媒体、社交网络和AR购物等应用操作方面。

而三星S9系列在通过AI将软硬件整合提供超出当前AI助手的用户体验来占领用户的心智,通过一个比原有体系更高维度的东西,实现对其他对手的降维。随着Bixby未来的改进与完善以及实现对更多第三方APP的覆盖支持,产生更多的使用场景,那么它未来可能将逐步在视觉识别层面建立自身的技术壁垒与护城河。

因此,对于诸多厂商而言,对于三星在AI视觉技术上的前瞻布局应该有危机感,如何在AI视觉识别层面快速跟上节奏,是当下需要思考的。

作者:王新喜 TMT资深评论人 本文未经许可谢绝转载 我的微信公众号:redianweiping

 
最新文章
相关阅读