“双十一”来到第11年,直播风头正劲。今年“双十一”期间,淘宝直播已经成为商家标配,服饰、美妆、食品等行业商家纷纷拿起了直播工具,有人甚至戏称:现在还不开直播的店铺,就跟没有详情页一样。

  为了更好的观看体验,淘宝自主研发了全新的音视频实时通信架构,实现了大规模低延时直播,从原先5秒至7秒的延时降低至2秒以内,提升了用户和主播的互动效率,此外,人工智能技术还可以实时识别主播正在讲解的商品,陈列在直播页面中。

  没错,时代的风吹到哪,技术先行抵达。直播、短视频当道,这类“双十一”新玩法的背后,也有不断进步的AI。

  AI助手为主播分忧

  进出直播间的剁手党成千上万,分分钟形成刷屏之势,主播分身乏术。这时候,他的AI秘书就登场了。给主播打下手,提供主播问答、商品问答、优惠券问答等服务都不在话下,也就是说,你在直播间问的问题,大多都是AI助手在解答。

  AI秘书使用了自然语言理解和基于知识图谱问答等技术,能够精确解析直播间观众对于商品和主播的多种复杂表达和问法,在直播场中实现多对一沟通的高效快速响应,大比例提高直播间的客户问题的回复率、解决率。

  除了基于文字,AI客服还可以进行基于图片的智能问答。AI客服利用图片解析算法理解图片内容,结合用户的问题,自动理解和识别截取可以回答用户的图片作为回答,并高亮图片中的精确答案位置。目前,智能图片问答已经覆盖了家电数码、零食果蔬、母婴洗护等多个行业。

  方便了剁手党,卖家同样受惠于AI。“双十一”期间,卖家需要在短时间内制造大量宣传图、海报图等,图像智能生成技术就派上了用场。基于图像智能生成技术,AI设计师可以改变传统的设计模式,在短时间内完成大量横幅广告、海报图和会场图的设计。卖家只需要任意输入想达成的风格、尺寸,系统就能代替人工完成素材分析、抠图、配色等耗时耗力的设计项目,实时生成多套符合要求的设计解决方案。

  图片之外,短视频也成了标配。短视频智能设计产品基于图像智能识别技术和视频智能生成技术,帮助用户在极短时间内完成大量的商品营销类短视频的设计和制作。

  机器翻译帮助货通全球

  卖货到全世界,语言不通怎么办?“双十一”之前,机器翻译技术已经经历了升级,对话机器人可以帮助全世界中小卖家将产品详情与评论自动翻译成当地语言,还实现了实时AI语言翻译的客户服务与业务咨询,涵盖64种语言方向。当然,获取商品信息光靠看商家网页还不够,有问题找客服,海外消费者也不例外。在国内,承担客服职责的是对话机器人,这两年,它还有了国际版,专门服务海外业务平台。

  对话机器人精通英语、法语、泰语、西班牙语、阿拉伯语等11种语言,两周就能学一门新外语。基于语言之间的交叉映射关系,对机器来说,在资源匮乏的情况下,通过将多种语言混合,学习语言间的共性,反而能比学习单一语言效果更好。2017年对话机器人初次在海外落地,用6个月学会了印尼语,又用6个月在智能客服岗位上达成堪比中文机器人的解决能力,而现在,多语机器人新学一门语言的时间已经缩短到两周。

  声纹识别开启语音购元年

  今年“双十一”,语音购物千呼万唤始出来:消费者只要说出想要购买的商品,就能直接下单;如果开通了“声纹支付”功能,还可以直接语音付款。

  “语音购元年”,听起来科技感十足,据报道,已有数百万人体验了语音购物,其中超过半数的用户是首次尝试。声纹识别技术采用基于深度网络的注意力嵌入式模型,通过网络结构的参数设计,模拟了基于人耳感知的频谱特征,可以在一定程度上消除同一人在不同场景发音下的频谱特征差异干扰,显著提升远场交互下的声纹识别性能。

  此外,今年“双十一”,消费者还可以体验AR试妆产品,AR试妆通过标准化工具拿到彩妆色号、材质等数字信息,通过AI+AR技术让用户看到同样商品在自己脸上呈现出的不同效果。通过高效实时的精准人脸识别技术,即便在人脸晃动和大角度偏转时,都能有很好的稳定性表现,以毫秒级别画出商品在用户脸上的逼真效果。新玩法背后是新技术。在屡屡刷新的成交额、令人瞠目的商业数字之外,不断突破的技术正贴地而行。(记者 崔爽)