专访|王小川:人工智能助力媒体交融

来源:深圳商报 2018年09月10日 10:58

读创/深圳商报记者陈姝

△王小川(图片由搜狗供给)

“构建全媒体传达格式”是“2018媒体交融开展论坛”的主题。怎么进一步加速传统媒体和新式媒体交融开展,充分运用新技能新运用立异媒体传达方法,占据信息传达制高点?在论坛举办前夕,搜狗CEO王小川承受读创专访时表明,媒体的交融是渠道和内容“双打通”,受众无障碍获取资讯。搜狗近年来深耕人工智能等范畴,环绕天然交互、常识核算两大方向布局,在输入法语音辨认、虚拟主播、软硬件翻译等方面已取得打破性开展。

媒体交融是渠道和内容的打通

王小川以为,媒体的交融包含渠道的打通以及内容的打通,受众不再受介质的影响,无障碍获取资讯。

首要是在汗牛充栋的信息中,协助渠道的运用者快速找到所需信息。作为查找引擎公司,搜狗现已在为知乎、今天头条等渠道供给站内查找效劳;

第二,经过技能让语音、图画、视频等内容也可以转化成言语,打破介质的屏障。他说,人工智能技能可以让语音-言语、图画-言语、视频-言语、言语-不同言语之间完结无障碍的变换。搜狗输入法语音辨认、图画辨认、唇语辨认、虚拟主播、机器同传、软硬件翻译产品,可以协助媒体打破方式的限制;

第三,提高各渠道媒体作业者的作业功率。一方面,经过底层技能协助媒体完结速记等,如搜狗推出的搜狗录音翻译笔,可以协助记者做录音转写和同传,把记者从收拾速记和翻译的事务性作业中解放出来;另一方面,协助用户挑选有全球价值的信息,搜狗查找独有的微信查找、知乎查找、英文查找、学术查找都是媒体作业者的好帮手。

环绕两大方向布局人工智能

2018年的《政府作业陈述》提出,“加强新一代人工智能研制运用”“开展智能工业”。结合本身才能特色,搜狗现已建立起“以言语为中心”的人工智能战略,环绕天然交互、常识核算两大方向布局事务。

在产品上,搜狗现已有问答、对话、翻译、语音四类AI产品。查找和输入法作为搜狗的两大中心事务,在AI技能立异的加持下,经过数据和技能不断提高产品体会,拓深护城河,也带给了职业新的思路。据艾瑞咨询陈述显现,搜狗查找以17.8%的移动查找比例,稳居我国第二大查找引擎。搜狗手机输入规律继续稳居国内以DAU计的第三大手机运用,日活泼用户超3.8亿,同比添加36%。

在技能层面,搜狗近期斩获了多项国内外AI赛事榜首,包含国内尖端NLP职业会议NLPCC竞赛单元语义了解竞赛冠军;在语音组成范畴最具权威性、广泛性的世界评测竞赛BlizzardChallenge大赛中取得可懂度和语音中止两项子使命榜首;搜狗的视觉研讨团队还取得了CVPRWAD2018挑战赛冠军。

在运用层面,搜狗医疗查找频道搜狗明医具有智能自诊功用,创始了根据人工智能技能的智能确诊帮手,模仿医师与患者对话的形式,与用户进行更天然、更智能的病况交流。现在,其支撑的可确诊症状品种较2018年一季度添加两倍,现已掩盖用户症状查询的90%以上。在翻译范畴,本年上半年,搜狗先后推出了搜狗游览翻译宝和搜狗录音翻译笔两款AI翻译硬件,这也是搜狗AI有用化落地的重要的一步。

“虚拟主播”运用场景广泛

本年7月11日,在香港RISE科技峰会上,王小川就曾现场展现了全球首个虚拟主播。搜狗运用央视主播姚雪松1.5小时的音视频数据,结合语音、图画等多模态信息进行联合建模练习,输入一段RISE大会的文字稿,就快速猜测生成了与真人无异的播报作用,看起来就好像姚雪松自己亲临现场进行播报。

王小川表明,虚拟主播的推出源自搜狗在言语范畴的堆集与才能。该技能结合了人脸辨认、人脸建模、语音组成以及深度学习等多项前沿技能,能将恣意文本转化为相应的唇语,为用户供给多模态的交互体会并具有高度的可定制性。虚拟主播在技能上的完结意味着AI走向了音视频的富媒体表达,改写了AI的鸿沟。现在,搜狗的语音辨认(ASR)现在准确率已超98%,日均语音输入调用次数峰值达4亿次;唇语辨认(Lip-readingrecognition)在笔直运用范畴中的准确率超90%;语音组成(TTS)支撑23种音色、个性化组成以及情感搬迁、唇语组成等。

他说,搜狗虚拟主播的运用场景十分广泛。首要可以用于内容出产职业,教育职业。如运用到教育职业,虚拟主播可以成为脾气很好的教师,诲人不倦地一遍一遍协助用户进行发音口型辅导。跟着交互性的增强,虚拟主播未来还可以协助效劳职业更好地进行用户效劳,代替部分重复性的效劳作业,如银行的柜员,经常会重复相同的流程,虚拟形象可以代替人完结系列效劳。虚拟主播未来也可以开展成为带屏智能音箱上的虚拟私家助理,用户可以从单纯与声响的交互变成与一个传神的虚拟人物的交互。

自研录音翻译笔支撑33种言语

搜狗的翻译技能和语音技能现在在业界抢先,王小川称,公司也一直在不断优化相关产品,然后协助媒体作业者提高作业功率。

翻译方面,搜狗具有全球首创的神经网络机器翻译技能,可以确保整个翻译决议计划进程的连续性,使得翻译出的语句在流通度上更优异。一起,搜狗在“世界学术赛事WMT2017”中,取得人工点评目标的双向榜首名,中英机器翻译全球榜首,而且取得首要机器目标BLEU榜首名。

语音方面,搜狗的语音辨认技能实力继续坚持业界抢先。作为国内语音输入量排名榜首的公司,搜狗用户每日语音输入恳求量峰值达4亿次,每日发生语料规划24万小时,为搜狗语音研制供给了很多的实在语料数据;一起搜狗本身在深度学习方面具有雄厚的技能堆集。

结合两项技能优势,搜狗自研了“搜狗录音翻译笔产品”,协助媒体朋友、学生完结语音转写的繁复作业。现在,该产品实时转写的辨认准确率在一米范围内已逾越90%,3秒极速上屏,最快可支撑400字/分钟的高速辨认,翻译准确率则逾越90%,其水平缓功率远远逾越了人类。搜狗录音翻译笔还支撑包含中、英、日等33种言语的同传互译,能完全替代传统录音笔。跟着AI技能的前进,在辨认准确性和翻译的信达雅方面,产品还将不断提高,使其愈加有用、易用。

相关推荐
最新文章