百度大脑3.0开放110+能力,百度AI能力再升级

2018-07-05 19:42:11来源:洞察网
阅读(0)0评论

7月4日,百度AI开发者大会在北京国家会议中心隆重召开。此次大会上,百度大脑宣布升级至3.0版并还对外开放了110多项领先的AI能力。

“百度大脑3.0已经对外开放了110多项领先的AI能力。未来百度将继续研发顶尖的AI技术,同时全面赋能开发者,让每一位开发者都能平等便捷地获取AI能力。” 百度高级副总裁、AI技术平台体系总负责人王海峰在大会中提道。

百度大脑1.0完成基础能力搭建和核心技术初步开放,2.0形成了完整的技术体系,开放60多项AI核心能力,3.0的核心是“多模态深度语义理解”,同时开放110多项AI能力。

“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。多模态深度语义理解不仅能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。

看得懂世界杯“机器脑”

百度大脑的视觉语义化能力可以让机器从看清到看懂视频,并提炼出结构化语义知识。视觉语义化技术应用于世界杯视频解析,能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。基于这些语义化知识,既可以完成机器人自动解说,也可以进行精彩片段集锦、以及各种数据统计分析等。而在实际生活的超市购物场景中,百度的视觉语义化技术通过识别人物、动作、物品并关联时间序列,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助商店经营者分析和优化商店经营。

绕口令般的指令也能全然消化

语音语义一体化和自然语言理解技术能让机器准确识别并理解人说的话,实现更自然的人机对话。王海峰现场对着百度地图说出了一长串绕口令般的导航需求,百度地图语音智能助手完美识别并给出最佳路线,李彦宏开场播放的智能客服给参会者打电话的片段,其背后也是这些领先的AI技术在支撑。王海峰介绍,百度高噪声环境Hand-free语音识别准确率已提升了10个百分点;语音语义一体化技术使得远场语音识别准确率提升了10个百分点;在语音合成方面,WaveNet+拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。

百度大脑阅读量相当于6万个国家图书馆

王海峰以对话理解和阅读理解为例,为大家介绍了领先的百度自然语言理解技术。百度的对话理解技术已经积累多年,通过研发最新的深层注意力匹配模型,比已知的最好结果又提升了4.1%。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。通过持续获取和积累知识,百度大脑的理解能力不断升级,智能水平显著提升,进而能够更好地服务用户。

据悉,百度大脑每天调用次数超过4千亿次。相信未来百度将继续发力降低AI应用门槛,助力全行业早日迎来“AI时代”。

(本文来源:洞察网)

    相关标签:
来源:洞察网  编辑:李维
猜你喜欢