李彦宏讲解百度大脑:四个方面功能实现人工智能(转载)
author:一佰互联 2019-05-26   click:232

2016百度世界大会9月1日在北京开幕,百度公司董事长兼CEO李彦宏在会上发表演讲。李彦宏在演讲中详细介绍了百度大脑,百度大脑的能力主要有四个方面,它们最能够突出表现当今世界人工智能最热、最核心、最强大的能力。

据悉,百度大脑包括第一,语音的能力。包括语音识别能力和语音合成能力。

第二,图像的能力。图像能力指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。

第三,自然语言处理能力。自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。

第四,用户画像。用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

在谈到百度大脑的语音识别能力如何时候,李彦宏介绍到,百度大脑的语音识别现在已经到了第二代,使用深度学习的技术进行语音识别。百度语音识别的准确率能够达到97%,已经超过了人对语音的识别能力。

李彦宏在会上也同样介绍了百度大脑的另一种语音能力——语音合成。他是基于大数据与深度学习技术优势,百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声,为用户带来更自然、更接近真人朗读的听觉体验。目前,百度每天响应的语音合成的请求达到了2.5亿次。在情感语音合成技术上线后,用语音听小说的百度用户从过去平均每天听0.69小时,增长到现在的2.21小时。语音合成的能力对用户的App使用黏性的提升是非常显著的。

李彦宏指出,今天的语音合成可以根据个人需求进行定制,形成自然发声的能力,模拟任何一个你喜欢的人的说话方式。李彦宏透露,百度地图中有一个李彦宏导航语音包,其实就是根据他日常的语音合成的。

人脸识别是如何实现的?从技术的角度讲,它是通过对人脸特征的关键点的提取,找到了其中最不一样的地方,构成了一个面部的表情http://news.dichan.sina.com.cn/2016/09/01/1213962.html。当一个人表情发生变化的时候,他的表情特征并不会发生改变。除了人脸识别之外,百度在其他场景中也经常会遇到图像识别需求。

例如,百度的图像智能识别技术就帮助百度地图打破传统数据采集模式,实现了外业单人全景图像采集,使生产效率大幅提升。利用深度学习技术,采集设备可自动识别道路特征、提取建筑轮廓并绘制形状、识别道路图形标牌、电子眼、警示牌。图像智能识别技术能精准识别店铺名称、门牌号、停车场标识,甚至营业时间。

当前,百度地图的全流程数据生产自动化程度已超过80%,全景图像的自动化识别提取准确率高达95%。百度地图与图像智能识别技术的结合,让数据无限逼近现实世界。