2023深圳高交会-第二十五届中国国际高新技术成果交易会:展馆9个,面积12万多平米,时间2023.11.15-19(5天),专业观众15多万人次!
深圳高交会
联系我们

互联网的下一幕-人工智能

发布于:2016-09-01 12:12来源:www.gaojiaohui.net作者:编辑部
今天上午,百度世界大会在北京召开。李彦宏在大会上指出,互联网的发展已经不能靠人口红利来驱动了,中国经济进入新常态,互联网的下一幕将是人工智能。作为百度人工智能布局的重要组成部门,百度大脑的概念在三年前被提出。李彦宏透露,当时的百度大脑具有三岁孩子的智力水平。
 
  李彦宏还表示,百度大脑具有强大的语音能力、图像能力、自然语言处理能力、用户画像能力。未来将会有更多的应用场景,可以与各行各业相结合。
 
  以下为李彦宏演讲实录:
 
  当中国的7亿网民都用上智能手机,互联网的发展已经不能靠人口红利来驱动了。当前,中国进入到经济的新常态,国家也提倡互联网+,实际上是希望我们用互联网的效率来推动行业的发展。整个中国的经济增长需要依靠互联网,但是互联网的增长却遇到了瓶颈,过去粗放式的野蛮增长没有了。
 
  互联网的下一幕,就是人工智能。过去五六年,百度对人工智能的技术投入非常大。人工智能对百度意味着什么?就是“百度大脑”。三年前,百度就讲过“百度大脑”这个概念。那个时候的百度大脑已经具备了大概两三岁孩子的智力水平。
 
  今天的百度大脑相当于多少岁的人脑呢?回答这个问题还蛮难的。百度大脑和人脑的正常发育过程很不一样。百度大脑包括三个部分:1, 计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;2, 计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群;3, 数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据。

 
  百度大脑的语音识别能力如何?百度大脑的语音识别现在已经到了第二代,使用深度学习的技术进行语音识别。百度语音识别的准确率能够达到97%,已经超过了人对语音的识别能力。这样的能力到底可以在什么地方帮助到我们?例如,很多公司都有自己的电话销售部门,这个行业人员流动性很大,而销售人员需要长时间培训才能上岗。即使是经过培训,甚至有一定经验的销售人员,每个人销售效率也是参差不齐的。但是通过百度语音识别能力,一个新的销售上岗的第一天,就可能掌握他所获得的那些最优秀的销售的能力:新销售打电话给潜在客户的时候,客户每说一句话,客户每问一个问题,百度大脑都实时地识别了它的问题,并且显示在销售的电脑的屏幕上,屏幕上不仅实时展示了客户的问题,而且实时地把最优秀的销售是怎么回答这个客户的问题也展示在这个屏幕上。这样,新的销售的工作就简单多了,其实他基本上可以照着屏幕念,就能够达到最优秀的销售的话术的水平。

 
  语音识别还有很多应用场景,大家可以根据自己的行业背景去想象。百度大脑的能力主要有四个方面,它们最能够突出表现当今世界人工智能最热、最核心、最强大的能力:第一,语音的能力。包括语音识别能力和语音合成能力。第二,图像的能力。图像能力指的是看到一个图片,不仅看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。第三,自然语言处理能力。自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。第四,用户画像。用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

 

  百度大脑具有另一种语言能力--语音合成能力。基于大数据与深度学习技术优势,百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声,为用户带来更自然、更接近真人朗读的听觉体验。目前,百度每天响应的语音合成的请求达到了2.5亿次。在情感语音合成技术上线后,用语音听小说的百度用户从过去平均每天听0.69小时,增长到现在的2.21小时。语音合成的能力对用户的App使用黏性的提升是非常显著的。今天的语音合成可以根据个人需求进行定制,形成自然发声的能力,模拟任何一个你喜欢的人的说话方式。百度地图中有一个李彦宏导航语音包,其实就是根据他日常的语音合成的。以张国荣在影视、电台等留存下来的原声进行建模,通过情感语音合成技术实现与粉丝的“隔空对话”。实际上,任何一个人只要用30分钟按照要求录制50句话,就可以用百度大脑的语音合成技术模拟出来这个人的声音。人人都可以拥有自己的声音模型。

 
  人脸识别是如何实现的?从技术的角度讲,它是通过对人脸特征的关键点的提取,找到了其中最不一样的地方,构成了一个面部的表情。当一个人表情发生变化的时候,他的表情特征并不会发生改变。除了人脸识别之外,百度在其他场景中也经常会遇到图像识别需求。例如,百度的图像智能识别技术就帮助百度地图打破传统数据采集模式,实现了外业单人全景图像采集,使生产效率大幅提升。利用深度学习技术,采集设备可自动识别道路特征、提取建筑轮廓并绘制形状、识别道路图形标牌、电子眼、警示牌。图像智能识别技术能精准识别店铺名称、门牌号、停车场标识,甚至营业时间。当前,百度地图的全流程数据生产自动化程度已超过80%,全景图像的自动化识别提取准确率高达95%。百度地图与图像智能识别技术的结合,让数据无限逼近现实世界。
 
 
收缩
  • 服务热线

  • 15013426855
回到顶部

深圳高交会

 

 

互联网的下一幕-人工智能

 

今天上午,百度世界大会在北京召开。李彦宏在大会上指出,互联网的发展已经不能靠人口红利来驱动了,中国经济进入新常态,互联网的下一幕将是人工智能。作为百度人工智能布局的重要组成部门,百度大脑的概念在三年前被提出。李彦宏透露,当时的百度大脑具有三岁孩子的智力水平。
 
  李彦宏还表示,百度大脑具有强大的语音能力、图像能力、自然语言处理能力、用户画像能力。未来将会有更多的应用场景,可以与各行各业相结合。
 
  以下为李彦宏演讲实录:
 
  当中国的7亿网民都用上智能手机,互联网的发展已经不能靠人口红利来驱动了。当前,中国进入到经济的新常态,国家也提倡互联网+,实际上是希望我们用互联网的效率来推动行业的发展。整个中国的经济增长需要依靠互联网,但是互联网的增长却遇到了瓶颈,过去粗放式的野蛮增长没有了。
 
  互联网的下一幕,就是人工智能。过去五六年,百度对人工智能的技术投入非常大。人工智能对百度意味着什么?就是“百度大脑”。三年前,百度就讲过“百度大脑”这个概念。那个时候的百度大脑已经具备了大概两三岁孩子的智力水平。
 
  今天的百度大脑相当于多少岁的人脑呢?回答这个问题还蛮难的。百度大脑和人脑的正常发育过程很不一样。百度大脑包括三个部分:1, 计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;2, 计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群;3, 数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据。

 
  百度大脑的语音识别能力如何?百度大脑的语音识别现在已经到了第二代,使用深度学习的技术进行语音识别。百度语音识别的准确率能够达到97%,已经超过了人对语音的识别能力。这样的能力到底可以在什么地方帮助到我们?例如,很多公司都有自己的电话销售部门,这个行业人员流动性很大,而销售人员需要长时间培训才能上岗。即使是经过培训,甚至有一定经验的销售人员,每个人销售效率也是参差不齐的。但是通过百度语音识别能力,一个新的销售上岗的第一天,就可能掌握他所获得的那些最优秀的销售的能力:新销售打电话给潜在客户的时候,客户每说一句话,客户每问一个问题,百度大脑都实时地识别了它的问题,并且显示在销售的电脑的屏幕上,屏幕上不仅实时展示了客户的问题,而且实时地把最优秀的销售是怎么回答这个客户的问题也展示在这个屏幕上。这样,新的销售的工作就简单多了,其实他基本上可以照着屏幕念,就能够达到最优秀的销售的话术的水平。

 
  语音识别还有很多应用场景,大家可以根据自己的行业背景去想象。百度大脑的能力主要有四个方面,它们最能够突出表现当今世界人工智能最热、最核心、最强大的能力:第一,语音的能力。包括语音识别能力和语音合成能力。第二,图像的能力。图像能力指的是看到一个图片,不仅看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。第三,自然语言处理能力。自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。第四,用户画像。用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

 

  百度大脑具有另一种语言能力--语音合成能力。基于大数据与深度学习技术优势,百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声,为用户带来更自然、更接近真人朗读的听觉体验。目前,百度每天响应的语音合成的请求达到了2.5亿次。在情感语音合成技术上线后,用语音听小说的百度用户从过去平均每天听0.69小时,增长到现在的2.21小时。语音合成的能力对用户的App使用黏性的提升是非常显著的。今天的语音合成可以根据个人需求进行定制,形成自然发声的能力,模拟任何一个你喜欢的人的说话方式。百度地图中有一个李彦宏导航语音包,其实就是根据他日常的语音合成的。以张国荣在影视、电台等留存下来的原声进行建模,通过情感语音合成技术实现与粉丝的“隔空对话”。实际上,任何一个人只要用30分钟按照要求录制50句话,就可以用百度大脑的语音合成技术模拟出来这个人的声音。人人都可以拥有自己的声音模型。

 
  人脸识别是如何实现的?从技术的角度讲,它是通过对人脸特征的关键点的提取,找到了其中最不一样的地方,构成了一个面部的表情。当一个人表情发生变化的时候,他的表情特征并不会发生改变。除了人脸识别之外,百度在其他场景中也经常会遇到图像识别需求。例如,百度的图像智能识别技术就帮助百度地图打破传统数据采集模式,实现了外业单人全景图像采集,使生产效率大幅提升。利用深度学习技术,采集设备可自动识别道路特征、提取建筑轮廓并绘制形状、识别道路图形标牌、电子眼、警示牌。图像智能识别技术能精准识别店铺名称、门牌号、停车场标识,甚至营业时间。当前,百度地图的全流程数据生产自动化程度已超过80%,全景图像的自动化识别提取准确率高达95%。百度地图与图像智能识别技术的结合,让数据无限逼近现实世界。
 
 
热线:400-600-2281 深圳高交会 深圳会展中心

 

高交会