商业演讲稿——2010百度世界大会李彦宏演讲稿
各位来宾、各位合作伙伴和媒体的朋友大家上午好!欢迎来到2010百度世界大会。我想来到这样一个会场,很多人都非常容易想起一年前的百度世界大会。在一年前,百度首次对外公布了有关框计算的理念和畅想。如果说一年前的框计算推出的时候还只是一个理念,是一个畅想,甚至给人一点科幻的味道,今天我们的框计算已经迈出了结结实实的一大步。我想利用这个机会给大家展示和汇报一下框计算在过去一年中所取得的进展。
首先我们来看一下框计算的技术架构,这张图也是我去年给大家展示过的,从去年到今年整个的架构是没有任何的变化的,用户有各种各样的需求,通过一个简单的框进入到框计算的体系当中。在框计算的另外一段我们通过一些开放的接口让各种各样的应用、内容、数据很容易地提交上来,中间这一部分我们称之为需求分析。这里面的技术含量是非常高的,它包括了语义的分析、行为的分析、智能的人机交互和海量的计算。这个事情为什么很难呢?因为人的表达方式是多种多样的,它表达出来的用词、用语和实际的需求通常是有差距的。而计算在这方面通常是比较少的,一般来说既使是你表达清楚了它也不能真正地理解清楚。所以要把用户的需求精确地翻译成机器所需要的应用,这里面所需要做的工作是非常多的。
举一个例子,比如说行为分析,就是根据用户在百度或者说在其他的网站上的使用行为记录了他大量的点击行为,每一个用户从进来到出去或者到需求满足所做的每一个动作在统计意义上进行分析,通过机器学习的手法提升下一次同类型满足的程度,甚至是个性化的程度。仅仅机器学习的系统,就是一个非常高科技的系统。我们需要针对上十亿的特征进行训练,这块的开发花了很多的精力。语义分析搞人文职能的人都了解是非常难的一部分。智能的人机交互是海量的搜索引擎开始做的事情,但互联网发展到今天,搜索引擎已经是高科技领域最具技术含量的产业。所以,框计算集合了这四种技术应用才能对需求进行分析,分析之后对平台进行分发。
不管是内容、数据还是应用,通过开放的接口就可以进入到框计算的体系也可以很好地满足用户的需求,下面我给大家展示一下框计算的最新进展。这是一个比较炫的演示,大家可以看到这个框里面可以做各种各样的事情,无论是天气还是图片的欣赏等格式各样的应用。我给大家一一地解释一下。比如说有关出行的东西我们称之为框出行。大家很容易想到的就是天气如何,通过一个检索词——天气就可以得到今天、明天、后天、大后天的天气预报,非常地直观和清晰,这就是通过百度的开放平台提交的结果。这个结果是数据类型的,是相对比较确定答案的。所以我们认为没有必要让用户点击一个链接上网站上去,在这里用户的需求就得到了满足了。
大家注意到,这个检索词是“天气”两个字,那么系统怎么知道它是找北京的天气预报,怎么知道时间的呢?当用户输入关键词的时候有两个东西是缺少的、是没有输入的,一个是用户目前所在的位置,第二个是用户输入这个关键词的时间也没有输入,而这两个因素对分析用户的需求是有帮助的。我们根据用户来自的城市和用户输入关键词的时间判断出来他要的是北京市的天气预报,所以就展现出了这样的结果。换一个说法行不行呢?也是可以的。如果你输入的不是天气而是天气预报,而是今天的天气怎样,今天天气如何,今天的天气预报等等,有关用户天气方面的需求可能有好几百种的表达方式。每一种大方式代表的都是同样的需求,在这种情况下我们的需求分析需要能够搞清楚用户的表达和实际需求之间的关系,把它规划到同样的一类数据集上才能展示出同样的答案。这就是为什么数据分析的技术含量是非常高的。
过去计算机产业、计算机科学研究了很长的时间。一般来说只有在特定的数据集的情况下,才能比较准确地理解人的自然语言。而搜索引擎不是一个特定的环境,用户的需求都有不同的方式。在这种情况下传统的计算机科学认为这是无能为力的,是不能解决用户的需求的。随着框计算的诞生,虽然越来越多的人依赖我们的搜索框获得他们想要的信息和服务,在积累的大量数据的情况下,通过框计算各种各样的技术的分析,就可以很好地满足用户各种各样的需求。
除了天气之外,北京的朋友可能还面临一个问题就是出行的时候开车,不知道每天自己的车能上路哪天不能上路。有时候我听说智商低于100的人就没有必要在北京开车了。有了框计算这个东西事情就简单了很多。比如说你输入的词就是今日限行,那么就可以出现每一个时间段的限行车号,而且这个是来自于北京市交管局的,是最权威的结果。对用户来说他只要知道如何表达,只要想到要表达需求,就要迅速地得到最直接、最权威的答案。再走远一点,比如说需要坐火车、坐飞机,同样我们可以通过框计算的形式来展现给用户所需要的东西。比如说要从北京到上海去,这里我们立刻展示出了一天中全部15趟列车和票价的情况。头5趟结果就已经展示了,更多的详情通过察看连接就进入到了合作伙伴的网站,可以看到更多的结果。如果是飞机的查询还可能有智能的人机交互告诉大家要什么舱位的票,这些东西也可以在检索结果页面上轻松地完成了。
除了出行大家还有一个非常大的需求也就是娱乐。娱乐需求可以说是中国互联网最大的需求,无论是做搜索引擎还是做其他的互联网产业,例如游戏、短信、即时通讯,我们看到的用户的行为或者是用户的上网时间绝大多数都放在了娱乐这一类需求上面。这里我们给出一个例子是《新三国》,用户想看这个电视剧输入了关键词,迅速地就得到了一系列的视频展示。这是从第一集一直到第二十集,更多可以显示全部的结果,这个视频是经过百度认证的是高质量的,是有版权的。
某一个周末我突然想看这个电视剧,就真的通过这种方式进去的。我当时输入的词是“三国”,而我得到了同样的结果。再次说明用户需求的表达实际上是多种多样的,计算机或者说框计算需要能够准确地理解用户在找什么,并且以最方便的形式提供给他。当你看到了,比如说看到了第二集过两天又回去看的话,他还记得你点击到第二集,还可以知道你从什么时间接着看下去,现在这种服务都已经非常智能了。上社交网络同样是娱乐的需求,比如说大家输入开心网在结果页面就可以直接地输入自己的账户密码,可以很直接、很轻松地去用户自己想要的网站上去。(责任编辑:一枝笔写作事务所)