Google、Yahoo与baidu三大搜索引擎比较*转

Google、Yahoo与baidu三大搜索引擎比较【原创】

标签:it/科技google雅虎百度搜索引擎李开复李彦宏马云
Google、Yahoo与baidu三大搜索引擎比较
作者:凤霖
本文出自凤霖手笔,如有转载请注明出处。本文是在今年初成文,所以有些分析可能已经过时了。同时,我承认我对百度有成见,这里发表的都是个人意见。
早就想写一篇这样的文章,专门比较一下这三大搜索引擎。其实,相关的介绍,网上有很多,但纷繁紊乱,有些甚至不着边际。现在整理一下,和大家分享,希望各位予以指正。
一、简介
Google 的引擎技术是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,公司则创立于1999年,并于2004年8月在纳斯达克上市。当初,两个人并未想到能以此盈利,但今天,这个搜索引擎却已经成为了知识经济的代表,其猛虎下山的态势正引起比尔·盖茨的悔恨。
Yahoo于1994年由David Filo和Jerry Yang(也就是杨致远)创建,Yahoo是搜索引擎的鼻祖,最早推出一种“网络搜索目录式”的搜索引擎,后逐步演变成全球最大门户站点。Yahoo起先采用人工汇总加智能的第一代搜索技术,后来随着计算机速度的不断加快,才放弃人工汇总,全部采用计算机自动处理。从2000年7月份开始,Google替代Inktomi成为Yahoo公司的搜索引擎内核,应该说,这是Yahoo最大的一步败招,正是这步棋,为Google迅速崛起、良性发展提供了巨大的契机。直到2003年Yahoo才重新规划搜索引擎战略,收购Overture,放弃Google。
百度是2000年1月于北京中关村开业,启动资金来自于李彦宏、徐勇从美国硅谷拉回的120万美元风险投资。百度目前号称全球最大的中文搜索引擎。在我国的实际使用率要高于Google和Yahoo。它最早是为硅谷动力提供搜索技术服务,到2001年8月,发布搜索门户,从后台服务转向前台,专门提供独立搜索服务,并且在中国首创了竞价排名商业模式。2005年8月5日,百度在纳斯达克上市,由此进入一个崭新的发展阶段。
二、排名方式
先说说Google的排名方式,Google开创了第二代搜索技术,它利用Spider程序在互联网上抓取各个网站的网页,对网页内容进行分词处理,并对抓取到的网页进行超链分析,给予网页以1~10分的等级评分,然后做Page Rank方式排序,其实就是按照此网页被引用次数多少进行排序。Google还支持多达132种语言。应该说,Google这种客观、实际的排名方式正是这个虚幻的网络所最为缺乏的。
Yahoo在2003年以后重新认识到搜索引擎的重要性,推出了以YST技术为核心的搜索引擎,YST的意思就是Yahoo Search Technology,但实际上就是Google排名方式的一种延伸和技术补充。Yahoo自称YST技术相关性分析是利用文本、来源、相关链接及其他特定文件的特征进行分析,以决定文件与查询的相关性。YST不仅对网页内容分析,而且分析链接结构及查询意图(linkflux技术),现在Yahoo已支持38种语言搜索。这里要专门提一句,查询意图分析是目前Google也在完善的一项技术,尤其是针对恶意点击,除此以外,YST技术其实就是Google搜索技术的翻版。
百度的搜索引擎是一种按效果付费的网络推广方式,这种推广模式也是其主要盈利方式,其显示方式和Google关键词服务有很大不同。在Google的搜索结果中,赞助商链接位于页面顶部和右侧,用户可以清楚区分哪些是正常的搜索结果,哪些是赞助商们花钱买的位置。百度则完全不同,不仅仅在搜索结果的右侧有赞助商链接,在正常搜索结果的链接中也有赞助商广告链接,这些广告链接和真实搜索结果混杂在一起,很难区分,如果一个广告用户出的钱足够高,那么其广告链接会排在搜索结果的第一名,这样的处理,使得用户的搜索体验非常糟糕。由于遭到广泛的批评,百度左侧搜索内容的广告最近有所减少,但是搜索结果第一页仍然经常大部分或者全部是广告。目前百度正在考虑放弃竞价排名商业模式,转而效法Google的排名方式。终究,客观的、公正的资料才是有效的资料,尤其是在网上。
三、服务范围与凤霖点评
Google的服务范围包括:
网页搜索——也就是最基本的搜索服务。
新闻搜索——最早由Google推出的一种随时更新的新闻简报,便于使用者查看新闻。说实话这是对报刊杂志的一个挑战,随着时间的推进,这种挑战会越来越明显。
新闻快讯——提交给Google需要监视的主题词,同时提交自己的邮箱和要求监视的频率,Google会准时把其监控的新闻报道发送到你的邮箱里。
网上论坛——与其他的论坛没有多大区别,重要的是参与人员非常多。
网页目录——依网页主旨分别归类,并按其归类再进行搜索。
图片搜索——Google号称是互联网上最好用的图片搜索工具,搜索范围包括10亿张图片。
无线搜索——在手机上使用的搜索引擎。
工具栏——与IE搭配的搜索工具栏。
Picasa 照片管理软件——由Google提供的免费的专用图片管理软件。
本地搜索——可以对目前各大城市进行地图搜索、查找商家、并寻找驾车路线。
大学搜索——可以对国内国外各个大学的网站进行专业级搜索,我个人认为这是鸡肋。
学术搜索——广泛搜索学术文献的简便方法,同样也是Google最先提供。
还有很多服务项目,限于国情目前并未在国内大规模推广,相信会在逐步完善后提供给国内用户。
Yahoo的服务范围包括:
网页搜索——同样是最基本的搜索服务。
资讯搜索——随时更新的新闻简报。
音乐搜索——仿效百度的网络音乐提供模式。
图片搜索——号称搜索范围包括16亿张图片。
论坛搜索——对网上各种论坛和博客进行搜索的模式。
Wap搜索——在手机上使用的搜索引擎。
视频搜索——这是yahoo提供的特色服务,相信不久其他的搜索引擎会跟进。
知识堂——由网友来完善的网络大辞典,与“百度知道”类似。
网址大全——对精彩网站予以归类汇总。
免费站内搜索——免费获取代码,实现对客户网站的站内搜索,其他两大搜索引擎都有这样的服务,只是他们没有单独列出来。
搜索排行榜——对热门词语的搜索进行排行,我个人认为这个栏目属于狗仔队和无聊者的关注范围。
雅虎助手——提供免费搜索工具条。
雅虎的服务,有特色的东西很少,主要是因为马云主推的是阿里巴巴,而非雅虎,一个公司的精力总是有限的。
百度的服务范围包括:
百科全书——由全体网民共同撰写的百科全书。
百度传情——为恋爱者们提供,属于娱乐范围,但一直不温不火。
大学搜索——将搜索限定在某个大学的网站内,仿效Google。
地图搜索——方便出行,属于新增的项目。
风云榜——每天对上亿次搜索进行分析,并提供排行榜单。
Hao123——收购网址之家后,提供的网址归总。
教育网站搜索——查找各类教育网站的信息。
MP3搜索——这是百度推动的逐步被年轻人接受的一项特色服务,前一段时间还因为侵犯众多歌手版权而吃了官司。
手机搜索——针对无线用户。
百度搜霸——这是一个流氓软件,为百度带来了众多的眼球,只要一不小心就会被自动安装到PC上。
图片搜索——自称有9000万张图片可供搜索。
网页搜索——最基本的搜索服务。
文档搜索——利于用户查找各类研究报告、论文、课件等文件。
影视搜索——一项很有特色的娱乐服务。
邮件新闻订阅——有些类似于Google的新闻快讯。
政府网站搜索——应该说这是一项有中国特色的服务,用于搜索各类政府公文、政策法规等政府信息。其实就是锁定政府网站,进行定向搜索。
百度指数——是以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务。它的有用性主要在于经济指数和行业指数的搜索服务。
常用搜索——主要包括对股票、天气、航班、电视等信息的搜索。
百度词典——英汉互译的词典,百度承诺以后会逐渐加入对其它语言的互译功能,的确属于特色服务。
地区搜索——锁住特定区域,寻找身边发生的信息。
法律搜索——用来查找各类法律条文、法律案例等信息。
国学搜索——力图打造一个开放的国学平台,目前内容还不够多,但随着时间的延续,会越来越好。
百度黄页——网上信息查找,网罗身边的商家。
百度空间——这是一个基于web2.0的个人网上免费空间。
少儿搜索——针对儿童的搜索。
手机娱乐——针对手机用户的的娱乐搜索平台。
百度贴吧——相互交换看法的一个大型论坛。
百度网站——与Hao123网站类似,有充数之嫌。
Wap贴吧——基于WAP的的短信论坛。
硬盘搜索——在个人主机上,进行搜索的免费软件。
音乐掌门人——音乐汇总推广平台。
邮编查找——对各地邮编的查找平台。
百度知道——这项服务在网上很有名,一人提问,他人回答。在网上,总会有人知道你问题的答案。
百度资讯——24小时的自动新闻更新服务。
百度的服务特色在于中西结合,只要是Google推出的特色服务,百度总会在最短时间内推出类似版本,而同时百度又在不断增加有关我们中国特色的东西。有时,百度虽然缺乏想象力,但是脚步很快。
四、三大引擎在我国的市场攻略
目前,三种搜索引擎使用了完全不同的三种模式,在我国寻求发展与壮大。
主页方面,Google只提供搜索引擎功能,没有花里胡哨的累赘,尤其是不做门户,精力全放在对自身业务的改善与提高上。对所提供数据保持真实与可靠性是Google成立之初对自身的基本要求,把本职做好才使得Google有了今天,估计他的“搜索立足”之本将永远不会抛弃。与此同时,Google还最先在我国推出了GB级电子邮箱、桌面搜索、专业搜索、学术搜索等服务,开创许多互联网先河。从2001年9月推出中文搜索引擎以来,Google很快被我国当时的网民所接受,被亲切称为“狗哥”,进而创造了一种新兴的搜索文化,受到国内一些有影响力网民的追捧,记得当时许多国内论坛中都有关于“Google”的讨论组。现在,Google开始注重中文本土化,有一篇文章叫做《Google掌门:李彦宏你错了》,里面说到Google全球董事长兼CEO施密特针对目前Google市场占有率低于百度的应对方法,分别是增设服务器、组建本地资料库和大规模招兵买马等手段,估计这些都是李开复的规划,若实现这些政策的同时再增加宣传力度的话,也一定会抢回更多市场份额。
至于雅虎,在马云接手后,去除了花里胡哨的东西,回归于宁静,但鉴于阿里巴巴的主营产业并非于此,估计未来的雅虎也不外乎处于附属增值产品的地位。
百度市场占有率能在目前遥遥领先,究其原因不外乎:
1.定位准确,比如MP3搜索这项特色服务主要针对年轻人,侵犯版权后哪怕吃官司也要上马的决心下,收获自然大于支出。据统计,访问百度和查询信息的用户以18—40岁为主流人群,是最具消费能力的群体。
2.针对性强,像“产品关键字”能使潜在客户直接访问企业的产品介绍页面。此外,在中文分词、相关性搜索、特色搜索等等方面均不同程度超越了Google。
3.流氓软件推广,Google虽然不屑于做这方面的努力,但鉴于目前网上立法的不完善,百度却抓住了“中国特色”这四个字的内涵,通过大规模的流氓软件推广,有效实现了市场占有率的飞跃。前一段时间,有大量用户投诉百度超级搜霸强制安装、难以卸载等问题,在不少论坛中,如何卸载百度超级搜霸插件经常成为热门话题,在2005年北京网络行业协会设立的“流氓软件”网络调查中,百度超级搜霸成为“流氓软件”排行榜前十名,并被限令整改。然而可笑的是,2006年的3月15日,百度居然贼喊捉贼,自己开通超级搜霸315举报网站。
4.放大国有品牌形象,现在的百度充其量只能算是华人参股的企业。百度公司注册于英属开曼群岛,百度的创始人李彦宏持有美国绿卡,百度的启动资金是1999年李彦宏从美国拿到120万风险投资,其后的第二次融资得到了约1000多万美元。第三次是在2004年6月,百度引入包括IDG,JDF,Google等多家风险投资1亿美元,其中Google投资1000万美元占3%股份。现在,美资在百度中占有51%以上的份额,百度在中国注册全资子公司的目的可能是为了规避中国政府的关于外资不能进入新闻广告等领域的法规。因此,百度准确的说应该是一家由华人创办的、专注于在华业务的美资搜索引擎技术公司。
其实,百度这些问题也是我国浮躁的IT行业中不少公司所面临的通病,急功近利、唯利是图、丧失诚信、同行之间恶意竞争等等。
五、各自优势比较
目前为止,全球公认,Google技术上比Yahoo和百度要成熟、稳定。作为全球最大的搜索引擎,Google企业文化开放而独特,品牌优势明显,在全球消费者品牌排名前一百位中,Google排名第七位,仅仅八年的时间,Google创造了一个被全世界所瞩目的奇迹。Yahoo的排名在第三十八位,里面没有百度。顺便说句题外话,中国移动在此项排名中排在第四位,仅次于微软、通用电气和可口可乐,相信在此类排名的前十位中,将来会有更多的中国公司。
另外,Google在全世界有10000多台服务器,200多条T3级宽带;Google的专利网页级别技术PageRank能够提供高命中率的搜索结果;Google的搜索结果,摘录查询网页的含有关键字的内容,而不仅仅是网站简介;Google智能化的“手气不错”功能,提供可能最符合要求的网站;Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。这些都是其它的搜索引擎努力模仿的地方,但画龙恐怕难画骨。
雅虎的优势是在结合阿里巴巴之后逐步建立起来的清晰而与众不同的产品形象,其实这种针对企业用户的模式,也应该是最有商业潜在价值的模式,可是,强化该模式的路却是很长的。
百度的地图服务、桌面搜索服务、搜索工具栏服务、新闻快讯服务、主题推广服务等等都是明显抄袭Google的模式,这是典型的拿来主意,但却很见效,当然,这也是成本最低的手段。另外,至少从实际效果看,目前百度的市场攻略是正确的。接下来,遵纪守法的前提下,保持市场占有率将是百度未来需要研究的课题。
综合来看,百度的优势是通过多种手段建立起来的。目前,在我国青少年群体中已经形成了暂时的使用习惯,但这种习惯的保持还需要百度再付出很多。
六、各自缺陷比较
Google也有缺点,因为我国政治言论环境的限制,Google曾被有关部门要求清理不健康的和反动的网页,Google中文曾有很长时间不能正常服务,直到现在也会出现有时不能打开的现象,这使许多网民转投到其他中文搜索引擎。其实很多网民都不知道,www. Google.cn已经没有不能打开的现象,因为这个域名下的服务,完全是由李开复手下这帮中国技术人员所提供的。说起来,还是Google的宣传力度不够。
百度的流氓软件目前已经在市场上引起反感,但他要保住目前的暂时领先地位,却又不得不如此大规模的发放流氓软件,只有网民把对百度的使用养成习惯后,才能放弃,这自然就形成了一个悖论。下一步,我国有关方面治理流氓软件的力度将会加大。
百度中文搜索技术至少目前要比Google强,但随着计算机的逐步智能化,搜索也需要向智能化发展,百度在技术上未来提高的空间还很大。而在这样大的空间里,随时也都有被其它搜索引擎赶上的可能性,尤其是在Google大规模实现本土化之后,百度需要时刻保持警惕性。
当然雅虎也有这方面的特点,尤其是在马云接手后就更为明显。马云的抄袭不仅仅针对Google,也同时针对百度,像音乐搜索与知识堂都是针对百度的,其它针对Google的模仿就不细数了。
现在的百度和雅虎有点像几十年前的松下和东芝等企业,专门跟在索尼的身后,以模仿并跟进的方式抢夺市场份额。这种跟进并不一定是坏事,但不是长久之计,当网络方面的立法逐步完善后,跟进的空间与时间将被大大压缩。因此,特色服务,尤其是被网民所认可后的特色服务才是立足之本。
三大搜索引擎所形成的暂时平衡终究要被打破,至于是何时,这要由第三代搜索引擎的开发进程所决定。
最后,要说清楚一点,凤霖所提出的批评和建议都是善意的,真的从民族主义角度出发,我还是更希望百度能够在第三代搜索引擎的研制与开发中脱颖而出,进而独霸全球。现在,三大引擎的竞争,已经演变成了李开复、李彦宏和马云之间的三国演义,希望这部书越来越精彩。


——————原创——小海——create is my all————

More info:sina blog:http://blog.sina.com.cn/idoneboy. personal website*wordpress*:https://hoctoboy.wordpress.com.
新浪微博@ 今日经济hoctoboy:http://weibo.com/newhoctoboy main email: hoctoboy@gmail.com

All Rights Reserved.Unless mark specially, hoctoboy’s sina and the wordpress blog articles are original, transport please indicate the address or this word:
——————原创——小海——create is my all————
All Rights Reserved.除非特别注明,hoctoboy(人称:小海)新浪博客与wordpress上的博客都为原创,转载请注明地址或者这段话:
——————原创——小海——create is my all————
Add me*All imfo:
QQ:807244012.
Twitter@waterhoctoboy.
soundcloud@hoctoboy.
YouTube@hoctoboy.
flickr@hoctoboy.
Google plus@hoctoboy.
instgram@hoctoboy.
tumblr@hoctoboy.
Facebook:hoctoboy@gmail.com /hoctoboy@163.com /hoctoboy@sina.com.
Skype@hoctoboy.
pintrest@hoctoboy.
500px@hoctoboy.
linkedin@hoctoboy.
foursquare@hoctoboy.
whatsapp@hoctoboy.
kakaotalk@hoctoboy.
blab@hoctoboy.
ask.fm@ hoctoboy.
in short*all my accounts follow you can search——hoctoboy

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s