除了google还有什么替代google的搜索引擎擎

当前位置 & &
& 除了Google你还应该试试的8个搜索引擎
除了Google你还应该试试的8个搜索引擎
16:05:03&&出处:&&作者:
编辑:刘艺 &&)
让小伙伴们也看看:
阅读更多:
好文共享:
文章观点支持
当前平均分:0(0 次打分)
[04-04][04-04][04-04][04-04][04-04][04-04][04-03][04-03][04-03][04-03]
登录驱动之家
没有帐号?
用合作网站帐户直接登录求赐教:除了google,还有什么搜索引擎比较强大? - 电商营销 -
福步外贸论坛(FOB Business Forum) |中国第一外贸论坛
& 求赐教:除了google,还有什么搜索引擎比较强大?
(一米阳光)
UID 527722
福步币 36 块
阅读权限 40
来自 里约热内卢
求赐教:除了google,还有什么搜索引擎比较强大?
如题,自从google搬去了HK后,就不知道用哪个搜索引擎能快速找到自己想要的东西,尤其是国外的信息资源,求分享。
& && && &国内的,知道一般用百度就搞定。
UID 2125931
阅读权限 25
UID 482495
积分 15239
阅读权限 80
GOOGLE应该是最全面的了
(康帕斯中国总部
康帕斯平台QQ:
UID 260683
积分 247487
帖子 16126
福步币 62 块
阅读权限 120
来自 手机:
回复 #1 风帆飞扬 的帖子
可以到黄页,名录,买家信息网上面去搜寻。
UID 1525120
阅读权限 40
国外的有&&必应 、雅虎&&如果针对俄罗斯的有:yandex
UID 1996485
阅读权限 40
还是google比较好吧
UID 1150919
积分 110708
帖子 17645
福步币 5655 块
阅读权限 150
回复 #1 风帆飞扬 的帖子
更多国外搜索引擎:
当前时区 GMT+8, 现在时间是
Powered by D1scuz! && 2001-如何提高网站在Google中的排名――面向搜索引擎的网站设计
如何提高网站在Google中的排名
&&& ――面向搜索引擎的网站设计
作者: 车东 Email: /
写于:2003/01
版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
关键词:Google PageRank "link popularity" "website promotion"
"optimization for search engine"&
内容摘要:(注意:这个网站设计本身就利用了其中一些方法)。
网站设计中面向搜索引擎的优化注意事项:
谁不想自己的网站在Google的搜索结果重排名靠前呢,但你的网站设计是Search Engine Ready的吗?
什么是PageRank
Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考Google
の秘密 - PageRank 底解h一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联
网上PageRank就是基于网页中相互链接关系的分析得出的。
此外,从计算方法角度阐述PageRank机制还有这篇文章:
里面有更详细的PageRank算法说明和各种清晰的小型个案分析
比如:子页中导航条的重要性
B &=& A =& C&&
B &=& A &=& C&& (好)
页面数量因素:
B &=& A &=& C
F &=\&& /=& G
B &=& A &=& C&& (好)
D &=/&& \=& E
一个意想不到的结论:
(B &=& A &=& C)&&&&& ( E &=&
(B &=& A &=& C)& &=& ( E &=& D &=& F)
PageRank升高的只是被链接的2个首页A和D,而网站子页面的PageRank平均会略有下降。同时:一个网站进入Google的索引量越大其受类
似因素影响越小。
PageRank不对称的页面互链:
Google会用BadRank之类的算法进行纠正,而且一个网页着有来自“与其自身不相称”的高PageRank站点的链接,而自身又缺少足够数量和质
量的反相链接的话,其PageRank会自动降低为0,A(pr=7)
&=& B(pr=0)
简单的说就是:偶尔要被权威站点反相链接不算数,要被足够多的权威站点引用才能提高自身网页的PageRank。
在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事
实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。通过搜索引擎推广自己需要注意以下几个方面:
以量取胜:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的
网站推广比较经典的方式就是加入比较大型门户网站的分类目录,比如:,dmoz.org等。其实这里有一个误区:不一定非要加入大型网站的分类目录才是网站推广,因
为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的,哪怕是出现在新闻报道,论
坛,邮件列表归档中。很多大型站点的邮件列表发邮件时,一定注意在自己的签名中加上自己网站的地址。
Blogger(Weblog的简称)们也许最深刻地理解了“链接就是一切”这句话的含义,由于Blog的内容之间有大量的相互链接,因此最经常被引用的
Blog页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。
以质取胜:被PageRank高的网站引用能更快地提高PageRank
数量只是关键因素之一,来自PageRank高的页面的链接还能更快的提高被链接目标的PageRank,以我的个人网站为例:我没有加入任何分类目录,
只是将一些文章投稿在了上,由于页面上有文章出处链接,
相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次数多更重要。这里我要特别感谢的是,当时ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链
接的网站。
按照这个原则:能够名列Yahoo!和DMOZ这样的大型权威目录的头2层是非常有价值的。
了解搜索引擎的"价值观":
这篇文章被Jakarta.apache.org的lucene项目引
用以后,这篇文章就成为了所有页面中PageRank最高的页面(在上显示是5/10),而Google深厚的学院气氛让我一直怀疑他们对政府,教育等非功利站点有特别加分 :-),毕竟.org
.edu才代表了互联网精神的实质:知识的共享。
但更合理的解释是:.org很多都是开放技术平台的开发者,他们会在首页这样的地方加入Powered By Apache, Power by
FreeBSD之类的链接表示对其他开源平台的尊重,所以象,
, FreeBSD这样的开源站点在GOOGLE中都有非常高的PageRank。
而在.edu这些站点中,很多都是学术性比较强的文档,以超链接形式标明参考文献的出处已经成为一种习惯,而这也无疑正是PageRank最好的依据。
注意:不要通过Link
Farm提高自身的站点排名:Google会惩罚那些主动链接到Link
Farm站点以提高自身排名站点,相应站点的页面将不会被收入到索引中。但如果你的页面被别的Link
Farm链接了也不必担心,因为这种被动的链接是不会被惩罚的。
不要吝啬给其他网站的链接:如果一个网页只有大量的进入链接,而缺乏导出链接,也会被搜索引擎认为是没有价值的站点。保证你的网站能够帮助搜
索引擎更准确地判断哪些是对用户最有价值的信息,也就是说如果你的网站只有外部反向链接而没有导出链接的话,也会对你的网站在搜索结果中的表现带来负面影
  当然网站中连一个导出链接都没有的情况非常罕见,除非你是刻意这么做。正常情况下大家都会自然地在网页中加上一些其他网站的链接,带领访问者去到我们
认为重要或能够提供更多有价值信息的地方,
另外在推广自己网站之前也许首先需要了解自己网站目前在一些搜索引擎中的知名度,原理非常简单,可以参考如何评价网站的人气一
网站推广只是手段,如何突出内容、让需要相关信息的用户能够尽快的找到你的网站才是目的,PageRank高并不代表像Yahoo!这样的门户站点
就能在所有搜索结果中排名靠前,因为搜索引擎的结果是搜索关键词在页面中的匹配度和页面的PageRank相结合的排名结果。因此第二个要点:如何突出关
标题设计只是提升关键词密度(keywords
density)的一个方面:在现代搜索引擎在关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:很大程度上,不只看这个网页自己说自己有什么内
容,还要看别人如何链接时,如何描述你的网站。
比如查:“世界卫生组织”,返回结果中有 http://www.who.int/
而这个页面中是没有中文的,之所以能匹配上,是因为很多链接它的中文网站使用了:&a
href="http://www.who.int/"&世界卫生组织&/a&,所以,这个页面中不存在的关键词也成为了页面摘要的一
所以把握好整个网站的主题风格是非常
重要的,越是有和被链接页面主题相关的链接标题,对被链接页面越有益处。
关于可以参考:/engine/theme_pyramids.htm
不要空着标题:空着&title&&/title&无异于浪费了最有价值的一块阵地;
传统的页面中,HTML页面中会有类似以下的隐含信息,用于说明当前网页的主要内容关键字:
&&& &meta name="keyword" content="mp3 download
music..."&
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music
mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文件中的人工meta
keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而
在相应的搜索结果排名中更靠前。
标题长度和内容:不要过长,一般在40个字符以内,并充分突出关键词的比重;
如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧,毕竟用户主要通过名词来找到需要的内容。标
题内容:尽量用一些别人可以通过关键词找到的字眼(也别太过头,如果标题中的字眼超过1半内容中都没有,有可能被搜索引擎排除出索引),因此基于web日
志中来自其他搜索引擎的关键词查询统计非常必要。
如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
我的网站上的一个小应用:一个web界面的unix命令手册(man
page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web
interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:&
[命令名]"这样的格式,比如:"phpMan:
ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标
题,比如:“新闻频道”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
除了&title&&/title&外,还可以用&h1&&/h1&标题行突出内容主题,
加强标题的效果;
在我的网站设计中:我会把用&h1&[标题]&/h1&这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
尽量使用静态网页:目前能够像Google一样对动态网页进行索引的搜索引擎还比较少,而即使是Google也更不会索引所有的内容,总体上
说Google喜欢新的,静态的内容。
因此无论从效率上讲还是方便搜索引擎收录,使用内容发布系统将网站内容发布成静态网页都是非常必要的。
比如:/phpMan.php/man/intro/3
/phpMan.php?mode=man&parameter=intro&section=3
更容易进入搜索引擎的索引。而且在URL中的命中有时候比在标题中还能突出关键词。
而且能够进入Google索引的页面数量越多越好。可以用类似以下的脚本统计自己的网站被Google和百度索引的情况。
YESTERDAY=`date -d yesterday +%y%m%d`
LOG_PATH='/home/apache/logs'
grep -i Googlebot $LOG_PATH/access_log|awk '{print $7}' |sort
-u&spider/$YESTERDAY.googlebot.txt
grep -i baiduspider $LOG_PATH/access_log|awk '{print $7}' |sort
-u&spider/$YESTERDAY.baiduspider.txt
网站目录结构要扁平,因为每深一级目录,PAGERANK降低一个档次。假设首页是3,其子目录就是2,更深可能就无法列入评级范围了。
表现和内容的分离:“绿色”网页
网页中的javascript和css尽可能和网页分离,一方面提高代码重用度(也方便页面缓存),另外一方面,由于有效内容占网页长度的百分比高,也能
提高相关关键词在页面中的比重也增加了。总之,应该鼓励遵循w3c的规范,使用更规范的XHTML和XML作为显示格式便于内容更长时间的保存。
让所有的页面都有能够快速入口:,
方便网页爬虫(spider)快速遍历网站所有需要发布的内容。如果首页就是用Flash或图片进入的话,无异于将搜索引擎拒之门外,除了UI设计的用户
友好外,spider
friendly也是非常重要的。
保持网站自身的健康:经常利用检查网站中是否有死链。
保持网页内容/链接的稳定性和持久性:在搜索引擎索引中网页存在的历史也是一个比较重要的因素,而且历史比较久的网页被链接的几率越高。为了
保证自己网页能够被比较持久的被其他网站的页面引用,如果自己网页中有链接更新时,最好能保留旧的页面并做好链接转向,以保持内容的连续性。要知道,把一
个网站和内容在搜索引擎中的排名“培养”的很高是一件非常不容易的事情,谁都不希望好不容易自己的内容被别人找到了,点击却是“404
页面不存在”吧,因此站点管理员对自身站点error.log的分析也是非常必要的。
文件类型因素:Google有对PDF, Word(Power Point, Excel),
PS文档的索引能力,由于这种文档的内容比一般的HTML经过了更多的整理,学术价值一般比较高,所以这些类型的文档天生就比一般的HTML类型的文档
PageRank要高。因此,对于比较重要的文档:技术白皮书,FAQ,安装文档等建议使用PDF
PS等高级格式存取,这样在搜索结果中也能获得比较靠前的位置。
常常能发现门户站点的一条新闻往往比其他站点的首页排名还要靠前。因此一个站点总体PageRank提高了以后,往往自身一些并不重要的内容
也会被同那些高PageRank的内容一起带入被搜索引擎优先查询的列表中。这点有些不是很合理,因为这样经常造成很多大站点的邮件列表归档往往比其他站
点的首页PageRank还要高。
网站设计不仅仅只是被动的迎合搜索引擎的索引,更重要是充分利用搜索引擎带来的流量进行更深层次的用户行为分析。目前,来自搜索引擎关键词统计几乎
是各种WEB日志分析工具的标准功能,相信商业日志统计工具在这方面应该会有更强化的实现。WEB日志统计这个功能如此重要,以至于新的RedHat
8中已经将日志分析工具webalizer作为标准的服务器配置应用之一。
以Apache/webalizer为例,具体的做法如下:
记录访问来源:
在Apache配置文件中设置日志格式为combined格式,这样的日志中会包含扩展信息:其中有一个字段就是相应访问的转向来源:
HTTP_REFERER,如果用户是从某个搜索引擎的搜索结果中找到了你的网页并点击过来,日志中记录的HTTP_REFERER就是用户在搜索引擎结
果页面的URL,这个URL中包含了用户查询的关键词。
在webalizer中缺省配置针对搜索引擎的统计:如何提取HTTP_REFERER中的关键词
webalizer中缺省有针对yahoo, google等国际流行搜索引擎的查询格式:这里我增加了针对国内门户站点的搜索引擎参数设置
SearchEngine&&& .cn word=
SearchEngine&&& && word=
SearchEngine&&& &&& word=
SearchEngine&&&
通过这样设置webalizer统计时就会将HTTP_REFERER中来自搜索引擎的URL中的keyword提取出来,比如:所有来自
链接中,参数q的值都将被作为关键词统计下来:,从汇总统计结果中,就可以发现用户是根据什么关键词找到你的次数,以及找到你的用户
最感兴趣的是那些关键词等,进一步的,在webalizer中有设置还可以将统计结果倒出成CSV格式的日志,便于以后导入数据库进行历史统计,做更深层
次的数据挖掘等。
以前通过WEB日志的用户分析主要是简单的基于日志中的访问时间/IP地址来源等,很明显,基于搜索引擎关键词的统计能得到的分析结果更丰富、更直
观。因此,搜索引擎服务的潜在商业价值几乎是不言而喻的,也许这也是
等传统搜索引擎网站在门户模式后重新开始重视搜索引擎市场的原因,
知道了,在互联网上有谁比搜索引擎更了解用户对什么更感兴趣呢?
请看本站的反相链接统计:
需要注意的是:由于Google针对Windows
2000中的IE使用的是UTF-8方式的编码,因此很多统计有时候需要在UTF-8方式下查看才是正确字符显示。从统计中能够感受到:在使用水平比较高
的IT开发人员中Google已经成为最常用的搜索引擎。而使用百度的用户也已经大大超过了传统的搜狐,新浪等门户站点,因此传统门户网站在搜索引擎上的
优势将是非常脆弱的。而从技术的发展趋势来看,以后还会有更多的利用互联网媒体做更深层次数据挖掘的服务模式出现:
在“新科学家”(New
Scientist)在线杂志上,公布了康奈尔大学的一个新研究成果,引人注目,也许与Google 收购Pyra 的动机有关。
这所大学的计算机科学家 Jon Klenberg
开发了一个计算机算法,能够识别一篇文章中某些文字的“突发”增长,而且他发现,这些“突发”增长的文字可以用来快速识别最新的趋势和热点问题,因此能够
更有效地筛选重要信息。过去很多搜索技术都采用了简单计算文字/词组出现频率的方法,却忽略了文字使用增加的速率。
特别指出,这种方法可以应用到大量Weblog上,以跟踪社会趋势,这对商业应用也很有潜力。例如,广告商可以从成千上万的个人Blog
中快速找到潜在的需求风尚。而且只要Blog
覆盖话题范围足够大(实际上发展趋势确实如此),这项技术对政治、社会、文化和经济等领域也都会有实际意义了。
虽然Google
新闻的内部算法至今没有公开,但是人们猜测这种完全由机器所搜集的头条新闻应当不是Google搜索引擎中惯用的鸽子算法,很可能与这种“突发”判断算法
有关。如此说来,Google收购Blog工具供应商的举动确实还有更深层次的远见了。
news, Word
'bursts' may reveal online trends
- 还没有写完这些介绍,在 SlashDot
上也看到了很多有关这个发现的讨论
参考资料:
面向Google搜索引擎的网站设计优化
关于Google的十个神话:
如何评价一个网站的人气
如何提高网站在Google中的排名――面向搜索引擎的广告模式
如何提高网站在Google中的排名――面向搜索引擎的网站链接设计
Measuring Link Popularity
Google の秘密 - PageRank 底解h
这篇文章是在查"Google
PageRank"的时候查到的,这篇文章不仅有一个算法说明,也是一个Google的weblog,记录了很多关于Google的新闻和一些市场动态信
更详细的PageRank算法说明:
Google的海量处理机制:鸽子系统
WEB日值统计工具Webalizer
Robots的说明:
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件
robots.txt,在这个文件中声明该网站中哪些内容可以被robot访问,哪些不可以。
反Google站点:观点也很有趣
关于Google的WebLog
搜索引擎论坛:
原文出处:&a
href="/tech/google.html"&/tech/google.html&/a&
&&返回首页   |      |      |      |   
太没节操!全世界首个色情搜索引擎比谷歌还厉害 真会有人用吗
  每个人都有自己爱用的搜索引擎,由于一些技术巨头对成人内容相关的搜索结果进行了限制,某些搜索引擎更适合搜索小黄片。
  用Boodigo这款搜索引擎,你不用担心&巴西小姑娘&这种搜索结果会出现在搜索历史记录而被同事看到。忘了说了,Boodigo号称是全世界第一个成人搜索引擎。
  和其它搜索引擎不同,Boodigo是专门用来寻找成人网站并按序排名的搜索引擎。这就避免了一些其它搜索引擎会碰到的问题,比如你搜搜&口交&,出来的确实维基页面、妇女杂志上的口交指南等等。在Boodigo,搜口交,出来的页面就是口交图和口交视频网站。
&一点不拖泥带水。
  说到成人搜索引擎,Boodigo不是第一家,之前还有模仿Google的成人向搜索引擎Search.xxx和PornMD。PornMD会直接将你带到免费的非法Tube类成人网站(允许用户自己上传成人视频的仿Youtube型网站),但是Boodigo面向的是坚持道德操守的小黄片爱好者们:他们指向的站点都是收费的工作室或色情影星页面。
  我们(原文)从色情影星,前阵子闹得很凶的杜克大学色情明星Belle Knox下手,下面是我们取消安全搜索设置后用Google搜索得出的结果:
这是我们用Boodigo搜出的结果:
搜出来的结果要么是各大色情站点里Belle的页面,要么有Belle作品的收费色情网站,不过你进去后还要在里面再次进行搜索。
美国花花公子}

我要回帖

更多关于 替代google的搜索引擎 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信