搜索研究院

 

当——搜索引擎令你失望时

搜索引擎9238 2001.4


  如果没有搜索引擎,我们都会迷失在辽阔的信息海洋中。但是,有些时候,不管你掌舵是多么的老练,搜索引擎可能不是帮助你自由的冲浪,而是让你迷航。

  搜索引擎的失败包括从搜索到几十万几百万的无关结果,到搜索不到任何结果,以及这两个极端之间的各种不同程度的失败。 这里是搜索引擎

  令你失望的五种常见状况,我们给出了如何挽救失败搜索的特殊技巧。


1:找到 8,700,000 相关网页:找到几十万几百万的过多网页
===========================================================

  最常见的搜索失败,象上边这个例子,搜索引擎没有帮你找到草堆中的那根针,而是给了你整个草堆。
通常,这种搜索失败有两个原因,这两个原因其实都很容易解决。

  第一,你用来搜索的关键词太短了,可能只有一两个字。
  第二,你要搜索的内容太常见了,以至网上有巨大数量的相关内容。

  搜索请求中的常见短语(Common words)词通常是一个多单词的短语,含有三到四个在句子中常见的单词。
只要可能,尽量使用常见词的同义词。更好的方法是,想出不常用的甚至是罕见词来描述你的主题。这里的诀窍是不要把自己想得太聪明,不

  要使用不会被大多数网络写作者使用的关键词。 如果你必须使用某个常见词,那么使用 (加号)和-(减号)来缩小你的搜索范围。比如:' George Washington -state -D.C. -university' 会主要找出关于George Washington这个人的网页,不会被淹没在大量跟 Washington state、 Washington D.C. 和 George Washington University有关的网页中。

  这简单的小符号能够帮你去除成千上百万的无关网页。


2:你的搜索没有找到任何相关网页 :没有找到任何网页
======================================================

  If you have typed the address (URL), do check the spelling!

  虽然这种情况不算多,但搜索引擎有时确实不能按你的搜索要求找到任何内容。
有时出现这种问题仅仅是因为网上还没有你要找的内容。当你找一个人,找一个没名气的小公司,或者找非常深奥冷僻的论据时就有可能遇到这种情况。

  这种失败多半是因为你找错了地方。找人,就不要用普通搜索引擎,用专业的寻人工具会更有效。找公司,应该用Transium 或 Kompass 这样的黄页工具。找深奥冷僻的论据,为什么不试一试Ask Jeeves 或其它的专业参考服务呢?

  你要知道主要搜索引擎收集的网站在数量和范围上都有很大的差异。Yahoo (一百多万) 和 Webcrawler (二百多万)如果跟AltaVista, HotBot, 和Northern Light数以亿计的数量相比真是小儿科了。

  如果你要找的内容必须用普通搜索引擎来搜索,那么使用元搜索引擎吧,象Dogpile, Mamma, 或Savvy Search。


3:“404-Not Found”错误 点击搜索结果,却得到“404-Not Found”错误
=========================================================================

  网管犯的最愚蠢的错误之一,但也是相当常见的错误是:象整理自己的硬盘一样整理网站,把所有混乱的文件起上规范的名字,然后搬到整整齐齐结构清晰的文件夹中。

  当文件被移动或重新命名后,收藏这个文件的每一个书签,搜索引擎指向这个文件的每一个链接,以及指向这个文件的每一个被发表的链接, 就都作废了。这种欠考虑的“整理”在网络上制造了远比计算机失灵更多的混乱。如果我是因特网的总管,一定会把修改url定为非法,哪怕一个网站会多么的混乱。

  OK, 牢骚就发到这里。但是,当遇到这种情况时,你能做什么?

  有个好消息可以告诉你, '404' 或者 'document not found' 这种信息是由那个曾经的网页呆过的服务器发出的,就是说该服务器还在那里,

  你所要做的只是一点小小的侦察工作,找到那个网页在该服务器上的新位置。

  使用一种叫做'URL back-up' 的方法,把你的指针移到地址栏里'htm' 或 'html' 的后边,然后往前删除文件名,在碰到第一个斜杠后停止,然后打回车键。重复此动作, 直到你找到含有指向你找的文件的链接的菜单,或者到根目录为止。根目录上应该有链接或搜索框能帮你找到所需文件。

  多数情况下,只要文件还在原来那个服务器上,你在原来位置的附近小小的转一圈就能找到它。更大的问题是文件从原始服务器上彻底消失了。

4:网站已搬走;转向地址未知 搜索到的网站已搬走,地址未知
============================================================

  网站就象人,有时会被迫迁移。学生毕业了;网页从免费社区搬到有独立域名的大网站了;人们改变ISP了。
当遇上这种事时,你最好赌一下运气,搜索你在寻找的文件的标题或者作者的名字。搜索标题很简单,只要用双引号括起来进行短语搜索就行了。但是更好的方法是对标题进行field搜索。

  field搜索是大多数搜索引擎支持的高级功能。
  它允许你限定在搜索HTML的标题,就是会出现在浏览器标题条上的那些标题。(这种标题页是默认的收藏夹标题)。你可以利用field来搜索标题、图片和其它的网页特殊部分。

  如果你搜索文件的作者,那么使用 HotBot的'the person' 搜索选项。搜索人的时候,记得名字首字母要大写,整个姓名用双引号括起来。


5:上次能搜到的内容,这次却搜不到了
======================================

  你做了所有努力,可是,上星期还带给你很好搜索结果的搜索请求,这次无论你怎么努力,都只搜索到一堆无用的结果,你想要找的网页已经不见了。发生了什么事?

  有关搜索引擎的一个肮脏的小秘密是:搜索引擎永不停息的从它们的索引库中抛弃已索引的网页。有时是成千上万的网页。有时这些被遗弃的网页会重新出现在索引库中,有时不会。

  正式的解释从精选索引数据库、保持索引内容的新鲜和相关度、到维护改造临时数据库都有。
all and well,否则你在寻找的文件永远不会再出现在索引库里。

  幸运的是,有两个地方可以让你找到需要的网页。Google 对它索引的的所有网页准备了一份'cache'。即使你要找的网页链接已经连不上了,

  你也可以点击该网页的“cache”,然后你会得到google上次索引该网页时准备的备份。

  Alexa, 制造了一个受欢迎的工具条,这个工具条能显示相关网页的链接,并保存了超过100万网页的档案。使用Alexa, 当你的浏览器显示 'not found' 信息时,你可以点击Alexa窗口上的'archive' 链接,查看该网页的备份。

  这种方法有不利的一面,Google的cache和Alexa的archive都可能是过期的内容。当然,在大多数情况下,有点东西总比什么都没有强。


话外音
=======
有多少熟练的搜索者,就有多少搜索信息的诀窍。


注意:以上文章4月中译自about,原文中错误与过时之处不在少数,未作纠正,仅供参考,切勿全信。


“我们若能更妥善地搜寻资料,实在已经改变世界。”

返回首页