搜索引擎9238 2001.4
这里描述了菜鸟们搜索时容易犯的七个低级错误,正是因为你经常犯这些错误,所以你总是得到无用的、荒谬的或者完全没有意义的搜索结果。而一旦你认识到这些错误,将很容易把这些小鬼从你的搜索工具箱中永远驱逐出去。
1:停用词Sputtering on 'Stop Words'
=======================================
一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。
这些被叫做“停用词”(stop words),因为搜索引擎在它的数据库里碰到这些词时不会搜索。
为什么不搜么?因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是'be' 的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。
如果你在一个搜索请求中使用了停用词,那么你得到大量毫不相关的搜索结果。比如,短语'searching the Web' 包含了两个停用词,'the' 和 'Web'。虽然这还不算特别常见的词汇,但Web 在网络上实在是太常见了,使它事实上不能帮你搜索到什么有用的内容。
如果去掉停用词,'searching the Web' 变成 'searching',这个关键词带给你的搜索结果会从搜索一个逃犯直到寻求启蒙。(quests for enlightenment)—如果你够幸运,当然也会得到一些关于“searching the Web”的搜索结果。
怎样辨别停用词呢?300个最常用的英文词汇基本上都是停用词,搜索引擎google在你的搜索关键词中含有停用词时,会把它忽略的每个停用词告诉你,就显示在搜索结果页最上边。你可以用一个含停用词 'web' 的关键词试一下。
2:布尔操作符Bungling with Boolean
=====================================
布尔操作符,象and、or 和not,能够使你的搜索结果更精确——如果使用正确的话。
问题在于布尔操作符看上去太简单了,似乎非常容易使用,这真的可能是一种误解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的说法, 各种搜索引擎对布尔符都有自己的支持方法,并非完全相同。比如,同样一种效果,有的搜索引擎只要用'not',有的搜索引擎却要用'and not'才能达到。而且,有些搜索引擎要求布尔符必须是大写的,另一些就没有这种要求。
如果你真的想使用布尔符,请认真学习它的使用方法。
3:普通词Being Ever So Vulgar
==================================
Vulgar来自拉丁语vulgus, 意思是普通。象一些有教养的诡辩家,搜索引擎对普通词的搜索存在缺陷。不是因为它们妄自尊大或自命不凡。而是因为这些词太常见了,以至于出现在成百万上千万的网页中,使得它们事实上不能被用来帮你找到什么有用的内容。
比如说“weather”, 有成千上万的网站提供跟“weather”相关的信息,从地方天气预报到学术论文到气象学,
所以使用更多的关键词或更明确的关键词来搜索要比单单搜索'weather'好得多。 设计一个类似 'Cicely Alaska annual snowfall'这样特殊的搜索关键词,会给你真正有用的结果。
4:寻找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多义词。 Kris Carpenter是Excite 的搜索服务主管,举了'bond' 作为例子。我们不得不问自己,他们在找的信息是关于金融公债的、化学粘合剂的、还是大名鼎鼎的007邦德的?
最好的解决办法是,在搜索引擎之前先问自己这个问题,然后用短语代替多义单词作为关键词。
搜索引擎也很容易被同拼法异音异义的词迷惑,比如 'lead' ,发音LEED的时候, 意思是领导,发音LED的时候指的是一种金属元素。
如果可以,尽可能使用意义明确的同义词代替同拼法异音异义的字。例子可以看The Heteronym Home Page.
5:大写字母Committing Capital Offenses
========================================
搜索者的另一个问题是要不要在关键词中使用大写字母。
有的搜索引擎是区分大小写的,但也有搜索引擎是不分大小写的。凭经验来说,总是使用小写字母搜索是个好主意。
这样搜索,会得到所有包含你的搜索关键词的网页,不管其中的关键词首字母大写还是小写。
如果你在搜索关键词中使用大写字母,那么搜索引擎返回的结果将只有一种,其网页中含有大小写跟你的搜索关键词完全相同的单词。
象人名和地名之类关键词使用大写字母是个好选择,但是其它对大小写没那么敏感的单词,如果也使用大写字母,可能使你错过很多有用的网页。 如果想知道哪个搜索引擎对大写敏感,以及如何处理大小写字母,就对Danny Sullivan的网站“Search Engine Watch”上的Search Engines And Capitalization花点时间吧。
6:Close, But No Cigar
==================================
多数搜索引擎对于 'Kosovo refugees' 或 'space shuttle missions' 这样的短语搜索效果很好。然而,当你使用类似这一节的标题的短语“Close, But No Cigar”进行搜索时,就遇到问题了。 在一个主流搜索引擎中搜索'close but no cigar',得到的第二条结果是:The Common Cold: Relief But No Cure. Definitely no cigar!
两个关键词之间的距离称为接近程度。 当你的搜索关键词们分散在一个网页的不同位置时,有些搜索引擎会给你一个积极的结果,不管它们是否彼此靠近,还是位于同一个短语中。
如果你希望你用的搜索关键词们在搜索到的内容里互相靠近,那么你的最好选择是AltaVista 和Lycos, AltaVista 它允许你使用 NEAR 这个操作符号,而 Lycos 的高级搜索提供了多种设置关键词接近程度的可能。
好,现在说最容易犯的那个搜索错误
7:在错误的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你决定找某种内容之前,先确认你对这次搜索任务使用了正确的工具。各种搜索引擎在搜索范围、功能和质量方面大相径庭,如果没有为你的每次搜索分别选择正确的搜索工具,你将浪费自己大量的时间。
你应该使用Excite 还是HotBot? AltaVista 还是 InfoSpace? 分析你的需求,比较不同搜索引擎的强项和弱点,然后选择最适合这次搜索任务的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太过苛求自己。我所听过的最荒谬可笑的说法是:“你能在ingternet上找到任何东西”。这就象在说,你能在每一个煤矿里都找到钻石。
也许听上去有点异端邪说的味道,但是有个网络搜索指南确实说过,有时你能选择的最好搜索方法是放弃搜索,跑一趟附近的图书馆。图书馆里网上找不到的成吨的信息资源。而且图书馆员一般是受过训练的的专家,它们通常会很乐意帮你找东西。当你在网上无处可去的时候,试一下真正的“人工智能搜索引擎”吧,你会发现它们真的非常优秀 。
让错误走开Begone, Mistakes!
===================================
在你逐渐获得网络搜索经验的过程中,避免这七个常见的搜索错误将成为一种自然而然的习惯。无论何时,当你得到意料之外和怪异的搜索结果时,记得检查一下你用的搜索关键词,弄明白发生了什么事。你可能发现又一个自己需要避免的搜索错误。
注意:以上文章4月中译自about,原文中错误与过时之处不在少数,未作纠正,仅供参考,切勿全信。
“我们若能更妥善地搜寻资料,实在已经改变世界。”