Google信息检索学(三):条件搜索(Condition)

大多数人在使用搜索引擎时,使用的关键字是自然语言的.对于机器来说,相对于结构化的编程语言,自然语言比较难以理解.虽然现在的自然语言处理技术已经日渐发展,但还远没达到可以日常应用的水平,连科技巨头Google也是一样.正因如此,我们在搜索时应该按照搜索引擎的语法来进行搜索,避免使用自然语言的语法.

也许上面的文字会让你头大,我来举个使用自然语言搜索的例子:

Google公司是在哪一年创立的?

相对的,使用Google搜索引擎语法的例子:

Google 公司 创立 年份

使用这两组关键字进行搜索,得出的是全然不同的结果,通过对比可以发现,第二组关键字得出的搜索结果更准确,更专业.

第二组关键字可以使用Google的”高级搜索”功能来实现,但实际上我们平时用到的Google语法只有几种,可以直接通过键盘输入相应的字符来使用,这样用起来会更快.

如果要使用”高级搜索”,需要你访问一个Google的常规页面,在右上角找到齿轮图标,选择Advanced search.

接下来就是”高级搜索”的页面,该页面由表单组成,并不是很好用.

以上内容只是告诉你Google有”高级搜索”这一功能,并不建议你依赖它进行搜索.

“高级搜索”的本质是Google的关键字条件搜索,下面列举一些常用的条件搜索,它们已经可以帮助你完成大部分搜索.

与(AND)条件

与(AND)条件是最常用的,它的使用很简单,只需要在两个关键字间加入空格即可.

例如我要搜索2013年辽宁省的高考作文题目,应该使用以下关键字:

2013 辽宁 高考 作文 题目

像这样简单的给原来的关键字加上空格,并去除一些可能妨碍搜索的自然语言内容,就可以减少搜索的范围并大大增强搜索结果的质量.

或(OR)条件

或(OR)条件的使用频率比较低,但偶尔还是会用到,它使用英语单词or作为特殊关键字,使用的时候需要改为大写,用法和与(AND)条件类似.

2013 欧冠奖杯 拜仁 OR 多特蒙德

这里的”OR”左右加不加空格都是一样的,不会影响搜索,是否加空格可以看自己的喜好.

非(NOT)条件

非(NOT)条件会使含有部分关键字的结果被排除,通常用在一些容易导致歧义的关键字上,使用的方法是在不想要被搜索的关键字前面加上-(减号),并且在-的前面必须有空格.

小米 -手机

完全匹配

完全匹配意味着禁止Google对你的关键字进行拆分,搜索结果里该关键字的内容必须是连续的,完全匹配时关键字的左右应该加上引号,常用在搜索一句话上.

“人只有用自己的心才能看清事物,真正重要的东西用眼睛是看不到的。”

需要注意的是,完全匹配可能会省略一些标点符号以显示更多结果.

通配符

通配符可以用来进行模糊搜索,通常用在你不清楚关键字的情况下,Google使用的通配符是*,用它替换你不知道的词即可.

不**,毋宁死

通配符在很多情况下并不好用,你只要知道有这么个东西存在就好了.