对于中文使用者而言,下面的报道无疑是个好消息:
在1月11日和12日这两天,全球互联网第一搜索引擎Google和第一中文搜索引擎百度,几乎是不约而同地把焦点瞄准了中文:Google发布了其学术搜索的中文版(scholar.google.com),百度则发布了其国学搜索(guoxue.baidu.con)。
Google学术搜索可以帮助使用者准确搜索到某一领域的学术文献。据Google全球副总裁、中国区总裁李开复称,目前全球互联网上的中文学术文献的数量仅次于英文,中文已经成为互联网第二大语言,这也是Google积极推出中文学术搜索的主要动力。
目前,Google 学术捜索可搜索到用西欧语言、中文和巴西葡萄牙语撰写的文献。百度国学则主要专注于中国传统历史文化领域的资料搜索。目前两者均免费。
没有上网,也能找到
记者最近正在研读《隋书》(中华书局版),就随便在Google学术搜索上查了一下该书的主编“魏征”,结果第一条就是唐朝魏征主编的《隋书》。同一时刻(1月12日9:30),在百度国学上没有找到任何结果。
不过,Google学术搜索这第一条结果无法点击进去,该条目最左边的方括号中写着“引用”两字。
据Google资深工程师赵羽可介绍,Google学术搜索除了能否检索到大部分已经上网的学术文献外,还可以通过对这些在线文献进行逻辑分析,找出那些没有上网的、但也许更加重要的文献,魏征主编的《隋书》就是一例。
原来,有许多在线的学术文章中都引用了该书的内容,版本也多为中华书局版,于是,该版就成为“魏征”词条下最重要的一条结果。当然,该书是否在线并不是研究者的最大障碍,重要的是,研究者知道了确实还有这么一本书可以参考。
Google学术搜索涵盖了各方面文献(百度目前仅限于国学等几个领域),包括没有上网的文献,比如,爱因斯坦的很多著作并未在线发布,但却被众多学者所引用,通过Google学术搜索,一样能找到这些被引用文献的名称、版本、作者、出版日期、出版社、内容摘要等信息。通过提供这些引用信息,使研究者了解到许多重要的未上线文献。
Google杰出工程师Anurag Acharya说:“我们不知道下一个重要的突破会来自哪里,但我们相信,通过使各地研究者更轻松地了解在全球范围内已取得的研究成果,我们可以对他们有所帮助。”
搜索结果的排名顺序对研究者而言,可能比普通用户更为重要。
赵羽可介绍,Google学术搜索的文献排名是严格按照文章的学术价值来进行的,参考因素包括文献、作者、出版者的权威性,被引用的次数等,与普通 Google网页排名大有不同。
例如,查询“Human Genome”(人类基因组),普通 Google搜索结果超过700万个,排名在前面的都是机构首页,包括美国能源部、美国国家卫生研究院等,到了20名前后才出现刊登于《自然》、《科学》的相关文章。而Google学术搜索只命中39万个结果,排名前10位的都是在《自然》、《科学》等著名学术媒体上发表的文章。至于学术搜索的结果排名是否与Pagerank排名相似,赵羽可认为,有类似地方,但也有大不同。





