电脑版
首页

搜索 繁体

Chapter18(2/4)

今天,在互联网和全球所有大图书馆和博馆的在线数据帮助下,凯瑟琳的这一要求只需使用有翻译模块的相对简单的搜索引擎,输一些心挑选的关键词就能办到。

本章尚未读完,请击下一页继续阅读---->>>

『注①:弗里斯兰语(Frisian),古代居住在荷兰北的条顿人使用的语言。』

写了几个后,她停顿一下,思索片刻后又写了一串。“好了。”她说着把那张纸递给翠西。

你终于来了,宝贝⑤。

“我会编写一个名为代理者的程序。”翠西解释说“这不是完整的程序,但用起来很快。原则上,就是命令别人的搜索引擎为我们的工作服务。大分的数据库都有内搜索功能——图书馆、博馆、大学、政府机构等等。我编写的蜘蛛会找到他们的搜索引擎,输你的关键词,要求他们行搜索。使用这方式,我们可以驾驭成千上万的搜索引擎共同为我们工作。”

“没问题。”翠西说。这个实验室的许多研究资料包许多用古代文字书写的段落,翠西经常被要求编写一些特定的光学字符识别翻译模块,把那些晦涩的文字变成英语文本。她不得不成为世界上惟一使用古老的弗里斯兰语①、米克语②、阿卡得语③建立光学字符识别翻译模块的元系统专家。

凯瑟琳对此表赞赏。“程序并联。”

“这么快?”觊瑟琳看上去颇受鼓舞。

这些模块会有助益,但要想建立一个有效的搜索蜘蛛④,关键还在于选对关键词。有独特却又不能过度限制。

『注⑤:原文是You'vecomealongway,baby,自某烟草公司的香烟广告词。』

『注②:米克语(Maek),据东密歇大学的语言学网页介绍,这是韩国东极少数居民使用的一语,但有些专家怀疑这语言的存在。』『注③:阿卡得语(Akkadian),古代生活在索不达米亚的闪米特人游牧族阿卡得人的语言。』

“需要多长时间?”凯瑟琳问。

这是英语吗?“你真的认为我们在一个地方找齐全东西?逐字逐字?”

翠西开始写程序。以她的平,编写搜索蜘蛛实在是大材小用,但翠西·唐纳不在乎这个。她会为凯瑟琳·所罗门任何事情。直到现在,翠西仍时常觉得自己能来这儿活是天赐好运。

『注④:搜索蜘蛛(searchspider),搜索引擎的一自动程序。』凯瑟琳似乎已经想到了翠西前面,在一张纸上匆匆写下一些可能的关键词。

『注⑥:网上确有这样一个博客。』“翠西·唐纳吗?”一个女

元系统。“发现了什么我会叫你的。”

翠西。传统的搜索引擎通常需要一整天时间来爬梳整个在线世界,以找新的文本,消化其内容,然后添加到可搜索的数据库里。但这不是翠西要编写的蜘蛛。

“谢谢你,翠西。”凯瑟琳拍拍她的背,向门走去。“我在图书室。”

一年前,翠西从那个有着许多小隔间的科技公司辞掉了元系统分析员的工作。赋闲在家的那段时间里,她成了编程自由人,还开了一个专题研究博客——“元系统分析的应用前景”⑥——尽她怀疑是否有人能读得懂。但是有天晚上,她的手机响了。

翠西接过那张搜索词表,睛猛地睁大了。凯瑟琳要调查的是什么疯狂的传说啊?“你要我搜索所有这些关键词条吗?”里面甚至有个翠西都不认识的词。

翠西本想说不可能。但这个单词在这儿是被禁用的。凯瑟琳认为,在一个会把预先设定的谬误变成确定的真理的领域里,这是一个危险的意识设定。翠西·唐纳极为怀疑对这些关键词的搜索会落那个范畴。

“编写蜘蛛需要一两分钟,然后启动搜索。大概十五分钟后,蜘蛛就会抓得差不多了。”

“我想试一下。”

热门小说推荐

最近更新小说