晓木虫
学术数据库客户端

找到从互联网上消失的网站有新办法了

 找回密码
 立即注册

QQ登录

微信登录

找到从互联网上消失的网站有新办法了

摘要: 从“互联网档案”的“网站时光倒流机”beta版本中搜索“geocities”能出现结果要找到那些已经从互联网上消失的网站,是很困难的事。但“互联网档案”(Internet Archive)创始人Brewster Kahle说,他们的“网站时光 ...

http://changedig-products.img.aliyuncs.com/network-crawler/2016-12-08/40061481162165269-60334565

从“互联网档案”的“网站时光倒流机”beta版本中搜索“geocities”能出现结果

要找到那些已经从互联网上消失的网站,是很困难的事。但“互联网档案”(Internet Archive)创始人Brewster Kahle说,他们的“网站时光倒流机”(Wayback Machine)正准备提供一项新功能,让追溯已经消失的网站变得易如反掌。

Wayback Machine已经能帮助人们找到过去15年内曾出现在互联网上网站了,但要搜索到在Internet Archive保存下来的网站,还得知道网页的URL。但在不久之后,只需使用关键词就能找到过期网站了——实际上你现在就能在公开的beta版本上进行测试了。

Wayback Machine的新功能不像谷歌那样可以显示一个网站上每个网页里的所有文字,而是显示每个保存下来的网站主页,而不能点入特定网页,但这样你也能看到这些过期网站的概貌了。

“互联网上可能有十亿个网站,”Kahle解释到,“我们做到这一步已经是尽力而为了。”但这项功能从可用性的角度说,已经是一大进步了。Kahle说,他也曾因为Wayback Machine没有关键词搜索功能而感到纠结。“我用Wayback Machine的时候,往往是先去谷歌用关键词找到网站的URL,然后再去Wayback Machine找这个网站之前的版本。但如果这个网站已经完全消失了怎么办?”

这可能要怪瞬息万变的互联网生态:互联网的历史充满了死去的各种网站,它们会整个消失,很难或根本不可能从谷歌上找到。

就拿GeoCities来说,它曾经是使用范围甚广的网站,后来被Yahoo收购,但现在除了在日本之外,都已经下线了。现在在谷歌搜索“GeoCities”,第一个结果是维基百科对这个网站的介绍,接下来是关于它怎么消亡的故事,但搜不到geocities.com这个URL,现在这个网址已经链接到Yahoo旗下一些小产业了。

但如果你在Wayback Machine测试版中搜索“GeoCities”,第一个结果就是geocities.com。Wayback Machine收集了这个域名下过去曾有过的3700万个网页的2亿个搜索结果。这是Wayback Machine新搜索功能的真正实力:让我们很容易就看到某个网站过去的样子。

找到从互联网上消失的网站有新办法了  |  责任编辑:虫子

路过

雷人

握手

鲜花

鸡蛋
返回顶部