グーグルのズサン工事?!&10年一昔・4万分の1

google2001search」というサービスが9月30日から1か月限定で始まっています。(その講釈はこちら) GOOGLE TECHNOLOGY INC.が設立された1998年9月から10年が経過したのを記念して開設されたページの中にあります。

ま、10年一昔で、そのころの検索結果はこんなもんでした、ということを実感してもらおうということなんだけど、実際には「技術的な問題がいろいろあって、2001年1月の検索結果を見てください」ということだそう。で、「google2001search」ということ。

で、google2001searchのページ(googleのロゴはスタート当時のもの)で「首相官邸」と入れて検索すると、出てくるのは3万4400件、で、通常のグーグルで検索すると133万件。ちょっと見は7年で首相官邸に関する情報が40倍以上にも増えたように見えるけど、実は違う。それはあとで。

2001searchで検索した結果のトップは「首相官邸トップページ」で、そのサマリーは「首相官邸ホームページ. 首相官邸正面玄関. 森総理, ようこそ官邸へ.当ホームページでは、森内閣で検討された事項や政府公表資料等を積極的に公開しております。 また、国民の皆様からのご意見・ご要望を頂戴し、今後の施策に反映させ ・・・

とあって、明らかに森内閣当時のもの。たしかに2001年1月段階の首相は森さん。で、「首相官邸トップページ」とある部分をそのままクリックすると、麻生首相が笑顔で受話器を耳にあてている現在の首相官邸トップページが表示されます。しかし、2001searchのウリである<View old version on the Internet Archive>をクリックすると、あらら、確かに昔の官邸ページですが、どうやら2001年12月中旬のページで、官邸の主は小泉サンです。

2001年4月26日に首相は森さんから小泉さんに代わっています。つまり、2001searchで出た検索結果はgoogleの2001年1月のindexから表示されましたが、<View old version on the Internet Archive>をクリックすることで飛ぶ先は<internet archive>に設定されているので、出てきたのはインターネットアーカイブに残されているコピーだったわけです。

逆に言うと、2001年当時、「首相官邸」というキーワードを含んでいても、インターネットアーカイブにコピーのない”弱小”サイトは、2001searchでは表示対象にされないので今より40分の1以下の3万あまりしか検索結果が表示されないのです。また、グーグルの言う「技術的な問題がいろいろあって」というのは、2000年以前はインターネットアーカイブの巡回&コピー収集能力がとても低かったことと関係がありそうです。

では、なぜsearch2001の検索結果とinternet archiveのコピーとの日付が合わなかったのでしょうか。それは多分こういうことです。googleにしろインターネットアーカイブにしろ、毎日毎日、すべてのウェブページを巡回しているわけではないそうです。有力サイトでも数日に1回というペースらしい。まして7年前だともっと間隔が空いたはず。

ですから、グーグルが巡回してindexを作った日にインターネットアーカイブも巡回してコピーを取っていないというのは当たり前に起きる。そこで、グーグルはインターネットアーカイブに残された2001年中の「首相官邸トップページ」のいくつかのコピーの中の一つに適当にリンクを張ったというところでしょう。まあ、これが表題に「ズサン工事」と書いたわけです。証拠はないけど、そうとしか考えられません。だって、2001年1月から4月までインターネットアーカイブは「首相官邸」のトップページを14本もコピーしてるんですから。なんでそのあたりにリンク張らないで、いきなり12月に行くんだよ、ってなもん。ね、杜撰でしょ。英語の方は検証してないけど、少なくとも日本語ページでは他にも例が見つかった。

で、その1例で、1998年4月に書いた私の記事が個人サイトに勝手に全文掲載されていて、自分なりに「10年一昔」を実感しました。それは小中学校の情報化に関する記事でしたが、その趣旨は省略します。我ながらびっくりしたのは(失念してた!)、当時、通信速度1.5メガ・ビットの専用回線の料金がな~~んと月32万6千円、保守管理サービス度の低いものでも15万2千円もしたということ。で、全国でも3000回線程度しか普及していなかったとは! 10年経って、メガを飛び越してギガ(メガの1000倍)回線がKDDIの場合、月5460円から、(プレスリリース)なんて10年前には日本中の誰も想像しなかったことだろうな。なにせ速度は700倍近くなって料金は60分の1! つまり料金は4万分の1になっちゃったわけですから。そういう意味じゃ10年先を考えると恐ろしい。ズサン工事って書いたけど、この企画、いや、なかなか意味がありそうです。

あ、それと根本的な疑問。グーグルは古いインデックスを全部残していることははっきりしたけど、そのインデックスを作るために収集したサイトのコピーは残していないのだろうか。残していないってことを言いたいためにズサンなやり方でインターネットアーカイブをあえて使ったということは・・・・な、ことはないんでしょうね。

  • Share/Bookmark

Trackback URL

No Comment

No comments yet

Leave a reply