イベント

GitHubの全パブリックリポジトリを北極圏の地下に1000年間保存する「GitHub Arctic Code Vault」

Arctic Code Vaultを含むGitHub Archive Programの全体像も紹介

 コード共有サイトのGitHubは、年次イベント「GitHub Universe 2019」を11月13~14日に開催した。本稿では、1日目の基調講演で発表された、GitHubの全パブリックリポジトリを北極圏の地下に1000年間保存する「GitHub Arctic Code Vault」と、GitHub Arctic Code Vaultを含む「GitHub Archive Program」についてレポートする。

全パブリックリポジトリを北極圏の地下に1000年保存

 1日目の基調講演の最後に再度登壇したGitHub CEOのNat Friedman氏は、まず、フィレンツェのサンタ・マリア・デル・フィオーレ大聖堂のドゥオーモの写真を示し、ローマ帝国時代の失われた建築技術をフィリッポ・ブルネレスキがよみがえらせて建設したというエピソードを語った。

 そして、現在では人類の進歩はソフトウェアに依存しており、その保存が問題だと主張した。

GitHubのCEOのNat Friedman氏
サンタ・マリア・デル・フィオーレ大聖堂のドゥオーモは、ローマ帝国時代の失われた建築技術をよみがえらせて建築されたという

 ここでFriedman氏が発表したのが「GitHub Arctic Code Vault」だ。まず動画で、北極圏の非武装地帯にあるノルウェーのスヴァールバル諸島の様子が紹介された。この地下の廃坑に、マイクロフィルムに保存されたGitHubのパブリック全リポジトリを、1000年間を想定して保存するという。

GitHub Arctic Code Vault発表
北極圏の非武装地帯にあるノルウェーのスヴァールバル諸島で地下の廃坑に保存

 第1回のスナップショットは2020年2月2日に取得して保存する。以後、数年ごとにスナップショットを取るという。

 このプロジェクトに携わるGitHubのDirector of Product Management, Special Projects、Kyle Daigle氏と、VP of special projectsのThomas Dohmke氏に、基調講演後に話を聞いたが、「テクノロジーは急速に変わるので、第1回以降の周期や保存方法はまだわからない」と語った。

 保存にはノルウェーのPiql社のマイクロフィルム技術が使われる。このマイクロフィルムでは、8800万ピクセルのQRコードによるデジタルデータと、ヒューマンリーダブルな写真などのデータを混在して記録できる。このPiql社が、ノルウェーの国営炭鉱会社Store Norske Spitsbergen Kulkompaniとともに運営するのが、スヴァールバルの地下の炭鉱にデータを保存する「Arctic World Archive」だ。

 ちなみに、Arctic World Archiveに近いコンセプトのプロジェクトに、同じくスヴァールバルの地下で世界中の種子を冷凍保存する「Svalbard Global Seed Vault(スヴァールバル世界種子貯蔵庫)」がある。このプロジェクトはビル・ゲイツ氏が中心になって実現された。

第1回のスナップショットは2020年2月2日に取得
保存にはPiql社のマイクロフィルム技術が使われる。一番右のコマには高密度QRコードが、そのほかのコマにはヒューマンリーダブルな画像が記録されている
プロジェクトに携わる、GitHubのDirector of Product Management, Special ProjectsのKyle Daigle氏と、VP of special projectsのThomas Dohmke氏

GitHub Arctic Code Vaultを含む共同プロジェクト「GitHub Archive Program」

 GitHub Arctic Code Vaultは、GitHubのオープンソース ソースコードを保存する「GitHub Archive Program」のプロジェクトの1つだ。GitHub Archive Programではデータ保管を、「コールドレイヤー」「ウォームレイヤー」「ホットレイヤー」の3つに分け、そのコールドレイヤーの取り組みに当たるのがGitHub Arctic Code Vault、という位置づけである。

 ウォームレイヤーはコールドレイヤーのように“氷づけ”するのではなく、参照される保管方法。これには、世界のWebを保存し続けている「Internet Archive」と、ソフトウェアを保存している「Software Heritage Foundation」とのパートナーシップにより行われる。

 ホットレイヤーは常に更新されているGitHubのパブリックリポジトリをリアルタイムで保存するもので、「GH Archive」と「GHTorrent」という2つのパートナーコミュニティが行う。GitHubのAPIにより公開されているすべてのイベントをモニターし、そこからデータベースに追加し、統計分析などに利用する。

GitHub Arctic Code VaultはGitHub Archive Programのプロジェクトの1つ

 GitHub Archive Programは、スタンフォード大学図書館、Long Now Foundation、 Internet Archive、Software Heritage Foundation、Piql、Microsoft Research、オックスフォード大学ボドリアン図書館などの機関や団体とのパートナーシップによって実現する。

 GitHub Arctic Code Vaultの発表と同じ1日目に開催されたブレークアウトセッション「GitHub Archive Program Partner Panel」では、それらのパートナーが壇上に集まり、自社の取り組みをそれぞれ紹介した。

GitHub Universeのブレークアウトセッション「GitHub Archive Program Partner Panel」の様子

 GitHub Arctic Code VaultでGitHubと組んでいるPiql社のPatricia Alfheim氏とBendik Bryde氏は、Piqlのマイクロフィルム技術と、前述したArctic World Archiveについて説明。バチカン図書館を含む世界30件のArctic World Archiveの顧客を紹介し、「Arctic World ArchiveではGitHub Archive Proramを歓迎します。GitHubは初めてのソフトウェアリポジトリの顧客です」と語った。

Piql社のPatricia Alfheim氏とBendik Bryde氏
Arctic World Archiveの紹介
Piqlのマイクロフィルムのリール
Arctic World Archiveの顧客。バチカン図書館の名前もある

 技術的に興味深いものとしては、ガラスに情報を高密度に記録するMicrosoftの「Project Silica」の紹介があった。「データを安全に何千年も保存する」というコンセプトのデータストレージ媒体だ。Senior ResearcherのIoan Stefanovici氏は、熱湯に入れても、スチールたわしでこすっても、電子レンジで“チン”しても、オーブンで焼いても壊れないというところを動画で見せた。

MicrosoftのSenior ResearcherのIoan Stefanovici氏
ガラスに情報を高密度に記録するProject Silica

 そのほか、Internet ArchiveのFounder and Digital LibrarianのBrewster Kahle氏は、日本の古代の仏像を例に、たくさん複製することで安全に遺されたと語り、コピーして残すことの重要性を説いた。

 Software Heritage FoundationのFounderのRoberto Di Cosmo氏は、宇宙船アポロ11号のソースコードや、ゲーム「Quake III」のソースコードを例に挙げながら、「Collect, preserve and share the source code of all the software that is available」というミッションを紹介した。

 スタンフォード大学図書館のHenry Lowood氏は、カセットテープに記録された昔のPCゲームなどを例にして、文化の対象としてのハードウェアやソフトウェアを集めた博物館としての活動を紹介。

 ロング・ナウ協会(The Long Now Foundation)のNick Brysiewicz氏は、1万年動作するという時計や、ロゼッタストーンなどの「次の1万年を考える」プロジェクトを紹介した。

Internet ArchiveのFounder and Digital LibrarianのBrewster Kahle氏
Software Heritage FoundationのFounderのRoberto Di Cosmo氏
Software Heritage Foundationの活動の例:アポロ11号やQuake IIIのソースコード
スタンフォード大学図書館のHenry Lowood氏
スタンフォード大学図書館の活動の例:カセットテープに記録された昔のPCゲーム
ロング・ナウ協会のNick Brysiewicz氏
1万年動作するという時計のプロジェクト