イベント
GitHubの全パブリックリポジトリを北極圏の地下に1000年間保存する「GitHub Arctic Code Vault」
Arctic Code Vaultを含むGitHub Archive Programの全体像も紹介
2019年11月18日 11:56
コード共有サイトのGitHubは、年次イベント「GitHub Universe 2019」を11月13~14日に開催した。本稿では、1日目の基調講演で発表された、GitHubの全パブリックリポジトリを北極圏の地下に1000年間保存する「GitHub Arctic Code Vault」と、GitHub Arctic Code Vaultを含む「GitHub Archive Program」についてレポートする。
全パブリックリポジトリを北極圏の地下に1000年保存
1日目の基調講演の最後に再度登壇したGitHub CEOのNat Friedman氏は、まず、フィレンツェのサンタ・マリア・デル・フィオーレ大聖堂のドゥオーモの写真を示し、ローマ帝国時代の失われた建築技術をフィリッポ・ブルネレスキがよみがえらせて建設したというエピソードを語った。
そして、現在では人類の進歩はソフトウェアに依存しており、その保存が問題だと主張した。
ここでFriedman氏が発表したのが「GitHub Arctic Code Vault」だ。まず動画で、北極圏の非武装地帯にあるノルウェーのスヴァールバル諸島の様子が紹介された。この地下の廃坑に、マイクロフィルムに保存されたGitHubのパブリック全リポジトリを、1000年間を想定して保存するという。
第1回のスナップショットは2020年2月2日に取得して保存する。以後、数年ごとにスナップショットを取るという。
このプロジェクトに携わるGitHubのDirector of Product Management, Special Projects、Kyle Daigle氏と、VP of special projectsのThomas Dohmke氏に、基調講演後に話を聞いたが、「テクノロジーは急速に変わるので、第1回以降の周期や保存方法はまだわからない」と語った。
保存にはノルウェーのPiql社のマイクロフィルム技術が使われる。このマイクロフィルムでは、8800万ピクセルのQRコードによるデジタルデータと、ヒューマンリーダブルな写真などのデータを混在して記録できる。このPiql社が、ノルウェーの国営炭鉱会社Store Norske Spitsbergen Kulkompaniとともに運営するのが、スヴァールバルの地下の炭鉱にデータを保存する「Arctic World Archive」だ。
ちなみに、Arctic World Archiveに近いコンセプトのプロジェクトに、同じくスヴァールバルの地下で世界中の種子を冷凍保存する「Svalbard Global Seed Vault(スヴァールバル世界種子貯蔵庫)」がある。このプロジェクトはビル・ゲイツ氏が中心になって実現された。
GitHub Arctic Code Vaultを含む共同プロジェクト「GitHub Archive Program」
GitHub Arctic Code Vaultは、GitHubのオープンソース ソースコードを保存する「GitHub Archive Program」のプロジェクトの1つだ。GitHub Archive Programではデータ保管を、「コールドレイヤー」「ウォームレイヤー」「ホットレイヤー」の3つに分け、そのコールドレイヤーの取り組みに当たるのがGitHub Arctic Code Vault、という位置づけである。
ウォームレイヤーはコールドレイヤーのように“氷づけ”するのではなく、参照される保管方法。これには、世界のWebを保存し続けている「Internet Archive」と、ソフトウェアを保存している「Software Heritage Foundation」とのパートナーシップにより行われる。
ホットレイヤーは常に更新されているGitHubのパブリックリポジトリをリアルタイムで保存するもので、「GH Archive」と「GHTorrent」という2つのパートナーコミュニティが行う。GitHubのAPIにより公開されているすべてのイベントをモニターし、そこからデータベースに追加し、統計分析などに利用する。
GitHub Archive Programは、スタンフォード大学図書館、Long Now Foundation、 Internet Archive、Software Heritage Foundation、Piql、Microsoft Research、オックスフォード大学ボドリアン図書館などの機関や団体とのパートナーシップによって実現する。
GitHub Arctic Code Vaultの発表と同じ1日目に開催されたブレークアウトセッション「GitHub Archive Program Partner Panel」では、それらのパートナーが壇上に集まり、自社の取り組みをそれぞれ紹介した。
GitHub Arctic Code VaultでGitHubと組んでいるPiql社のPatricia Alfheim氏とBendik Bryde氏は、Piqlのマイクロフィルム技術と、前述したArctic World Archiveについて説明。バチカン図書館を含む世界30件のArctic World Archiveの顧客を紹介し、「Arctic World ArchiveではGitHub Archive Proramを歓迎します。GitHubは初めてのソフトウェアリポジトリの顧客です」と語った。
技術的に興味深いものとしては、ガラスに情報を高密度に記録するMicrosoftの「Project Silica」の紹介があった。「データを安全に何千年も保存する」というコンセプトのデータストレージ媒体だ。Senior ResearcherのIoan Stefanovici氏は、熱湯に入れても、スチールたわしでこすっても、電子レンジで“チン”しても、オーブンで焼いても壊れないというところを動画で見せた。
そのほか、Internet ArchiveのFounder and Digital LibrarianのBrewster Kahle氏は、日本の古代の仏像を例に、たくさん複製することで安全に遺されたと語り、コピーして残すことの重要性を説いた。
Software Heritage FoundationのFounderのRoberto Di Cosmo氏は、宇宙船アポロ11号のソースコードや、ゲーム「Quake III」のソースコードを例に挙げながら、「Collect, preserve and share the source code of all the software that is available」というミッションを紹介した。
スタンフォード大学図書館のHenry Lowood氏は、カセットテープに記録された昔のPCゲームなどを例にして、文化の対象としてのハードウェアやソフトウェアを集めた博物館としての活動を紹介。
ロング・ナウ協会(The Long Now Foundation)のNick Brysiewicz氏は、1万年動作するという時計や、ロゼッタストーンなどの「次の1万年を考える」プロジェクトを紹介した。