ニュース

一橋大学、小・中・高での統計教育推進に向けた「基本統計量に基づいた度数別数値パターン検索」にオラクルの自律型データベースを採用

 日本オラクル株式会社は18日、国立大学法人一橋大学が、学術研究・高等教育のための公的統計ミクロデータ利用の促進の一環として、小・中・高での統計教育の推進に向けて同大学が開発した「基本統計量に基づいた度数別数値パターンデータベース」を「Oracle Autonomous Data Warehouse」で構築するとともに、ウェブ上でのデータ検索環境を「Oracle Application Express(APEX)」で構築したと発表した。

 一橋大学は、独立行政法人統計センターと連携協力協定を締結し、日本の公的統計並びに学術研究の発展および振興に寄与する活動を行っている。その活動の一つに、学内にオンサイト施設を設置し、公的統計ミクロデータの利用(オンサイト利用)環境の提供がある。オンサイト利用においては、利用者は統計調査の調査票情報を用いて探索的な研究が行えるが、この審査はEES Net SDCと呼ばれる文書を元に総務省で策定されたガイドラインに基づいて行われている。

 一橋大学の行った「基本統計量に基づいた度数別数値パターン検索」の研究開発では、前述のガイドラインに加え、データの持ち出しが安全か否かを、平均、分散、歪度および尖度などの基本統計量を用いて判定可能か検証を行った。この研究で用いた基本統計量の検索および活用の手法は、小・中・高での統計教育に興味を持つきっかけとなることから、データ検索環境を一橋大学経済研究所のウェブ上で2020年6月から公開した。

 この研究では、1510億の基本統計量と約2億件にもおよぶ数値パターン(無限にある実数を有限化することで得られる値)を検索して回答を得るシステムを、限られた人員、予算内で構築する必要があった。当初、一橋大学では高性能ワークステーションで稼働する他社データベースでこのデータの処理と抽出を試みたが、性能上検索結果を得ることができないという問題に直面し、性能、運用管理およびコストの要件に合ったシステムを検討していたという。

 そこで、Oracle Autonomous Data Warehouseで検証したところ、これまで全く抽出できなかったデータ検索が実行できる性能を得られただけでなく、アジャイル開発基盤での迅速なUI設計・開発が可能であること、自律機能による運用管理の負担軽減、暗号化によるデータ・セキュリティなどの今後の運用や外部公開におけるメリットを評価し、Oracle Autonomous Data Warehouseの導入を決定したという。

 今回の研究開発では、Oracle Autonomous Data Warehouseのパーティショニング機能により1510億件ある基本統計量を分散処理し、2TB以上あったデータに対して圧縮機能を活用することで、最小限のリソースでも高い性能を実現した。また、Oracle Autonomous Data Warehouseでは、データウェアハウスを利用していない際にはコンピュートリソースをオフにできるため、仮想サーバー上にスケジューラー機能を実装、設置し、利用コストを柔軟に管理している。

 さらには、ウェブ上でのデータ利用を可能にする検索環境を、ローコードでのアプリケーション開発ツール「Oracle Application Express」で開発、公開した。

 環境構築には、日本オラクルのコンサルティング部門が提供する「Rapid Start Service for Autonomous Data Warehouse Cloud 」を採用し、Oracle Autonomous Data WarehouseへのデータロードやOracle Application Expressでのウェブアプリケーション開発などの支援により、約1.5カ月という迅速な環境構築を実現した。クラウド上にある検索システムを相互に確認し、修正を繰り返すアジャイル型の開発手法を採用することにより、短期間でのパターンデータベース開発およびデータ検索環境の構築を可能にした。

 一橋大学では、Oracle Autonomous Data Warehouseの採用を機に、同大学で手掛ける他のプロジェクトでも利用を開始している。高性能で運用負担を軽減できるだけでなく、Oracle Autonomous Data Warehouseで利用可能な「Oracle Data Visualization」で簡単にデータの可視化を実現できることから、同大学で行っているカンボジア政府統計調査の支援活動など、さまざまな統計データの利用促進に活用しているという。