ニュース

NEC、生成AIを活用して作成した15万人規模の「医療合成データ」による医療等データの二次利用に向けた実証を実施

 日本電気株式会社(以下、NEC)は25日、医療等データの二次利用の推進に向け、生成AIと医療情報の知見を活用して15万人規模の「医療合成データ」を作成し、実証を実施したと発表した。

 「医療合成データ」は、日本人の統計的特徴を反映した架空の患者データの集合で、同データを国際的な医療データ分析向けの共通規格「OMOP」に沿った形式に変換し、協力団体やパートナー企業とともに評価することで、将来の医療等データの二次利用に向けたデータ活用のプロセスを実証するとともに、「医療合成データ」の研究過程における有用性を確認できたという。

実証の概要図

 検査結果、処方内容、レセプト(診療報酬明細書)などの医療等データの活用には、個人の治療・健康管理に用いる「一次利用」と、医学研究や創薬に用いる「二次利用」がある。欧州では「欧州医療健康データスペース規則(EHDS)」が制定され、統一データ流通・活用基盤の構築も進んでおり、日本においても、政府や研究機関による国際的な動向を踏まえた医療等データの二次利用に向けた検討が加速している。

 しかし国内では、以前よりさまざまな二次利用研究は行われていたものの、医療機関ごとにデータ形式やコード体系が異なることがあり、分析可能な状態に整備する「前処理」に多大な工数を要することが課題となっている。また、医療機関・研究ごとにサイロ化したまま進んだため、国際連携によるデータ利活用が進みにくい環境であることも課題であり、さらに実データの利用には厳格なプライバシー保護と許諾プロセスが必要で、研究開発の迅速化を阻む要因となっていたという。

 こうした課題に対し、NECは今回、将来的な二次利用データプラットフォームの構築に向け、大規模な医療合成データの生成、データの国際共通規格「OMOP」への変換、実際の研究プロセスを模したシミュレーションに関する実証を実施した。

 AIによる学習と生成AIによる妥当性チェックを組み合わせることで、実際の患者情報を用いることなく、日本人の統計的特性(年齢構成、男女比、疾病履歴など)を再現した15万人規模の疑似的な医療データを短期間で合成した。

 レセプトデータ、DPC(診断群分類)データ(DPC制度の対象病院が厚生労働省に提出する入院医療に関するデータ)、処方FHIRデータ(医療情報交換のための国際標準規格「HL7 FHIR」に基づき、処方情報を構造化して表現した電子データ)など、異なる形式のソースを模した合成データを生成した上で、さらにこれらのデータをOMOPに統合変換し、複数のデータソースを横断した解析が可能であることを確認した。

 実証では、15万人規模の大量の医療合成データをOMOPへ変換し、3つのリサーチクエスチョンに適用した。また、愛媛大学および一般社団法人医療データ連携分析基盤協会の有識者の知見ならびにパートナー企業の協力を得て評価した。

 その結果、変換データはOMOP適合率98%を達成したことや、各研究で有効な解析環境を構築できたことを確認した。また、将来想定される実際の医療等データの共通規格への変換プロセスを先行して実証した。さらに、医療合成データを用いたデータ連結解析および研究者のニーズの先行検証の有効性を示すことができた。

 NECは、今回の実証で得られたスキームを、さまざまな医療データ二次利用基盤へ実装することを検討していく。これにより、安全かつ高度な医療データの利活用を促進し、医学研究の発展と国民の健康増進に貢献するとしている。