渡邊の「邊」などの異体字の使い分け、MS Officeで可能に、IVSアドイン公開


 日本マイクロソフト株式会社は12日、人名や地名などに使われる漢字の“異体字”をMicrosoft Officeドキュメントで扱えるようにするアドイン「Unicode IVS Add-in for Microsoft Office」の無償提供を開始した。オープンソースのポータルサイト「CodePlex」からダウンロードできる。

 IVS(Ideographic Variation Sequence)とは、文字コードにおいて1つの文字として扱われるために使い分けることができなかった細かな字形の違いがある漢字を、プレーンテキスト中でも指定できるようにする仕組み。基本となる字形の文字(基底文字)の符号に、その字形バリエーションを表す符号(字形選択子)を組み合わせることで異体字を表現する。IVSに対応したフォントとアプリケーションであれば、そうした異体字を入力・表示し、テキストデータとしてやり取りして再現できる。

IVS異体字の例(使用アプリケーションは「Word 2013」)。各異体字の下に記載してあるのが、その字形を指定するための符号

 IVS Add-inは、Windows 7/VistaのMicrosoft Office 2010/2007に対応しており、「Unicode IVD(UTS#37)」対応フォントと組み合わせて使用することで、「Word」「Excel」「PowerPoint」で約5万8000字の異体字を表示・印刷・編集できるようになる。これらのOfficeアプリケーション上では、そのドキュメントで使用する異体字をテンポラリ領域に外字として割り当てて処理し、ファイル書き出し/読み込み時にIVSの符号と相互変換する仕組み。

 UTS#37に対応するフォントとしては、独立行政法人情報処理推進機構(IPA)が公開している「IPAmj明朝」などがある。IPAmj明朝は、経済産業省の委託事業である「文字情報基盤構築に関する研究開発事業」の成果として公開されているもの。「戸籍統一文字」の漢字5万5270字、「住民基本台帳ネットワークシステム統一文字」の漢字1万9563字を網羅する「文字情報基盤漢字」として5万8813文字について、「ISO/IEC 10646(UCS)」における符号化を推進してきた。現在はまだ6789字が符号化されていないが、このうち約4400字が2013年度にIVSとして実装されるほか、2014年度にさらに500字が符号化される予定だという。さらに2015年度以降、残る1900字についての符号化完了を目指す。

「文字情報基盤漢字」の概要とカバーする漢字の範囲

「文字情報基盤漢字」および「IPAmj明朝」フォントと「ISO/IEC 10646(UCS)」の関係

 日本マイクロソフトは2007年、漢字1万50字を収録する文字コード「JIS X 0213:2004」に対応した。しかし、人名や地名を含めたすべての漢字を表現できるわけではなく、自治体のシステムなどでは、そうした漢字を各自治体ごとに“外字”として作成・登録して運用しているという。その結果、自治体間でそのままデータをやり取りすることができず、電子行政の分断が発生。システムを相互接続する必要のある被災者支援システムの整備や、システムのクラウド化にあたってネックとなっている。

 IVSおよびIPAmj明朝を使用することで、日本の行政業務上で必要とされる漢字が文字コードで再現できる“内字”として扱えるようになるため、各自治体のシステムごとに発生していた外字の作成・管理コストが不要になるとともに、自治体間でのデータの活用も容易になることが期待されるという。また、Microsoft Officeでも扱えるようにすることで、異体字を扱うために自治体職員全員に専用アプリケーションを配備するといったコスト負担も避けられるとしている。

文字コードとマイクロソフトの取り組み

 なお、日本マイクロソフトによれば、最新OSのWindows 8およびWindows Server 2012においては、すでにOSレベルでUTS#37に対応済み。UTS#37対応フォントをインストールしていれば、例えば「メモ帳」やOfficeの次期バージョンである「Office 2013」などのアプリケーションから標準で異体字を扱えるという。

 ただし、IVS Add-inをインストールしたOffice 2010/2007であれ、Windows 8であれ、IVSによる異体字を扱えるようになるといっても、それだけではIMEから変換・選択できるようになるわけではない。IMEから異体字を入力するためには、IVS Add-inおよびIPAmj明朝をインストールした上で、さらにユーザー側でIMEの辞書を拡張する必要がある。

IMEからのIVS異体字の入力方法例

 IPAmj明朝は、その成り立ちからもわかるように、自治体・行政などの一部の業務分野での使用を想定したものだ。UTS#37対応フォントとしてはこのほか、Adobe Systemsでも提供しているが、こちらも出版・印刷という一部業界でのニーズを想定したものと言える。また、日本マイクロソフトが提供し、Windowsユーザーに広く使用されている「メイリオ」フォントについて同社では、一般にも使用頻度が高いと考えられる地名の異体字などごく一部を除き、文字情報基盤漢字のすべての字形を用意する考えはないとしている。このように、現状ではIVS異体字の仕組み自体、広く一般ユーザーに手軽に利用してもらうという位置付けではないと考えられ、こうした設定作業などを必要とするような実装は、逆に異体字の知識がない一般ユーザーが不用意に変換・入力してしまわないためのハードルになっているとも言えそうだ。

 なお、日本マイクロソフトもメンバーとして参加するIVS技術促進協議会が2013年1月より、IVSに対応したMicrosoft IME拡張辞書を無償提供予定だという。

 また、IVS Add-inは、インストールモジュールとして配布するだけでなく、ソースコードも無償で公開。機能を拡張した行政機関向けツールをSI企業が開発したり、Windows以外のOSでの活用も行えるようにした。まずは、IVS Add-inと入力補助ツール機能などをセットにした有償版がイースト株式会社から発売される。

日本マイクロソフト株式会社最高技術責任者/マイクロソフトディベロップメント株式会社代表取締役社長の加治佐俊一氏独立行政法人情報処理振興機構技術本部国際標準推進センター長の田代秀一氏



関連情報