ニュース

富士通クラウドテクノロジーズ、エリアごとの人口密度と経済的価値を機械学習によりクラスタリングしたデータ「Starflake retail」を提供

 富士通クラウドテクノロジーズ株式会社は6月30日、衛星データを含む複数のデータセットに機械学習を適用し、独自にクラスタリングしたデータサービス「Starflake retail」の提供を開始した。

 Starflake retailは、任意のエリアごとの人口密度と経済的な価値(地価など)を比較、クラスタリングしたデータ。流通業の店舗開発業務や不動産ディベロッパーの商業用不動産・分譲地開拓業務などにおいて、エリアごとの「コストパフォーマンス」を把握することができる。

サンプル画像:一都三県のStarflake retailをOpen Street Mapにプロットしたもの

 富士通クラウドテクノロジーズでは、流通サービスや不動産ディベロッパー企業が出店計画を決定する際に、目に見えて人口が多く、地価も高い都市エリアはほぼ必ず出店を検討するが、重要になるのは人口が比較的多く、地価が比較的安い、隠された「コストパフォーマンスの高いエリア」の情報ということが、複数のユーザー企業のヒアリングで明らかになったという。

 このため、「公示地価」および250mメッシュ単位で集計された「国勢調査(2015年版)」のデータを用い、地価が比較的安いが人口密度の高いエリアを抽出しようと試みたが、公示地価は年次更新のため、再開発の影響などを考慮できていない可能性があることや、人口10万人以上都市のみが開示されているため、郊外・地方都市はデータに欠損があるといった課題があったとしている。

 そこで、全世界日次で取得可能な「Starflake nightview(都市の夜間光データ)」が「公示地価」の代理変数とならないか検証を重ねたところ、一定の成果が得られたと説明。この結果を受け、Starflake nightviewを公示地価の代理変数=経済的な価値を表す変数として利用するとともに、国勢調査をもとにした人口密度データと250mメッシュ単位で結合し、富士通クラウドテクノロジーズの独自ロジックおよび教師なし学習のアルゴリズムにより、日本全国を人口密度と経済的な価値のバランス=コストパフォーマンスで分類した7つのクラスターに分けることに成功したという。

夜間光は公示地価と強い正の相関があるという

 クラスターのうち、「都市エリア」「準都市エリア」は、目に見えて人口が多く、地価も高い都市エリアに該当する。一方、「人口集中エリア」は、人口密度が高いわりに夜間光が低く、人口密度は高いが、比較的地価が安いコストパフォーマンスの高いエリアと解釈でき、出店や拠点開拓時にはこの「人口集中エリア」を選択することで、安い地価に比べて多くの顧客を獲得できると考えられるとしている。

クラスタリングイメージ

 サービスでは、任意の場所のエリアごとの人口密度と経済的な価値を比較、クラスタリングしたデータをCSVファイルで提供する。価格は、1都道府県あたり50万円(税別)。富士通クラウドテクノロジーズでは、Starflake retailの提供開始を記念して、対象プロダクト(地理関連統計データ、Starflakeシリーズ)を一律20%割引で提供するキャンペーンを実施する。キャンペーン期間は9月30日まで。