物流、不動産、マーケティング、アナリティクスなど、多くの住所データを扱う分野での活用が期待されます。
住所データを扱う際の問題
住所データを扱う際、住所の書き方(漢字、ひらがなカタカナ、英語表記)、分割の仕方が人やシステムによって違うことが原因で起こる“表記ゆれ”という問題があります。表記ゆれにより、同じ住所であっても別のデータとして扱われることもあるそう。例えば、「東京都千代田区永田町一丁目7番1号」と「千代田区永田町1-7−1」は同じ場所を指しますが、コンピューターが読む場合には別のデータとして認識されます。
また、住所データに緯度経度の座標を付与する“緯度経度情報追加(ジオコーディング)”のコストの高さも問題のようです。
住所表記を統一、座標を付与する「クイック住所変換」
「クイック住所変換」では、表記ゆれをしている住所を含むExcel(.xlsx)ファイル、CSVファイル(.csv)をアップロードすると、正規化(使いやすい統一されたフォーマットの表記に変換)済みの住所と、座標が付与されたデータをダウンロードできます。正規化やジオコーディングのプロセスを組み込むことで、会員名簿、CRMやSAの顧客リスト、配送先リスト、店舗リスト、マーケティングデータなど、住所を含むすべてのデータの精度を向上させることが可能です。
住所を番地・号レベルまで正規化
「クイック住所変換」の強みは、全国の住所を網羅し、更新していくデータとして公開した「Geolonia 住所データ」を利用して、住所を番地・号レベルまで正規化できること。市区町村名に含まれる「ケ」「の」「ツ」、北海道の「条」表記などにも対応するほか、抜けている都道府県や郡を補完したり、新字体と旧字体のゆらぎを吸収したりと、さまざまな表記を正規化することが可能です。
なお、テストデータなどにおける正規化の精度は約98%だといいます。
国のデータを参照
「クイック住所変換」が対象とする元データは、デジタル庁が整備を進めるアドレスベースレジストリ、法務省が公開する登記所備付地図データ、国土交通省の位置参照情報。合計267,947,482件のデータ量をベースに正規化変換とジオコーディングを行っています。株式会社Geoloniaは、今後も、国によるデータの追加や更新に歩調を合わせ、精度の向上や機能追加を継続する方針です。
利用フローと料金体制
同サービスは、クレジットカード決済だけですぐに利用できる仕組みで、問い合わせや会員登録などは必要ありません。1,000件までのスタンダードが5,000円、5,000件までのミドルが10,000円、15,000件までのラージが30,000円で、正規化のみの利用であれば半額で利用できます(すべて税抜)。
データは再利用・再配布、クレジット表記不要で商用利用も可能。未決済のデータファイルは、利用から24時間で自動削除されるので安心です。
参考元:https://prtimes.jp/main/html/rd/p/000000010.000060265.html
(文・Higuchi)