ITにおける「名寄せ (なよせ)」の意味を分かりやすく解説してみました。
名寄せ(なよせ)とは
名寄せとは、複数に分散した書類の中から、氏名やメールアドレス、住所や電話番号などの情報をもとにして、同一人物や同一企業を一つにまとめる作業のことを言います。
主に、銀行、金融機関において、各種取引口座(預金口座・貯金口座の他貿易取引口座)を一元管理することをいいます。
特にIT業界における「名寄せ」とは、複数に分散されているデータベースの同一人物、同一企業、同一世帯に対し、同一のIDを付与するなどしてデータを統合することを言います。
ITで名寄せの判定として使われる一般的なキーは以下のものがあります。
1. 氏名
2. ふりがな
3. 生年月日
4. 性別
5. 住所
6. 自宅電話番号
7. 携帯電話番号
8. emailアドレス
データクレンジングとは
名寄せをITっぽく、ほぼ同義で言い換えた用語をデータクレンジングと言います。
データクレンジングとは、データベースに保存されているデータの誤記や表記ゆれ、重複などを削除し、活用しやすいよう標準化することを意味します。
具体的な例は以下のとおりです。
● 全角・半角文字の混在やスペースの有無
● 法人名の表記(株式会社・(株)やアルファベット・カタカナ表記の違いなど)
● 電話番号のハイフンの有無
● 人名の異体字
● 元号をはじめとした日付表記の違い
名寄せツール比較
代表的な名寄せツールを比較してみました。
FORCAS (フォーカス)
FORCASは、顧客管理システムから名刺データ、営業ターゲットリストなどの面から、データベースを名寄せすることができる名寄せエンジンです。
↓FORCAS (フォーカス) の公式サイトはコチラ
TRILLIUM (トリリアム)
TRILLIUMは全世界で約1,500ユーザー、日本国内では約200ユーザーの実績がある、データクレンジング・名寄せツールです。
↓TRILLIUM (トリリアム) の公式サイトはコチラ
・https://www.agrex.co.jp/page/trillium
OpenRefine (Google Refine)
OpenRefine (オープンリファイン) は無料でスタンドアローンの名寄せツールです。
↓OpenRefineの公式サイトはコチラ
コメント