2018年12月03日

氏名を自動でヘボン式ローマ字変換するのは難しい

こんにちは、滝澤です。


今日も変わらず、アカウント作成業務を実施していた時のこと。

私の業務では、日本語の氏名(姓・名)からメールアドレスを生成しており、

「ヘボン式ローマ字変換」をルールとしています。


手作業でのローマ字変換は手間なのでVBAを検討・調査し、

ローマ字変換までは可能となりましたが、

日本語の氏名(姓・名)からの「ヘボン式ローマ字変換」は目視チェックが必須となってしまいました。


今日は、

「氏名を自動でヘボン式ローマ字変換するのは難しい」について投稿したいと思います。


なぜ、氏名の自動ヘボン式ローマ字変換は難しいのか、

原因はヘボン式ローマ字変換のルールにある「長音」の扱いにあります。


長音ルール   :母音の重なりを1文字で表記する。

           (例: とおる→TORU 、 おおにし→ONISHI )


たとえば「広岡(ひろおか)」さんをヘボン式ローマ字変換する場合、

そのまま、ルールに沿うと、「hirooka」ではなく「hiroka」となってしまいます。

これは、「hirooka」の「oo」が含まれるためです。


しかしながら、日本語としては「広」「岡」と漢字が分かれるため、「hiro+oka」の「hirooka」と作成するのが望ましくあります。

その他の例:

ひろおかいのうえおおにしとおるこうじ
HirookaInoue×Oonishi×Tooru×Kouji
×Hiroka×InoeOnishi○Toru
○Koji

その他の氏名でも上記のように、日本語の区切りを判別して長音を1文字とするか判断する必要があります。


上記以外の方式として、「氏名のパターン」を組み込むこともを検討しましたが、どちらも実現が難しく断念しました。

 ・「氏名のパターン」を組み込む : パターンが膨大で漏れが発生する

 ・「日本語の区切りを判別」する : パターンが膨大で漏れが発生する


結論としては、

最低でも氏名を入力するどこか1つのシステムで目視チェックが必要になるという、ありきたりなものになってしまいました。


「「氏名を自動でヘボン式ローマ字変換するのは難しい」」

それではこの辺で失礼します。

posted by 滝澤 at 12:04| Comment(2) | 運用保守 | このブログの読者になる | 更新情報をチェックする