2019年03月04日

氏名を自動でヘボン式ローマ字変換するのは難しい その2

こんにちは、滝澤です。

2018年12月3日の記事で、「氏名を自動でヘボン式ローマ字変換するのは難しい」を投稿しました。

今日は引き続き「その2」を書きたいと思います。


前回の記事で、

「ヘボン式では長音の取り扱いが難しく、
日本語の区切りを判別して長音を1文字とするか判断する必要がある」と書きました。

(例:「井」「上」と漢字が分かれるため、「ino+ue」の「inoue」が望ましい等)


その後の調査したところ

上記の理解であってはいるがあくまで、「長音かどうか」が判断ポイントで、

「通常、長音(読み方の「ー」)は、二つの漢字をまたがないため、

漢字(日本語の区切り)を判別して、長音かどうかの判断材料に利用する」が正しい様です。

#氏名読み変換
1ニーナニーナnina
2新菜にいなniina
3松浦まつ うらmatsuura
4小団扇こ うちわkouchiwa
5坂野上さか の うえsakanoue
6納江のう えnoe

#1、#2は外務省のヘボン式ローマ字綴方表に例として記載あり。

#3、#4は神奈川県パスポートセンターの例として記載があり。


氏名に関することだけに、こだわりを持つ方もおおく、

私もアドレスが自分の思うスペルと違っていた場合には訂正を求めると思います。

いっそのこといつでも修正可能であればいいのですが、、、


といったところで、

私の目標である「日本語の氏名(姓・名)からメールアドレスを自動生成」は、

ヘボン式ローマ字変換では難しいという結論は変わらず。今日も目視チェックを頑張ります!


それではこの辺で失礼します。

posted by 滝澤 at 06:59| Comment(0) | 運用保守 | このブログの読者になる | 更新情報をチェックする