2019-08-16T01:54:32Z kzstock 毎月更新されるJP郵便番号データをMS-IMEの郵便番号辞書に変換する手順(KEN_ALL.CSV|2018/11/30)
Scrap 2nd.
3

毎月更新されるJP郵便番号データをMS-IMEの郵便番号辞書に変換する手順(KEN_ALL.CSV|2018/11/30)

1st:
2:2018-12-21
検証:Windows 10 Pro April 2018 Update, v1803
日本郵便郵便番号データ ken_all.zip 


年賀状シーズンなので MS-IME の郵便番号辞書が古い問題についての投稿のいくつかを拝読させていただきましたが、Microsoft 公式サイトで配布されている各Windowsのバージョンに対応したMS-IME郵便番号辞書の更新方法についての解説記事ばかりで、日本郵便が毎月リリースしている郵便番号データを利用する解説記事を見つけることができませんでした。

JP(Japan Post)日本郵便が毎月リリースしている郵便番号データを利用して、MS-IMEの郵便番号辞書を作成できることは知っていたのでチャレンジしたところ、2018/11/30版MS-IME郵便番号辞書の作成に成功したので手順をメモに残します。

私が利用したのは、JP郵便番号データ、フリーソフト「郵便番号辞書登録お助けツール」及びMS-IMEのユーザー辞書ツールです。

郵便番号データ(KEN_ALL.CSV)から不要な項目(列)を削除して、MS-IMEと同じ配置となるように列の並びを調整するスキルがあれば、「郵便番号辞書登録お助けツール」は必須ではありません。

今回作成した MS-IMEの郵便番号辞書はシステム辞書として登録したので、これまで通りユーザー辞書はそのまま利用することができます。


目次
  1. LINK郵便番号データを入手する(ken_all.zip|KEN_ALL.CSV)
  2. LINKKEN_ALL.CSV を MS-IMEで利用できる形式にコンバートする
  3. LINKMicrosoft IME ユーザー辞書ツールへコンバートしたデータを読み込む
  4. LINKユーザー辞書をシステム辞書に変換する
  5. LINK作成した郵便番号辞書をMS-IMEのシステム辞書として登録する

MS-IME で利用することができる最新の郵便番号辞書を作成する方法

日本郵便の郵便番号データ、フリーソフト及びMS-IMEのユーザー辞書ツールを利用して、MS-IMEで利用することができる最新の郵便番号辞書を作成します。

今回作成した郵便番号辞書は、124,229件のデータ量でした。

1. 郵便番号データを入手する

日本郵便株式会社(JP:Japan Post)の公式サイトから郵便番号データをダウンロードします。更新履歴を見る限り毎月末に最新版がアップロードされています。

記述時点の最新データは ken_all.zip, 2018/11/30 です。

ダウンロードするのは「全国一括(1,687,259Byte)|ken_all.zip」ファイルです。


ken_all.zip はZIP形式に対応したアーカイバーまたは、Windows のZIPフォルダー機能を利用して解凍します。

解凍すると KEN_ALL.CSV が現れます。

拡張子 .CSV はカンマ区切りのテキストファイルなので、メモ帳などで開くことができますが、サイズが大きいので途中でエラーになる可能性があります。

2. KEN_ALL.CSV を MS-IMEで利用できる形式にコンバートする

Vector から郵便番号データをMS-IMEで利用できる形式にコンバートするソフトウェア「郵便番号辞書登録お助けツール」をダウンロードします。

名称:郵便番号辞書登録お助けツール 0.9(2007.02.14)
動作OS:Windows XP/Me/2000/98
ファイル名:ZipCsv2TextExe.lzh


ダウンロードしたファイル(ZipCsv2TextExe.lzh)は拡張子LZH形式に対応したアーカイバーLhazなどで解凍します。
LZH について
拡張子 .LZH は日本の吉崎栄泰氏が開発した圧縮形式ですが、暗号化に対応していない、セキュリティに問題があるなどの制約があるため利用を控えるよう推奨されている形式です。MS-DOS時代に.ZIPに対抗する形で開発されましたが、現在メンテナンスが止まっています。Unlha32.dll の作者は別人です。
動作OSに Windows 10 はありませんが、私の環境(Windows 10 Pro April 2018 Update, v1803)では問題なく動作しました。

元ファイル:郵便番号データ(KEN_ALL.CSV)を指定する
変換後ファイル:区別しやすい名前を付ける(例:KEN_ALL_convert.CSV)


私の環境では変換後に2件のエラーが発生しました。
重複エラーだったので気にしなくてよさそうです。
! 指定された単語は既に登録されています。
581-0027 大阪府八尾市八尾木 地名その他
! 指定された単語は既に登録されています。
673-0012 兵庫県明石市和坂 地名その他

3. Microsoft IME ユーザー辞書ツールへコンバートしたデータを読み込む

3-1. MS-IME のユーザー辞書ツールを起動する
起動方法はいくつかありますが、一番簡単なのは次の手順です。
  1. タスクバーの通知領域にある「あ(またはA)」と表示されているアイコンにマウスカーソルを合わせる
  2. 右クリックする
  3. ユーザー辞書ツールを選択する
3-2. 新規ユーザー辞書を作成する
メニューバーの「ファイル > 新規作成」を選択する。

3-3. コンバートしたファイルを新規ユーザー辞書に読み込む
  1. メニューバーの「ファイル > テキストファイルからの登録」を選択する
  2. コンバートしたファイルを指定する(例:KEN_ALL_convert.CSV)
  3. 処理が終わるまで待つ(時間がかかります)

「テキストファイルからの登録」を選択した時に表示されるダイアログは、拡張子 .txt のみを表示するようになっているので、拡張子 .CSV を表示させるには「すべてのファイル (*.*)」を選択してください。

4. ユーザー辞書をシステム辞書に変換する

メニューバーの「ツール > システム辞書の作成」を選択する。


コンバートしたファイル名だと認識できるファイル名をつける。
  • 例:jpostzipdic_20181130.dic
辞書名と説明を記述したらOKをクリックする。
以下は記入例です。
  • 辞書名:Microsoft IME 郵便番号辞書(2018/11/30)
  • 説明:この辞書は、日本郵便データからコンバートしたMicrosoft IME のシステム辞書です。


OKをクリックするとシステム辞書の作成が始まります。
時間がかかるので終わるまで待ちましょう。

5. 作成した郵便番号辞書をMS-IMEのシステム辞書として登録する

新規作成した郵便番号辞書(jpostzipdic_20181130.dic)はどこに保存してもかまいませんが、利便性を考慮して既存の郵便番号辞書と同じフォルダーに保存しました。

辞書フォルダー
MS-IMEの郵便番号辞書が保存されているフォルダー
C:\Windows\IME\IMEJP\Dicts\IMJPZP.DIC

ユーザー辞書フォルダー
C:\Users\login-user\AppData\Roaming\Microsoft\IME\15.0\IMEJP\UserDict

コピーする時に管理者権限を要求してくるので続行をクリックします。



Microsoft IME の詳細設定 > 辞書/学習 > システム辞書:追加 > 作成した辞書(拡張子 .dic)を選択する(jpostzipdic_20181130.dic)

Microsoft IME の詳細設定ダイアログは、タスクバーの通知領域にある「あ(またはA)」のアイコンを右クリックして「プロパティ > 詳細設定」と遷移すると表示することができます。

MS-IMEの純正郵便番号辞書のチェックを外し、追加した新規郵便番号辞書に☑ チェックを入れたらOKをクリックします。


以上で手順はおわりです。

あとがき

Windows 10 の年2回リリースされる機能更新プログラムをインストールするとMS-IMEの郵便番号辞書が新しいバージョンに更新されますが、その時に今回作成した郵便番号辞書が削除される可能性があるのでバックアップを取っておきましょう。

2018/12/21
W10 v1809 へアップデートしたタイミングで今回作成した jpostzipdic_20181130.dic は削除されました。機能更新プログラムを適用すると C:\Windows\IME\IMEJP\Dicts フォルダーは初期化される仕様になっていると思われます。
W10 1809:アップデート後に初期化された設定とアップデートする時の注意点 :Scrap 2nd.

おわり
次の投稿 前の投稿 ホーム

0 件のコメント:

コメントを投稿

にゃんつくばっと