標準のエンコードをUTF-8に

わたしは,MS-DOSの時代から,テキストファイルでメモを残していた。WindowsMacでも続けており,それらのテキストファイルの多くはShift-JIS。

しかし,自宅でMacBook,会社でMacBookProを使うようになり,MacOSXがメインのOSになってきたころから,テキストにUTF-8を使うことも増えてきた。でも,持ち歩くのはWindowsマシンが中心であったのと,以前からのファイルに書き足すものも多かったので,メモのほとんどはShift-JISのままだった。

また,TeXは,MacでもShift-JISで運用していたので,2つのエンコードが混在している状態が続いている。

昨日から,TeXの実験をしていて,TeXUTF-8で動かしてみた。コンパイルするときに,

platex -kanji=utf8 hoge.tex

とするだけ。こんなに簡単にできるのなら,もっと早く移行すればよかった。勉強不足だった。

TeXUTF-8が使えるなら,もうShift-JISを使うこともない。最近メインで使っているWindows7の環境でも,UTF-8を標準のエンコードにしてみよう。

まずはエディタの設定。Windows環境では,古くから秀丸を使っている。秀丸の設定を変更。
 その他-動作環境-ファイル-エンコード1
を開き,標準のエンコードの種類をクリックして,ここでUTF-8を選択。これで新規ファイルはUTF-8になる。

次に,これからも書き足す予定のメモファイルを変換。漢字コードの変換といえばnkf。試しに,コマンドプロンプトnkfを実行すると,何とコマンドが使えそう。インストールした記憶もないのに,いったいどうして?

CygwinのbinにPathを通してあったので,ここにあるのかと探しても見当たらない。TeXだ。TeXのbinを見たらnkf.exeがあった。

出所がはっきりしたのでこのままnkfを使って変換してみた。UTF-8への変換は,-uではなく-wというのも知らなかった。

nkf -w hoge.txt > hoge_u.txt

カレントディレクトリにある*.txtをすべてUTF-8に変換するPerlスクリプトをつくり,ディレクトリ単位で確認しながら処理。通常使っているメモファイルのあるディレクトリのいくつかを変換した。

これでUTF-8をメインで使う準備ができた。