なんでやねんDTP・新館

はてなダイアリーから移行しました…

タグ付きテキストのCID指定_ユニコード版

私は今までタグ付きテキストはシフトJISで運用していた(勉強不足が原因)が、ユニコードで書き分け可能な文字が多いことから少し調べてユニコードで運用することにしようと思った。
たとえば「唖」を「啞」に置換する場合にユニコード指定で<555E>としなければならなかったのが、そのまま「啞」で置き換えることが出来る。



で、色々しているうちにCID指定のものがうまく読み込めないことになった。
原因は、知っている人には当たり前のことかも知れないが、下の画像の通りユニコードで指定している部分<001A>。



結局、タグ付きテキストで書き出される「^Z」(のようなもの)をコピーして「<001A>」のかわりに挿入することで解決した。



これはシフトJISでもこのまま使用可能である。