なんでやねんDTP・新館

はてなダイアリーから移行しました…

旧字体の利用について_結

※コレを含め「旧字体の利用について」と題する三つは080713の日付で「仕切り直します_置換テーブルなど」と記したように再検討中です。080818の「常用漢字を旧字体にする」以降の「〜を旧字体にする」「〜にヒゲを生やす」と題する記事をご覧ください。常用/人名用/表外漢字字体表内/表外漢字字体表外で分割する予定です。
(080819 追記

やっと置換テーブルが出来上がった。(JeditXの複数一括置換用)


基本的に各種字形タグで置換可能なモノはそれを使用し、残ったモノでシフトJISで表現可能なモノはシフトJISで、次にユニコード/CIDコードの順でコード指定した。
最終的には、前の一覧に加えて幾・機・筑・築・沪・舮を追加し、扱いに苦慮する「弁」「蘆と芦」「枡と桝」「凛と凜」「熙と煕」「凛と凜」「靭と靱」(凛・靭は凜・靱に置換の上)は【 】で括った。
置換結果は以下の通り(リストから外したため標準あるいはnlck字形ママのモノもある)。
(画像クリックで別窓に大きく表示:でも見づらい)*1



JeditXの複数一括置換のダイアログをみると200行が限度のようで、400行以上のテーブルになったため3つに分けざるを得なかった。


ここOSX標準のzip圧縮ファイルを置いてありますので、必要な方はダウンロードしてご使用ください(password=「tikan02」)。


圧縮ファイルの内容は
旧字_1-5-01〜03.txtが今回のモノで、tikan_1-5.txtとhige_1-5.txtを元に余計な処理を削除し、必要な処理を追加したモノ。01から順に複数一括置換で適用(1-5書体、nlck字形で使用)
tikan_1-4.txt:1-4書体用印刷標準字体置換(標準字形で使用)
tikan_1-5.txt:1-5書体用印刷標準字体置換(nlck字形で使用)
hige_1-4.txt:1-4書体用ひげ付き字形置換(tikan_1-4.txtと併用のこと)
hige_1-5.txt:1-5書体用ひげ付き字形置換(tikan_1-5.txtと併用のこと)
tikan_iwata.txt:イワタ明朝体オールド(R/M/B)用
(tikan01〜05.txt:Adobe-Japan1-4準拠書体での印刷標準字体の使用_01〜05で作成したモノ)


詳しくは関連記事をご覧下さい。
「Adobe-Japan1-4準拠書体での印刷標準字体の使用_まとめ」
「ヒゲあり字形_まとめ」
「イワタ明朝体オールドと印刷標準字体のようなもの」


ヌケや間違いなど、お気づきの点あれば、お気軽にコメント欄にお願いします。


コメント欄で間違いをご指摘いただいた。


いずれも「旧字_1-5-03.txt」内のCID指定の入力ミスで、修正箇所は以下の通り(上記リンク先のファイルは訂正しましたが、01をダウンロードしてくださった方は再度ダウンロードしていただくか、修正お願いします)。
掃【tab】<001a>
掃【tab】<001a>
盲【tab】<001a>
盲【tab】<001a>
猶【tab】<001a>
猶【tab】<001a>


【以下080711追記
その後、気になって新字源をパラパラしていると以下も追加しなければならないことが判った。



「讃・逞」は下の字形が親字で、上は俗字とし、旧字の表記はない。さらに「苣」などは下の字形が親字で上の字形の表記はない。
これらは氷山の一角で、まだまだ出てくると思われるので、更新はその内にということで……。頭が痛い。

              • -

讃【tab】讚
澗【tab】<3D4E>
煙【tab】<001a>
間【tab】<001a>
逞【tab】<001a>
苣【tab】<001a>


【以下080717追記
「腔」が正しく置換されていない……、CID指定しているのだがnlckが勝ってしまっている*2ということ。何とかダブらないで済むのではと思っていたが、見落としていた。こうなるとnlckを基本にすること自体にも問題がありそう……。仕切り直し! 仕切り直し!!

*1:「蝿」が不適切ですが、置換ファイルは修正済み

*2:「ヒゲあり字形の一括置換(呼び出し)」のコメント欄参照。