置換テーブルを更新し、改定常用漢字表に対応した…
改定常用漢字表の答申内閣告示(2010年11月30日)からほぼ1年、イワタオールドのPr6も発表され、筑紫明朝のPr6の出荷も近いと聞く。
従来使用していた表外漢字に関する置換テーブルを見直し、同時に改定常用漢字表に対応させるべく以下のような手順でテストをし、更新した。
まず、置換候補文字(474字)を入力する。
全字種のpdf → hyougai-tikan_syoki.pdf ← アイコンをクリックがベター
これに従来使用していたモノに予め少々変更を加えた「筑紫明朝Pr5」用の置換テーブルを適用し、結果をチェックする。
全字種のpdf → hyougai-tikan_zantei.pdf ← アイコンをクリックがベター
上でのチェックを反映した修正済みの置換テーブルを適用し、結果をチェックする(最終的にはイワタオールド用のみが別テーブル)。
全字種のpdf → hyougai-tikan_saisyuu.pdf ← アイコンをクリックがベター
置換設定ファイルの公開を一時は考えたが、少し思うところがあるので非公開とする。※メールでの直接請求には応じるつもり*1。
また、上記と同様な手順で、従来のテーブルを流用・修正して改定後の常用漢字・人名用漢字などをすべて旧字体に置換するテーブルと、八屋根・髭付きに置換するテーブルを作成するつもり(未完成)だが、これの公開方法も上記と同じとする。
※実際の処理には三島梅花藻さんの「連続文字置換用スクリプト.jsx」を利用
- 置換設定ファイル名には「表外置換」としてあるが、(83JISで変更されたママの「表外漢字字体表」外の表外漢字を含め)JISの新字体や入力時に間違いそうな字種を(私なりの)「いわゆる康煕字典体」に改め、かつ改定常用漢字表に対応することを目的とした置換テーブルで、私はテキストを流し込んだ後、まずこの置換を行うことにしている
- 04JISの例示字形変更に対応したN付き書体は(現状では)使用していないので、(Nなしの)90JIS準拠の「Pr5」および「Pr6」書体用のテーブルである
- 上記に関連して:N付き書体を使用しても(上の画像に見える)「釜/鍵/梗」などの髭の有無は変わらない。N付き書体は改定常用漢字表対応ではなく04JIS対応であり、表外字に対する「髭」の扱いに関するポリシーに拠るため
従来のテーブルからの主な変更点は以下の通り。
- aaltタグを使用する必要がある場合には、(Pro書体にも適用可能なように)一部の字種については親字を変更していたが、置換元を親字とするように改めた
- 一部の印刷標準字体は、(Pro書体にも適用可能なように)aaltタグを使用していたが、nlckタグを使用するように改めた
- これによって、「歎」のaaltテーブルの差を気にする必要がなくなり、一本化できた
- 「釜/鍵/梗」については、(表外漢字であることから)印刷標準字体を無視して髭付きとしていたが、改定常用漢字表に追加されたため、nlckタグを用いて印刷標準字体(髭なし)を呼び出すように改めた(もちろんデフォルトで髭付きをポリシーとしているイワタ明朝オールドは髭付きママ)
- 「曾/瘦/麵」については、改定常用漢字表に簡易字体が採用されたため「曽/痩/麺」を呼び出すように改めた(字体差の大きい「彌→弥」についてはママ放置)※但し従来から旧字体で入力されている常用漢字については、ママ処理しないことにしているので、この処理は不要かもしれない(検討中)
- 改定常用漢字表で削除された「勺」についてはママとした
なお、Pro書体用には表外漢字の正字化_まとめ(結)の後半の記述が参考になるかと思う。
置換対象の字種および字形については異論もあるとは思うが、その取捨選択の経緯は「表外漢字の正字化」と題した一連の記事に書き込んでいるので参照していただきたい。
ダウンロードされるpdfの文字群も、冒頭の改定常用漢字表対応の部分以外は、ほぼその記事の並びに従っている。
以下に当該記事へのリンクを……。
表外漢字の正字化_01
表外漢字の正字化_02
表外漢字の正字化_03
表外漢字の正字化_04
表外漢字の正字化_05
表外漢字の正字化_06
表外漢字の正字化_07
表外漢字の正字化_08
表外漢字の正字化_09
表外漢字の正字化_10
表外漢字の正字化_11
表外漢字の正字化_12
表外漢字の正字化_13
表外漢字の正字化_14
表外漢字の正字化_15
表外漢字の正字化_16
なお、イワタ書体のCIDの入れ替えについては 【イワタ書体ライブラリー イワタ AJ1-6シリーズ】 というpdfにも記載され、公開されている。
その一方では、イワタオールド同様に独自仕様にしていた字游工房の游明朝体Pro-RはPr6仕様に字形を増加するにあたり、独自仕様を断念したらしい(「游明朝体 Pr6 R書体見本パンフレット」を参照)。
以下に作業中に気付いて呟いた関連発言を掲げておく(twitter上で多用する三点リーダーが表示されないが……)。
※末尾のURLクリックで画像表示あるいはpdfリンク、アイコン右下の日付クリックでtwitter保存画面
すんごくヒマなので今はこんなのを作成中自家製置換テーブルの再確認用資料 URL
各社各様CID7648と20269 URL
イワタオールドはあらかじめ「灸」のCID1662と20270および「粂」のCID1791と20272を入れ替えてあるのでこの2字にはjp04タグもnlckタグもなしみたい代替字形のハイライト表示にならないGSUBテーブルは未確認
イワタオールド明朝Pr6は、甑(U+7511)にnlckを適用してもjp04を適用してもexpt字形のCID7684が呼び出されるホンマにjp04もnlckも付いていないのかも知れない
@monokano ありがとうございます。単なる間違いでしょうね困ったaaltで呼び出すしかないCID20284と入れ替え済みのCID13778を
2011-10-20 17:29:15 via YoruFukurou to @monokano
参ったなイワタの置換テーブルがややこしいことになりそうやわ以前からCIDを入れ替えてあったりするがProから増えた字形もProの字形はそのままで当然そうなってしまうのも理解でける
もう以前のを少々変更して使ってるけど元がProやからnlckもjp04も使われへんかったから大丈夫かな
こんなんでけたらpdfを公開するつもり URL
こんなpdfが公開されていたCIDを入れ替えてある文字の一覧がある【イワタ書体ライブラリー イワタ AJ1-6シリーズ】 URL
イワタオールド明朝のPr6Nは【(常用漢字でも)デフォルトで髭付き】にもかかわらず04JISの変更に従ったために【(印刷標準字体)変更部分のみ髭無し】になってしまっているこれではアカンやんか
イワタオールドPr6は予めCID1662と20270及びCID1791と20272を入れ替えてあるのでjp04タグもnlckタグも関係なし:処理は不要だが処理しても問題はないやろ URL
「縵」イワタはCID6123と13577を入れ替えてある(既に髭付き)ので処理したらアカン URL
これはよく出来ている例ご苦労が偲ばれる URL
*1:必要な方はメールをいただければ提供する用意はしてある……左のプロフィール欄のアイコンをクリックするとアドレス有り