文字コードで区別できる注意したい文字たち
私の場合、JIS X 2013: 2004(04JIS)の例示字形変更に対応した「N付き」書体を使用していても、書籍組版などで要求される表外漢字を「いわゆる康煕字典体」とするには、まだまだ字形を置き換える処理が必要だと考えています。
例えば、下の画像の(参考)部分に一部を掲げてあるように、83JISで簡易字体に例示字形を変更されたモノのうち「表外漢字字体表」外だったので、04JISでもママ放置されたモノたちです。
が、それ以外にもとりあえずは処理しておきたい字種として以下の39字があります。
(以下コピペ可かと…)
唖焔鴎噛侠躯鹸麹屡繍蒋醤蝉掻騨箪掴填顛祷涜嚢溌醗頬麺莱蝋攅/倶剥叱呑嘘妍屏并痩繋
啞焰鷗嚙俠軀鹼麴屢繡蔣醬蟬搔驒簞摑塡顚禱瀆囊潑醱頰麵萊蠟攢/俱剝𠮟吞噓姸屛幷瘦繫
JIS X 0208 第2次規格(83JIS)で例示字形を変更され、第4次規格(97JIS)で包摂されたが、JIS X 0213で包摂分離された29字(スラッシュの前部分)と、「いわゆる康煕字典体」が大幅に採用されたJIS X 0213の平成16年改正(04JIS)で、ユニコードとの兼ね合いから新たに別コード位置に追加された10字(スラッシュの後ろ部分)です。
前者は、(その拡張文字集合である)JIS X 0213でいずれも別コード位置に復活しています。つまり、両者共に文字コードで区別できるモノです。
※青文字部分はコメント欄でのご指摘により間違いを修正(2019.07.01 ご指摘ありがとうございました)
これらは、印刷標準字体(nlck)を適用すると置換できる場合もあるのですが、そうでない場合もあります。
予めテキスト段階などで文字コードを置き換える処理をしておくのが賢明でしょう。
少し説明しますと、以下が、適当な書体を使用し、(上の1行目=簡易字体に)印刷標準字体(nlck)を適用した結果です。
- 黄色バックになっているのが置き換えられたモノ
- 小塚のProはAJ1-4なので「妍/并」は仕方なし
つまり、書体に依っては「N付き」か「Nなし」かによって結果が異なる場合があるということです。
例えば、字形パネルで印刷標準字体(nlck)を表示してみるとよくわかりますが、明らかに字種が異なります。
- 「啞鷗嚙」などは「簡易字体」が表示されていますし、「焰」は見当たりません
筑紫明朝の場合は、Pr5当時は同じだったモノが、変更されています。
→参照
また、ヒラギノ明朝の場合はさらに事情が異なります。
→参照
このように、書体に依り複雑な紐付けの差異がありますので、文字コードで区別可能なモノはそのように処理するのが妥当だろうと考えます。
※主にNなし書体の場合に異なりがありますが、いずれにせよ……ということです。