なんでやねんDTP・新館

はてなダイアリーから移行しました…

旧字体の利用について_01

※コレを含め「旧字体の利用について」と題する三つは080713の日付で「仕切り直します_置換テーブルなど」と記したように再検討中です。080818の「常用漢字を旧字体にする」以降の「〜を旧字体にする」「〜にヒゲを生やす」と題する記事をご覧ください。常用/人名用/表外漢字字体表内/表外漢字字体表外で分割する予定です。
(080819 追記

歌集などを主力にしている東京の出版社とお付き合いがある。旧知の装幀家を介してだが、そこの書籍の75%位はその方の手になるものと思う。
その版下用の写植時代からのお付き合いだが、このご時世、仕事がヒマなこともあり、何とか頼み込んで、今年の春以降くらいから本文組版も担当させていただいている。


つい最近、その出版社から「全文を旧字・旧かなで組める?」とのご質問。勿論「大丈夫ですよ、おまかせ……」と即答した。
そのころ、丁度タイミング良く「はてなアンテナ」のおかげで「新かな・旧かな」考「新仮名遣い」と「旧仮名遣い」についてという記事で、歌人と旧字・旧かなの関連を興味深く読むこともできたものの、置換テーブルの作成に四苦八苦する結果になった。


とりあえず、web上でpdfを公開されているもののなかで一番信頼できそうな「旧仮名遣い・旧字変換支援プログラムmisimaシステム辞書:新字–旧字変換対応表(訂5)」を参考に置換テーブルの作成に取りかかった。ここで作者のYasuda氏にお礼を申し上げておきます*1


まず、ここで挙げられている文字1,042字を、pdfから抜き出して元テキストとした。


【1,042字の一覧】


置換テーブルには従来同様、各種字形置換のタグで可能なモノはそれを利用し、JISコードの変更、あるいはユニコード、CIDでの指定などを補助的に使用するつもり。
参考:「新字源」(第315版,角川書店,1991)


●元テキストに前に作成した2種の置換テーブルを適用した*2
「Adobe-Japan1-4準拠書体での印刷標準字体の使用_まとめ」の後半1-5書体用の部分と「ヒゲあり字形_まとめ」を参照。
その結果、何らかの処理が加わったのは以下の通り(クリックで別窓に拡大表示、以下同)。



有効なのは(主に表外字にあたるもの+ヒゲ付き)28*9−17=235字

「芦と蘆」・「桝と枡」については「別字意識:これぐらいは入力時に字形を確認するのでは」という点で悩みのタネ、保留。
「隙」は印刷標準字体ではあるが「新字源」と字形が違うという点で保留。
「蝿」は、これも印刷標準字体ではあるが「新字源」と字形が違う点および、これを採用すると「縄」と部分字形が不統一となる点で保留。
※「靭・靱」については「新字源」と字形が違う点および他の部分字形に「刃」があるモノとの関連で悩んだが、印刷標準字体をある意味尊重して、とりあえず「コレで良し」とした*3


●元テキストにtrad字形を適用した結果、字形が変換されたのは以下の通り。



有効なのは(主に常用・人名許容の旧字)28*13+20−27=357字

「慎・真・鎮」についてはL部の交わり方に関して「新字源」と字形が違うという点で保留。
「専」は「新字源」では置換後の字形は俗字で、旧字は別字形が掲載という点で保留。
「覇」は「新字源」では「もとは霸の俗字」として別字扱いという点で保留。
「弁」は相手が三種「辨・瓣・辯」ある点で保留。
「翻」は「新字源」では「飜」は別体字として扱われている点で保留。
※「縄・蝿」は印刷標準字体ではないが、「新字源」と字形が同じで部分字形も一致するこちらを採用した。


残るは1,042−235−357=450字


●残る450字にexpt字形とJIS78字形を適用した結果、字形が変換されたのは以下の通り。


「唹・悗・枴」は「新字源」には文字そのものが記載無し。
「拐」は元の字形が「新字源」と同じで、置換後の字形は俗字扱い。
「冉」は元の字形が「新字源」と同じで、置換後の字形は別体字扱い。
「匕」は元の字形が「新字源」と同じで、78字形は記載無し(exptを採用)。
「閏・親」は元の字形が「新字源」と同じで、置換後の字形は記載無し。
「凛と凜」は悩みのタネで保留。


ここまでの字形の選定には色々と悩むモノもあり、参考にさせていただいた上記のpdfとは一部解釈を変えている(囲・廻・丈・訊・双・捜など)が、基本的には「表外漢字字体表」をある程度参考に、「新字源」(第315版,角川書店,1991)の字形を尊重する方向で選定した。


残るは450−14−25=411字。今回はここまで。


※ミス発見! 
「燿」はJIS78字形で大丈夫。置換テーブルではそのように処理するが、ここでは数字が合わなくなるのでママ続ける。

*1:参考文献として、「府川充男小池和男著『旧字旧かな入門』柏書房,2001年」を挙げていることを頼もしく思ったりもした

*2:最終的に1-5準拠の書体でnlckを段落書式に設定することを想定して

*3:旧字とは関係がないが、つい最近(080706)の朝日新聞の記事で見出しは「強靭」、本文は「強靱」というのがあって、何だかなァと思ったことでした