なんでやねんDTP・新館

はてなダイアリーから移行しました…

字形変更と文字検索

まず画像を……。
環境はOSX10.4.11、Adobe InDesign CS2_J(Ver.4.0.5)。



左は段落スタイルで、それぞれ標準字形(90JIS)、エキスパート字形(expt)、印刷標準字形(nlck)を適用(字形メニューから各字形を適用しても同じ)したモノであるのに対し、右は1行目をコピーした後、字形パレットの当該字形をダブルクリックして入力したモノ(黄色の地色は環境設定/組版/置換字形の強調表示)。


情報パレットで確認すると左側は芦(蘆=CID6474)部分はU+82A6、鴎(鷗=CID7646)部分はU+9D0Eとすべて同じなのに対して、右側は蘆はU+8606/鷗はU+9DD7と字形に対応したコードが表示されている。当然の結果ではあるのだが……。



これに文字検索をかけると芦および鴎に対しては○部分がヒットし、蘆と鷗に対しては○部分しかヒットしない。これも当然といえば当然の結果。


CS3はCIDで検索可能とのことらしいが、これをpdfに変換しても検索結果は同じ
別に文字コードのある字形への置き換えを自動で処理したものは、検索してもヒットしないということになる。
「長澤蘆雪」と表示されていても「長沢芦雪」でしかヒットしないということも起こり得る。
書籍の組版データをpdfの状態でWebで公開云々という話も某出版社からあることもあり、「ちょっと困る」といわれはしないかと少々気がかりではある。