<   2012年 08月 ( 1 )   > この月の画像一覧

奇妙なPDFファイル

PDFファイルの学術論文に、「一曰。以和為貴。無忤為宗。人皆有黨…」という十七条憲法の断片が引用されていた。

全文はどうなっているのかと気になり、そこから「無忤為宗」(忤<さから>ふこと無きを宗<むね>とせよ)という文句をコピーして検索すると、何も出てこなかった。あれっと思って検索ウィンドーを見ると、「無身為宗」(身<み>無きを宗<むね>とせよ)と化けていた。

何じゃこりゃと思い、今度は「人皆有黨」(人みな党あり)をコピーしてみた。すると今度は、検索ウィンドーでは「人皆有窯」(人みな窯<かま>あり)となった。卒倒しそうだ。

ではと思い、「一曰。以和為貴」(一に曰<いは>く、和を以て貴しとなし)をコピーして検索ウィンドーに貼り付けた。これも、「一日。心持為貴」(一日<いちにち>、心持<こころもち>は貴しとなり)と出てくる。こりゃ意味不明だよ。

何でこんなことになるのかと考えてみたら、このPDFファイルは、どうやら紙に印刷されたものをスキャンしたものらしかった。GIF特有のギザギザが見える。ということは、これは自動でテキスト化しているということだ。

そう考えると、けっこうすごい技術だ。
[PR]
by ijustat | 2012-08-02 04:52 | Japanese