YASUさんのメッセージ(#17318)への返事 > テキストファイルでは、 > 「書式」→「右端で折り返し」のレ点チェックを外す。 > で、改行なしになるはずですが。 認識してテキストなりワードで保存する段階で既に各行15文字で自動的に改行されちゃって るんですよね・・・。その後の扱いはメモ帳では改行が変になることがあるからテラパッド 使ってるわけですが。 > 使っているOCRソフトが違うと分かりませんね。 > ちなみに、わたしが使っているのは、 > 『読んでココ!』というものなんですが、そのソフトでは自動的に改行になります。 > もちろん、空白を入れておけば、自動改行になるよう設定してあります。 > 後は、改行無しと。 > 大抵のOCRソフトはそんな感じだと思います。 私の使ってるソフトは、このまえ1万一寸で買った複合機にオマケでついてた、読取革命 ライトっていうオマケ安物ソフトです。 何年も前から懸案になってた、西脇慧名で右翼の機関紙に載った論文も何とかアップでき ないかと思っていろいろテストしてる、もといテストしておられる方がおられるようですが、 下記のいくつかの方法を試そうとしているらしいと ・スキャナで画像として読んでPDF ・OCRでワードにして修正してPDF ・OCRでテキスト→HTML 一番上が一番安直で手軽ですが、画像のままよりは圧縮されるもののファイルサイズが相当 大きくなると。ワードにすると、修正してもとのレイアウトを再現するのが結構面倒だし、 図表や写真ごと再現するのでないならテキストだけなら「サチコ」さんの例みたいにレイア ウトも全部崩して単にテキストファイルだけにしてしまったらファイルサイズ的には非常に 軽くできるわけですよね。著作権の意味でもレイアウトまで再現することに何の意味も無い と。写真が含まれるなら別ですが・・・師匠はテキストだけ抜き出し? 写真とかはどう されてましたっけ? 西脇さんって、前世紀の頃にVD師が著者に会わせてやってもいいと仰ってましたけど、 誰なんですかね? イチローさんあたり?? どこかにそういったOCR練習サイトみたいなのが複数隠されてるそうですwww |