私の知人で最近OCRを悪用してる香具師がいて、そいつから師匠に質問してくれと頼まれ ました。 段組で一行15文字くらいの本をOCRし、一行15字のテキストファイルとして保存して手動 作業で一行ずつ改行を削除してウエブうp用の改行無し(または1行40文字くらい)に変更 しているそうなのですが、改行を一括削除、かつ段落のところでは改行を残すという作業を 効率的にやる方法って無いんでせうか? 領域の読み込みは手動で各段落一つずつを一領域として、1ページを数領域として認識させ てるわけですが・・・、いえ、認識させておられるそうなのですが・・・ |