喫茶Honfleur掲示板 2007〜2009年

タイトル 画像
Message#から前件を

日から 前を

最新20件 最新50件 最新100件 最新200件 200件以前
昨日以降(0) 2日前以降(0) 3日前以降(0) 4日前以降(0) 5日前以降(0)
リンク タイトル 画像 サーチ 携帯モード セットアップ


Message#17329 2008年11月8日(土)20時29分
From: 아벨(Abel)
変更
Re2:代理質問 >YASU師匠
YASUさんのメッセージ(#17318)への返事

> テキストファイルでは、
> 「書式」→「右端で折り返し」のレ点チェックを外す。
> で、改行なしになるはずですが。

認識してテキストなりワードで保存する段階で既に各行15文字で自動的に改行されちゃって
るんですよね・・・。その後の扱いはメモ帳では改行が変になることがあるからテラパッド
使ってるわけですが。

> 使っているOCRソフトが違うと分かりませんね。
> ちなみに、わたしが使っているのは、
> 『読んでココ!』というものなんですが、そのソフトでは自動的に改行になります。
> もちろん、空白を入れておけば、自動改行になるよう設定してあります。
> 後は、改行無しと。
> 大抵のOCRソフトはそんな感じだと思います。

私の使ってるソフトは、このまえ1万一寸で買った複合機にオマケでついてた、読取革命
ライトっていうオマケ安物ソフトです。

何年も前から懸案になってた、西脇慧名で右翼の機関紙に載った論文も何とかアップでき
ないかと思っていろいろテストしてる、もといテストしておられる方がおられるようですが、
下記のいくつかの方法を試そうとしているらしいと
・スキャナで画像として読んでPDF
・OCRでワードにして修正してPDF
・OCRでテキスト→HTML
一番上が一番安直で手軽ですが、画像のままよりは圧縮されるもののファイルサイズが相当
大きくなると。ワードにすると、修正してもとのレイアウトを再現するのが結構面倒だし、
図表や写真ごと再現するのでないならテキストだけなら「サチコ」さんの例みたいにレイア
ウトも全部崩して単にテキストファイルだけにしてしまったらファイルサイズ的には非常に
軽くできるわけですよね。著作権の意味でもレイアウトまで再現することに何の意味も無い
と。写真が含まれるなら別ですが・・・師匠はテキストだけ抜き出し? 写真とかはどう
されてましたっけ?

西脇さんって、前世紀の頃にVD師が著者に会わせてやってもいいと仰ってましたけど、
誰なんですかね? イチローさんあたり??

どこかにそういったOCR練習サイトみたいなのが複数隠されてるそうですwww

最新20件 最新50件 最新100件 最新200件 200件以前
昨日以降 2日前以降 3日前以降 4日前以降 5日前以降
nerimb5.cgi Ver. 5.043
Copyright(C) 1997-2008, hidekik.com
当掲示板の内容は全て冗談です。冗談を解する方のみ閲覧してください。