OnlineOCRです。
他と比べた場合の特長(私の用途としては「欠点」)である「行末の改行コードが入らない」ということもありますが、wordファイル(他にEXCELも可)として保存され、その場合レイアウトも元の画像ファイルと同じであるという利点があります。
Wordファイルとしてダウンロードすることで、すぐに「校正」ができ、読み取り間違いによるスペリングの間違いも発見できます。文の途中(もちろん行末でも)に改行コードを入れると、次の文字が「大文字でない」ということでエラー候補になってしまうので、これは大変に助かります。
各行末の改行はマクロで入れることにしました。
Sub Macro1()
'
' Macro1 Macro
'
Selection.EndKey Unit:=wdLine
Selection.TypeText Text:=Chr(11)
' Selection.MoveDown Unit:=wdLine, Count:=1
'
End Sub
たまたまなのか、いつものことなのか分かりませんが、行末の"-"(単語の途中で改行する場合)が、"¬"となります。

この"¬"を事前にマクロで処理できるといいのですが、私の知識ではできません。
Wordの編集画面上では"-"と表示され、検索でも"¬"では見つかりません。
ただし、テキストファイルとして保存(Shift-JIS)しようとすると、Shift-JISとして保存出来ないので、その存在が分かります。
この行末の"¬"は後ろに改行コードを入れると消えてしまうので、改行コードを入れるマクロを実行する前に"-"に置換しておく必要があります。これは手作業…。
とにかく、簡単な作業で
1 マクロを使って、簡単に各行末で改行が入れられ、Shift-JISコードで保存出来る。
2 行末の改行を入れずに保存しても、行末にはspaceが入っている。行末の語と次の行頭の語がくっついてしまうことはない。
3 オリジナルと同じレイアウトで、wordファイルとして保存出来る。画像ファイルにあった行末の"-"は自動的に削除される。(削除すべきでない場合もあるので、要注意)
という利点のあるファイル作成がでります。
そしてOCRとして一番肝心なこと…文字の読み間違えは特殊なフォント以外は、ほぼ皆無といえそうです。
タグ:OCR