印刷されたテキストをコピー、貼り付け、編集、検索できるデジタルテキストに変換する場合は、光学式文字認識(OCR)スキャナーを使用する必要があります。
ドキュメントをスキャンまたは写真を撮ることを選択すると、これはJPEGやPDFなどの形式で保存されます。 OCRソフトウェア 次に、これらのドキュメント内の文字と数字を認識し、検索可能なPDF、またはMicrosoftWordなどのプログラムで編集できるファイルに変換できます。
問題は、一部のOCRスキャナーは他のスキャナーよりもはるかにうまく機能し、最高のものは財布にかなり重いということです。
たとえば、Omnipage18の価格は150ドルですが、さまざまな言語の認識に特に優れています。 Adobe Acrobat Pro DC 目を見張るような400ドルの費用がかかりますが、信じられないほどの精度があります。 ABBYY FineReader 価格は150ドルですが、雑誌やパンフレットなどのドキュメントを検索可能なテキストに変換するのに最適です。この記事の後半で、ABBYYのオンラインサービスをテストします。
ただし、無料の代替手段が必要な場合は、 ダウンロード WindowsまたはOSXで使用する場合は、これらのOCRツールを試してみてください。ただし、無料で使用したい場合は、 オンライン OCRツール、以下の結果で上位のいくつかを試したので、読み続けてください。
テスト
今ではほとんどの人がスマートフォンを使ってスキャンしているようですが、私は使うことにしました Evernoteのスキャン可能なアプリ (iOSおよびAndroidでは無料)。リチャード・ドーキンの最初のページをスキャンしました 登山はありそうもない 、非常に基本的なフォーマットでどのような結果が得られるかを確認します。ティム・フェリスのページもスキャンしました 4時間のシェフ 少し複雑なフォーマットでスキャナーを試してみてください。これらの各ファイルをPDFとして保存しました。
次に、これらのドキュメントは、おそらく最高のオンラインOCRツールのいくつかを実行して、どれだけうまくいったかを確認しました。
無料のオンラインOCR [利用できなくなりました]
幸い、無料のオンラインOCRを使用するために登録は必要ありません。そして、私のドキュメントのフォーマットとレイアウトを維持するという彼らの主張を見て、私は二重に感銘を受けました。
このサイトは、PDF、GIF、BMP、JPEG、TIFF、およびPNGを入力としてサポートできると主張しています。出力は、DOC、PDFテキストドキュメント、RTF、およびTXTのいずれかです。残念ながら、ファイルサイズに制限があるかどうかはわかりませんでした。
基本文書からPDFへ
完全に変換されました。言うことはあまりありません!私たちはに出発します とても 良いスタート。
DOCへの基本文書
実際の言葉は、「ラシュモア山」の「ount」がどういうわけかAWOLになることを除けば、完璧に変換されたようです。ただし、フォーマットは別の話です。多くのコンマがアンダースコアに置き換えられ、ドキュメント全体のポイントにランダムなスペースが挿入されました。後でこのテストでプレミアムソフトウェアがどのように機能したかを見ると、これは悪い努力ではありません まったく 。
複雑なドキュメントからPDFへ
複雑なドキュメントからDOCへ
今回は、変換に10秒しかかからず、テキストは約95%の精度で再び変換されました。いくつかの奇妙な間隔の問題があり、ソフトウェアはドキュメントの右上のフォントを変換するのに問題があり、あちこちでいくつかの文字を見逃していました。
評決
i2OCR
i2OCRはいくつかの印象的な主張をしています。このツールは60以上の言語を認識し、(フォーマットを削除することで)複数列のレイアウトを処理でき、ファイルサイズの制限がなく、アップロードされたファイルを変換できます と URLから。また、このツールを使用するために登録する必要もありません。
このサービスは、画像からテキストを抽出し、フォーマットされていないテキストを出力するだけで機能します。テキストを他のプログラムにコピーしたり、DOC、PDF、またはHTMLとしてダウンロードしたりする前に、サイドバイサイドビューの間違いをすばやく修正できます。
注:PDFドキュメントをアップロードしようとすると、i2OCRによって拒否されたため、これらをJPEGに変換する必要がありました(スクリーンショットを撮ってからファイルをアップロードする)。
プレーンテキストへの基本文書
複雑なドキュメントからプレーンテキスト
このツールでは読めなかった右上のタイトルとレシピを除いて、テキストの大部分はあまり多くの間違いなく変換されました。列がプレーンテキストに変換される方法は、理想からはほど遠いものでした。この変換を実行可能にしたい場合は、行を一貫性のある文に再配置するために多くの時間が必要になります。
評決
オンラインOCR
オンラインOCRは現在46の異なる言語をサポートしており、PDF、JPG、BMP、TIFF、およびGIFをWord、Excel、またはプレーンテキスト形式に変換できます。このサイトは、「変換されたドキュメントは元のドキュメントとまったく同じように見える」と主張しています。
登録せずに使用できるバージョンでは、1時間あたり最大15枚の画像を変換できます(5MBの制限)。アカウントにサインアップすると、この制限を超えてさらにページを購入できると同時に、複数ページのドキュメントやZIPアーカイブを変換することもできます。
DOCへの基本文書
ローマ数字とは別に完璧に変換された基本文書 私 拾われていない。サイトが約束したように、フォーマットは本にあった通りでした。このツールへの称賛。
複雑なドキュメントからDOCへ
複雑なドキュメントを変換する際の以前のOCRツールに失望した後、私はオンラインOCRに非常に感銘を受けました。上記のように、レイアウトはほぼ完璧でした。繰り返しになりますが、レシピはあまりうまく取り上げられていませんでしたが、他の小さな間違いはごくわずかでした。
評決
オンラインOCRからの絶対に素晴らしい結果。私が見る唯一の欠点は、言及されている出力形式にはDOCX、XLSX、およびTXTのみが含まれているため、変換されたドキュメントをPDFとしてダウンロードする方法がないことです。
ABBYY FineReader Online(10ページの試用版)
前述のように、ABBYYはOCRソフトウェアのマーケットリーダーの1つであり、完全なダウンロード可能なプログラムの費用は約150ドルです。彼らは提供します 10ページの無料トライアル ただし、オンラインツールの場合(登録が必要です)。 5ドルのサブスクリプションの場合、彼らのオンラインツールを使用すると、毎月200ページを変換できます。
受け入れられるファイルは、PDF、JPG、JPEG、TIF、TIFF、PCX、DCX、BMP、およびPNGのいずれかの形式で最大100MBにすることができます。 ABBYYは約200の言語も認識します。出力は特に印象的で、DOCX、XLSX、RTF、TXT、PPTX、ODT、PDF、FB2、EPUBから選択できます。
試用中にいくつかのベータ機能を試すこともできます。 1つ目は、ドキュメントを別の言語に翻訳するオプションです。もう1つは、Dropbox、Googleドライブ、Evernote、Microsoft OneDrive、Boxのいずれであっても、変換したドキュメントをクラウドストレージアカウントにエクスポートすることです。
DOCXへの基本文書
複雑なドキュメントからDOCXへ
変換されると、ドキュメント内のテキストに誤りはほとんどありませんでしたが(OCRがそのレシピのフォントに再び苦労していることを除けば!)、フォーマットには多くの要望がありました。
3つの列はどういうわけか2ページを占め、中央の列は それだけ 2ページ目に表示されます。あなたが実際にしたかった場合 NS この変換されたドキュメントで何でも、あなたはあなたの髪を引っ張ってしまうでしょう。
基本文書からPDFへ
複雑なドキュメントからPDFへ
評決
最終結果
ほとんどの人のように、いくつかの雑誌記事といくつかの家計簿をスキャンするだけの場合は、これらのドキュメントを編集する必要はありません。したがって、PDFに直接変換することは、それらのドキュメントを引き続き検索できるため、適切です。このため、Free OnlineOCRは間違いなく私たちがテストした最高の無料ツールでした。そうは言っても、ほぼ完璧に月額5ドルを支払うつもりなら、 ABBYYのFineReaderOnline 少し正確でした。
ドキュメントをDOCに変換することになると、完璧なソリューションを見つけることができませんでしたが、これまでで最高の結果が得られました。 オンラインOCR 。変換は完全ではありませんでしたが、フォーマットの整合性はほぼ損なわれず、間違いはごくわずかでした。これらの結果をABBYYの「プレミアム」製品と比較すると、非常に感銘を受けずにはいられません。
この投稿には、GoogleドライブのOCR機能は含まれていません。グーグルのいたるところに少しだけですが、他のいくつかの無料のオンラインOCRサービスをテストしたかったという事実のために。
あなたへ:他にどのオンラインOCRツールを読者に勧めますか?そして、二度と使用しないことを試みたのはどれですか?
共有 共有 つぶやき Eメール スピーチをアニメーション化するためのビギナーズガイドスピーチのアニメーション化は難しい場合があります。プロジェクトにダイアログを追加する準備ができたら、プロセスを分解します。
Windows10が自動修復でスタック次を読む 関連トピック
- インターネット
- 生産性
- ファイル変換
- OCR
ロブナイチンゲールは、英国ヨーク大学で哲学の学位を取得しています。彼はソーシャルメディアマネージャーおよびコンサルタントとして5年以上働いており、いくつかの国でワークショップを行っています。過去2年間、Robはテクニカルライターでもあり、MakeUseOfのソーシャルメディアマネージャーであり、ニュースレターの編集者でもあります。彼は通常、世界中を旅し、ビデオ編集を学び、写真を試しています。
ロブナイチンゲールのその他の作品ニュースレターを購読する
ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。
購読するにはここをクリックしてください