まずはじめに、Google Driveにテキスト化したい画像を入れましょう。
大前提としてGoogle Drive内にあるファイルでしか、このOCR機能は使えませんので、Google Driveを利用していない方はまずそれを利用開始してください。Google Driveについては以前こちらで記事にしました。
では、Google Driveを利用している前提で以下に手順を示します。
(1)Google Dive内にテキスト化したい画像ファイルを入れる。
(2)ブラウザからGoogle Diveにアクセスし、テキスト化したい画像ファイルを選択する。
(3)画像ファイルを選択したまま右クリック。アプリで開く→Googleドキュメントを選択
(4)自動的にOCR機能が働き、テキストファイル化(拡張子はgdoc)され、同ディレクトリに保存される
で、結果はどうだったかというと、試しに日本国憲法の前文をテキスト化してみましたが、テキスト化した画像とその結果は以下の通りです。
日本国憲法
前文
日本国民は、正当に選挙された国会における代表者を通じて行動し、われらとわれらの子孫のために、諸 国民との協和による成果と、わが国全土にわたつて自由のもたらす恵沢を確保し、政府の行為によって再び 戦争の惨禍が起ることのないやうにすることを決意し、ここに主権が国民に存することを宣言し、この憲法 を確定する。そもそも国政は、国民の厳粛な信託によるものであつて、その権威は国民に由来し、その権力 は国民の代表者がこれを行使し、その福利は国民がこれを享受する。これは人類普遍の原理であり、この憲 法は、かかる原理に基くものである。われらは、これに反する一切の憲法、法令及び詔勅を排除する。
日本国民は、恒久の平和を念願し、人間相互の関係を支配する崇高な理想を深く自覚するのであつて、平 和を愛する諸国民の公正と信義に信頼して、われらの安全と生存を保持しようと決意した。われらは、平和 を維持し、専制と隷従、圧迫と偏狭を地上から永遠に除去しようと努めてゐる国際社会において、名誉ある 地位を占めたいと思ふ。われらは、全世界の国民が、ひとしく恐怖と欠乏から免かれ、平和のうちに生存す る権利を有することを確認する。
われらは、いづれの国家も、自国のことのみに専念して他国を無視してはならないのであつて、政治道徳 の法則は、普遍的なものであり、この法則に従ふことは、自国の主権を維持し、他国と対等関係に立たうと する各国の責務であると信ずる。 日本国民は、国家の名誉にかけ、全力をあげてこの崇高な理想と目的を達成することを誓ふ。
前文
日本国民は、正当に選挙された国会における代表者を通じて行動し、われらとわれらの子孫のために、諸 国民との協和による成果と、わが国全土にわたつて自由のもたらす恵沢を確保し、政府の行為によって再び 戦争の惨禍が起ることのないやうにすることを決意し、ここに主権が国民に存することを宣言し、この憲法 を確定する。そもそも国政は、国民の厳粛な信託によるものであつて、その権威は国民に由来し、その権力 は国民の代表者がこれを行使し、その福利は国民がこれを享受する。これは人類普遍の原理であり、この憲 法は、かかる原理に基くものである。われらは、これに反する一切の憲法、法令及び詔勅を排除する。
日本国民は、恒久の平和を念願し、人間相互の関係を支配する崇高な理想を深く自覚するのであつて、平 和を愛する諸国民の公正と信義に信頼して、われらの安全と生存を保持しようと決意した。われらは、平和 を維持し、専制と隷従、圧迫と偏狭を地上から永遠に除去しようと努めてゐる国際社会において、名誉ある 地位を占めたいと思ふ。われらは、全世界の国民が、ひとしく恐怖と欠乏から免かれ、平和のうちに生存す る権利を有することを確認する。
われらは、いづれの国家も、自国のことのみに専念して他国を無視してはならないのであつて、政治道徳 の法則は、普遍的なものであり、この法則に従ふことは、自国の主権を維持し、他国と対等関係に立たうと する各国の責務であると信ずる。 日本国民は、国家の名誉にかけ、全力をあげてこの崇高な理想と目的を達成することを誓ふ。
驚いたのは「あつて」と本来促音である「っ」が「つ」と正しく識別されていたことです。また旧仮名使いの「ゐる」も正しく認識されています。これはすごい。ただ、改行位置や無駄な半角スペースが含まれるなど、文章の整形には一手間必要ですが、字母さえ正しく認識できていればそれは大した手間ではありません。もちろん業務に使うには校正は必須で、テキスト画像の状況にもよりますが、これならかなりの精度が期待できます。
OCRが普及し始めた1990年代後半当時、スキャナーにバンドルされていたOCRソフトを使っていた時期がありましたが、誤変換が多く使い物になりませんでした。それから約20年、単純に画像をテキストに置き換えるのではなく、おそらく前後の文脈からA.I.が正しい字句を判断しているのだと思いますが、この精度が無料で使えるなんてただただ驚くばかりです。業務のデジタル化が普及した現在、そんなにOCRをしなければならない局面は多くないかもしれませんが、知っているのと知らないとでは大きな違いです。原稿を見ながらポチポチと手打ちでテキスト入力なんて無駄な作業を強いられているのなら、一度試してみる価値のある方法だと、私は思います。