画面領域内の画像を正確にテキスト認識する方法

PowerToysというマイクロソフトが提供する公式ユーティリティセットがあります。便利な機能満載で手放せません。特に便利に使っていた機能の一つとしてText Extractorがあります。スニッピングツールのように画面上の領域を選択すると領域内の画像をOCR処理してテキスト化してクリップボードに保持してくれます。

特に、公報データがイメージ版しかない時にテキスト化してコピペしたい場合などに重宝していたのですが、OCRが文章のコンテキストをまったく理解していないようで、たとえば、for(エフ オー アール)をf0r(エフ ゼロ アール)と認識するようなアホな間違いを平気でします。テキストの修正に結構な手間がかかっていました。

代替の機能として、翻訳アプリのDeepLの「画面上のテキストの取り込み」の方が全然優秀であることがわかりました。無料版でも使えます(設定でオンにする必要あり)。選択した領域のOCRをしてくれますが、ちゃんとAIが機能しているようでスペルミスはまずありません。本来翻訳のための機能ですが、原文を正確にOCRしたい場合でも使えます。

カテゴリー: IT, 雑談 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です