1.はじめに
1.1 本記事の対象者
- Power AutomateDesktopでOCR機能を使って文字を読み取りたい人
1.2 本記事の目的
- Power AutomateDesktopでOCR機能をどの方法で読み取ると精度がよくなるかが分かる。
2.PowerAutomateDesktopのOCR機能の精度比較
021年2月から無料版Power Automateを使って今まで貯めてきたノウハウを解説していきます。
もしよろしければ、確認してみてください!!
2.1 PowerAutomateのOCRの概要
Power Automate Desktopに以下のようなOCRの機能があります。
そもそも、OCRとはなんぞやとなるかと思うので、ちょっと調べたことを書きます。
OCRは、Optical Character Recognition/Readerの略で、日本語で光学的文字認識になります。
自分のイメージでは、手書きの文字や画像に含まれる文字を読み取って、実際の文字データにしてもらう機能と考えています。
最近だと、下のようなイメージで、家計管理アプリでレシートの金額を読み取る機能とかがありますが、その機能です。
そんなOCRの機能が無料版のPower Automate Desktopにあるということで、非常に気になったので試しに使用してみました!
OCR機能を使用する際に、思うような精度が出ないかったこともあり、少し試したことも記載いたします。
2.2.Power Automate Desktopの標準のOCR機能の取り込み結果
今回取り込む情報は、近所で商品を買ったときに入手したレシートです。(下図がそのレシート)
細かい設定は後述しますが、Power Automate Desktop の標準のOCR機能を用いると、下のように読み取られました。
ウィンドウのファイル名の一部を読み込んでいますが、肝心のレシートの内容がほぼ空欄になっている。
空白の部分は改行が入っているみたいなので、高さ的なものは読み取っているように見えるが、使用できるとは思えないです。。。
2.3.Power Automate Desktopの標準のOCR機能の精度向上試行錯誤の結果
2.2ではPower Automate Desktopの標準OCR機能で読み取った結果を確認しました。
個人的には、これくらいだと実務や何か趣味に使えるような気がしなかったため、調査や試行錯誤をしました。
その結果、いくつかの要素を改善すれば、以下のように読み取れることが分かりました。
完璧にではないですが、明らかに読み取れる量が多くなりました。
試行錯誤した内容は以下の点です。
- 画像のアプリケーションを立ち上げてから、OCR機能で読み込みタイミングの変更
- OCRエンジンの種類 ※結局Windowsの標準を使いましたが、せっかくなので書きます
- 検索モードの変更
- 元画像の取り方の変更
別記事で詳しく書こうとは思いますが、いったん、途中経過でということで記事を記載しました。
3.まとめ
まとめに入ります。
業務効率を上げるために提供されているMicrosoft365のツール群で、今回はPowerAutomateのアクション「OCR機能」精度向上について説明しました。
使い方としては、帳票の画像から金額を取得したり、単語帳を自分で写真撮影して自分用の単語帳の元データにしてもらえたりするのかなと思いました。
PowerAutomateDeskTopの標準OCR機能の設定の方法は以下の記事で書きました。
標準OCR機能ではなく、Tesseractを利用したものも記事にしたいと思います。
最後まで読んでいただきありがとうございます
コメント