解析エンジニアの自動化 blog

コツコツと自動化した方法を残す blog

python

Python + pyocr で ocr したら高認識率で1桁数字も認識した

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 今まで Tesseract を使用して ocr してきました。 この際、 pytesseract という Python から Tesseract を…

【 ocr の認識率を上げる画像処理】初心者でも簡単な補間

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 補間はノイズ除去の一種だと思います。 ノイズ除去では文字周りに小さな点が散らばっていました。 しかし、…

【 ocr の認識率を上げる画像処理】初心者でも簡単なノイズ除去

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 ノイズ除去は最も重要な画像処理だと思っています。 今でこそ Python などでライブラリを簡単に使えて誰で…

【 ocr の認識率を上げる画像処理】画像をキレイにする基本〜収縮処理〜

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 白色を収縮させて輪郭を小さくする収縮処理というものがあって、収縮処理単体で行うことは少ないが、膨張処…

【 ocr の認識率を上げる画像処理】画像をキレイにする基本〜膨張処理〜

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 白色を膨張させて輪郭を大きくする膨張処理というものがあって、膨張処理単体で行うことは少ないが、収縮処…

【 ocr の認識率を上げる画像処理】画像のサイズ変更

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 ocr する時に画像処理をしてから ocr する事があると思います。 画像処理の方法にはグレースケール変換、二…

【画像処理】 ocr に必要な色々な画像処理を見据えた白黒反転処理

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 画像の白黒反転処理は重要です。 線を収縮や膨張させる画像処理方法がありますが、この処理は白色を対象に…

【画像処理】 ocr の認識率を上げるための二値化

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 二値化は画像処理ではかなり良く出てくる処理です。 リンクの記事でグレースケール変換を纏めましたが、二…

ocr の認識率を上げるためのグレースケール変換

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 画像処理の結果 コメント 目的 私は Tesseract を使って ocr しています。 Tesseract のみでの ocr でも、かなり認識率は高いほうだと感じ…

罫線の無い 10 行 10 列の等間隔整列したサイズの大きい文字の画像を大きくリサイズして ocr してみる(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード〜画像拡大〜 拡大した画像 ソースコード〜 ocr 〜 ocr の結果 コメント 目的 リンクの記事で罫線の無い表の ocr で画像サイズを大きくする…

罫線の無い 10 行 10 列の等間隔整列した文字の画像を大きくリサイズして ocr してみる(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード〜画像拡大〜 拡大した画像 ソースコード〜 ocr 〜 ocr の結果 コメント 目的 リンクの記事で 罫線入りの表の ocr で画像サイズを大きくす…

罫線入りの 10 行 10 列の表の画像を大きくリサイズして ocr してみる(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード〜画像拡大〜 拡大した画像 ソースコード〜 ocr 〜 ocr の結果 コメント 目的 リンクの記事で Python + Tesseract を使った ocr について動…

フォントサイズが ocr の認識率に与える影響についてのまとめ(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事でフォントサイズ 11 ポイントで 2 行 6 列の表を ocr しました。 残念ながら…

文字認識でフォントサイズの違いは正解率にどのくらい影響するか

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で 2 行 6 例の小さい表のを ocr を再チャレンジしました。 残念ながら 1 箇…

【再チャレンジ】 2 行 6 列の表の文字認識(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で 2 行 6 例の小さい表を Python で ocr をしました。 全く文字を認識しませ…

2 行 6 列の表の文字が認識出来なかった(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で小さい表を Python で ocr をしました。 正確に文字を認識出来ました。 罫…

とっても小さい表を Python で ocr

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で『表の中の文字』と『欄外の文字』 を Python で ocr をしたところ、正しく…

『表の文字』と『欄外の文字』の認識(Python + Tesseract)

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で Python で ocr をしたところ、罫線の中の文字を正しく認識しました。 また…

罫線で囲まれた文字を Python で ocr してみた

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で Python で ocr をしたところ、正しく文字を認識しました。 といっても、と…

絶対に誰でも出来る Python で ocr 入門

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で当たり前の事ですが、 ocr は文字が大きくはっきりしている方が良く認識さ…

ocr するならやっぱり大きい文字の方が良い

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で Python で ocr をしたのですが、認識は悪かったです。 ocr ( Python + Tes…

ocr ( Python + Tesseract ) で惨敗した

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で Python で ocr をしたのですが、全然正しく文字を認識しませんでした。 初…

初心者が Python で初めての ocr

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 プログラム ソースコード 使い方 ocr する画像 ocr の結果 コメント 目的 リンクの記事で Tesseract と pytesseract をインストールしました。 初心者が Python で …

初心者が Python で ocr するために pytesseract をインストールする

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 インストール環境 インストール コマンドプロンプトの起動 起動画面 インストールコマンド入力 コメント 目的 Python で ocr してみようと思いたって、リンクの記事…

初心者が Python で ocr するために Tesseract をインストールする

こんにちは。 仕事の自動化にやりがいと達成感を感じるガッくんです。 この記事の目次 目的 インストール環境 ダウンロード インターネット検索 ダウンロード Tesseract 入手 インストール コメント 目的 テキスト抽出が出来ないスキャンされた PDF や 画像…