PythonでPDFのOCRを実装する
/
PythonでPDFのOCRを実装します.
全国630店舗以上!もみほぐし・足つぼ・ハンドリフレ・クイックヘッドのリラクゼーション店【りらくる】
# ライブラリのインストール
! pip install fitz
! pip install PyMuPDF==1.16.14
! apt install tesseract-ocr
! apt install libtesseract-dev
! pip install pytesseract
! apt install ghostscript
! pip install ocrmypdf
# OCRの実行
下記のコードで日本語データをインストールします.
# 日本語のインストール
! apt install tesseract-ocr-jpn*
! tesseract --list-langs
そして,下記のコードでOCRを実行します.
!ocrmypdf -l jpn_vert Jisaku_x86.pdf Jisaku_x86_ocr.pdf
# まとめ
PythonでPDFのOCRを実装しました.