2024年11月22日金曜日

ショートカットアプリによるOCR

MacOSでpdfファイルのOCRによるテキスト抽出 

MacOSの標準機能を使用して、pdfファイル(画像)からOCRで文字認識して、テキストファイルをファイルに吐き出すショートカットアプリを作成。


内容

pdfのページ毎にテキストファイルを書き出すため、作業用のtmpフォルダに一旦描き出したのち、テキストファイルを結合して1つのテキストファイルにして指定のフォルダに書き込みを行う。











0 件のコメント:

コメントを投稿

Automatorで複数の画像のpdf化

  Finderで画像を選んで右クリックするだけでPDFに変換できるようになります。   1. Automatorを起 動する 「アプリケーション」フォルダから Automator を開き、「新規書類」をクリック。 2. 「クイックアクション」を選択する 書類の種類を選択する画面...