MacOSでpdfファイルのOCRによるテキスト抽出
MacOSの標準機能を使用して、pdfファイル(画像)からOCRで文字認識して、テキストファイルをファイルに吐き出すショートカットアプリを作成。
内容
pdfのページ毎にテキストファイルを書き出すため、作業用のtmpフォルダに一旦描き出したのち、テキストファイルを結合して1つのテキストファイルにして指定のフォルダに書き込みを行う。
Finderで画像を選んで右クリックするだけでPDFに変換できるようになります。 1. Automatorを起 動する 「アプリケーション」フォルダから Automator を開き、「新規書類」をクリック。 2. 「クイックアクション」を選択する 書類の種類を選択する画面...
0 件のコメント:
コメントを投稿