2024年11月22日金曜日

ショートカットアプリによるOCR

MacOSでpdfファイルのOCRによるテキスト抽出 

MacOSの標準機能を使用して、pdfファイル(画像)からOCRで文字認識して、テキストファイルをファイルに吐き出すショートカットアプリを作成。


内容

pdfのページ毎にテキストファイルを書き出すため、作業用のtmpフォルダに一旦描き出したのち、テキストファイルを結合して1つのテキストファイルにして指定のフォルダに書き込みを行う。











0 件のコメント:

コメントを投稿

Kindle関連: EpubファイルをMobiに変更するショートカット

 事前準備 aozoraEpub3とkindlegenを使用する。 aozoraEpub3をダウンロードし、適当なフォルダに保存。 AmazonからKindle previewerをダウンロード、インストールし、kindlegenをaozoraEpub3のフォルダに保存する。 シ...