MacOSでpdfファイルのOCRによるテキスト抽出
MacOSの標準機能を使用して、pdfファイル(画像)からOCRで文字認識して、テキストファイルをファイルに吐き出すショートカットアプリを作成。
内容
pdfのページ毎にテキストファイルを書き出すため、作業用のtmpフォルダに一旦描き出したのち、テキストファイルを結合して1つのテキストファイルにして指定のフォルダに書き込みを行う。
事前準備 aozoraEpub3とkindlegenを使用する。 aozoraEpub3をダウンロードし、適当なフォルダに保存。 AmazonからKindle previewerをダウンロード、インストールし、kindlegenをaozoraEpub3のフォルダに保存する。 シ...
0 件のコメント:
コメントを投稿