PDF内の文字列の取得ねぇ…

PDF に関する質問は、ここ数年で PDF が広まるにつれてだんだん増えてきました。
Acobat なら OLE である程度は制御可能なので、何回かレスしたことがあります。
しかし、もはや、Excel VBA の世界の話ではないですね。
まぁ、Excel VBA掲示板では、そういうのはしょっちゅうですが。
 
MOUG(Excel VBA)2008/03/15 20:59:38
『pdfがらみの社内ツールなのですが??? 』
http://www2.moug.net/bbs/exvba/20080315000014.htm

省庁とかのURLからダウンロードしたデータのpdfファイルとか、
メルマガに添付しているpdfとかが、フォルダに混在してるんで、
<Adobe Reader の検索機能>を使用して、
KEYWORD毎にカテゴリ分類したいんが、
マンパワーじゃ限界なんで、プログラムで連続一括で処理できないか?

 
あぁ、それは手作業ではやりたくない仕事だね、気持ちは分かります。
でも、Adobe Reader では機能が外部のアプリから使えるようになってないような気がします。
参照設定まではできるんだけど、CreateObjectでエラーになってしまいます。
Acrobat なら、↓のようなことができるんだけどね。
「PDFファイル内の文字を出力する」
http://homepage3.nifty.com/belie/vba/vba017.htm
 
別の手ってことで、ユーザーフォームの「その他のコントロール」で Adobe PDF Reader にチェックを入れて、AcroPDF コントロールを置いて、コレを通じてPDFファイルにアクセスしてやれと思って、早速実験♪
PDFファイルを開くのは、

  Me.AcroPDF1.LoadFile "フルパスのファイル名"

で難なくできたけど、そこから先が分からない…
う〜ん。この手も大変そうだ。
 
ま、暇で暇でしょーがないときにでも調べようかな。
 
 
 
別の手として、PDFファイルのファイル構造を調べて(公開されているので可能なはず)、ダイレクトにPDFファイルにアクセスするって方法も考えられるけど、さすがにそこまでやるほど興味はないです。
 
# Adobe Reader 8 の前提で書いています。
 
※.Excel World の 2008年3月16日 06:57 の日記をコピーしています。
http://excel.sns.fc2.com/excel/