----- Original Message ----- From: "SHIMADA Iwaki" <s-iwk _at_ mbc.nifty.com> To: <linux-users _at_ linux.or.jp> Cc: <okumura _at_ ztv.ne.jp> Sent: Tuesday, March 06, 2001 11:24 PM Subject: [linux-users:81013] Re: pdfのテキストだけを抽出 > > From: Mitsuo Satou <satou _at_ osk.3web.ne.jp> > > Subject: [linux-users:80982] Re: pdfのテキストだけを抽出 > > Date: Tue, 6 Mar 2001 09:18:24 +0900 > > Message-ID: <20010306091444.0330.SATOU _at_ osk.3web.ne.jp> > > > > > > linuxとは直接関係ないのですが、PDFファイルからテキスト部分だけを抽出 す > > > > るソフトってないものでしょうか? > > > > 今はページごとにコピー&ペーストしていますが、面倒なもので。 > > > > > > Xpdfに含まれている pdftotext はいかがでしょうか? > > > Namazuとセットでよく使われています。 > > > > > > http://www.foolabs.com/xpdf/ > > > > 別解というわけではないですが,Acrobat でもページごとしかできないという > > ことはないと思います。たしか「ページをつなげる」とかいうオプションがあっ > > たはずです。 > > たしかにありました。WindowsのAcrobatでやってみたところ、バッファオーバー > したのか、途中で切れてしまいました。 Windowsの話題で恐縮ですが,なぜかWordにコピーしたところうまくいきました.秀 丸エディタでは途中で切れてしまいました.クリップボードにはその途中分までしか ありませんでした. 不思議だ...>Word ぷら
Follow-Ups: References:
- [linux-users:80980] pdfのテキストだけを抽出s-iwk
- [linux-users:80982] Re: pdfのテキストだけを抽出Mitsuo Satou
- [linux-users:80983] Re: pdfのテキストだけを抽出okumura
- [linux-users:81013] Re: pdfのテキストだけを抽出SHIMADA Iwaki
- Prev by Subject: [linux-users:81044] Re: grubでSCSI HDDが認識されなくなる
- Next by Subject: [linux-users:81046] Re: EPSON EDi Cube NC710
- Previous by thread: [linux-users:81013] Re: pdfのテキストだけを抽出
- Next by thread: [linux-users:81061] Re: pdfのテキストだけを抽出
- Indexes:[Main][Thread]