「PDFTOHTML(1) 日本語試訳」
翻訳にあたって大いに参考にしたサイト。
-------------------------------------------
PDFTOHTML(1)
名前
pdftohtml - PDF ファイルを HTML、XML、PNG 画像に変換するプログラム
書式
pdftohtml [options] <PDF-file> [<HTML-file> <XML-file>]
説明
このマニュアル・ページでは pdftohtml コマンドについて簡単に説明する。このマニュアル・ページは Debian GNU/Linux 配布系のために書かれたものである。元のプログラムにはマニュアル・ページが付属していなかった。
pdftohtml は PDF 文書を HTML に変換するプログラムである。同プログラムの出力は、実行時点の作業ディレクトリに作成される。
オプション
オプションの概要は以下の通り。
-h, -help
オプションの概要を表示する。
-f <int>
変換処理を始めるページ。
-l <int>
変換処理を終えるページ。
-q
如何なるメッセージやエラーも表示しない
-v
著作権と版の情報を表示する
-p
.pdf のリンクを .html で置き換える
-c
1 頁が 1 HTML 文書となる複合型出力(complex output)を生成。
-s
全頁を含んだ単一の HTML 文書を生成する
-i
画像を無視する
-noframes
フレーム無しの HTML。複合型出力(complex output)では無視される。
-stdout
標準出力を使用する
-zoom <fp>
PDF 文書を拡大する(初期設定は 1.5)
-xml
後処理に使える XML を出力する
-enc <string>
出力文字列の符号化方式の名前
-opw <string>
所有者パスワード(暗号化されたファイルの場合)
-upw <string>
ユーザ・パスワード(暗号化されたファイルの場合)
-hidden
非表示のテキストの抽出を強制する
-dev
Ghostscript の出力デバイスの名前(png16m、jpeg など)。このオプション指定がなければ、スプラッシュを使用する。
-fmt
スプラッシュ出力用の画像ファイルの形式(png あるいは jpg)。複数 HTML を用いる複合型出力を選択し、且つ、-fmt も -dev も指定しなかった場合、-fmt png を指定したものと見做される。
-nomerge
段落を繫げない
-nodrm
文書のDRM(デジタル著作権管理)設定を上書きする
開発者
Gueorgui Ovtcharov と Rainer Dorsch が pdftohtml を開発した。このプログラムは Derek Noonburg の xpdf パッケージを基にしており、同パッケージに負うところ大である。
Søren Boll Overgaard <boll@debian.org> がこのマニュアル・ページを執筆してくれた。このマニュアルは Debian GNU/Linux システムを想定したものだが、他のシステムでも使えるだろう。
----------------------------------------
PR