PDF 内部構造 新しいページはコチラ
提供: yonewiki
(→概要) |
(→概要) |
||
3行: | 3行: | ||
− | ここでは公開された仕様書に基づいて中身がどうなっているのかを記録します。中身が分かったところで、バイナリ形式にするのは面倒だし、覚えても意味ないんじゃない?今はオープンソースもあるし、それの仕様に基づいてライブラリに情報を渡してPDFを吐き出せばいいじゃないとも言えます。ですが、よく使う文書の中身が公開されているなら、それを理解しておくのもよいものです。いざというときには自分でPDF文書を構成することもできるという。素晴らしい。自分は圧縮しなければならないというところが引っ掛かっていましたが、実は圧縮されていなくても、PDFのページ記述言語の仕様にそったテキストが作れれば、PDFは読み取ってくれます。一つ、無理があるところは、文字数のバイト長、PDFを構成するオブジェクトという単位の情報の塊がファイル内のどこにあるかファイル先頭からのオフセットアドレス値をトレーラと呼ばれる部分に埋め込むことが必要となるのですが、ものすごく面倒です。でもこの算出をしてくれるフリーのコマンドラインプログラムPDFtk([https://www.pdflabs.com/tools/pdftk-server/ https://www.pdflabs.com/tools/pdftk-server/]) | + | ここでは公開された仕様書に基づいて中身がどうなっているのかを記録します。中身が分かったところで、バイナリ形式にするのは面倒だし、覚えても意味ないんじゃない?今はオープンソースもあるし、それの仕様に基づいてライブラリに情報を渡してPDFを吐き出せばいいじゃないとも言えます。ですが、よく使う文書の中身が公開されているなら、それを理解しておくのもよいものです。いざというときには自分でPDF文書を構成することもできるという。素晴らしい。自分は圧縮しなければならないというところが引っ掛かっていましたが、実は圧縮されていなくても、PDFのページ記述言語の仕様にそったテキストが作れれば、PDFは読み取ってくれます。一つ、無理があるところは、文字数のバイト長、PDFを構成するオブジェクトという単位の情報の塊がファイル内のどこにあるかファイル先頭からのオフセットアドレス値をトレーラと呼ばれる部分に埋め込むことが必要となるのですが、ものすごく面倒です。でもこの算出をしてくれるフリーのコマンドラインプログラムPDFtk([https://www.pdflabs.com/tools/pdftk-server/ https://www.pdflabs.com/tools/pdftk-server/])があるので、最初はこれを使えば勉強もしやすく、簡単に言えば、HTMLくらい簡単なものに感じることができます。PDFtkのコマンドラインはPDFtk Serverというプログラムに含まれるようです。いづれにしても無料です。これとは別にPDFtkのUIが付いたPDFtk Free版とPDFtkPro版がありますが、使いやすいですが、すべてができるわけではないです。使いたい人は使ってみるのもいいと思います。 |
PDFtkをしっていれば、もっと勉強する人いたんじゃねと思うところです。標準化されてるんだからまさにHTMLやCSSと変わらない言語です。もっとPDFは使いやすくなっていたんじゃないか?そう思います。いまからでも遅くないPDFを理解してPDFを越えよ!情報戦士たち。そう思ったりします。おまえがやれよ的なとこもありますが。PDFを最大限活用する一歩になると思います。少しづつでもいいので勉強しましょかね。 | PDFtkをしっていれば、もっと勉強する人いたんじゃねと思うところです。標準化されてるんだからまさにHTMLやCSSと変わらない言語です。もっとPDFは使いやすくなっていたんじゃないか?そう思います。いまからでも遅くないPDFを理解してPDFを越えよ!情報戦士たち。そう思ったりします。おまえがやれよ的なとこもありますが。PDFを最大限活用する一歩になると思います。少しづつでもいいので勉強しましょかね。 | ||
+ | |||
+ | |||
+ | == '''説明''' == | ||
+ | [[PDF構造の概念 簡単な説明]] |