PDF 内部構造 新しいページはコチラ

提供: yonewiki
移動: 案内, 検索
(ページの作成:「== '''概要''' ==  PDFは旧Adobe Systems(現Adobe)が策定した文書ファイル形式で、誕生当初(1993年頃)は、その中身は謎となっていたフ...」)
 
(概要)
3行: 3行:
  
  
 ここでは公開された仕様書に基づいて中身がどうなっているのかを記録します。中身が分かったところで、バイナリ形式にするのは面倒だし、覚えても意味ないんじゃない?今はオープンソースもあるし、それの仕様に基づいてライブラリに情報を渡してPDFを吐き出せばいいじゃないとも言えます。ですが、よく使う文書の中身が公開されているなら、それを理解しておくのもよいものです。いざというときには自分でPDF文書を構成することもできるという。素晴らしい。自分は圧縮しなければならないというところが引っ掛かっていましたが、実は圧縮されていなくても、PDFのページ記述言語の仕様にそったテキストが作れれば、PDFは読み取ってくれます。一つ、無理があるところは、文字数のバイト長、PDFを構成するオブジェクトという単位の情報の塊がファイル内のどこにあるかファイル先頭からのオフセットアドレス値をトレーラと呼ばれる部分に埋め込むことが必要となるのですが、ものすごく面倒です。でもこの算出をしてくれるフリーのコマンドラインプログラムPDFtkがあるので、最初はこれを使えば勉強もしやすく、簡単に言えば、HTMLくらい簡単なものに感じることができます。
+
 ここでは公開された仕様書に基づいて中身がどうなっているのかを記録します。中身が分かったところで、バイナリ形式にするのは面倒だし、覚えても意味ないんじゃない?今はオープンソースもあるし、それの仕様に基づいてライブラリに情報を渡してPDFを吐き出せばいいじゃないとも言えます。ですが、よく使う文書の中身が公開されているなら、それを理解しておくのもよいものです。いざというときには自分でPDF文書を構成することもできるという。素晴らしい。自分は圧縮しなければならないというところが引っ掛かっていましたが、実は圧縮されていなくても、PDFのページ記述言語の仕様にそったテキストが作れれば、PDFは読み取ってくれます。一つ、無理があるところは、文字数のバイト長、PDFを構成するオブジェクトという単位の情報の塊がファイル内のどこにあるかファイル先頭からのオフセットアドレス値をトレーラと呼ばれる部分に埋め込むことが必要となるのですが、ものすごく面倒です。でもこの算出をしてくれるフリーのコマンドラインプログラムPDFtk([https://www.pdflabs.com/tools/pdftk-server/ https://www.pdflabs.com/tools/pdftk-server/])があるので、最初はこれを使えば勉強もしやすく、簡単に言えば、HTMLくらい簡単なものに感じることができます。
  
  
 
 PDFtkをしっていれば、もっと勉強する人いたんじゃねと思うところです。標準化されてるんだからまさにHTMLやCSSと変わらない言語です。もっとPDFは使いやすくなっていたんじゃないか?そう思います。いまからでも遅くないPDFを理解してPDFを越えよ!情報戦士たち。そう思ったりします。おまえがやれよ的なとこもありますが。PDFを最大限活用する一歩になると思います。少しづつでもいいので勉強しましょかね。
 
 PDFtkをしっていれば、もっと勉強する人いたんじゃねと思うところです。標準化されてるんだからまさにHTMLやCSSと変わらない言語です。もっとPDFは使いやすくなっていたんじゃないか?そう思います。いまからでも遅くないPDFを理解してPDFを越えよ!情報戦士たち。そう思ったりします。おまえがやれよ的なとこもありますが。PDFを最大限活用する一歩になると思います。少しづつでもいいので勉強しましょかね。

2022年2月18日 (金) 00:00時点における版



個人用ツール
名前空間

変種
操作
案内
ツールボックス