PDF 内部構造 構造の概念 簡単な説明 新しいページはコチラ
提供: yonewiki
(→概要) |
(→概要) |
||
65行: | 65行: | ||
</syntaxhighlight2> | </syntaxhighlight2> | ||
− | + | はじめて見たときは、なんじゃコレ。って感じでした。皆さんの中にも初めての人がいたら同じような気持ちだったはずです。冷静にみてみると見えてくるものがあります。最初の2行あたりは、すべての拡張子のファイルにもあるファイルヘッダ部です。なんらかのファイル操作をしたことがある人なら知っているかもしれません。★マークがあるところは、任意の数値を指定したり、PDFtkに自動で算出してもらう数値だったりが入る箇所です。このファイルは実際はバイナリファイルですが、テキストで閲覧しても上記のように表示されるくらいテキストに近いものです。そして出回っているPDF生成ツールを使うとたいていは圧縮されて、なにがなんだかわからないファイルになっているのですが、上記のようにテキストでも理解できる非圧縮の見通しのいいPDFファイルも存在しています。ファイルを理解したい人にとってはこれでいいのですが、世の中そうもいかないらしい。いまファイルを理解しようとしている我々も含めて、単純に便利に使いたい人の方が多い。では上から見てます。 | |
71行: | 71行: | ||
− | ふむふむ。PDF-1.0 ~ PDF-1.7 までのバージョンがありますので、それぞれの仕様にあわせた値なので数字の部分は変わります。大した機能を使わない文書ならPDF-1.1とかを指定しても問題ないでしょう。むしろ大きなバージョンは複雑な仕様になっているので、きちんとすべての情報を書けていなくて動かなくなることがあるかもしれません。自分ごときが扱うときは、まだ1.1くらいしか使ったことないです。1.1でも普段使う機能は出来上がってます。ちなみに1.1の仕様に沿っていれば現状の1.7に対応しているリーダーでは開けるように、後方互換が完全に保証されています。逆に1.7の文書も1.1でひらける前方互換も概ね(おおむね) | + | ふむふむ。PDF-1.0 ~ PDF-1.7 までのバージョンがありますので、それぞれの仕様にあわせた値なので数字の部分は変わります。大した機能を使わない文書ならPDF-1.1とかを指定しても問題ないでしょう。むしろ大きなバージョンは複雑な仕様になっているので、きちんとすべての情報を書けていなくて動かなくなることがあるかもしれません。自分ごときが扱うときは、まだ1.1くらいしか使ったことないです。1.1でも普段使う機能は出来上がってます。ちなみに1.1の仕様に沿っていれば現状の1.7に対応しているリーダーでは開けるように、後方互換が完全に保証されています。逆に1.7の文書も1.1でひらける前方互換も概ね(おおむね)保証されているようです。ヘッダのあとにファイルがバイナリファイルであることを明示する工夫として、128以上のASCII文字列(ASCII文字コードは0~127の値とアルファベット文字を主に数値と文字を結び付けた対応関係があります。詳しくはASCII文字コードで調べて下さい)の外側の数値を記載しています。 |
95行: | 95行: | ||
− | + | そして、最後に55行目でファイルのサイズをバイト単位で指定した数値部分があって、%%EOFというファイル終端記号で終わっています。 | |
+ | |||
+ | |||
+ | PDFファイルとは、こういう構造になっています。まだ理解しきれていませんが、シンプルな表現のみの文書の全貌はみえてきたと思います。 |