PDF 内部構造のソースを表示
新しいページはコチラ
移動:
案内
,
検索
== '''概要''' == PDFは旧Adobe Systems(現Adobe)が策定した文書ファイル形式で、誕生当初(1993年頃)は、その中身は謎となっていたファイル形式です。米国税務署が文書形式を採用したのを機会に2001年から2008年にかけて標準化機構(ISO)が仕様を策定し、2008年にはPDF1.7が公開されています。いつ頃、仕様が公開されたのかは知りませんが、2022年を過ぎた現在では、その仕様に基づいたPDFが広く使われるようになっている文書ファイル形式です。中身はバイナリですが、圧縮された情報を展開するとテキスト形式で記述できるページ記述言語(PDL:Page Description Language)というものになっています。PDLは様々な試み(PostScript(Adobe), Pages(IBM), LIPS(Canon), PCL(Hewlett-Packard), ART(Fuji Film))がありますが、PDFはもっとも成功した言語だと言えると思います。 ここでは公開された仕様書に基づいて中身がどうなっているのかを記録します。中身が分かったところで、バイナリ形式にするのは面倒だし、覚えても意味ないんじゃない?今はオープンソースもあるし、それの仕様に基づいてライブラリに情報を渡してPDFを吐き出せばいいじゃないとも言えます。ですが、よく使う文書の中身が公開されているなら、それを理解しておくのもよいものです。いざというときには自分でPDF文書を構成することもできるという。素晴らしい。自分は圧縮しなければならないというところが引っ掛かっていましたが、実は圧縮されていなくても、PDFのページ記述言語の仕様にそったテキストが作れれば、PDFは読み取ってくれます。一つ、無理があるところは、文字数のバイト長、PDFを構成するオブジェクトという単位の情報の塊がファイル内のどこにあるかファイル先頭からのオフセットアドレス値をトレーラと呼ばれる部分に埋め込むことが必要となるのですが、ものすごく面倒です。でもこの算出をしてくれるフリーのコマンドラインプログラムPDFtk([https://www.pdflabs.com/tools/pdftk-server/ https://www.pdflabs.com/tools/pdftk-server/])があるので、最初はこれを使えば勉強もしやすく、簡単に言えば、HTMLくらい簡単なものに感じることができます。PDFtkのコマンドラインはPDFtk Serverというプログラムに含まれるようです。いづれにしても無料です。これとは別にPDFtkのUIが付いたPDFtk Free版とPDFtkPro版がありますが、使いやすいですが、すべてができるわけではないです。使いたい人は使ってみるのもいいと思います。 PDFtkをしっていれば、もっと勉強する人いたんじゃねと思うところです。標準化されてるんだからまさにHTMLやCSSと変わらない言語です。もっとPDFは使いやすくなっていたんじゃないか?そう思います。いまからでも遅くないPDFを理解してPDFを越えよ!情報戦士たち。そう思ったりします。おまえがやれよ的なとこもありますが。PDFを最大限活用する一歩になると思います。少しづつでもいいので勉強しましょかね。 == '''説明''' == [[PDF 内部構造 構造の概念 簡単な説明]]<br /> [[PDF 内部構造 基本とファイル構造キー]]<br /> [[PDF 内部構造 グラフィックス]]<br />
PDF 内部構造
に戻る。
個人用ツール
3.145.17.123
このIPアドレスのトーク
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
操作
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ツールボックス
リンク元
関連ページの更新状況
特別ページ