デジタル画像の世界には、JPEGやPNGといったカラフルな画像を扱うフォーマットが多数存在します。しかし、FAXやスキャンした白黒の文書を扱う際には、別の種類の圧縮技術が主役となります。それが、TIFFファイルでもよく利用されるCCITT G3とG4という圧縮方式です。
これらの技術は、かつて国際的な通信基準を定めていたCCITT(国際電信電話諮問委員会)によって標準化されました。なぜ、これらの方式が今も使われ続けているのでしょうか?
G3とG4の共通の目的:白黒画像を効率的に圧縮する
CCITT G3とG4は、FAX通信の効率化を目的として開発されました。FAXの送信は、白(紙の地色)と黒(文字や線)の2色で構成されるドット(ビットマップ)画像を扱うため、この2色に特化した圧縮方式が非常に効果的です。
これらの方式は、画像のパターンを「白」と「黒」の連続として捉え、その長さを記録することでデータを大幅に削減します。この技術はランレングス符号化(Run-Length Encoding)を応用したものです。
CCITT Group 3 (G3)
CCITT G3は、一次元または二次元のランレングス符号化を用いる圧縮方式です。
-
一次元符号化(1D): 各走査線(行)の白と黒のラン(連続したピクセル)の長さを符号化します。これは、データの変更を検出する比較的単純な方法です。
-
二次元符号化(2D): 一つ前の走査線との差分を符号化することで、さらに圧縮率を高めます。文書の文字などは、隣接する行で類似したパターンを持つことが多いため、この方法が非常に効果的です。ただし、通信エラーに弱いという欠点があり、一定の行ごとに一次元符号化に戻ることでエラーを吸収する仕組みも組み込まれています。
G3はFAX通信の標準として広く普及しました。TIFFファイルでも、ファクシミリ画像やモノクロのスキャン文書の保存によく利用されます。
CCITT Group 4 (G4)
CCITT G4は、G3の進化版であり、二次元符号化のみを使用します。
-
特徴: G3の二次元符号化をさらに洗練させ、データの冗長性を最大限に排除します。G3のような一次元符号化への切り替えを行わないため、G3よりも高い圧縮率を実現します。
-
用途: G4は、エラー訂正機能が確保された通信環境(例:ISDNやコンピュータネットワーク)を前提としています。FAX通信よりも、スキャナーで読み取った文書をTIFF形式で保存する際など、エラーの少ない環境での利用に最適です。
G3とG4の比較
TIFFとG3/G4:現代の利用シーン
TIFFファイルは、G3やG4を含む多様な圧縮方式をサポートしています。TIFF形式でモノクロのスキャン文書を保存する際、これらの圧縮方式を選択することで、ファイルサイズを劇的に小さくすることが可能です。
-
G4: スキャンした白黒のドキュメント(契約書、論文、図面など)を、劣化なく、かつ最も小さなサイズで保存したい場合に最適です。ドキュメント管理システムなどで利用されることが多く、白黒画像のアーカイブにおけるデファクトスタンダードと言えます。
-
G3: FAX送信を前提としたシステムや、一部の古い機器との互換性を保つ必要がある場合に利用されます。
まとめ
CCITT G3とG4は、現代のカラー画像圧縮技術とは異なりますが、白黒画像に特化した非常に効率的な圧縮方式です。FAX通信というアナログな世界から生まれた技術が、今もTIFFファイルというデジタルな世界で重要な役割を担っているのは、その優れた圧縮性能の証と言えるでしょう。
次にTIFFファイルを扱う機会があれば、「このファイルはG4で圧縮されているな」と少し気にしてみてはいかがでしょうか。そこには、情報通信の歴史が息づいているのです。