gzip
gzip(ジー・ジップ)は、データ圧縮プログラムのひとつ、およびその圧縮データのフォーマットである。「GNU zip」の略であり[1] GNUプロジェクトによって開発・メンテナンスされている。現在、多くのUNIXに標準搭載される。
拡張子 | .gz |
---|---|
MIMEタイプ | application/gzip |
タイプコード | Gzip |
UTI | org.gnu.gnu-zip-archive |
マジック ナンバー | \x1f\x8b |
開発者 | Jean‐Loup Gailly、Mark Adler |
種別 | データ圧縮 |
ウェブサイト | www |
開発元 | GNUプロジェクト |
---|---|
最新版 |
1.12
/ 2022年4月7日 |
リポジトリ | |
プログラミング 言語 | C言語 |
対応OS | クロスプラットフォーム |
種別 | データ圧縮 |
ライセンス | GPL |
公式サイト |
www |
それ以前に普及していたcompressの圧縮アルゴリズムはLZWだが、LZWは特許を侵害していたのでGNUプロジェクトが代替としてgzipを開発した[2][注 1]。
フォーマットはRFC 1952 「GZIP File Format Specification」として文書化されている。
概要
編集gzipは、Lempel-Zivアルゴリズム (LZ77) とハフマン符号を用いており、従来のcompressよりも圧縮率が高いことが特徴である[4]。ただし非常に冗長なファイルでは、compressの方が圧縮率が高いこともある。開発者向けにライブラリとしてzlibが作成され、これにより広く使われる形式となった。gzipによって圧縮されたファイルの拡張子は慣習的に.gz
を用いる(極初期のgzipは.z
を用いたが、packとの混同を避けるため変更された。1993年頃に作成された.z
はgzipファイルの可能性が高い。なお、gzip自体はpack形式の伸長が可能である)。
また、gzipコマンドは標準入力から受け取ったデータを圧縮し、標準出力から取り出すことができる(gunzipは逆の動作)[4]ため、ファイル圧縮に限らず、多様な目的に使用できる。
gzipはzip等と異なりファイルアーカイバとしての機能は持たず、複数ファイルを扱いたい場合はtarファイルをgzip圧縮するという使い方が一般的である[4]。GNU tarにはアーカイブをgzipにフィルタする-zオプションが付いている。これによりアーカイブと圧縮を同時に、あるいは抽出と伸張を同時に行うことができる[5]。gzip圧縮したtarアーカイブは拡張子.tar.gz
または.tgz
を付ける習慣がある。
HTTP 1.1にはデータを圧縮し転送量を減らす機能があるが、gzipはその際の圧縮フォーマットの一つとしても使われている[6]。また、gzipはその仕様がRFC 1952で記述されている。
初期のうちに登場した1.2.4が安定したバージョンとして長期にわたって利用されたが、4GB超のファイルへの対応が無かったため、種々のバージョンアップが行われた。
互換性
編集gzipは、zip、compress、compress -H、packで圧縮されたファイルを伸張することができる。zipファイルについては、Deflate法で圧縮されファイルが1つしか含まれていない場合にだけ伸張できる[4]。gzipがインストールされているシステムでは、gunzip、zcat、uncompressコマンドが、gzipコマンドへのハードリンクとして存在していることがある。Linux Standard Baseでも指定コマンドになっている[8]。
- -r
- サブディレクトリにわたって圧縮する
- -v
- 詳細情報を表示する
- -数字
- 圧縮率の調整 (例:-9 圧縮率を最大にする -1 圧縮速度を最大にする。既定は6)
- -f
- 上書きを強制する
拡張子
編集tarと組み合わせる場合には.tar.gz
もしくは.tgz
とする[9]。
Media Type
編集2012年8月に発行されたRFC 6713でapplication/gzip
が定義されて、IANAにも正式に登録された。以前はapplication/x-gzip
やapplication/x-gzip-compressed
などが用いられていた。[10]
tarによるアーカイブがなされている場合は、非公式のapplication/x-tar-gz
も用いられる。[要出典]
HTTP圧縮
編集gzipは、HTTP通信を高速化するために使用されるもっとも一般的な圧縮アルゴリズムであり、現在ではほとんどのサーバーソフトウェアとブラウザーがgzip圧縮に対応している[11][12]。2024年3月現在、すべてのウェブサイトのうち約50%がgzip圧縮を使用している[13]。
脚注
編集注釈
編集- ^ 当時のGNU bullitinではyabbaが紹介されていたがそれを差し置いてリリースされたのがgzipである。
出典
編集- ^ a b Jean-loup Gailly; Mark Adler (2003年7月27日). “The gzip home page” (英語). 2014年11月7日閲覧。
- ^ “Gzip - GNU Project - Free Software Foundation”. GNUプロジェクト. 2024年5月4日閲覧。
- ^ “gzipとは - 意味をわかりやすく - IT用語辞典 e-Words”. IT用語辞典 e-Words. 2024年5月4日閲覧。
- ^ a b c d e “GNU Gzip”. GNUプロジェクト. 2024年5月4日閲覧。
- ^ “GNU tar 1.35”. GNUプロジェクト. 2024年5月4日閲覧。
- ^ “RFC 2616: Hypertext Transfer Protocol -- HTTP/1.1”. RFC Editor. 2024年5月4日閲覧。
- ^ “Linux File Compression: gzip, bzip2, and xz Unveiled | Linux Journal”. Linux Journal. 2024年5月4日閲覧。
- ^ Linux Standard Base https://refspecs.linuxfoundation.org/lsb.shtml
- ^ a b Free Software Foundation, Inc.; Jean-loup Gailly (2013年6月11日). “Overview - GNU Gzip” (英語). gzip - gzip: the data compression program. Free Software Foundation. 2014年11月7日閲覧。
- ^ a b Levine, John (2012年8月). “RFC 6713 - The 'application/zlib' and 'application/gzip' Media Types” (英語). Internet Engineering Task Force. 2014年11月6日閲覧。
- ^ “HTTP の圧縮 - HTTP | MDN”. Mozilla Foundation. 2024年5月3日閲覧。
- ^ “gzip compression (gzip 圧縮) - MDN Web Docs 用語集: ウェブ関連用語の定義 | MDN”. Mozilla Foundation. 2024年5月3日閲覧。
- ^ “Usage Statistics of Gzip Compression for Websites, May 2024”. Q-Success. 2024年5月3日閲覧。