מהו קובץ GZ?
קובץ GZ הוא ארכיון דחוס שנוצר באמצעות אלגוריתם הדחיסה הסטנדרטי gzip (GNU zip). זה עשוי להכיל קבצים דחוסים מרובים, ספריות וקוביות קבצים. פורמט זה פותח בתחילה כדי להחליף פורמטים של דחיסה במערכות UNIX. והוא עדיין אחד מסוגי הארכיון הנפוצים ביותר במערכות לינוקס. יישומים כגון WinZip יכולים לפתוח קבצי GZ כדי להציג את תוכנם ב-Windows וב-MacOS.
פורמט קובץ GZ - מידע נוסף
Gzip משתמש באלגוריתם DEFLATE לדחיסת ארכיון ושונה מפורמט הארכיון ZIP בהחלת אלגוריתם הדחיסה על ארכיון שלם במקום קבצים בודדים. מפרטי פורמט הקובץ GZIP גרסה 4.3 שפורסם על ידי Internet Engineering Task Force (IETF) מכיל מידע מפורט על פורמט הקובץ. פורמט הקובץ מורכב מ:
- כותרת הקובץ
- כותרות אופציונליות
- נתונים דחוסים
- כותרת תחתונה של קובץ
כותרת קובץ GZ
כותרת הקובץ GZ מורכבת מ-10 בתים כדלקמן:
היסט | גודל | ערך | תיאור |
---|---|---|---|
0 | 2 | 0x1f 0x8b | מספר קסם המזהה את סוג הקובץ |
2 | 1 | שיטת דחיסה * 0-7 (שמורה) * 8 (הפחתה) | |
3 | 1 | דגלי קובץ | |
4 | 4 | חותמת זמן של 32 סיביות | |
8 | 1 | דגלי דחיסה | |
9 | 1 | מזהה מערכת הפעלה |
דגלי קובץ
ערך | מזהה | תיאור |
---|---|---|
0x01 | FTEXT | אם מוגדר, יש להתייחס לנתונים הלא דחוסים כטקסט במקום נתונים בינאריים. דגל זה מרמז על המרת סוף שורה עבור קובצי טקסט חוצי פלטפורמה, אך אינו אוכף אותה. |
0x02 | FHCRC | הקובץ מכיל סכום בדיקה של כותרת (CRC-16) |
0x04 | FEXTRA | הקובץ מכיל שדות נוספים |
0x08 | FNAME | הקובץ מכיל מחרוזת שם קובץ מקורית |
0x10 | FCOMMENT | הקובץ מכיל הערה |
0x20 | שמור | |
0x40 | שמור | |
0x80 | שמור |
מערכת הפעלה
ערך | תיאור |
---|---|
0 | מערכת קבצים FAT (MS-DOS, OS/2, NT/Win32) |
1 | אמיגה |
2 | VMS (או OpenVMS) |
3 | יוניקס |
4 | VM/CMS |
5 | Atari TOS |
6 | מערכת קבצים HPFS (OS/2, NT) |
7 | מקינטוש |
8 | מערכת Z |
9 | CP/M |
10 | TOPS-20 |
11 | מערכת קבצים NTFS (NT) |
12 | QDOS |
13 | בלוט RISCOS |
255 | לא ידוע |
כותרות אופציונליות של GZ
הכותרות הנוספות האופציונליות הן אלו המסומנות בדגלי הקובץ וכוללות מידע כגון שם הקובץ המקורי, שדות נוספים, הערות וסכום בדיקת כותרת.
נתונים דחוסים
סעיף זה מכיל את הנתונים הדחוסים באמצעות אלגוריתם הדחיסה DEFLATE.
כותרת תחתונה של קובץ GZ
הכותרת התחתונה של הקובץ היא בגודל של 8 בתים ומכילה את המידע הבא.
היסט | גודל | תיאור |
---|---|---|
0 | 4 | Checksum (CRC-32) |
4 | 4 | ערך גודל נתונים לא דחוס בבתים |
הפניות
- gzip - ויקיפדיה
- RFC1952: מפרט פורמט קובץ GZIP, מאת IETF.