Apa itu file DOCX?
DOCX adalah format yang terkenal untuk dokumen Microsoft Word. Diperkenalkan pada tahun 2007 dengan rilis Microsoft Office 2007, struktur format Dokumen baru ini berubah dari biner biasa menjadi kombinasi file XML dan biner. File DOCX dapat dibuka dengan Word 2007 dan versi selanjutnya, tetapi tidak dengan versi MS Word yang lebih lama yang hanya mendukung ekstensi file DOC.
Sejarah Singkat
Setelah Microsoft membuka spesifikasi untuk format file DOC, para pesaingnya dapat dengan mudah merekayasa balik format tersebut dan menyediakan dukungan yang sama dalam aplikasi mereka sendiri. Selain itu, persaingan dari Open Office dengan format Open Document-nya memaksa Microsoft untuk mengadopsi standar yang lebih terbuka dan luas. Pada awal tahun 2000-an, Microsoft memutuskan untuk melakukan perubahan guna mengakomodasi standar untuk Office Open XML. Dokumen dalam standar baru ini diberikan ekstensi .docx, di mana huruf “X” melambangkan XML. Pada tahun 2007, format file baru ini menjadi bagian dari Office 2007 dan terus digunakan dalam versi Microsoft Office selanjutnya. Format file baru ini memiliki beberapa keunggulan, seperti ukuran file yang lebih kecil, risiko korupsi yang lebih rendah, dan representasi gambar yang lebih baik.
Spesifikasi Format File DOCX - Informasi Lebih Lanjut
File DOCX terdiri dari kumpulan file XML yang dikemas dalam arsip ZIP. Isi dari dokumen Word baru dapat dilihat dengan mengekstraknya. Kumpulan file ini dikategorikan sebagai berikut:
- MetaData Files - berisi informasi tentang file lain yang tersedia dalam arsip
- Document - berisi isi utama dari dokumen
File Metadata
Microsoft Word menggunakan file ini untuk menemukan hubungan antara file dan menentukan lokasi isi dokumen. Ketika arsip dokumen Word diekstrak, terdapat beberapa file metadata seperti yang dijelaskan di bawah ini.
Relationships - _rels/.rels
File ini berisi informasi yang memberi tahu MS Word di mana mencari isi dokumen dan referensi lainnya. Setiap hubungan diidentifikasi dengan ID hubungan yang unik dan menentukan file XML yang direferensikan sebagai target. Contoh file hubungan ditunjukkan sebagai berikut:
<Relationship Id#"rId1" Type#"http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument" Target#"word/document.xml"/>.
Content Types
Sebuah dokumen dapat berisi beberapa jenis media di dalamnya, seperti gambar, tema, word art, dan lain-lain. File [Content_Types].xml berisi informasi tentang jenis media yang ada dalam dokumen. Contoh isi file XML tersebut adalah sebagai berikut:
<Override PartName#"/word/document.xml" ContentType#"application/vnd.openxmlformats-officedocument.wordprocessingml.document.main+xml"/>
Referensi ke Sumber Daya - _rels/document.xml.rels
Informasi tentang sumber daya, seperti gambar yang disematkan dalam dokumen, direferensikan dalam file XML ini.
Isi Utama Dokumen
Bagian ini merujuk pada file XML utama dalam arsip yang berisi teks dari dokumen. Konten ini direpresentasikan oleh berbagai node sesuai dengan spesifikasi OpenOffice XML. Sebagian besar isi file ini terdiri dari Paragraf dan Tabel, meskipun bisa juga terdapat node lainnya.
Node Format File
File document.xml utama adalah kumpulan node yang merepresentasikan keseluruhan isi file. Setiap node memiliki bagian awal dan akhir yang dapat mencakup node lainnya atau isi dari dokumen. Contoh sederhana dari file XML semacam itu adalah sebagai berikut:
<w:document>
<w:body>
<w:p w:rsidR#"005F670F" w:rsidRDefault#"005F79F5">
<w:r><w:t>Dokumen Contoh</w:t></w:r>
</w:p>
<w:sectPr w:rsidR#"005F670F">
<w:pgSz w:w#"12240" w:h#"15840"/>
<w:pgMar w:top#"1440" w:right#"1440" w:bottom#"1440" w:left#"1440" w:header#"720" w:footer#"720"
w:gutter#"0"/>
<w:cols w:space#"720"/>
<w:docGrid w:linePitch#"360"/>
</w:sectPr>
</w:body>
</w:document>
Berikut ini adalah informasi mengenai beberapa node dalam file DOCX yang merepresentasikan isi dokumen:
<w:document>
- Mewakili elemen akar dari konten utama dalam file.
<w:body>
- Mewakili badan dokumen yang dapat terdiri dari berbagai elemen lainnya seperti paragraf, tabel, dan bagian.
Paragraf
Paragraf adalah wadah utama untuk konten dalam sebuah dokumen. Paragraf direpresentasikan oleh elemen <w:p> dalam dokumen. Sebuah paragraf terdiri dari satu atau lebih <w:r> (runs) yang berisi teks aktual dari paragraf tersebut. Selain runs, paragraf juga dapat berisi elemen dokumen lainnya seperti hyperlink, komentar, dan sebagainya. Contoh struktur paragraf ditunjukkan di bawah ini:
<w:p>
<w:pPr>
<w:pStyle> w:val#"MyStyle"/>
<w:spacing w:before#"120" w:after#"120"/>
</w:pPr>
<w:r>
<w:t xml"space#"preserve">Sebuah paragraf adalah wadah utama dalam dokumen yang terdiri dari satu atau lebih runs yang berisi teks dari paragraf tersebut.</w:t>
</w:r>
</w:p>
FAQ tentang DOCX
Apakah DOCX merupakan ekstensi file? - DOCX digunakan sebagai ekstensi file untuk mewakili format file Microsoft Word 2007 dan versi yang lebih baru yang digunakan untuk menyimpan file Word. Ekstensi ini juga memberi tahu sistem operasi Anda bahwa file DOCX ini memerlukan Microsoft Word 2007 untuk membukanya dan menampilkan ikonnya.
Apakah DOCX sama dengan Word? - DOCX adalah format file yang digunakan oleh Microsoft Word untuk menyimpan dokumen dalam format Open XML. Sementara itu, Word adalah perangkat lunak aplikasi dari Microsoft Office yang juga mendukung format file lainnya seperti DOC, DOT, DOTM, dan lain-lain.
Apa perbedaan antara DOC dan DOCX? - DOC adalah format file Word yang digunakan dalam Word 2007 dan versi sebelumnya. DOCX didasarkan pada format file Open XML yang didukung oleh Microsoft Word 2007 dan versi yang lebih baru. Lihat Perbedaan antara DOC dan DOCX untuk informasi lebih lanjut.