Ano ang isang DOCX file?
Ang DOCX ay isang kilalang format para sa mga dokumento ng Microsoft Word. Ipinakilala mula 2007 sa paglabas ng Microsoft Office 2007, ang istruktura ng bagong format ng Dokumento ay binago mula sa simpleng binary patungo sa kumbinasyon ng XML at binary na mga file. Maaaring buksan ang mga file ng Docx gamit ang Word 2007 at mga lateral na bersyon ngunit hindi sa mga naunang bersyon ng MS Word na sumusuporta sa mga extension ng DOC file.
Maikling Kasaysayan
Matapos buksan ng Microsoft ang mga detalye para sa format ng DOC file, naging madali para sa mga kakumpitensya nito na i-reverse engineer ang format at magbigay ng parehong suporta sa kanilang sariling mga application. Bilang karagdagan, ang kumpetisyon mula sa Open Office sa anyo ng Open Document Format nito, ay nagpilit sa Microsoft na magpatibay ng mas bukas at malawak na mga pamantayan. Noong unang bahagi ng 2000 nang magpasya ang Microsoft na gawin ang pagbabago upang matugunan ang pamantayan para sa Office Open XML. Ang mga dokumento sa ilalim ng bagong Pamantayan na ito ay binigyan ng .docx extension, ang “X” pagiging para sa XML. Pagsapit ng 2007, ang bagong format ng file na ito ay naging bahagi ng Office 2007 at nagpapatuloy din sa mga bagong bersyon ng Microsoft Office. Ang bagong uri ng file ay nagdagdag ng mga pakinabang ng maliliit na laki ng file, mas kaunting pagbabago ng katiwalian at mahusay na na-format na representasyon ng mga imahe.
Mga Detalye ng Format ng DOCX File - Higit pang Impormasyon
Binubuo ang Docx file ng koleksyon ng mga XML file na nasa loob ng ZIP archive. Ang mga nilalaman ng isang bagong dokumento ng Word ay maaaring matingnan sa pamamagitan ng pag-unzip ng mga nilalaman nito. Ang koleksyon ay naglalaman ng isang listahan ng mga XML file na nakategorya bilang:
- MetaData Files - naglalaman ng impormasyon tungkol sa iba pang mga file na available sa archive
- Dokumento - naglalaman ng aktwal na nilalaman ng dokumento
Metadata Files
Ginagamit ng Microsoft Word ang mga file na ito upang mahanap ang kaugnayan sa pagitan ng mga file at upang mahanap ang mga nilalaman ng dokumento. Kapag na-extract ang isang archive ng dokumento ng Word, naglalaman ito ng ilang mga file tulad ng nakadetalye sa ibaba.
Relationships - _rels/.rels
Ang file na ito ay naglalaman ng impormasyon na nagsasabi sa MS Word kung saan hahanapin ang mga nilalaman ng dokumento at iba pang mga sanggunian. Ang bawat ugnayan ay nakikilala sa pamamagitan ng isang natatanging id ng relasyon at tinutukoy ang na-refer na XML file bilang target. Ang isang sample na file ng relasyon ay ipinapakita bilang sumusunod:
<Relationship Id#"rId1" Type#"http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument" Target#"word/document.xml"/>.
Content Types
Ang isang dokumento ay maaaring maglaman ng ilang uri ng media sa loob tulad ng mga larawan, tema, word art, atbp. Ang [Content_Types].xml ay naglalaman ng impormasyon tungkol sa mga ganitong uri ng media na nasa dokumento. Ang mga nilalaman ng naturang XML file ay ipinapakita bilang sumusunod:
<Override PartName#"/word/document.xml" ContentType#"application/vnd.openxmlformats-officedocument.wordprocessingml.document.main+xml"/>
References To Resources - _rels/document.xml.rels
Ang impormasyon tungkol sa mga mapagkukunan, tulad ng mga larawang naka-embed sa dokumento, ay isinangguni sa XML file na ito.
Mga Nilalaman ng Pangunahing Dokumento
Ito ay tumutukoy sa pangunahing XML file ng archive na naglalaman ng nilalaman ng teksto ng dokumento. Ang nilalamang ito ay kinakatawan ng iba’t ibang mga node ayon sa mga pagtutukoy ng OpenOffice XML. Karamihan sa mga nilalaman ng file na ito ay binubuo ng Mga Talata at Talahanayan, kahit na ang mga ito ay maaaring iba pang mga node.
File Format Nodes
Ang pangunahing document.xml file ay isang koleksyon ng mga node para sa representasyon ng kabuuang nilalaman ng isang file. Ang bawat node ay may simula at dulo na sumasaklaw sa alinman sa mga karagdagang node o sa mga nilalaman. Ang isang pinasimpleng halimbawa ng naturang xml file ay ang sumusunod:
<w:document>
<w:body>
<w:p w:rsidR#"005F670F" w:rsidRDefault#"005F79F5">
<w:r><w:t>Example Document</w:t></w:r>
</w:p>
<w:sectPr w:rsidR#"005F670F">
<w:pgSz w:w#"12240" w:h#"15840"/>
<w:pgMar w:top#"1440" w:right#"1440" w:bottom#"1440" w:left#"1440" w:header#"720" w:footer#"720"
w:gutter#"0"/>
<w:cols w:space#"720"/>
<w:docGrid w:linePitch#"360"/>
</w:sectPr>
</w:body>
</w:document>
Ang sumusunod ay ang impormasyon tungkol sa ilan sa mga node na nakapaloob sa isang DOCX file para sa representasyon ng mga nilalaman.
<w:document>
- Kinakatawan ang root element ng pangunahing nilalaman ng file.
<w:body>
- Kinakatawan ang katawan ng dokumento na maaaring binubuo ng maraming iba pang mga node ng elemento tulad ng mga talata, talahanayan at mga seksyon.
Paragraphs
Ang isang talata ay ang pangunahing may hawak ng nilalaman sa loob ng isang dokumento. Ito ay kinakatawan ng <w:p> elemento sa loob ng isang dokumento. Ang isang talata pa ay binubuo ng isa o higit pang run <w:r> na naglalaman ng aktwal na teksto ng talata. Bilang karagdagan sa mga run, ang mga talata ay maaari ding maglaman ng iba pang mga elemento ng dokumento tulad ng mga hyperlink, komento, atbp. Ang isang halimbawang istraktura ng talata ay tulad ng ipinapakita sa ibaba:
<w:p>
<w:pPr>
<w:pStyle> w:val#"MyStyle"/>
<w:spacing w:before#"120" w:after#"120"/>
</w:pPr>
<w:r>
<w:t xml"space#"preserve">A paragraph is main container in a document that further consists of a one or more runs where the text of paragraph is actually contained.</w:t>
</w:r>
</w:p>
Mga FAQ ng DOCX
- Ang DOCX ba ay isang File Extension? - Ang DOCX ay ginagamit bilang file extension upang kumatawan sa Microsoft Word 2007 at mas bago ang mga format ng file na ginagamit upang mag-imbak ng mga Word file. Sinasabi rin nito sa iyong OS na ang DOCX file na ito ay nangangailangan ng Microsoft Word 2007 upang buksan ito at ipakita ang icon nito.
- Ang DOCX ba ay kapareho ng Word - Ang DOCX ay isang format ng file na ginagamit ng Microsoft Word upang mag-save ng mga dokumento sa Open XML na format. Ang Word, sa kabilang banda, ay isang application software ng Microsoft Office na sumusuporta din sa iba pang mga format ng file tulad ng DOC, DOT, DOTM, at iba pa.
- Ano ang pagkakaiba ng DOC at DOCX - Ang DOC ay word file na naka-save sa Word 2007 at mas naunang format ng file. Ang DOCX ay batay sa Open XML file format na suportado ng Microsoft 2007 at mga mas bagong bersyon. Tingnan ang Mga Pagkakaiba sa pagitan ng DOC at DOCX para sa higit pang mga detalye.