تنسيق ملف PDF - ما هو ملف PDF؟
تنسيق المستندات المحمولة (PDF) هو نوع من المستندات التي أنشأتها Adobe في التسعينيات. كان الغرض من تنسيق الملف هذا هو تقديم معيار لتمثيل المستندات والمواد المرجعية الأخرى بتنسيق مستقل عن برامج التطبيقات والأجهزة وكذلك نظام التشغيل. يتمتع تنسيق ملف PDF بالقدرة الكاملة على احتواء معلومات مثل النصوص والصور والارتباطات التشعبية وحقول النموذج والوسائط الغنية والتوقيعات الرقمية والمرفقات والبيانات الوصفية والميزات الجغرافية المكانية والكائنات ثلاثية الأبعاد الموجودة فيه والتي يمكن أن تصبح جزءًا من المستند المصدر.
في معظم الحالات ، يتم تحويل المستندات الموجودة إلى PDF بدلاً من إنشاء ملف PDF جديد من البداية. لكن هذا لا يعني عدم وجود برنامج لإنشاء ملفات PDF أو معالجتها.
** (هل تريد مشاركة شيء ما حول تنسيق ملف PDF؟ يمكنك نشر نتائجك في قسم PDF File Format News.) **
تنسيق ملف PDF - تاريخ موجز
إن الانتقال السريع للجدول الزمني حول تشكيل ملف PDF من حيث الجدول الزمني هو كما يلي:
** 1993 ** - أتاحت Adobe Systems مواصفات PDF مجانًا
** 2008 ** - تم إصدار PDF كمعيار مفتوح في 1 يوليو 2008 وتم نشره بواسطة المنظمة الدولية للتوحيد القياسي باسم ** ISO 32000-1: 2008 **.
** 2008 ** - نشرت Adobe ترخيص براءات اختراع عامة إلى حقوق تنسيق ISO 32000-1 الخالية من حقوق الملكية لجميع براءات الاختراع المملوكة لشركة Adobe والضرورية لإنشاء واستخدام وبيع وتوزيع تطبيقات متوافقة مع PDF.
تم تعيين الإصدار الأول من PDF كملف PDF 1.0 والذي مر لاحقًا بمراجعات تصل إلى PDF 1.7. يتضمن PDF 1.7 ، الذي أصبح ISO 32000-1 ، بعض تقنيات الملكية غير المعيارية بالإضافة إلى Adobe XML Forms Architecture (XFA) وامتداد JavaScript لـ Acrobat. كان ذلك في 28 يوليو 2017 عندما تم نشر PDF 2.0 المعروف باسم ISO 32000-2: 2017 والذي لا يتضمن أي تقنيات غير قياسية.
مواصفات تنسيق ملف PDF
ملف PDF هو مجموعة من البايتات التي يمكن تجميعها في رموز وفقًا لقواعد بناء الجملة المحددة بواسطة مواصفات PDF. مرة واحدة أو أكثر يتم دمج الرموز المميزة لتشكيل كيانات نحوية ذات مستوى أعلى ، كائنات أساسية ، وهي قيم البيانات الأساسية التي يتم إنشاء مستند PDF منها.
بنية ملف ملفات PDF
محتويات ملف PDF مرتبة في التسلسل التالي داخل الملف.
| رأس | الجسم | جدول الإسناد الترافقي | مقطورة
رأس ملف PDF
بصرف النظر عن إصدار PDF ، يبدأ ملف PDF برأس يحتوي على معرف فريد لملف PDF وإصدار التنسيق مثل٪ PDF-1.x حيث تتراوح x من 1 إلى 7.
نص الملف
يتكون نص ملف PDF من سلسلة من الكائنات غير المباشرة التي تمثل محتويات المستند. تمثل الكائنات ، كما هو موضح أعلاه ، مكونات المستند مثل الخطوط والصفحات والصور التي تم أخذ عينات منها. بدءًا من PDF 1.5 ، يمكن أن يحتوي النص أيضًا على تدفقات كائنات ، يحتوي كل منها على سلسلة من الكائنات غير المباشرة.
جدول المراجع التبادلية
يحتوي جدول الإسناد الترافقي على معلومات تسمح بالوصول العشوائي إلى الكائنات غير المباشرة داخل الملف بحيث لا يلزم قراءة الملف بأكمله لتحديد موقع أي كائن معين. يجب أن يحتوي الجدول على إدخال من سطر واحد لكل كائن غير مباشر ، مع تحديد إزاحة البايت لهذا الكائن داخل نص الملف. (بدءًا من PDF 1.5 ، قد يتم تضمين بعض أو كل معلومات المرجع التبادلي بدلاً من ذلك في تدفقات المرجع التبادلي.
عرض الملف
يتيح المقطع الدعائي لملف PDF للقارئ المطابق العثور بسرعة على جدول الإسناد الترافقي وكائنات خاصة معينة. يجب على القراء المطابقين قراءة ملف PDF من نهايته. يجب أن يحتوي السطر الأخير من الملف فقط على علامة نهاية الملف ، ٪٪ EOF. يجب أن يحتوي السطران السابقان ، واحد لكل سطر وبالترتيب ، الكلمة الأساسية startxref وإزاحة البايت في الدفق الذي تم فك تشفيره من بداية الملف إلى بداية الكلمة الأساسية xref في قسم الإسناد الترافقي الأخير.
كائنات PDF
يتضمن ملف PDF عدة أنواع مختلفة من الكائنات من الأنواع التالية
- القيم المنطقية - تمثل صوابًا أو خطأً مشروطًا
- أرقام - عدد صحيح وقيم حقيقية
- سلاسل - تحتوي على أحرف داخل أقواس
- الأسماء - ابدأ بأحرف توجيه / حرف مثل / ASom kindlyLongerName ينتج عنه ASomethingLongerName
- المصفوفات - يدعم ملف PDF المصفوفات ذات البعد الواحد. يمكن إنشاء مصفوفات ذات أبعاد أعلى باستخدام المصفوفات كعناصر متداخلة
- القواميس - مجموعة من الأشياء كأزواج ذات قيمة رئيسية. يمكن أن يكون لها أي مدخلات.
- التدفقات - يمثل تسلسل البايت الذي يمكن أن يكون بطول غير محدود أيضًا
- Null Object - يمثل قيمة خالية
يمكن أن تكون هناك كائنات أخرى مثل التعليقات التي يتم تقديمها بعلامة٪ وقد تحتوي على أحرف 8 بت.
كائنات غير مباشرة
يمكن تسمية أي كائن في ملف PDF ككائن غير مباشر. يتم إعطاء الكائنات غير المباشرة معرف كائن فريد يمكن من خلاله للكائنات الأخرى الرجوع إليها. يتم الاحتفاظ بالإحالة المرجعية إلى هذه في جدول فهرس ويتم تمييزها بالكلمة الأساسية xref التي تتبع النص الرئيسي وتعطي إزاحة البايت لكل كائن غير مباشر من بداية الملف.
تخطيطات PDF الخطية وغير الخطية
يتم تصنيف تخطيطات PDF على أنها Llnear وغير الخطية اعتمادًا على التطبيقات المستهدفة وعوامل أخرى.
غير الخطية - تستخدم ملفات PDF غير الخطية مساحة قرص أقل مقارنة بملفات PDF الخطية. توجد صفحات PDF من المستند في شكل مبعثر عبر ملف PDF وهذا هو السبب في أن الملفات غير الخطية تكون أبطأ مقارنة بالملفات الخطية.
PDF الخطي - لاستهداف مشاهدي PDF عبر الإنترنت ، يتم إنشاء ملفات PDF الخطية بطريقة يتم كتابتها على القرص بطريقة خطية. هذا لا يتطلب ملحقات المتصفح لتحميل المستند بأكمله أولاً قبل عرضه.
نظرة عامة على الأشياء
كما ذكرنا ، نص PDF عبارة عن مجموعة من العناصر المذكورة أعلاه. يعتمد PDF إلى حد كبير على PostScript بدون ميزات التحكم في لغات البرمجة مثل أوامر if و loop. يتم جمع الأوامر الصادرة عن كود بوستسكريبت لإنشاء محتويات رسومية وترميزها بالإضافة إلى أي ملفات أو رسومات أو خطوط تشير إليها الوثيقة. يتم تجميع كل هذه المحتويات في ملف واحد ، مما ينتج عنه إخراج PostScript مؤلف.
نص
يتم تمثيل النص في PDF بعناصر نصية يتم عرضها بالفعل بحروف رمزية من الخطوط. الحرف الرسومي هو شكل رسومي ويخضع لجميع عمليات المعالجة الرسومية ، مثل تحويل الإحداثيات. نظرًا لأهمية النص في معظم أوصاف الصفحات ، يوفر PDF تسهيلات ذات مستوى أعلى لوصف الصور الرمزية وتحديدها وعرضها بشكل ملائم وفعال.
الرسومات
تصف عوامل تشغيل الرسوم المستخدمة في تدفقات محتوى PDF مظهر الصفحات التي سيتم إعادة إنتاجها على جهاز إخراج نقطي. هذه المرافق مخصصة لكل من تطبيقات الطابعة والعرض. يشكل مشغلو الرسومات ست مجموعات رئيسية:
- يتعامل مشغلو حالة الرسومات مع بنية البيانات التي تسمى حالة الرسومات ، وهي الإطار العالمي الذي يتم من خلاله تنفيذ مشغلي الرسومات الآخرين. تتضمن حالة الرسومات مصفوفة التحويل الحالية (CTM) ، التي تحدد إحداثيات مساحة المستخدم المستخدمة في تدفق محتوى PDF إلى إحداثيات جهاز الإخراج. يتضمن أيضًا اللون الحالي ومسار القطع الحالي والعديد من المعلمات الأخرى التي تعتبر معاملات ضمنية لمشغلي الطلاء.
- يحدد مشغلو إنشاء المسار المسارات التي تحدد الأشكال ومسارات الخطوط والمناطق من أنواع مختلفة. وهي تشمل عوامل تشغيل لبدء مسار جديد وإضافة مقاطع ومنحنيات خطية إليه وإغلاقه.
- تملأ عوامل رسم المسار المسار بلون ، أو ترسم حدودًا على طوله ، أو تستخدمه كحدود قطع.
- يقوم مشغلو الدهان الآخرون برسم كائنات رسومية معينة ذاتية الوصف. تتضمن هذه الصور عينات ، والظلال المحددة هندسيًا ، وتدفق المحتوى بالكامل الذي يحتوي بدوره على تسلسلات من مشغلي الرسومات.
- يقوم مشغلو النص بتحديد وإظهار الحروف الرسومية من الخطوط (أوصاف المحارف لتمثيل أحرف النص). نظرًا لأن PDF يعامل الحروف الرسومية كأشكال رسومية عامة ، يمكن تجميع العديد من عوامل تشغيل النص مع حالة الرسومات أو عوامل الرسم. ومع ذلك ، فإن هياكل البيانات وآليات التعامل مع الحروف الرسومية وأوصاف الخط متخصصة بدرجة كافية.
- يربط مشغلو المحتوى المحدد المعلومات المنطقية ذات المستوى الأعلى بالكائنات الموجودة في دفق المحتوى. لا تؤثر هذه المعلومات على المظهر المعروض للمحتوى ؛ إنه مفيد للتطبيقات التي تستخدم PDF لتبادل المستندات.