PDF ফাইল ফরম্যাট - একটি PDF ফাইল কি?
পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) হল এক ধরনের নথি যা 1990 সালে অ্যাডোব দ্বারা তৈরি করা হয়েছিল। এই ফাইল ফরম্যাটের উদ্দেশ্য ছিল নথিপত্র এবং অন্যান্য রেফারেন্স উপাদানের প্রতিনিধিত্বের জন্য একটি মান প্রবর্তন করা যা অ্যাপ্লিকেশন সফ্টওয়্যার, হার্ডওয়্যার এবং অপারেটিং সিস্টেম থেকে স্বাধীন। পিডিএফ ফাইল ফরম্যাটে টেক্সট, ইমেজ, হাইপারলিঙ্ক, ফর্ম-ফিল্ড, রিচ মিডিয়া, ডিজিটাল স্বাক্ষর, সংযুক্তি, মেটাডেটা, ভূ-স্থানিক বৈশিষ্ট্য এবং 3D অবজেক্টের মতো তথ্য ধারণ করার সম্পূর্ণ ক্ষমতা রয়েছে যা উৎস নথির অংশ হিসেবে পরিণত হতে পারে।
বেশিরভাগ ক্ষেত্রে, বিদ্যমান নথিগুলি স্ক্র্যাচ থেকে একটি নতুন পিডিএফ তৈরি করার পরিবর্তে PDF এ রূপান্তরিত হয়। কিন্তু এর মানে এই নয় যে পিডিএফ ফাইল তৈরি বা ম্যানিপুলেশন করার জন্য কোন সফটওয়্যার নেই।
(PDF ফাইল ফরম্যাট সম্পর্কে কিছু শেয়ার করতে হবে? আপনি আপনার ফলাফলগুলি PDF File Format News বিভাগে পোস্ট করতে পারেন।)
PDF ফাইল ফরম্যাট - সংক্ষিপ্ত ইতিহাস
টাইমলাইনের পরিপ্রেক্ষিতে PDF file format সম্পর্কে একটি দ্রুত টাইমলাইন নিম্নরূপ:
1993 - Adobe Systems PDF স্পেসিফিকেশন বিনামূল্যে উপলব্ধ করেছে
2008 - পিডিএফ 1 জুলাই, 2008-এ একটি উন্মুক্ত মান হিসাবে প্রকাশিত হয়েছিল এবং আন্তর্জাতিক মানক সংস্থা দ্বারা ISO 32000-1:2008 হিসাবে প্রকাশিত হয়েছিল।
2008 - অ্যাডোবি পিডিএফ অনুগত বাস্তবায়ন করতে, ব্যবহার, বিক্রয় এবং বিতরণ করার জন্য প্রয়োজনীয় Adobe-এর মালিকানাধীন সমস্ত পেটেন্টের জন্য রয়্যালটি-মুক্ত অধিকার ISO 32000-1 ফর্ম্যাটে একটি পাবলিক পেটেন্ট লাইসেন্স প্রকাশ করেছে।
The first version of PDF designated as PDF 1.0 which later went through revisions up to PDF 1.7. PDF 1.7, যা ISO 32000-1 হয়ে উঠেছে, কিছু অ-প্রমিত মালিকানা প্রযুক্তির পাশাপাশি Adobe XML ফর্ম আর্কিটেকচার (XFA) এবং অ্যাক্রোব্যাটের জন্য জাভাস্ক্রিপ্ট এক্সটেনশন অন্তর্ভুক্ত করে। এটি 28 জুলাই, 2017 এ ছিল যখন PDF 2.0, যা ISO 32000-2:2017 নামে পরিচিত, প্রকাশিত হয়েছিল যেটিতে কোনো অ-প্রমিত প্রযুক্তি অন্তর্ভুক্ত নেই।
পিডিএফ ফাইল ফরম্যাট স্পেসিফিকেশন
একটি পিডিএফ ফাইল হল বাইটের একটি সেট যা PDF স্পেসিফিকেশন দ্বারা সংজ্ঞায়িত সিনট্যাক্স নিয়ম অনুসারে টোকেনে গোষ্ঠীভুক্ত করা যেতে পারে। একবার বা একাধিক টোকেন একত্রিত হয়ে উচ্চ-স্তরের সিনট্যাকটিক সত্ত্বা গঠন করে, প্রধানত অবজেক্ট, যা মৌলিক ডেটা মান যা থেকে একটি PDF নথি তৈরি করা হয়।
PDF ফাইলের ফাইল স্ট্রাকচার
পিডিএফ ফাইলের বিষয়বস্তু ফাইলের ভিতরে নিম্নলিখিত ক্রমানুসারে সাজানো হয়েছে।
| শিরোনাম |দেহ |ক্রস-রেফারেন্স টেবিল |ট্রেলার
পিডিএফ ফাইল হেডার
পিডিএফ সংস্করণ নির্বিশেষে, একটি পিডিএফ ফাইল পিডিএফের অনন্য শনাক্তকারী এবং %PDF-1.x-এর মতো ফর্ম্যাটের সংস্করণ সহ একটি হেডার দিয়ে শুরু হয় যেখানে x 1-7 পর্যন্ত।
ফাইল বডি
একটি পিডিএফ ফাইলের মূল অংশটি একটি নথির বিষয়বস্তু প্রতিনিধিত্বকারী পরোক্ষ বস্তুর একটি ক্রম নিয়ে গঠিত। অবজেক্টগুলি, উপরে বর্ণিত হিসাবে, নথির উপাদানগুলি যেমন ফন্ট, পৃষ্ঠা এবং নমুনাযুক্ত চিত্রগুলিকে উপস্থাপন করে৷ PDF 1.5 থেকে শুরু করে, বডিতে বস্তুর স্ট্রীমও থাকতে পারে, যার প্রতিটিতে পরোক্ষ বস্তুর একটি ক্রম থাকে।
ক্রস-রেফারেন্স টেবিল
ক্রস-রেফারেন্স টেবিলে এমন তথ্য রয়েছে যা ফাইলের মধ্যে পরোক্ষ অবজেক্টে এলোমেলোভাবে অ্যাক্সেসের অনুমতি দেয় যাতে কোনও নির্দিষ্ট বস্তু সনাক্ত করার জন্য সম্পূর্ণ ফাইলটি পড়ার প্রয়োজন না হয়। টেবিলে প্রতিটি পরোক্ষ বস্তুর জন্য একটি এক-লাইন এন্ট্রি থাকবে, ফাইলের মূল অংশের মধ্যে সেই বস্তুর বাইট অফসেট নির্দিষ্ট করে। (পিডিএফ 1.5 দিয়ে শুরু করে, কিছু বা সমস্ত ক্রস-রেফারেন্স তথ্য বিকল্পভাবে ক্রস-রেফারেন্স স্ট্রীমে থাকতে পারে।
ফাইল ট্রেলার
একটি পিডিএফ ফাইলের ট্রেলার একজন কনফর্মিং রিডারকে দ্রুত ক্রস-রেফারেন্স টেবিল এবং কিছু বিশেষ বস্তু খুঁজে পেতে সক্ষম করে। কনফর্মিং পাঠকদের একটি পিডিএফ ফাইল এর শেষ থেকে পড়া উচিত। ফাইলের শেষ লাইনে শুধুমাত্র ফাইলের শেষের মার্কার, %% EOF থাকবে। দুটি পূর্ববর্তী লাইনে থাকবে, প্রতি লাইনে একটি এবং ক্রমানুসারে, শেষ ক্রস-রেফারেন্স বিভাগে ফাইলের শুরু থেকে xref কীওয়ার্ডের শুরু পর্যন্ত ডিকোড করা স্ট্রীমে কীওয়ার্ড startxref এবং বাইট অফসেট।
পিডিএফ অবজেক্ট
একটি পিডিএফ ফাইলে বিভিন্ন ধরণের অবজেক্ট রয়েছে যা নিম্নলিখিত ধরণের
বুলিয়ান মান - শর্তসাপেক্ষ সত্য বা মিথ্যা প্রতিনিধিত্ব করে
সংখ্যা - পূর্ণসংখ্যা এবং বাস্তব মান
স্ট্রিং - বন্ধনীর মধ্যে অক্ষর রয়েছে
নাম - একটি ফরোয়ার্ড / অক্ষর দিয়ে শুরু করুন যেমন /ASomewhatLongerName ফলাফল ASomewhatLongerName
অ্যারে - পিডিএফ এক মাত্রিক অ্যারে সমর্থন করে। নেস্টেড উপাদান হিসাবে অ্যারে ব্যবহার করে উচ্চ মাত্রার অ্যারেগুলি তৈরি করা যেতে পারে
অভিধান - কী-মান জোড়া হিসাবে বস্তুর সংগ্রহ। এতে শূন্য এন্ট্রি থাকতে পারে।
স্ট্রীম - বাইটের ক্রম প্রতিনিধিত্ব করে যা সীমাহীন দৈর্ঘ্যেরও হতে পারে
নাল অবজেক্ট - একটি নাল মান উপস্থাপন করে
মন্তব্যের মতো অন্যান্য বস্তুও থাকতে পারে যা % চিহ্ন দিয়ে প্রবর্তিত হয় এবং এতে 8-বিট অক্ষর থাকতে পারে।
পরোক্ষ বস্তু
পিডিএফ ফাইলের যেকোনো বস্তুকে পরোক্ষ অবজেক্ট হিসেবে লেবেল করা হতে পারে। পরোক্ষ অবজেক্টগুলিকে অনন্য অবজেক্ট আইডেন্টিফায়ার দেওয়া হয় যার দ্বারা অন্যান্য অবজেক্টগুলি এটিকে উল্লেখ করতে পারে। এগুলোর ক্রস-রেফারেন্সিং একটি সূচক টেবিলে রক্ষণাবেক্ষণ করা হয় এবং xref কীওয়ার্ড দিয়ে চিহ্নিত করা হয় যা মূল অংশকে অনুসরণ করে এবং ফাইলের শুরু থেকে প্রতিটি পরোক্ষ বস্তুর বাইট অফসেট দেয়।
লিনিয়ার এবং নন-লিনিয়ার পিডিএফ লেআউট
পিডিএফ লেআউটগুলি লক্ষ্য অ্যাপ্লিকেশন এবং অন্যান্য বিষয়গুলির উপর নির্ভর করে Llnear এবং নন-লিনিয়ার হিসাবে শ্রেণীবদ্ধ করা হয়।
নন-লিনিয়ার - লিনিয়ার পিডিএফ ফাইলের তুলনায় নন-লিনিয়ার পিডিএফ ফাইল কম ডিস্ক স্পেস ব্যবহার করে। নথির PDF পৃষ্ঠাগুলি পিডিএফ ফাইল জুড়ে বিক্ষিপ্ত আকারে থাকে এবং সেই কারণেই নন-লিনিয়ার ফাইলগুলি লিনিয়ার ফাইলের তুলনায় ধীর হয়।
লিনিয়ার পিডিএফ - অনলাইন পিডিএফ দর্শকদের লক্ষ্য করে, লিনিয়ার পিডিএফ ফাইলগুলি এমনভাবে তৈরি করা হয় যে সেগুলি লিনিয়ার ফ্যাশনে ডিস্কে লেখা হয়। প্রদর্শনের আগে পুরো নথি লোড করার জন্য এটির জন্য ব্রাউজার প্লাগইনগুলির প্রয়োজন নেই৷
অবজেক্ট ওভারভিউ
উল্লিখিত হিসাবে, PDF বডি উপরে উল্লিখিত বস্তুর একটি সংগ্রহ। পিডিএফ মূলত ইফ এবং লুপ কমান্ডের মতো প্রোগ্রামিং ভাষার নিয়ন্ত্রণ বৈশিষ্ট্য ছাড়াই পোস্টস্ক্রিপ্টের উপর ভিত্তি করে। গ্রাফিকাল বিষয়বস্তু তৈরি করার জন্য পোস্টস্ক্রিপ্ট কোড দ্বারা জারি করা কমান্ডগুলি নথি দ্বারা উল্লেখিত যেকোনো ফাইল, গ্রাফিক্স বা ফন্ট ছাড়াও সংগ্রহ করা হয় এবং টোকেনাইজ করা হয়। এই সমস্ত বিষয়বস্তু একটি একক ফাইলে জমা হয়, যার ফলে পোস্টস্ক্রিপ্ট আউটপুট গঠিত হয়।
পাঠ্য
Text in PDF is represented by text elements which are actually displayed with glyphs from fonts. A glyph is a graphical shape and is subject to all graphical manipulations, such as coordinate transformation. Because of the importance of text in most page descriptions, PDF provides higher-level facilities to describe, select, and render glyphs conveniently and efficiently.
গ্রাফিক্স
পিডিএফ কন্টেন্ট স্ট্রীমগুলিতে ব্যবহৃত গ্রাফিক্স অপারেটরগুলি একটি রাস্টার আউটপুট ডিভাইসে পুনরুত্পাদন করা পৃষ্ঠাগুলির উপস্থিতি বর্ণনা করে৷ সুবিধাগুলি প্রিন্টার এবং ডিসপ্লে অ্যাপ্লিকেশন উভয়ের জন্যই প্রযোজ্য। গ্রাফিক্স অপারেটর ছয়টি প্রধান গ্রুপ গঠন করে:
গ্রাফিক্স স্টেট অপারেটররা গ্রাফিক্স স্টেট নামক ডাটা স্ট্রাকচার ম্যানিপুলেট করে, গ্লোবাল ফ্রেমওয়ার্ক যার মধ্যে অন্যান্য গ্রাফিক্স অপারেটররা এক্সিকিউট করে। গ্রাফিক্স স্টেটে বর্তমান ট্রান্সফরমেশন ম্যাট্রিক্স (CTM), যা পিডিএফ কন্টেন্ট স্ট্রীমের মধ্যে ব্যবহৃত ইউজার স্পেস কোঅর্ডিনেটকে আউটপুট ডিভাইস কোঅর্ডিনেটে ম্যাপ করে। এটিতে বর্তমান রঙ, বর্তমান ক্লিপিং পাথ এবং অন্যান্য অনেক প্যারামিটার রয়েছে যা পেইন্টিং অপারেটরদের অন্তর্নিহিত অপারেন্ড।
পাথ নির্মাণ অপারেটররা পাথ নির্দিষ্ট করে, যা আকার, লাইন ট্রাজেক্টোরি এবং বিভিন্ন ধরণের অঞ্চলকে সংজ্ঞায়িত করে। তারা একটি নতুন পথ শুরু করার জন্য অপারেটরদের অন্তর্ভুক্ত করে, এতে লাইন সেগমেন্ট এবং বক্ররেখা যোগ করে এবং এটি বন্ধ করে।
পাথ-পেইন্টিং অপারেটররা একটি রঙ দিয়ে একটি পথ পূরণ করে, এটি বরাবর একটি স্ট্রোক আঁকে বা এটিকে ক্লিপিং সীমানা হিসাবে ব্যবহার করে।
অন্যান্য পেইন্টিং অপারেটররা কিছু স্ব-বর্ণনাকারী গ্রাফিক্স বস্তু আঁকেন। এর মধ্যে রয়েছে নমুনাযুক্ত ছবি, জ্যামিতিকভাবে সংজ্ঞায়িত শেডিং এবং সম্পূর্ণ বিষয়বস্তু স্ট্রীম যার মধ্যে গ্রাফিক্স অপারেটরগুলির ক্রম রয়েছে।
Text operators select and show character glyphs from fonts (descriptions of typefaces for representing text characters). Because PDF treats glyphs as general graphical shapes, many of the text operators could be grouped with the graphics state or painting operators. However, the data structures and mechanisms for dealing with glyph and font descriptions are sufficiently specialized.
চিহ্নিত বিষয়বস্তু অপারেটররা বিষয়বস্তু প্রবাহের বস্তুর সাথে উচ্চ-স্তরের যৌক্তিক তথ্য সংযুক্ত করে। এই তথ্য সামগ্রীর রেন্ডার করা চেহারাকে প্রভাবিত করে না; নথি বিনিময়ের জন্য পিডিএফ ব্যবহার করে এমন অ্যাপ্লিকেশনগুলির জন্য এটি দরকারী।