একটি DJVU ফাইল কি?
DjVu, déjà vu হিসাবে উচ্চারিত, একটি গ্রাফিক্স ফাইল ফরম্যাট যা স্ক্যান করা নথি এবং বইগুলির জন্য বিশেষত যেগুলিতে পাঠ্য, অঙ্কন, ছবি এবং ফটোগ্রাফের সংমিশ্রণ রয়েছে। এটি AT&T ল্যাব দ্বারা তৈরি করা হয়েছিল। এটি টেক্সট এবং ব্যাকগ্রাউন্ড ইমেজের ইমেজ লেয়ার সেপারেশন, প্রগতিশীল লোডিং, গাণিতিক কোডিং এবং বিটোনাল ইমেজের জন্য ক্ষতিকর কম্প্রেশনের মতো একাধিক কৌশল ব্যবহার করে। যেহেতু DJVU ফাইলে সংকুচিত কিন্তু উচ্চ-মানের রঙিন ছবি, ফটোগ্রাফ, টেক্সট এবং অঙ্কন থাকতে পারে এবং কম জায়গায় সংরক্ষণ করা যায়, তাই এটি ওয়েবে ইবুক, ম্যানুয়াল, সংবাদপত্র, প্রাচীন নথিপত্র ইত্যাদি হিসেবে ব্যবহার করা হয়।
DjVu-কে PDF-এর উচ্চতর বিকল্প গ্রেড করা যেতে পারে। DjVu এর সাথে সম্পর্কিত ফাইল এক্সটেনশনগুলি হল .DJVU বা .DJV৷ DjVu কম্প্রেশন অনুপাত প্রায় 5 – 10 অর্জন করতে পারে বিদ্যমান পদ্ধতির চেয়ে ভাল যেমন JPEG এবং GIF রঙের নথিগুলির জন্য এবং 3 - 8 গুণ ভাল কালো এবং সাদা নথিতে TIFF থেকে। 300 DPI-তে স্ক্যান করা নথি 25 MB পর্যন্ত সম্পূর্ণ রঙের সাথে 30 থেকে 100 KB পর্যন্ত কমপ্রেস করা যেতে পারে। একইভাবে কালো এবং সাদা নথি 5 থেকে 30 KB পর্যন্ত সংকুচিত করা যেতে পারে। গড় HTML পৃষ্ঠা 50 KB পর্যন্ত হতে পারে, তাই এই নথিগুলি কোনো সমস্যা ছাড়াই নেটে আপলোড করা যেতে পারে।
সংক্ষিপ্ত ইতিহাস
The DjVu technology was developed in AT&T labs by Yann LeCun, Léon Bottou, Patrick Haffner, and Paul G from 1996 to 2001. DjVu ফাইল বিন্যাসটি বিভিন্ন সংশোধনের মধ্য দিয়ে গেছে, সবচেয়ে সাম্প্রতিক 2005 থেকে।
সংস্করণ | রিলিজের তারিখ | নোটস |
---|---|---|
1–19 | 1996–1999 | এগুলি উন্নয়নমূলক সংস্করণ। |
20 | এপ্রিল 1999 | একক পৃষ্ঠাকে মাল্টিপেজ ফরম্যাটে পরিবর্তন করা হয়েছে। |
23 | জুলাই 2002 | সিআইডি খণ্ড |
24 | ফেব্রুয়ারি 2003 | LTAnno খণ্ড |
21 | সেপ্টেম্বর 1999 | পরোক্ষ স্টোরেজ ফরম্যাট প্রতিস্থাপিত হয়েছে। পাঠ্য অনুসন্ধান স্তর যোগ করা হয়েছে. |
22 | এপ্রিল 2001 | পৃষ্ঠা অভিযোজন, রঙ JB2 |
25 | মে 2003 | এনএভিএম খণ্ড। DjVu বুকমার্কের জন্য সমর্থন যোগ করা হয়েছে। |
26 | এপ্রিল 2005 | পাঠ্য/লাইন টীকা |
DjVu ফাইল ফরম্যাট
DjVu documents are IFF85 files. The structure provides a hierarchy of containers which holds information in a DjVu file. These containers are also called “Chunks”. Chunk type and Chunk ID describes how the chunk is used. There is a 4byte header followed by IFF structure. The first four bytes of a DjVu file are 0x41 0x54 0x26 0x54. এই বিভাগে বিভিন্ন ধরণের DjVu নথি এবং সংশ্লিষ্ট অংশগুলি নিয়ে আলোচনা করা হয়েছে যার মধ্যে তারা রয়েছে।
চাঙ্ক আইডি | ব্যবহার |
---|---|
ফর্ম | |
FORM:DJVM | একটি মাল্টিপেজ DjVu ডকুমেন্ট। যৌগিক খণ্ড যা DIRM খণ্ড ধারণ করে। |
FORM:DJVU | একক পৃষ্ঠা DjVu নথি। যৌগিক খণ্ড যাতে খণ্ডগুলি থাকে যা একটি djvu নথিতে একটি পৃষ্ঠা তৈরি করে। |
FORM:DJVI | একটি ভাগ করা DjVu ফাইল যা INCL অংশের মাধ্যমে অন্তর্ভুক্ত করা হয়েছে৷ ভাগ করা টীকা এবং আকৃতি অভিধান। |
FORM:THUM | যৌগিক খণ্ড যাতে TH44 খণ্ড রয়েছে যা এম্বেড করা থাম্বনেল। |
DIRM | মাল্টি-পেজ ডকুমেন্টের জন্য পৃষ্ঠার নামের তথ্য। |
NAVM | বুকমার্ক তথ্য |
ANTa, ANTz | প্রাথমিক ভিউ সেটিংস এবং ওভারলেড হাইপারলিঙ্ক, টেক্সট বক্স, ইত্যাদি উভয়ই সহ টীকা। |
TXTa, TXTz | ইউনিকোড টেক্সট এবং লেআউট তথ্য। |
Djbz | শেয়ার করা আকৃতির টেবিল। |
Sjbz | BZZ সংকুচিত JB2 বিটোনাল ডেটা মাস্ক সংরক্ষণ করতে ব্যবহৃত হয়। |
FG44 | IW44 ডেটা ফোরগ্রাউন্ড সংরক্ষণ করতে ব্যবহৃত হয় |
BG44 | IW44 ডেটা ব্যাকগ্রাউন্ড সঞ্চয় করতে ব্যবহৃত হয় |
TH44 | IW44 ডেটা এমবেড করা থাম্বনেইল ছবি সংরক্ষণ করতে ব্যবহৃত হয় |
WMRM | JB2 ডেটা ওয়াটারমার্ক অপসারণের জন্য প্রয়োজন৷ |
FGbz | রঙ JB2 ডেটা। সংশ্লিষ্ট Sjbz খণ্ডে প্রতিটি (ব্লিট বা আকৃতি?) জন্য একটি রঙ প্রদান করে। |
INFO | একটি DjVu পৃষ্ঠা সম্পর্কে তথ্য |
INCL | একটি অন্তর্ভুক্ত ফর্মের ID:DJVI খণ্ড। |
BGjp | JPEG এনকোড করা ব্যাকগ্রাউন্ড |
FGjp | JPEG এনকোডেড ফোরগ্রাউন্ড |
Smmr | G4 এনকোডেড মাস্ক |
DJVU কম্প্রেশন
একক চিত্রকে অনেকগুলি বিভিন্ন ছবিতে বিভক্ত করা হয় এবং তারপর প্রতিটি চিত্র আলাদাভাবে সংকুচিত হয়। একটি DjVu ফাইল তৈরির জন্য ছবিটিকে প্রথমে তিনটি ছবিতে বিভক্ত করা হয়, একটি ব্যাকগ্রাউন্ড, ফোরগ্রাউন্ড এবং একটি মাস্ক ইমেজ। সাধারণত ব্যাকগ্রাউন্ড এবং ফোরগ্রাউন্ড ইমেজ হয় নিম্ন-রেজোলিউশনের রঙের ছবি; কিন্তু মাস্ক ইমেজ একটি উচ্চ-রেজোলিউশন ইমেজ এবং সাধারণত পাঠ্য সেখানে সংরক্ষণ করা হয়। পৃথকীকরণের পরে অগ্রভাগ এবং পটভূমির চিত্রগুলি একটি ওয়েভলেট ভিত্তিক কম্প্রেশন অ্যালগরিদম IW44 এর মাধ্যমে সংকুচিত হয়, যখন মুখোশ চিত্রটি JB2 নামক অন্য একটি পদ্ধতি ব্যবহার করে সংকুচিত হয়।
JB2 এনকোডিং পদ্ধতিটি পৃষ্ঠায় অভিন্ন আকার চিহ্নিত করার মাধ্যমে পাঠ্য চিত্রের অনেক অপ্রয়োজনীয়তা দূর করে, যেমন একটি নির্দিষ্ট ফন্টে একটি অক্ষরের একাধিক ঘটনা। JB2 প্রথমে একই আকারের মধ্যে রিডানডেন্সির সুবিধা নিয়ে প্রতিটি অনন্য আকৃতির বিটম্যাপ কোড করে। এটি তারপর সেই অবস্থানগুলিকে কোড করে যেখানে প্রতিটি আকৃতি পৃষ্ঠায় প্রদর্শিত হয়। JB2 এবং IW44 উভয়ই ZP-কোডার নামক একটি নতুন ধরনের অভিযোজিত বাইনারি গাণিতিক কোডারের উপর নির্ভর করে যা শ্যানন সীমার কয়েক শতাংশের মধ্যে যেকোন অবশিষ্ট অপ্রয়োজনীয়তা বের করে দেয়। ZP-কোডারটি অভিযোজিত, এবং অন্যান্য আনুমানিক বাইনারি গাণিতিক কোডারের চেয়ে দ্রুত।