מהו קובץ TXT?
קובץ עם סיומת .TXT מייצג מסמך טקסט המכיל טקסט רגיל בצורה של שורות. פסקאות במסמך טקסט מזוהות על ידי החזרות עגלה ומשמשות לסידור טוב יותר של תוכן הקובץ. ניתן לפתוח מסמך טקסט סטנדרטי בכל עורך טקסט או יישום עיבוד תמלילים במערכות הפעלה שונות. כל הטקסט הכלול בקובץ כזה הוא בפורמט הניתן לקריאה על ידי אדם ומיוצג על ידי רצף של תווים.
קבצי טקסט יכולים לאחסן כמות גדולה של נתונים מכיוון שאין הגבלה על גודל התוכן. עם זאת, עורכי טקסט שפותחים קבצים גדולים כל כך צריכים להיות חכמים לטעינה והצגתם. כמעט כל מערכות ההפעלה מגיעות עם עורכי טקסט המאפשרים ליצור ולערוך קבצי טקסט. לדוגמה, מערכת ההפעלה Windows מגיעה עם Notepad ו- Wordpad למטרה זו. באופן דומה, MacOS מגיע עם TextEdit ליצירה ועריכה של מסמכי טקסט. עם זאת, ישנם עורכי טקסט חינמיים אחרים הזמינים גם דרך האינטרנט המספקים לך את היכולת לעבוד עם מסמכי טקסט כמו Notepad++ שהוא הרבה יותר מתקדם מבחינת פונקציונליות.
מפרטי פורמט קובץ
לפורמט קובץ הטקסט אין מפרטי פורמט קובץ מיוחדים. לקבצי טקסט יש סוג MIME “טקסט/רגיל” ובעלי עיצוב מועט או ללא עיצוב כלל. זה מאפשר לעורכי טקסט לפתוח קבצים כאלה ללא כל דרישות אחרות. ערכת התווים המוגדרת כברירת מחדל של קובצי טקסט היא ASCII המשמשת ליצירה והצגה של תוכן קובץ טקסט. תווים מקודדים באמצעות ערכת תווים ASCII, אך הדבר מטיל הגבלה על השימוש על תווים כגון סימן לירה, דולר וסימן אירו שאינם ניתנים לייצוג באמצעות ערכת התווים ASCII. לפיכך, ניתן לשמור קבצי טקסט גם בפורמט Unicode, כאשר UTF-8 הוא המשמש ביותר.
פורמט קובץ טקסט של Windows
קובצי טקסט במערכת ההפעלה Windows מורכבים ממספר שורות כאשר כל שורה מורכבת מרצף של תווים. כל שורה מרומזת של המשתמש מוגדרת על ידי שילוב של שני תווים, כלומר החזרת עגלה (CR) והזנת שורה (LF). קובצי טקסט של Windows יכולים להיות בקידוד ANSI, OEM, Unicode או UTF-8. קידוד UTF-16 עוזר לשמור מידע בקובץ טקסט הדורש שני בתים לייצוג. קבצים כאלה מתחילים בדרך כלל עם Byte Order Mark (BOM) אשר מעביר את מידת הקצה של תוכן הקובץ. יש לציין כי יישומים אחרים במערכת ההפעלה Windows יכולים לאחסן מידע בפורמט קובץ טקסט אך עם סיומות קבצים שונות כדי לייצג טקסט ספציפי ליישום. לדוגמה, שפות תכנות בדרך כלל שומרות קוד בקובץ טקסט אך עם הרחבות משלהן.
פורמט קובץ טקסט יוניקס
כל המערכות הללו מסדרות קובץ טקסט כקובץ שהתווים שלו מאורגנים באפס שורות או יותר. כל שורה היא רצף של אפס או יותר תווים שאינם בשורה חדשה ותו קו חדש שמסיים, בדרך כלל LF.