Was ist eine TXT-Datei?
Eine Datei mit der Erweiterung .TXT stellt ein Textdokument dar, das einfachen Text in Form von Zeilen enthält. Absätze in einem Textdokument werden durch Carriage Returns erkannt und dienen der besseren Anordnung von Dateiinhalten. Ein Standardtextdokument kann in jedem Texteditor oder jeder Textverarbeitungsanwendung auf verschiedenen Betriebssystemen geöffnet werden. Der gesamte in einer solchen Datei enthaltene Text ist in einem für Menschen lesbaren Format und wird durch eine Zeichenfolge dargestellt.
Textdateien können große Datenmengen speichern, da die Größe des Inhalts nicht begrenzt ist. Texteditoren, die solch große Dateien öffnen, müssen jedoch intelligent sein, um diese zu laden und anzuzeigen. Fast alle Betriebssysteme verfügen über Texteditoren, mit denen Sie Textdateien erstellen und bearbeiten können. Zum Beispiel wird das Windows-Betriebssystem zu diesem Zweck mit Notepad und Wordpad geliefert. In ähnlicher Weise wird MacOS mit TextEdit zum Erstellen und Bearbeiten von Textdokumenten geliefert. Es gibt jedoch auch andere freie Texteditoren, die über das Internet verfügbar sind und Ihnen die Möglichkeit bieten, mit Textdokumenten wie Notepad ++ zu arbeiten, das in Bezug auf die Funktionalität weitaus fortschrittlicher ist.
Dateiformatspezifikationen
Das Textdateiformat hat keine speziellen Dateiformatspezifikationen. Textdateien haben den MIME-Typ “text/plain” und wenig oder gar keine Formatierung. Dadurch können Texteditoren solche Dateien ohne weitere Anforderungen öffnen. Der Standardzeichensatz von Textdateien ist ASCII, der zum Erstellen und Anzeigen von Textdateiinhalten verwendet wird. Zeichen werden mit dem ASCII-Zeichensatz kodiert, aber dies führt zu einer Beschränkung der Verwendung von Zeichen wie Pfundzeichen, Dollar- und Eurozeichen, die nicht mit dem ASCII-Zeichensatz dargestellt werden können. So können Textdateien auch im Unicode-Format gespeichert werden, wobei UTF-8 am häufigsten verwendet wird.
Windows-Textdateiformat
Textdateien unter Windows bestehen aus mehreren Zeilen, wobei jede Zeile aus einer Folge von Zeichen besteht. Jede implizierte Benutzerzeile wird durch eine Kombination aus zwei Zeichen definiert, dh Wagenrücklauf (CR) und Zeilenvorschub (LF). Windows-Textdateien können in ANSI-, OEM-, Unicode- oder UTF-8-Codierung vorliegen. Die UTF-16-Codierung hilft beim Speichern von Informationen in einer Textdatei, die zwei Bytes zur Darstellung benötigt. Solche Dateien beginnen normalerweise mit Byte Order Mark (BOM), das die Endianness des Dateiinhalts kommuniziert. Es sollte beachtet werden, dass andere Anwendungen auf Windows-Betriebssystemen Informationen im Textdateiformat speichern können, jedoch mit anderen Dateierweiterungen, um anwendungsspezifischen Text darzustellen. Beispielsweise speichern Programmiersprachen Code normalerweise in einer Textdatei, jedoch mit ihren eigenen Erweiterungen.
Unix-Textdateiformat
Alle diese Systeme definieren eine Textdatei als eine Datei, deren Zeichen in null oder mehr Zeilen organisiert sind. Jede Zeile ist eine Folge von null oder mehr Zeichen, die kein Zeilenumbruch sind, und einem abschließenden Zeilenumbruchzeichen, normalerweise LF.