Wat is een TXT-bestand?
Een bestand met de extensie .TXT vertegenwoordigt een tekstdocument dat platte tekst in de vorm van regels bevat. Alinea’s in een tekstdocument worden herkend door regelterugloop en worden gebruikt om de bestandsinhoud beter te ordenen. Een standaard tekstdocument kan in elke teksteditor of tekstverwerkingsprogramma op verschillende besturingssystemen worden geopend. Alle tekst in zo’n bestand is in een voor mensen leesbaar formaat en wordt weergegeven door een reeks tekens.
Tekstbestanden kunnen grote hoeveelheden gegevens opslaan omdat er geen beperking is op de grootte van de inhoud. Teksteditors die zulke grote bestanden openen, moeten echter slim zijn om deze te laden en weer te geven. Bijna alle besturingssystemen worden geleverd met teksteditors waarmee u tekstbestanden kunt maken en bewerken. Windows OS wordt hiervoor bijvoorbeeld geleverd met Kladblok en Wordpad. Op dezelfde manier wordt MacOS geleverd met TextEdit voor het maken en bewerken van tekstdocumenten. Er zijn echter ook andere gratis teksteditors beschikbaar via internet die u de mogelijkheid bieden om met tekstdocumenten zoals Notepad++ te werken, wat veel geavanceerder is in termen van functionaliteit.
Specificaties bestandsindeling
Het tekstbestandsformaat heeft geen speciale bestandsformaatspecificaties. Tekstbestanden hebben het “text/plain” MIME-type en hebben weinig of geen opmaak. Hierdoor kunnen teksteditors dergelijke bestanden openen zonder enige andere vereisten. De standaard tekenset van tekstbestanden is ASCII die wordt gebruikt voor het maken en weergeven van de inhoud van tekstbestanden. Tekens worden gecodeerd met ASCII-tekenset, maar dit legt beperkingen op aan het gebruik van tekens zoals hekje, dollar en euroteken die niet kunnen worden weergegeven met de ASCII-tekenset. Tekstbestanden kunnen dus ook worden opgeslagen in Unicode-indeling, waarbij UTF-8 het meest wordt gebruikt.
Windows-tekstbestandsindeling
Tekstbestanden op Windows OS bestaan uit verschillende regels waarbij elke regel uit een reeks tekens bestaat. Elke door de gebruiker geïmpliceerde regel wordt gedefinieerd door een combinatie van twee tekens, namelijk een regelterugloop (CR) en een regelinvoer (LF). Windows-tekstbestanden kunnen in ANSI-, OEM-, Unicode- of UTF-8-codering zijn. De UTF-16-codering helpt bij het opslaan van informatie in een tekstbestand dat twee bytes nodig heeft voor weergave. Dergelijke bestanden beginnen meestal met Byte Order Mark (BOM) die de endianness van de bestandsinhoud aangeeft. Opgemerkt moet worden dat andere toepassingen op Windows OS informatie in tekstbestandsindeling kunnen opslaan, maar met verschillende bestandsextensies om toepassingsspecifieke tekst weer te geven. Programmeertalen slaan bijvoorbeeld meestal code op in een tekstbestand, maar met hun eigen extensies.
Unix-tekstbestandsindeling
Al dergelijke systemen fineren een tekstbestand als een bestand waarvan de tekens zijn georganiseerd in nul of meer regels. Elke regel is een reeks van nul of meer niet-nieuweregeltekens en een eindigend nieuwregelteken, normaal gesproken LF.