Qu’est-ce qu’un fichier TXT ?
Un fichier avec l’extension .TXT représente un document texte qui contient du texte brut sous forme de lignes. Les paragraphes d’un document texte sont reconnus par des retours chariot et sont utilisés pour une meilleure organisation du contenu du fichier. Un document texte standard peut être ouvert dans n’importe quel éditeur de texte ou application de traitement de texte sur différents systèmes d’exploitation. Tout le texte contenu dans un tel fichier est dans un format lisible par l’homme et représenté par une séquence de caractères.
Les fichiers texte peuvent stocker une grande quantité de données car il n’y a aucune limitation sur la taille du contenu. Cependant, les éditeurs de texte qui ouvrent des fichiers aussi volumineux doivent être intelligents pour les charger et les afficher. Presque tous les systèmes d’exploitation sont livrés avec des éditeurs de texte qui vous permettent de créer et de modifier des fichiers texte. Par exemple, le système d’exploitation Windows est fourni avec le Bloc-notes et Wordpad à cet effet. De même, MacOS est livré avec TextEdit pour créer et éditer des documents texte. Il existe cependant d’autres éditeurs de texte gratuits disponibles sur Internet qui vous permettent de travailler avec des documents texte comme Notepad ++ qui est beaucoup plus avancé en termes de fonctionnalités.
Spécifications du format de fichier
Le format de fichier texte n’a pas de spécifications de format de fichier spéciales. Les fichiers texte ont un type MIME “text/plain” et ont peu ou pas de formatage. Cela permet aux éditeurs de texte d’ouvrir ces fichiers sans aucune autre exigence. Le jeu de caractères par défaut des fichiers texte est ASCII qui est utilisé pour créer et afficher le contenu des fichiers texte. Les caractères sont encodés à l’aide du jeu de caractères ASCII, mais cela impose une limitation d’utilisation des caractères tels que le signe dièse, le dollar et le signe euro qui ne peuvent pas être représentés à l’aide du jeu de caractères ASCII. Ainsi, les fichiers texte peuvent également être enregistrés au format Unicode, UTF-8 étant le plus utilisé.
Format de fichier texte Windows
Les fichiers texte sur le système d’exploitation Windows se composent de plusieurs lignes où chaque ligne est composée d’une séquence de caractères. Chaque ligne implicite de l’utilisateur est définie par une combinaison de deux caractères, c’est-à-dire un retour chariot (CR) et un saut de ligne (LF). Les fichiers texte Windows peuvent être au codage ANSI, OEM, Unicode ou UTF-8. Le codage UTF-16 permet d’enregistrer des informations dans un fichier texte qui nécessite deux octets pour la représentation. Ces fichiers commencent généralement par Byte Order Mark (BOM) qui communique le caractère endian du contenu du fichier. Il convient de noter que d’autres applications sur le système d’exploitation Windows peuvent stocker des informations au format de fichier texte, mais avec des extensions de fichier différentes pour représenter le texte spécifique à l’application. Par exemple, les langages de programmation enregistrent généralement le code dans un fichier texte mais avec leurs propres extensions.
Format de fichier texte Unix
Tous ces systèmes définissent un fichier texte comme un fichier dont les caractères sont organisés en zéro ou plusieurs lignes. Chaque ligne est une séquence de zéro ou plusieurs caractères autres que de saut de ligne et un caractère de fin de ligne, normalement LF.