¿Qué es un archivo TXT?
Un archivo con extensión .TXT representa un documento de texto que contiene texto sin formato en forma de líneas. Los párrafos de un documento de texto se reconocen mediante retornos de carro y se utilizan para organizar mejor el contenido del archivo. Un documento de texto estándar se puede abrir en cualquier editor de texto o aplicación de procesamiento de texto en diferentes sistemas operativos. Todo el texto contenido en dicho archivo está en formato legible por humanos y representado por una secuencia de caracteres.
Los archivos de texto pueden almacenar una gran cantidad de datos ya que no hay límite en el tamaño del contenido. Sin embargo, los editores de texto que abren archivos tan grandes deben ser inteligentes para cargarlos y mostrarlos. Casi todos los sistemas operativos vienen con editores de texto que le permiten crear y editar archivos de texto. Por ejemplo, el sistema operativo Windows viene con Notepad y Wordpad para este propósito. Del mismo modo, MacOS viene con TextEdit para crear y editar documentos de texto. Sin embargo, también hay otros editores de texto gratuitos disponibles en Internet que le brindan la capacidad de trabajar con documentos de texto como Notepad ++, que es mucho más avanzado en términos de funcionalidad.
Especificaciones de formato de archivo
El formato de archivo de texto no tiene especificaciones especiales de formato de archivo. Los archivos de texto tienen un tipo MIME “texto/sin formato” y tienen poco o ningún formato. Esto permite que los editores de texto abran dichos archivos sin ningún otro requisito. El conjunto de caracteres predeterminado de los archivos de texto es ASCII, que se utiliza para crear y mostrar el contenido de los archivos de texto. Los caracteres se codifican con el conjunto de caracteres ASCII, pero esto impone una limitación de uso en caracteres como el signo de libra, el dólar y el euro que no se pueden representar con el conjunto de caracteres ASCII. Por lo tanto, los archivos de texto también se pueden guardar en formato Unicode, siendo UTF-8 el más utilizado.
Formato de archivo de texto de Windows
Los archivos de texto en el sistema operativo Windows constan de varias líneas donde cada línea se compone de una secuencia de caracteres. Cada línea implícita de usuario se define mediante la combinación de dos caracteres, es decir, retorno de carro (CR) y salto de línea (LF). Los archivos de texto de Windows pueden estar en codificación ANSI, OEM, Unicode o UTF-8. La codificación UTF-16 ayuda a guardar información en un archivo de texto que requiere dos bytes para su representación. Dichos archivos generalmente comienzan con una marca de orden de bytes (BOM) que comunica el carácter final del contenido del archivo. Cabe señalar que otras aplicaciones en el sistema operativo Windows pueden almacenar información en formato de archivo de texto pero con diferentes extensiones de archivo para representar el texto específico de la aplicación. Por ejemplo, los lenguajes de programación suelen guardar el código en un archivo de texto pero con sus propias extensiones.
Formato de archivo de texto Unix
Todos estos sistemas definen un archivo de texto como un archivo cuyos caracteres están organizados en cero o más líneas. Cada línea es una secuencia de cero o más caracteres que no son de nueva línea y un carácter de terminación de nueva línea, normalmente LF.