O que é um arquivo TXT?
Um arquivo com extensão .TXT representa um documento de texto que contém texto simples na forma de linhas. Os parágrafos em um documento de texto são reconhecidos por retornos de carro e são usados para melhor organização do conteúdo do arquivo. Um documento de texto padrão pode ser aberto em qualquer editor de texto ou aplicativo de processamento de texto em diferentes sistemas operacionais. Todo o texto contido em tal arquivo está em formato legível e representado por uma sequência de caracteres.
Os arquivos de texto podem armazenar grande quantidade de dados, pois não há limitação no tamanho do conteúdo. No entanto, os editores de texto que abrem esses arquivos grandes precisam ser inteligentes para carregá-los e exibi-los. Quase todos os sistemas operacionais vêm com editores de texto que permitem criar e editar arquivos de texto. Por exemplo, o sistema operacional Windows vem com o Bloco de Notas e o Wordpad para essa finalidade. Da mesma forma, o MacOS vem com o TextEdit para criar e editar documentos de texto. Existem, no entanto, outros editores de texto gratuitos disponíveis na Internet que fornecem a capacidade de trabalhar com documentos de texto como o Notepad ++, que é muito mais avançado em termos de funcionalidade.
Especificações de formato de arquivo
O formato de arquivo de texto não possui especificações especiais de formato de arquivo. Os arquivos de texto têm o tipo MIME “texto/simples” e têm pouca ou nenhuma formatação. Isso permite que os editores de texto abram esses arquivos sem quaisquer outros requisitos. O conjunto de caracteres padrão de arquivos de texto é ASCII, usado para criar e exibir o conteúdo do arquivo de texto. Os caracteres são codificados usando o conjunto de caracteres ASCII, mas isso impõe limitação de uso em caracteres como Libra, Dólar e Euro que não podem ser representados usando o conjunto de caracteres ASCII. Assim, os arquivos de texto também podem ser salvos no formato Unicode, sendo o UTF-8 o mais utilizado.
Formato de arquivo de texto do Windows
Os arquivos de texto no sistema operacional Windows consistem em várias linhas em que cada linha é composta por uma sequência de caracteres. Cada linha implícita do usuário é definida pela combinação de dois caracteres, ou seja, retorno de carro (CR) e avanço de linha (LF). Os arquivos de texto do Windows podem estar em codificação ANSI, OEM, Unicode ou UTF-8. A codificação UTF-16 ajuda a salvar informações em um arquivo de texto que requer dois bytes para representação. Esses arquivos geralmente começam com Byte Order Mark (BOM), que comunica o endianness do conteúdo do arquivo. Deve-se notar que outros aplicativos no sistema operacional Windows podem armazenar informações em formato de arquivo de texto, mas com diferentes extensões de arquivo para representar o texto específico do aplicativo. Por exemplo, linguagens de programação geralmente salvam código em arquivo de texto, mas com suas próprias extensões.
Formato de arquivo de texto Unix
Todos esses sistemas definem um arquivo de texto como um arquivo cujos caracteres são organizados em zero ou mais linhas. Cada linha é uma sequência de zero ou mais caracteres que não sejam de nova linha e um caractere de terminação de nova linha, normalmente LF.