TXTファイルとは何ですか?
拡張子が .TXT のファイルは、行形式のプレーン テキストを含むテキスト ドキュメントを表します。テキスト ドキュメント内の段落はキャリッジ リターンによって認識され、ファイルの内容をより適切に配置するために使用されます。標準のテキスト ドキュメントは、さまざまなオペレーティング システムの任意のテキスト エディタまたはワード プロセッシング アプリケーションで開くことができます。このようなファイルに含まれるすべてのテキストは、人間が判読できる形式であり、一連の文字で表されます。
テキストファイルは、コンテンツのサイズに制限がないため、大量のデータを保存できます。ただし、このような大きなファイルを開くテキスト エディターは、これらのファイルを読み込んで表示できるようにする必要があります。ほとんどすべてのオペレーティング システムには、テキスト ファイルを作成および編集できるテキスト エディタが付属しています。たとえば、Windows OS には、この目的のためにメモ帳とワードパッドが付属しています。同様に、MacOS には、テキスト ドキュメントを作成および編集するための TextEdit が付属しています。ただし、機能面ではるかに高度な Notepad++ のようなテキスト ドキュメントを操作する機能を提供する、インターネット経由で利用可能な他のフリー テキスト エディターもあります。
ファイル形式の仕様
テキスト ファイル形式には、特別なファイル形式の仕様はありません。テキスト ファイルの MIME タイプは “text/plain” で、書式設定はほとんどまたはまったくありません。これにより、テキスト エディターは他の要件なしでそのようなファイルを開くことができます。テキスト ファイルのデフォルトの文字セットは、テキスト ファイルの内容の作成と表示に使用される ASCII です。文字は ASCII 文字セットを使用してエンコードされますが、これにより、ポンド記号、ドル記号、ユーロ記号など、ASCII 文字セットを使用して表現できない文字の使用が制限されます。したがって、テキスト ファイルは Unicode 形式で保存することもでき、UTF-8 が主に使用されます。
Windows テキスト ファイル形式
Windows OS のテキスト ファイルは複数の行で構成され、各行は一連の文字で構成されています。各ユーザー暗黙の行は、キャリッジ リターン (CR) とライン フィード (LF) の 2 つの文字の組み合わせによって定義されます。 Windows テキスト ファイルは、ANSI、OEM、Unicode、または UTF-8 エンコーディングにすることができます。 UTF-16 エンコーディングは、表現に 2 バイトを必要とするテキスト ファイルに情報を保存するのに役立ちます。このようなファイルは通常、ファイル コンテンツのエンディアンを示すバイト オーダー マーク (BOM) で始まります。 Windows OS 上の他のアプリケーションは情報をテキスト ファイル形式で保存できますが、アプリケーション固有のテキストを表すファイル拡張子が異なることに注意してください。たとえば、プログラミング言語は通常、コードをテキスト ファイルに保存しますが、独自の拡張子を付けます。
Unix テキスト ファイル形式
このようなシステムはすべて、テキスト ファイルを、文字が 0 行以上に編成されたファイルとして分類します。各行は、0 個以上の非改行文字と終了改行文字 (通常は LF) のシーケンスです。