TXT 格式(纯文本)
TXT(Plain Text,纯文本)是计算机领域最基础的文件格式,始于 1960 年代 ASCII 编码时代。不包含任何格式控制符,仅存储字符编码序列,兼容所有文本编辑器和编程环境。适用于代码文件、日志记录和基础数据存储,但无法表现结构化信息。
格式简介
TXT 格式是最简单的文本文件格式,仅包含可打印字符和基本控制字符(如换行符、制表符),不包含任何字体、颜色、大小等格式信息。这种极简设计使其成为跨平台、跨系统的通用文本交换格式。
TXT 文件没有固定的文件扩展名,常见的包括 .txt、.text,在 Unix/Linux 系统中甚至可以不使用扩展名。文件内容完全由字符编码决定,支持 ASCII、UTF-8、UTF-16、GBK 等多种编码方式。
技术特点
编码支持
- ASCII:最早的 7 位编码标准,仅支持 128 个字符(英文字母、数字、基本符号)
- UTF-8:现代最常用的 Unicode 编码,向后兼容 ASCII,支持全球所有语言字符
- UTF-16:使用 16 位编码,适合包含大量非 ASCII 字符的文本
- GBK/GB2312:中文编码标准,在中文 Windows 系统中广泛使用
行结束符
不同操作系统使用不同的行结束符:
- Windows:CRLF(
\r\n,回车+换行) - Unix/Linux/macOS:LF(
\n,仅换行) - 旧版 Mac:CR(
\r,仅回车)
文件结构
TXT 文件没有复杂的文件头或元数据结构,文件内容就是纯文本数据:
[文件内容开始]
这是第一行文本
这是第二行文本
...
[文件内容结束]
文件大小完全由字符数量决定,没有额外的元数据开销。