AI智能
改变未来

面试必问的 Java 字节流与字符流

第一时间获取技术干货和业界资讯!

☞ 免费CSDN资料帮下服务 | 免费加群 ☜

最近,我写的都是一些基础知识。一些人不屑于看,看了标题就私信我“能不能写点高级的,看了这标题我就知道内容了,再这样我就取关了!”

但是也有人表示喜欢看。“内容虽然基础,但是看完后我有了新的认知!”

所以,我的尴尬的取关数据是时候给大家展示一下了。

最近 30 天的趋势图如下所示。

我要感谢一部分网友通过转发、评论等形式对我的支持!谢谢你们!

好了,下面我们开始今天的内容。

字节流和字符流其实很好理解!

字节流就是 Byte 流,字节就是 Byte。

字符流就是 Character 流,字符就是 Character。

这里面有两个单位换算大家需要记住一下。

  • 1 byte = 8 bit

  • 1 char = 2 byte = 16 bit

虽然 1 bit 才是数据真正的最小单位,但 1 bit 的信息量太少了。要表示一个有用的信息,需要好几个 bit 一起表示。所以大多数情况下,字节是数据最小的基本单位。

比如,我们熟知的基本型的大小都是 8 bit(也就是1字节)的整数倍:

  • boolean: 1 byte

  • short: 2 byte

  • int: 4 byte

  • float: 4 byte

  • long: 8 byte

  • double: 8 byte

到这里,我们认识的都是字节。但是,Java I/O 的编码系统提供的 Java IO 库有两个支系,面向字节流的 InputStream 和 OutputStream;面向字符的 Reader 和 Writer。

为什么要有字符流呢?那是因为英文,我们可以用字节来表示,但是中文、日文、韩文等没法用字节来表示了,所有人们就想到了新的字符编码集。比如,Unicode 字符集,GB 18030,GBK,Big5,ISO-8859-1 等。

所以,最终就是一个字符用 1 个、2 个或 4 个字节组成。总而言之,一切都是字节流,其实没有字符流这个东西。字符只是根据编码集对字节流翻译之后的产物。

所以,字节流的 InputStream 和 OutputStream 才是一切的基础。实际总线中流动的只有字节流。需要对字节流做特殊解码才能得到字符流。Java 中负责从字节流向字符流解码的桥梁是InputStreamReader 和 InputStreamWriter。

看下面的 InputStreamReader 和 OutputStreamWriter 的结构图。

实际负责编码和解码的是 StreamDecoder 类和 StreamEncoder 类。编码过程中必须指定使用的字符编码集 Charset。所以 InputStreamReader 和 OutputStreamWriter 的构造器都带有 Charset 类型的参数。

如果没有指定编码集,将使用系统默认编码集。而我们经常使用的 FileInputReader 和 FileOutputWriter 就是 InputStreamReader 和 OutputStreamWriter 的派生类。

到现在,你是不是想起了那句话。“世界上本来没有路,走的人多了,也就变成了路。”

计算机中本没有字符流,一开始只适用于英文,但是互联网属于全人类的,所以人们又搞出了字符流。字符只是包装的字节而已。

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » 面试必问的 Java 字节流与字符流