今日总结
- 字节流
OutputStream 字节输出流 超类
- FileOutputStream 基本流
FilterOutputStream
- BufferedOutputStream 字节缓冲输出流(高效)
InputStream 字节输入流 超类
- FileInputStream 基本流
FilterInputStream
- BufferedInputStream 字节缓冲输入流(高效)
- 字符流
Writer 字符输出流 超类
OutputStreamWriter 转换流
- FileWriter 基本流
- BufferedWriter 字符输出缓冲流(高效)
Reader 字符输入流 超类
InputStreamReader 转换流,字节输入流+指定编码表
- FileReader 基本流,字节输入流+默认编码表
- BufferedReader 字符输入缓冲流(高效)
1.字节缓冲流
字节缓冲流介绍(高效流)
- BufferOutputStream:字节缓冲输出流。 通过设置这样的输出流,应用程序可以向底层输出流写入字节,而不必为写入的每个字节导致底层系统的调用
- BufferedInputStream:创建BufferedInputStream将创建一个内部缓冲区数组。 当从流中读取或跳过字节时,内部缓冲区将根据需要从所包含的输入流中重新填充,一次很多字节
构造方法:
方法名 说明 BufferedOutputStream(OutputStream out) 创建字节缓冲输出流对象 BufferedInputStream(InputStream in) 创建字节缓冲输入流对象 - 它们的底层是有数组存在的,默认是8192个长度
缓冲流在读写数据释放资源,调用的方法和字节基本流(FileInputStream和FileOutputStream)是一样的。
- 因为它们都来自于同一个父类的方法。
2.字符流
2.1 为什么会出现字符流
字符流的介绍
由于字节流操作中文不是特别的方便,所以Java就提供字符流
字符流 = 字节流 + 编码表
中文的字节存储方式
用字节流复制文本文件时,文本文件也会有中文,但是没有问题,原因是最终底层操作会自动进行字节拼接成中文,如何识别是中文的呢?
汉字在存储的时候,无论选择哪种编码存储,第一个字节都是负数
- 读:读取字节,然后查询编码表拼成字符(解码)
- 写:先查询编码表将字符变成字节(编码),然后写出
2.2 编码表
- 编码表是字节(二进制)和字符的对照表
什么是字符集
是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等
l计算机要准确的存储和识别各种字符集符号,就需要进行字符编码,一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBXXX字符集、Unicode字符集等
常见的字符集
ASCII字符集:
ASCII:是基于拉丁字母的一套电脑编码系统,用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)
基本的ASCII字符集,使用7位表示一个字符,共128字符。ASCII的扩展字符集使用8位表示一个字符,共256字符,方便支持欧洲常用字符。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等
GBXXX字符集:
GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩汉字等
Unicode字符集:
UTF-8编码:可以用来表示Unicode标准中任意字符,它是电子邮件、网页及其他存储或传送文字的应用 中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。它使用一至四个字节为每个字符编码
编码规则:
128个US-ASCII字符,只需一个字节编码
拉丁文等字符,需要二个字节编码
大部分常用字(含中文),使用三个字节编码
其他极少使用的Unicode辅助字符,使用四字节编码
- 编码表只适用于文字和符号等,对图片,视频和音频等不适用。
- 字符流只能操作纯文本文件,不能操作图片,视频和音频等。
2.3 字符串中的编码解码问题
相关方法
方法名 说明 byte[] getBytes() 使用平台的默认字符集将该 String编码为一系列字节 byte[] getBytes(String charsetName) 使用指定的字符集将该 String编码为一系列字节 String(byte[] bytes) 使用平台的默认字符集解码指定的字节数组来创建字符串 String(byte[] bytes, String charsetName) 通过指定的字符集解码指定的字节数组来创建字符串
2.4 字符流中的编码解码问题
字符流中和编码解码问题相关的两个类
InputStreamReader:是从字节流到字符流的桥梁
它读取字节,并使用指定的编码将其解码为字符
它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集
OutputStreamWriter:是从字符流到字节流的桥梁
是从字符流到字节流的桥梁,使用指定的编码将写入的字符编码为字节
它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集
构造方法
方法名 说明 InputStreamReader(InputStream in) 使用默认字符编码创建InputStreamReader对象 InputStreamReader(InputStream in,String chatset) 使用指定的字符编码创建InputStreamReader对象 OutputStreamWriter(OutputStream out) 使用默认字符编码创建OutputStreamWriter对象 OutputStreamWriter(OutputStream out,String charset) 使用指定的字符编码创建OutputStreamWriter对象
2.5 字符流写数据的5种方式
方法介绍
方法名 说明 void write(int c) 写一个字符 void write(char[] cbuf) 写入一个字符数组 void write(char[] cbuf, int off, int len) 写入字符数组的一部分 void write(String str) 写一个字符串 void write(String str, int off, int len) 写一个字符串的一部分 刷新和关闭的方法
方法名 说明 flush() 刷新流,之后还可以继续写数据 close() 关闭流,释放资源,但是在关闭之前会先刷新流。一旦关闭,就不能再写数据
2.6 字符流读数据的2种方式
方法介绍
方法名 说明 int read() 一次读一个字符数据 int read(char[] cbuf) 一次读一个字符数组数据
2.7 字符缓冲流
字符缓冲流介绍
- BufferedWriter:将文本写入字符输出流,缓冲字符,以提供单个字符,数组和字符串的高效写入,可以指定缓冲区大小,或者可以接受默认大小。默认值足够大,可用于大多数用途
- BufferedReader:从字符输入流读取文本,缓冲字符,以提供字符,数组和行的高效读取,可以指定缓冲区大小,或者可以使用默认大小。 默认值足够大,可用于大多数用途
构造方法
方法名 说明 BufferedWriter(Writer out) 创建字符缓冲输出流对象 BufferedReader(Reader in) 创建字符缓冲输入流对象
2.8 字符缓冲流特有功能
方法介绍
BufferedWriter:
方法名 说明 void newLine() 写一行行分隔符,行分隔符字符串由系统属性定义,跨平台 BufferedReader:
方法名 说明 String readLine() 一次读一行文字。 只读取行内的内容,不包括任何行终止字符。如果流的结尾已经到达,则返回null
2.9 IO流如何选择
字节流
可以操作任意类型的文件,包括纯文本文件和非纯文本文件(图片、视频、音频等...)
1:非纯文本文件
2:一切复制操作都选字节流,即使复制纯文本文件
优先选择高效流
字符流
只能操作纯文本文件,不能操作非纯文本文件
1:读取字符串
2:写出字符串
优先选择高效流
2.10 IO流小结
字节流
字符流