快捷導(dǎo)航

詳解Java中字符流與字節(jié)流的區(qū)別

更新時間：2016年04月21日 14:41:28 作者：absfree

這篇文章主要為大家詳細(xì)介紹了Java中字符流與字節(jié)流的區(qū)別，這兩個的概念易混淆，今天就為大家進(jìn)行詳細(xì)區(qū)分，感興趣的小伙伴們可以參考一下

本文為大家分析了Java中字符流與字節(jié)流的區(qū)別，供大家參考，具體內(nèi)容如下

1. 什么是流

Java中的流是對字節(jié)序列的抽象，我們可以想象有一個水管，只不過現(xiàn)在流動在水管中的不再是水，而是字節(jié)序列。和水流一樣，Java中的流也具有一個“流動的方向”，通常可以從中讀入一個字節(jié)序列的對象被稱為輸入流；能夠向其寫入一個字節(jié)序列的對象被稱為輸出流。

2. 字節(jié)流

Java中的字節(jié)流處理的最基本單位為單個字節(jié)，它通常用來處理二進(jìn)制數(shù)據(jù)。Java中最基本的兩個字節(jié)流類是InputStream和OutputStream，它們分別代表了組基本的輸入字節(jié)流和輸出字節(jié)流。InputStream類與OutputStream類均為抽象類，我們在實際使用中通常使用Java類庫中提供的它們的一系列子類。下面我們以InputStream類為例，來介紹下Java中的字節(jié)流。

InputStream類中定義了一個基本的用于從字節(jié)流中讀取字節(jié)的方法read，這個方法的定義如下：

public abstract int read() throws IOException;
這是一個抽象方法，也就是說任何派生自InputStream的輸入字節(jié)流類都需要實現(xiàn)這一方法，這一方法的功能是從字節(jié)流中讀取一個字節(jié)，若到了末尾則返回-1，否則返回讀入的字節(jié)。關(guān)于這個方法我們需要注意的是，它會一直阻塞知道返回一個讀取到的字節(jié)或是-1。另外，字節(jié)流在默認(rèn)情況下是不支持緩存的，這意味著每調(diào)用一次read方法都會請求操作系統(tǒng)來讀取一個字節(jié)，這往往會伴隨著一次磁盤IO，因此效率會比較低。有的小伙伴可能認(rèn)為InputStream類中read的以字節(jié)數(shù)組為參數(shù)的重載方法，能夠一次讀入多個字節(jié)而不用頻繁的進(jìn)行磁盤IO。那么究竟是不是這樣呢？我們來看一下這個方法的源碼：

public int read(byte b[]) throws IOException {
  return read(b, 0, b.length);
}

它調(diào)用了另一個版本的read重載方法，那我們就接著往下追：

  public int read(byte b[], int off, int len) throws IOException {
    if (b == null) {
      throw new NullPointerException();
    } else if (off < 0 || len < 0 || len > b.length - off) {
      throw new IndexOutOfBoundsException();
    } else if (len == 0) {
      return 0;
    }

    int c = read();
    if (c == -1) {
      return -1;
    }
    b[off] = (byte)c;

    int i = 1;
    try {
      for (; i < len ; i++) {
        c = read();
        if (c == -1) {
          break;
        }
        b[off + i] = (byte)c;
      }
    } catch (IOException ee) {
    }
    return i;
  }

從以上的代碼我們可以看到，實際上read(byte[])方法內(nèi)部也是通過循環(huán)調(diào)用read()方法來實現(xiàn)“一次”讀入一個字節(jié)數(shù)組的，因此本質(zhì)來說這個方法也未使用內(nèi)存緩沖區(qū)。要使用內(nèi)存緩沖區(qū)以提高讀取的效率，我們應(yīng)該使用BufferedInputStream。

3. 字符流

Java中的字符流處理的最基本的單元是Unicode碼元（大小2字節(jié)），它通常用來處理文本數(shù)據(jù)。所謂Unicode碼元，也就是一個Unicode代碼單元，范圍是0x0000~0xFFFF。在以上范圍內(nèi)的每個數(shù)字都與一個字符相對應(yīng)，Java中的String類型默認(rèn)就把字符以Unicode規(guī)則編碼而后存儲在內(nèi)存中。然而與存儲在內(nèi)存中不同，存儲在磁盤上的數(shù)據(jù)通常有著各種各樣的編碼方式。使用不同的編碼方式，相同的字符會有不同的二進(jìn)制表示。實際上字符流是這樣工作的：

輸出字符流：把要寫入文件的字符序列（實際上是Unicode碼元序列）轉(zhuǎn)為指定編碼方式下的字節(jié)序列，然后再寫入到文件中；
輸入字符流：把要讀取的字節(jié)序列按指定編碼方式解碼為相應(yīng)字符序列（實際上是Unicode碼元序列從）從而可以存在內(nèi)存中。
我們通過一個demo來加深對這一過程的理解，示例代碼如下：

import java.io.FileWriter;
import java.io.IOException;


public class FileWriterDemo {
  public static void main(String[] args) {
    FileWriter fileWriter = null;
    try {
      try {
        fileWriter = new FileWriter("demo.txt");
        fileWriter.write("demo");
      } finally {
        fileWriter.close();
      }
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

以上代碼中，我們使用FileWriter向demo.txt中寫入了“demo”這四個字符，我們用十六進(jìn)制編輯器WinHex查看下demo.txt的內(nèi)容：

從上圖可以看出，我們寫入的“demo”被編碼為了“64 65 6D 6F”，但是我們并沒有在上面的代碼中顯式指定編碼方式，實際上，在我們沒有指定時使用的是操作系統(tǒng)的默認(rèn)字符編碼方式來對我們要寫入的字符進(jìn)行編碼。

由于字符流在輸出前實際上是要完成Unicode碼元序列到相應(yīng)編碼方式的字節(jié)序列的轉(zhuǎn)換，所以它會使用內(nèi)存緩沖區(qū)來存放轉(zhuǎn)換后得到的字節(jié)序列，等待都轉(zhuǎn)換完畢再一同寫入磁盤文件中。

4. 字符流與字節(jié)流的區(qū)別

經(jīng)過以上的描述，我們可以知道字節(jié)流與字符流之間主要的區(qū)別體現(xiàn)在以下幾個方面：

字節(jié)流操作的基本單元為字節(jié)；字符流操作的基本單元為Unicode碼元。
字節(jié)流默認(rèn)不使用緩沖區(qū)；字符流使用緩沖區(qū)。
字節(jié)流通常用于處理二進(jìn)制數(shù)據(jù)，實際上它可以處理任意類型的數(shù)據(jù)，但它不支持直接寫入或讀取Unicode碼元；字符流通常處理文本數(shù)據(jù)，它支持寫入及讀取Unicode碼元。

以上是我對Java中字符流與字節(jié)流的一些認(rèn)識，如有敘述不清晰或是不準(zhǔn)確的地方希望大家可以指正，謝謝大家。

您可能感興趣的文章: