Bootstrap

Base64

什么是Base64

base64是一种使用64个可见字符来表示二进制数据的方法。因为log_{2} {64}=6 ,以6位为一个单元,表示为一个可见字符。二进制数据每3个字节为一组,共24位,用4个可见字符表示。‘A’-‘Z’,‘a’-‘z’,‘0’-‘9’一共62个字符,剩下2个字符在不同系统中表示不一样。

base64对照表

十进制二进制字符十进制二进制字符十进制二进制字符十进制二进制字符
0000000A16010000Q32100000g48110000w
1000001B17010001R33100001h49110001x
2000010C18010010S34100010i50110010y
3000011D19010011T35100011j51110011z
4000100E20010100U36100100k521101000
5000101F21010101V37100101l531101011
6000110G22010110W38100110m541101102
7000111H23010111X39100111n551101113
8001000I24011000Y40101000o561110004
9001001J25011001Z41101001p571110015
10001010K26011010a42101010q581110106
11001011L27011011b43101011r591110117
12001100M28011100c44101100s601111008
13001101N29011101d45101101t611111019
14001110O30011110e46101110u62111110+
15001111P31011111f47101111v63111111/

示例说明

以字符串"abc"为例:

二进制表示为 01100001 01100010 01100011

6个字节为一组011000 010110 001001 100011 ,一共4组

将分组后的二进制转换为十进制,在对照表中找到对应的字符,即可得到编码结果YWJj.

文本abc
ASCII979899
二进制011000010110001001100011
索引2422935
Base64YWJj

如果出现要编码的字节数不能被3整除,多出来1个或者2个字节,这时候就需要额外处理.

先用"0"在二进制形式下补足,然后进行base64编码,最后在编码结果后添加1个或者2个"=",以表示补充的字节数.

多2个字节的情况,以字符串"ab"为例

补足0之后编码结果为YWI,因为差一个字节被3整除,因此添加1个"=",最终的编码结果就为YWI=

文本ab
ASCII9798
二进制011000010110001000000000
索引24228
Base64YWI=

多1个字节的情况,以字符串"a"为例:

补足0之后编码结果为YQ,因为差2个字节被3整除,因此添加2个"=",最终的编码结果就为YQ==

文本a
ASCII97
二进制011000010000000000000000
索引2416
Base64YQ==

代码实现

编码

  private static final char[] TABLE = {
      'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
      'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
      'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
      'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
      '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'
  };

  public static byte[] encode(byte[] src) {
    int length = (src.length + 2) / 3 * 4;
    byte[] dst = new byte[length];
    int size = src.length / 3;
    int dpos = 0, spos = 0;
    for (int i = 0; i < size; i++) {
      //3个字节为一组,共24个字节,用4个字符表示
      int bit = src[spos++] << 16 | src[spos++] << 8 | src[spos++];
      dst[dpos++] = (byte) TABLE[(bit >>> 18)];
      dst[dpos++] = (byte) TABLE[((bit & 0x3ffff) >>> 12)];
      dst[dpos++] = (byte) TABLE[((bit & 0xfff) >>> 6)];
      dst[dpos++] = (byte) TABLE[(bit & 0x3f)];
    }

    //最后一组不足3个字节,补充=
    if (spos != src.length) {
      int bit0 = src[spos++];
      dst[dpos++] = (byte) TABLE[bit0 >> 2];
      if (spos == src.length) {
        dst[dpos++] = (byte) TABLE[(bit0 << 4) & 0x3f];
        dst[dpos++] = '=';
      } else {
        int bit1 = src[spos++];
        dst[dpos++] = (byte) TABLE[((bit0 & 0x03) << 4) | bit1 >> 4];
        dst[dpos++] = (byte) TABLE[(bit1 & 0x0f) << 2];
      }
      dst[dpos++] = '=';
    }

    return dst;
  }

解码

  private static final int[] POS_TABLE = new int[256];

  static {
    for (int i = 0; i < TABLE.length; i++) {
      POS_TABLE[TABLE[i]] = i;
    }
  }

  public static byte[] decode(byte[] src) {
    int endCharCnt = (src[src.length - 1] == '=' ? 1 : 0)
        + (src[src.length - 2] == '=' ? 1 : 0);
    int len = src.length / 4 * 3 - endCharCnt;
    byte[] dst = new byte[len];
    int dpos = 0, spos = 0;
    int size = src.length / 4 - endCharCnt > 0 ? 1 : 0;
    for (int i = 0; i < size; i++) {
      //4个可见字符转换为3个字节
      int bit = (POS_TABLE[src[spos++]] << 18) |
          (POS_TABLE[src[spos++]] << 12)
          | POS_TABLE[src[spos++]] << 6
          | POS_TABLE[src[spos++]];
      dst[dpos++] = (byte) (bit >>> 16);
      dst[dpos++] = (byte) (bit >>> 8 & 0xff);
      dst[dpos++] = (byte) (bit & 0xff);
    }

    //处理=
    if (spos != src.length) {
      int bit = (POS_TABLE[src[spos++]] << 18)
          | (POS_TABLE[src[spos++]] << 12)
          | POS_TABLE[src[spos++]] << 6
          | POS_TABLE[src[spos++]];
      dst[dpos++] = (byte) (bit >>> 16);
      if (src[src.length - 2] != '=') {
        dst[dpos++] = (byte) (bit >>> 8 & 0xff);
      }
    }

    return dst;
  }

;