Base 64 Encoding 编码

2013-01-16 18:28

Base 64 Encoding 编码

by

at 2013-01-16 10:28:33

original http://kb.cnblogs.com/page/166471/

  Base 64 Encoding有什么用?举个简单的例子,你使用SMTP协议 (Simple Mail Transfer Protocol 简单邮件传输协议)来发送邮件。因为这个协议是基于文本的协议,所以如果邮件中包含一幅图片,我们知道图片的存储格式是二进制数据(binary data),而非文本格式,我们必须将二进制的数据编码成文本格式,这时候Base 64 Encoding就派上用场了。

  (一)编码原理

  Base 64 Encoding 的编码原理是将每三个字节(byte)转换为四个字符,每个字符占6 bit。

image

  6 bit一共有64种组合方式,也就是说该编码共需要使用至少64种字符(后面我们还会介绍一个特殊字符 =)。Base 64 Encoding使用了从 A 到 Z、a 到 z、0 到 9、以及 + 和 / 这些字符(即[A-Za-z0-9+/])。

image

  假设我们有三个字节的数据,byte[] {1, 2, 3},用二进制表示为:

  00000001 | 00000010 | 00000011

  依据上面的原理,使用Basee 64 Encoding编码后结果应该为:

  000000 | 010000 | 001000 | 000011

  转换为十进制为 0 | 16 | 8 | 3,对照上面的表,编码后的文本为 AQID

  既然Base 64 Encoding将每三个字节转换为四个字符,那如果一幅图片的字节数不能被3整除该怎么办?

  如果剩余一个字节,该字节同样被转换为四个字符。第一个6 bit转换成一个字符,接下来2 bit转换成一个字符(注意这里是向右添加0),最后添加两个=字符。

image

  假设我们有四个字节的数据,byte[] {1, 2, 3, 4},用二进制表示为:

  00000001 | 00000010 | 00000011 | 00000100

  依据上面的原理,使用Basee 64 Encoding编码后结果应该为:

  000000 | 010000 | 001000 | 000011 | 000001 | 000000

  转换为十进制为 0 | 16 | 8 | 3 | 1 | 0,对照上面的表,编码后的文本为 AQIDBA==

  如果不能被3整除,而余下两个字节,编码方式类似剩余一个字节,同样是转换成四个字符,最后一个字符用=。

image

  假设我们有五个字节的数据,byte[] {1, 2, 3, 4, 5},用二进制表示为:

  00000001 | 00000010 | 00000011 | 00000100 | 00000101

  依据上面的原理,使用Basee 64 Encoding编码后结果应该为:

  000000 | 010000 | 001000 | 000011 | 000001 | 000000 | 010100

  转换为十进制为 0 | 16 | 8 | 3 | 1 | 0 | 20,对照上面的表,编码后的文本为 AQIDBAU=

  (二)在.Net中的实现

  在.Net中,将二进制数据编码为文本可以使用public static string ToBase64String(byte[] inArray)方法;从文本文件转换回二进制数据可以使用public static byte[] FromBase64String(string s)方法。

  下面验证一下上面讲解的例子,分别将三组数据 byte[] {1, 2, 3},byte[] {1, 2, 3, 4},byte[] {1, 2, 3, 4, 5} 进行编码,并检验编码后的文本是否分别为AQID,AQIDBA==,AQIDBAU=。

byte[] binary1 = new byte[] { 1, 2, 3 };
string encoded1 = Convert.ToBase64String(binary1);
byte[] decoded1 = Convert.FromBase64String(encoded1);
Console.WriteLine(
"Encoded string: {0}, Decoded binary is equal to orignial binary? {1}"
, encoded1, binary1.SequenceEqual(decoded1));

byte[] binary2 = new byte[] { 1, 2, 3, 4};
string encoded2 = Convert.ToBase64String(binary2);
byte[] decoded2 = Convert.FromBase64String(encoded2);
Console.WriteLine(
"Encoded string: {0}, Decoded binary is equal to orignial binary? {1}"
, encoded2, binary2.SequenceEqual(decoded2));

byte[] binary3 = new byte[] { 1, 2, 3, 4, 5};
string encoded3 = Convert.ToBase64String(binary3);
byte[] decoded3 = Convert.FromBase64String(encoded3);
Console.WriteLine(
"Encoded string: {0}, Decoded binary is equal to orignial binary? {1}"
, encoded3, binary3.SequenceEqual(decoded3));

  输出结果为:

  Encoded string: AQID, Decoded binary is equal to orignial binary? True
  Encoded string: AQIDBA==, Decoded binary is equal to orignial binary? True
  Encoded string: AQIDBAU=, Decoded binary is equal to orignial binary? True

  总结:本文介绍了为何要使用编码,以及Base 64 Encoding编码的原理,最后还介绍了Base 64 Encoding在.Net中的实现。