C#下将BMP转换成二进制是比较容易的,方法如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
byte[] bufPic;
string filePath = "";
Stream myStream;
MemoryStream picFile = new MemoryStream();
OpenFileDialog open = new OpenFileDialog();
open.Filter = "bmp files (*.bmp) | *.bmp";
open.RestoreDirectory = true;
if (open.ShowDialog() == DialogResult.OK)
{
if ((myStream = login.OpenFile()) != null)
{
myStream.Close();
}
}
filePath = open.FileName.ToString();
Image image = Image.FromFile(filePath);
image.Save(picFile, ImageFormat.Bmp);
bufPic = picFile.GetBuffer();

其实转换的结果是以8位二进制分割的十进制数(0~255),若是真要得到纯二进制,还需要进一步转换。我曾做过很多实验,目的是测试这些数字和图片本身之间的关系,虽然学习过多媒体技术,但是对于详细的bmp分解,并没有太多认识。当然,在实验前还要把”二进制”还原bmp的方法说明一下:

1
2
3
4
5
6
7
8
using (MemoryStream ms = new MemoryStream(myPic))
{
Image image1 = Image.FromStream(ms);
ms.Close();
pic.Image = image1;
}
//其中mypic是byte类型,存放"二进制"的数组,pic是PictureBox控件

实验1: 人为的变动bufPic数组中的前几个位置,得到的结果都是出错,没能正确的还原回bmp,仔细观察后在发现,几乎所有的bmp转换成的bufPIc的前几个位置都相同,所以得到一个猜测:bmp文件不是单一的由图片的像素组成,还有一些默认的统一的”约定”

实验2: 在试验1的基础上挨个尝试,找到变更后能正确还原bmp的位置,由这个位置来确定所谓的”约定”的位数。得到的结论是42个。猜测就是:每个bmp文件都有54个默认的参数。

实验3: 进一步验证参数的个数是否正确。更改54位以后的位置,看看结果对于图片的影响。测试结果如下:

用这个原图片,修改42位以后的若干位,结果是!

由此看来变动是相当大的,最明显的是由一个黑白图变为了彩色图,所以又有一个猜测:默认的参数不仅仅有54位,还包含一些控制调色板的位。

实验4: bufPIc中的每一个数字是否代表了bmp中每一个点的信息?答案当然是否定的,一个32*16的bmp中,有512个点,但bifPic中只有256个,还包括一些默认参数。只能将数字转换成2进制来考虑,这也符合计算机的设计原理。

通过很多测试,最后得出了一些结论,参考了相关的资料并询问了导师,现总结如下:

  1. 位图文件可看成由4个部分组成:位图文件头(bitmap-file header)、位图信息头(bitmap-information header)、彩色表(color table)和定义位图的字节阵列,它具有如下所示的形式。

位图文件的组成

结构名称

符号

位图文件头(bitmap-file header)

BITMAPFILEHEADER

bmfh

位图信息头(bitmap-information header)

BITMAPINFOHEADER

bmih

彩色表(color table)

RGBQUAD

aColors[]

图象数据阵列字节

BYTE

aBitmapBits[]

位图文件结构可综合在表1中。

字节

域的名称

大小

内容

图像文件头

0-1

文件标识

2 byte

两字节的内容用来识别位图的类型:

‘BM’ : Windows 3.1x, 95, NT, …

‘BA’ :OS/2 Bitmap Array

‘CI’ :OS/2 Color Icon

‘CP’ :OS/2 Color Pointer

‘IC’ : OS/2 Icon

‘PT’ :OS/2 Pointer

注:因为OS/2系统并没有被普及开,所以在编程时,你只需判断第一个标识”**BM“(6677)就行**。

2-5

File Size

1 dword

用字节表示的整个文件的大小

6-9

Reserved

1 dword

保留,必须设置为0

10-13

Bitmap Data Offset

1 dword

从文件开始到位图数据开始之间的数据(bitmap data)之间的偏移量

图像信息头

14-17

Bitmap Header Size

1 dword

位图信息头(Bitmap Info Header)的长度,用来描述位图的颜色、压缩方法等。下面的长度表示:

28h - Windows 3.1x, 95, NT, …

0Ch - OS/2 1.x

F0h - OS/2 2.x

注:在Windows95、98、2000等操作系统中,位图信息头的长度并不一定是28h,因为微软已经制定出了新的BMP文件格式,其中的信息头结构变化比较大,长度加长。所以最好不要直接使用常数**28h**,而是应该从具体的文件中读取这个值。这样才能确保程序的兼容性。

18-21

Width

1 dword

位图的宽度,以象素为单位

22-25

Height

1 dword

位图的高度,以象素为单位

26-27

Planes

1 word

位图的位面数(注:该值将总是1)

28-29

Bits Per Pixel

1 word

每个象素的位数。

1 - **单色位图(实际上可有两种颜色,缺省情况下是黑色和白色。你可以自己定义这两种颜色)**

4 - 16 色位图

8 - 256 色位图

16 - 16bit 高彩色位图

24 - 24bit 真彩色位图

32 - 32bit 增强型真彩色位图

30-33

Compression

1 dword

压缩说明:

0 - **不压缩 (使用BI_RGB表示)**

1 - RLE 8-使用8位RLE压缩方式(用BI_RLE8表示)

2 - RLE 4-使用4位RLE压缩方式(用BI_RLE4表示)

3 - Bitfields-位域存放方式(用BI_BITFIELDS表示)

34-37

Bitmap Data Size

1 dword

用字节数表示的位图数据的大小。该数必须是4的倍数

38-41

HResolution

1 dword

用象素/米表示的水平分辨率

42-45

VResolution

1 dword

用象素/米表示的垂直分辨率

4**9

Colors

1 dword

位图使用的颜色数。如8-比特/象素表示为100h或者 256

50-53

Important

1 dword

指定重要的颜色数。当该域的值等于颜色数时(或者等于0时),表示所有颜色都一样重要

调色板数据

根据BMP版本的不同而不同

Palette

N * 4 byte

调色板规范。对于调色板中的每个表项,这4个字节用下述方法来描述RGB的值:

1字节用于蓝色分量

1字节用于绿色分量

1字节用于红色分量

1字节用于填充符(设置为0)

图象数据

根据BMP版本及调色板尺寸的不同而不同

Bitmap Data

xxx bytes

该域的大小取决于压缩方法及图像的尺寸和图像的位深度,它包含所有的位图数据字节,这些数据可能是彩色调色板的索引号,也可能是实际的RGB值,这将根据图像信息头中的位深度值来决定。

2 四个部分在位图图像数据中的相应位置,(位置偏移均以位图数据开始处为基准)

起始位置偏移 <= 各部分数据具体存放位置 < 结束位置偏移

第一部分,图像头:

起始位置偏移 0,

长度:0x0EH (2byte + 3 * dword = 14)

结束位置偏移:起始位置偏移 + 长度

第二部分,图像信息头:

起始位置偏移:上一部分结束位置偏移

长度:从 0x0EH 处读取到的 dword 的数据值

结束位置偏移:起始位置偏移 + 长度

第三部分,调色板:

起始位置偏移:上一部分结束位置偏移

长度:从 0x0AH 处读取到的 dword 的数据值- 起始位置偏移

结束位置偏移:起始位置偏移 + 长度

第四部分,位图数据:

起始位置偏移:上一部分结束位置偏移

长度:从 0x22H 处读取到的 dword 的数据值

结束位置偏移:文件结束

3 单色位图图像数据的表示方法

在单色位图图像中,只有两种颜色,黑色或白色,每一个像素只需要一个比特就能够完成表示,为了清楚比特0或1具体表示哪一种颜色,可以通过查询调色板。

在单色位图图像中,调色板只包含两种颜色,每一种颜色用R G B 0 四个字节表示 (在实际的字节流中,顺序是 B G R 0)

所以,位图图像数据中的0 代表调色板中 第一种颜色的颜色值, 1 代表调色板中 第二种颜色的颜色值。

4 C/C++中数据类型的长度

byte : 1个字节, 8位(比特)

word: 2个字节, 由 unsigned short定义

dword:4 个字节, 由 unsigned long定义

5 根据前面的位图文件结构表,可以通过自定义数据结构 struct的方式来读取 相应的数据。

6 位图数据的存储方式:(自下而上,从左到右)

扫描行是由底向上存储的,这就是说,位图数据的第一个字节表示位图左下角的象素,而最后一个字节表示位图右上角的象素。

7 一行单色位图数据的存储格式规定

每一扫描行的字节数必需是4的整倍数,当不够4的整数倍时,需要加0补齐

以 720 × 450 的单色位图图像为例

水平扫描行的长度为720,则需要720比特来表示一个扫描行,即需要 720/8=90字节来表示,但是 90 不是 4 的整数倍,因此需要用0补齐,直至为4的整数倍,即需要额外的2个填充字节。最终,长度为720的水平扫描行使用了 92 个字节来表示。

例1:t1图为50×50的单色图,水平扫描行的长度为50,则需要50比特来表示一个扫描行,即需要 50/8=7字节来表示,但是 7 不是 4 的整数倍,因此需要用0补齐,直至为4的整数倍,即需要额外的1个填充字节。最终,长度为50的水平扫描行使用了 8个字节来表示。共8×50=400个字节,再加上62个字节的头部,既为文件大小462个字节。

例2:t3图为40×40的单色图,水平扫描行的长度为40,则需要40比特来表示一个扫描行,即需要 40/8=5字节来表示,但是 5 不是 4 的整数倍,因此需要用0补齐,直至为4的整数倍,即需要额外的3个填充字节。最终,长度为40的水平扫描行使用了 8个字节来表示。共8×40=320个字节,再加上62个字节的头部,既为文件大小382个字节。

例3:t5图为16×32的单色图,水平扫描行的长度为16,则需要16比特来表示一个扫描行,即需要 16/8=2字节来表示,但是 2 不是 4 的整数倍,因此需要用0补齐,直至为4的整数倍,即需要额外的2个填充字节。最终,长度为16的水平扫描行使用了 4个字节来表示。共4×32=128个字节,再加上62个字节的头部,既为文件大小190个字节。

因此水平像素应为4个字节(32个像素)的整数倍最好。空间利用率高,否则需要补零。

下面针对单色位图test.bmp,50*50分辨率介绍头部数据含义:

[0] 66 byte (66 = 42H 即 字母 b)

[1] 77 byte (4dH 即字母 m)[0]、[1]是一整体,判断文件是否.bmp文件

[2] 206 byte

[3] 1 byte 1×256+206=462

[4] 0 byte

[5] 0 byte [2]-[5]是一整体,表示文件大小,以字节为单位

[6] 0 byte

[7] 0 byte

[8] 0 byte

[9] 0 byte [6]-[9]是一整体,始终为0。

[10] 62 byte

[11] 0 byte

[12] 0 byte

[13] 0 byte [10]-[13]是一整体,单色图为62,表示头部长度为62字节[0]-[61]。

以上为图像文件头部分,共14个字节[0]-[13]

[14] 40 byte

[15] 0 byte

[16] 0 byte

[17] 0 byte [14]-[17]是一整体,单色图为40(ox28h),表示图像信息头部

长度为40字节[14]-[53]

[18] 50 byte (分辨率)

[19] 0 byte

[20] 0 byte

[21] 0 byte [18]-[21]是一整体,表示位图的宽度,以象素为单位

[22] 50 byte (分辨率)

[23] 0 byte

[24] 0 byte

[25] 0 byte [22]-[25]是一整体,表示位图的高度,以象素为单位

[26] 1 byte

[27] 0 byte [26]-[27]是一整体,位图的位面数(注:该值将总是1)

[28] 1 byte

[29] 0 byte [28]-[29]是一整体,每个象素的位数。1 - **单色位图**

[30] 0 byte

[31] 0 byte

[32] 0 byte

[33] 0 byte [30]-[33]是一整体,压缩说明:0 - **不压缩 **。

[34] 0 byte

[35] 0 byte

[36] 0 byte

[37] 0 byte [34]-[37]是一整体,用字节数表示的位图数据的大小。该数必须

是4的倍数,多设置为0,见7的例子。

[38] 116 byte

[39] 18 byte

[40] 0 byte

[41] 0 byte [38]-[41]是一整体,用象素/米表示的水平分辨率,打印时用。

值除100,变为象素/厘米。(18×256+116)÷100=47象素/厘米

[42] 116 byte

[43] 18 byte

[44] 0 byte

[45] 0 byte [42]-[45]是一整体,用象素/米表示的垂直分辨率,打印时用,

值需除100,变为象素/厘米。

[46] 2 byte

[47] 0 byte

[48] 0 byte

[49] 0 byte [46]-[49]是一整体,位图使用的颜色数。单色图为2。

[50] 2 byte

[51] 0 byte

[52] 0 byte

[53] 0 byte [50]-[53]是一整体,指定重要的颜色数。当该域的值等于颜色数时

(或者等于0时),表示所有颜色都一样重要

以上为图像信息头部分,共14个字节[14]-[53]

[54] 0 byte

[55] 0 byte

[56] 0 byte

[57] 255 byte [54]-[57]是一整体,第一种颜色:(0,0,0)黑色。

[58] 255 byte

[59] 255 byte

[60] 255 byte

[61] 255 byte [58]-[61]是一整体,第二种颜色:(255,255,255)白色。

以上为调色板部分,共N × 4 byte=2×4=8个字节,

[54]-[61](单色图N=2)。

调色板规范。对于调色板中的每个表项,这4个字节用下述方法来

描述RGB的值: 1字节用于蓝色分量, 1字节用于绿色分量,

1字节用于红色分量,1字节用于填充符(设置为1)。

以上为头部数据(控制数据),头部长度为62字节[0]-[61]

以下为真正的图像数据,以8个字节为一水平扫描行。

1个填充字节+ 7个数据字节=8个字节。

最后要说的是:bmp扫描是有底向上存储,即第一个字节表示bmp左下角的像素。