1.RIFF规范
FIFF 是 Resource Interchange File Format(资源交换文件格式)的简称。RIFF 是一种文件格式规范,用于在计算机系统之间交换和存储多媒体资源。WAV 文件格式是 Microsoft 的 RIFF 规范的一个子集。
RIFF 规则定义了文件的结构和数据组织方式,包括文件头和数据块。它的结构如下:
RIFF 头部(12 字节):包含四个字节的文件标识符 "RIFF",四个字节的文件长度信息(不包括标识符和长度本身),以及四个字节的文件类型标识符。
数据块:紧随文件头的是一个或多个数据块,每个数据块包含一个四字节的标识符和四个字节的数据长度信息,以及实际的数据内容。
RIFF 还定义了很多不同的文件类型标识符(FourCC),用于标识特定类型的媒体资源,比如音频、视频、图像等。每种类型的文件都有特定的数据块结构和内容。
RIFF 文件格式的特点是灵活和可扩展,它允许在文件中包含不同类型的数据块,并且可以轻松添加新的数据块类型。这使得 RIFF 成为了多媒体资源交换和处理中常用的文件容器格式之一。
2.WAV文件格式
WAV 文件格式是 Microsoft 的 RIFF 规范的一个子集,用于存储多媒体文件。
wav 文件支持多种不同的比特率、采样率、多声道音频。
wav 文件由若干个 RIFF chunk 构成,分别为: RIFF WAVE Chunk,Format Chunk,Fact Chunk(可选),Data Chunk。另外,文件中还可能包含一些可选的区块,如:Fact chunk、Cue points chunk、Playlist chunk、Associated data list chunk 等。
具体格式如下:
文件解析说明:
wav 文件都是由 chunk 组成,chunk 的格式如下:
RIFF chunk:
typedef struct
{
char ChunkID[4]; //'R','I','F','F'
unsigned int ChunkSize;
char Format[4]; //'W','A','V','E'
}riff_chunk;
其中 ChunkSize 代表的是整个 file_size 的大小减去 ChunkID 和 ChunkSize 的大小,即 file_size=ChunkSize+8。
fmt chunk:
typedef struct
{
char FmtID[4];
unsigned int FmtSize;
unsigned short FmtTag;
unsigned short FmtChannels;
unsigned int SampleRate;
unsigned int ByteRate;
unsigned short BlockAilgn;
unsigned short BitsPerSample;
}fmt_chunk;
data chunk:
struct DATA_CHUNK
{
char DataID[4]; //'d','a','t','a'
unsigned int DataSize;
};
3.wav文件示例分析
linux下 hd 工具查看原始数据:
4.16bit 声音数据格式
5.C代码实现wav文件写入保存
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef struct
{
char ChunkID[4]; //'R','I','F','F'
unsigned int ChunkSize;
char Format[4]; //'W','A','V','E'
}riff_chunk;
typedef struct
{
char FmtID[4]; //'f','m','t'
unsigned int FmtSize;
unsigned short FmtTag;
unsigned short FmtChannels;
unsigned int SampleRate;
unsigned int ByteRate;
unsigned short BlockAilgn;
unsigned short BitsPerSample;
}fmt_chunk;
typedef struct {
char DataID[4]; //'d','a','t','a'
unsigned int DataSize;
} data_chunk;
typedef struct {
riff_chunk riff;
fmt_chunk fmt;
data_chunk data;
} wav_struct;
wav_struct gst_wav;
void init_wav()
{
gst_wav.riff.ChunkID[0] = 'R';
gst_wav.riff.ChunkID[1] = 'I';
gst_wav.riff.ChunkID[2] = 'F';
gst_wav.riff.ChunkID[3] = 'F';
//计算回写数据长度
gst_wav.riff.ChunkSize = 0; //即 ChunkSize = file_size - 8
gst_wav.riff.Format[0] = 'W';
gst_wav.riff.Format[1] = 'A';
gst_wav.riff.Format[2] = 'V';
gst_wav.riff.Format[3] = 'E';
gst_wav.fmt.FmtID[0] = 'f';
gst_wav.fmt.FmtID[1] = 'm';
gst_wav.fmt.FmtID[2] = 't';
gst_wav.fmt.FmtID[3] = ' ';
gst_wav.fmt.FmtSize = 16; //0x10=16 代表PCM编码方式
gst_wav.fmt.FmtTag = 1; //为1,代表PCM编码方式
//双通道
gst_wav.fmt.FmtChannels = 2; //通道个数
gst_wav.fmt.SampleRate = 48077; //采样频率 48.077KHz
gst_wav.fmt.ByteRate = 192308; //传输速率,每秒的字节数,计算公式为:SampleRate * FmtChannels * BitsPerSample/8
gst_wav.fmt.BlockAilgn = 4; //16*2/8
gst_wav.fmt.BitsPerSample = 16; //采样位数,一般有8/16/24/32/64
gst_wav.data.DataID[0] = 'd';
gst_wav.data.DataID[1] = 'a';
gst_wav.data.DataID[2] = 't';
gst_wav.data.DataID[3] = 'a';
//计算回写数据长度
gst_wav.data.DataSize = 0; //即 DataSize = file_size - 44
}
int main(int argc, char *argv[])
{
FILE *file;
char *text = "1237894561238878"; //实际应用中为采集的音频数据
size_t text_len = strlen(text);
file = fopen("test.wav", "wb+");
if (file == NULL) {
perror("Error opening file");
return EXIT_FAILURE;
}
//写入文件头
init_wav();
fwrite(&gst_wav, sizeof(char), sizeof(gst_wav), file);
//写入音频数据
fwrite(text, sizeof(char), text_len, file);
//回写音频文件长度
int fileSize = ftell(file);
fseek(file, 4, SEEK_SET); //回写
fileSize = fileSize - 8;
fwrite(&fileSize, sizeof(char), sizeof(fileSize), file);
fseek(file, 40, SEEK_SET); //回写
fileSize = fileSize + 8 - 44;
fwrite(&fileSize, sizeof(char), sizeof(fileSize), file);
fclose(file);
}