最簡單的視音頻播放示例9:SDL2播放PCM
來源:程序員人生 發布時間:2014-11-05 08:46:31 閱讀次數:4078次
本文記錄SDL播放音頻的技術。在這里使用的版本是SDL2。實際上SDL本身其實不提供視音頻播放的功能,它只是封裝了視音頻播放的底層API。在Windows平臺下,SDL封裝了Direct3D這類的API用于播放視頻;封裝了DirectSound這類的API用于播放音頻。由于SDL的編寫目的就是簡化視音頻播放的開發難度,所以使用SDL播放視頻(YUV/RGB)和音頻(PCM)數據非常的容易。

SDL簡介
SDL(Simple DirectMedia Layer)是1套開放源代碼的跨平臺多媒體開發庫,使用C語言寫成。SDL提供了數種控制圖象、聲音、輸出入的函數,讓開發者只要用相同或是類似的代碼就能夠開發出跨多個平臺(Linux、Windows、Mac OS X等)的利用軟件。目前SDL多用于開發游戲、摹擬器、媒體播放器等多媒體利用領域。用下面這張圖可以很明確地說明SDL的用處。
SDL實際上其實不限于視音頻的播放,它將功能分成以下數個子系統(subsystem):
Video(圖象):圖象控制和線程(thread)和事件管理(event)。
Audio(聲音):聲音控制
Joystick(搖桿):游戲搖桿控制
CD-ROM(光盤驅動器):光盤媒體控制
Window Management(視窗管理):與視窗程序設計集成
Event(事件驅動):處理事件驅動
在Windows下,SDL與DirectX的對應關系以下。
SDL | DirectX |
SDL_Video、SDL_Image | DirectDraw、Direct3D |
SDL_Audio、SDL_Mixer | DirectSound |
SDL_Joystick、SDL_Base | DirectInput |
SDL_Net | DirectPlay |
注:上文內容在《使用SDL播放視頻》的文章中已介紹,這里再次重復貼1遍。
SDL播放音頻的流程
SDL播放音頻的流程狠簡單,分為以下步驟。
1. 初始化1) 初始化SDL。
2) 根據參數(SDL_AudioSpec)打開音頻裝備
2. 循環播放數據1) 播放音頻數據。
2) 延時等待播放完成。
下面詳細分析1下上文流程。
1. 初始化
1) 初始化SDL。
使用SDL_Init()初始化SDL。該函數可以肯定希望激活的子系統。SDL_Init()函數定義以下:
int SDLCALL SDL_Init(Uint32 flags)
其中,flags可以取以下值:
SDL_INIT_TIMER:定時器
SDL_INIT_AUDIO:音頻
SDL_INIT_VIDEO:視頻
SDL_INIT_JOYSTICK:搖桿
SDL_INIT_HAPTIC:觸摸屏
SDL_INIT_GAMECONTROLLER:游戲控制器
SDL_INIT_EVENTS:事件
SDL_INIT_NOPARACHUTE:不捕獲關鍵信號(這個不理解)
SDL_INIT_EVERYTHING:包括上述所有選項
有關SDL_Init()有1點需要注意:初始化的時候盡可能做到“夠用就好”,而不要用SDL_INIT_EVERYTHING。由于有些情況下使用SDL_INIT_EVERYTHING會出現1些不可預知的問題。例如,在MFC利用程序中播放純音頻,如果初始化SDL的時候使用SDL_INIT_EVERYTHING,那末就會出現聽不到聲音的情況。后來發現,去掉了SDL_INIT_VIDEO以后,問題才得以解決。
2) 根據參數(SDL_AudioSpec)打開音頻裝備使用SDL_OpenAudio()打開音頻裝備。該函數需要傳入1個SDL_AudioSpec的結構體。DL_OpenAudio()的定義以下。
int SDLCALL SDL_OpenAudio(SDL_AudioSpec * desired,
SDL_AudioSpec * obtained);
它的參數是兩個SDL_AudioSpec結構體,它們的含義:
desired:期望的參數。
obtained:實際音頻裝備的參數,1般情況下設置為NULL便可。
SDL_AudioSpec結構體的定義以下。
typedef struct SDL_AudioSpec
{
int freq; /**< DSP frequency -- samples per second */
SDL_AudioFormat format; /**< Audio data format */
Uint8 channels; /**< Number of channels: 1 mono, 2 stereo */
Uint8 silence; /**< Audio buffer silence value (calculated) */
Uint16 samples; /**< Audio buffer size in samples (power of 2) */
Uint16 padding; /**< Necessary for some compile environments */
Uint32 size; /**< Audio buffer size in bytes (calculated) */
SDL_AudioCallback callback;
void *userdata;
} SDL_AudioSpec;
其中包括了關于音頻各種參數:
freq:音頻數據的采樣率。經常使用的有48000,44100等。
format:音頻數據的格式。舉例幾種格式:
AUDIO_U16SYS:Unsigned 16-bit samples
AUDIO_S16SYS:Signed 16-bit samples
AUDIO_S32SYS:32-bit integer samples
AUDIO_F32SYS:32-bit floating point samples
channels:聲道數。例如單聲道取值為1,立體聲取值為2。
silence:設置靜音的值。
samples:音頻緩沖區中的采樣個數,要求必須是2的n次方。
padding:斟酌到兼容性的1個參數。
size:音頻緩沖區的大小,以字節為單位。
callback:填充音頻緩沖區的回調函數。
userdata:用戶自定義的數據。
在這里記錄1下填充音頻緩沖區的回調函數的作用。當音頻裝備需要更多數據的時候會調用該回調函數。回調函數的格式要求以下。
void (SDLCALL * SDL_AudioCallback) (void *userdata, Uint8 * stream,
int len);
回調函數的參數含義以下所示。
userdata:SDL_AudioSpec結構中的用戶自定義數據,1般情況下可以不用。
stream:該指針指向需要填充的音頻緩沖區。
len:音頻緩沖區的大小(以字節為單位)。
在回調函數中可使用SDL_MixAudio()完成混音等工作。盡人皆知SDL2和SDL1.x關于視頻方面的API差別很大。但是SDL2和SDL1.x關于音頻方面的API是1模1樣的。惟獨在回調函數中,SDL2有1個地方和SDL1.x不1樣:SDL2中必須首先使用SDL_memset()將stream中的數據設置為0。
2. 循環播放數據
1) 播放音頻數據。使用SDL_PauseAudio()可以播放音頻數據。SDL_PauseAudio()的定義以下。
void SDLCALL SDL_PauseAudio(int pause_on)
當pause_on設置為0的時候便可開始播放音頻數據。設置為1的時候,將會播放靜音的值。
2) 延時等待播放完成。這1步就是延時等待音頻播放終了了。使用像SDL_Delay()這樣的延時函數便可。
代碼
源代碼以下所示。
/**
* 最簡單的SDL2播放音頻的例子(SDL2播放PCM)
* Simplest Audio Play SDL2 (SDL2 play PCM)
*
* 雷霄驊 Lei Xiaohua
* leixiaohua1020@126.com
* 中國傳媒大學/數字電視技術
* Communication University of China / Digital TV Technology
* http://blog.csdn.net/leixiaohua1020
*
* 本程序使用SDL2播放PCM音頻采樣數據。SDL實際上是對底層繪圖
* API(Direct3D,OpenGL)的封裝,使用起來明顯簡單于直接調用底層
* API。
*
* 函數調用步驟以下:
*
* [初始化]
* SDL_Init(): 初始化SDL。
* SDL_OpenAudio(): 根據參數(存儲于SDL_AudioSpec)打開音頻裝備。
*
* [循環播放數據]
* SDL_PauseAudio(): 播放音頻數據。
* SDL_Delay(): 延時等待播放完成。
*
* This software plays PCM raw audio data using SDL2.
* SDL is a wrapper of low-level API (DirectSound).
* Use SDL is much easier than directly call these low-level API.
*
* The process is shown as follows:
*
* [Init]
* SDL_Init(): Init SDL.
* SDL_OpenAudio(): Opens the audio device with the desired
* parameters (In SDL_AudioSpec).
*
* [Loop to play data]
* SDL_PauseAudio(): Play Audio.
* SDL_Delay(): Wait for completetion of playback.
*/
#include <stdio.h>
#include <tchar.h>
extern "C"
{
#include "sdl/SDL.h"
};
//Buffer:
//|-----------|-------------|
//chunk-------pos---len-----|
static Uint8 *audio_chunk;
static Uint32 audio_len;
static Uint8 *audio_pos;
/* Audio Callback
* The audio function callback takes the following parameters:
* stream: A pointer to the audio buffer to be filled
* len: The length (in bytes) of the audio buffer
*
*/
void fill_audio(void *udata,Uint8 *stream,int len){
//SDL 2.0
SDL_memset(stream, 0, len);
if(audio_len==0) /* Only play if we have data left */
return;
len=(len>audio_len?audio_len:len); /* Mix as much data as possible */
SDL_MixAudio(stream,audio_pos,len,SDL_MIX_MAXVOLUME);
audio_pos += len;
audio_len -= len;
}
int main(int argc, char* argv[])
{
//Init
if(SDL_Init(SDL_INIT_AUDIO | SDL_INIT_TIMER)) {
printf( "Could not initialize SDL - %s
", SDL_GetError());
return ⑴;
}
//SDL_AudioSpec
SDL_AudioSpec wanted_spec;
wanted_spec.freq = 44100;
wanted_spec.format = AUDIO_S16SYS;
wanted_spec.channels = 2;
wanted_spec.silence = 0;
wanted_spec.samples = 1024;
wanted_spec.callback = fill_audio;
if (SDL_OpenAudio(&wanted_spec, NULL)<0){
printf("can't open audio.
");
return ⑴;
}
FILE *fp=fopen("../NocturneNo2inEflat_44.1k_s16le.pcm","rb+");
if(fp==NULL){
printf("cannot open this file
");
return ⑴;
}
//For YUV420P
int pcm_buffer_size=4096;
char *pcm_buffer=(char *)malloc(pcm_buffer_size);
int data_count=0;
while(1){
if (fread(pcm_buffer, 1, pcm_buffer_size, fp) != pcm_buffer_size){
// Loop
fseek(fp, 0, SEEK_SET);
fread(pcm_buffer, 1, pcm_buffer_size, fp);
data_count=0;
}
printf("Now Playing %10d Bytes data.
",data_count);
data_count+=pcm_buffer_size;
//Set audio buffer (PCM data)
audio_chunk = (Uint8 *) pcm_buffer;
//Audio buffer length
audio_len =pcm_buffer_size;
audio_pos = audio_chunk;
//Play
SDL_PauseAudio(0);
while(audio_len>0)//Wait until finish
SDL_Delay(1);
}
return 0;
}
運行結果
運行的結果以下圖所示。運行的時候可以聽見音樂播放的聲音。
下載
代碼位于“Simplest Media Play”中
SourceForge項目地址:https://sourceforge.net/projects/simplestmediaplay/
CSDN下載地址:http://download.csdn.net/detail/leixiaohua1020/8054395
上述工程包括了使用各種API(Direct3D,OpenGL,GDI,DirectSound,SDL2)播放多媒體例子。其中音頻輸入為PCM采樣數據。輸出至系統的聲卡播放出來。視頻輸入為YUV/RGB像素數據。輸出至顯示器上的1個窗口播放出來。
通過本工程的代碼初學者可以快速學習使用這幾個API播放視頻和音頻的技術。
1共包括了以下幾個子工程:
simplest_audio_play_directsound:
使用DirectSound播放PCM音頻采樣數據。
simplest_audio_play_sdl2: 使用SDL2播放PCM音頻采樣數據。simplest_video_play_direct3d:
使用Direct3D的Surface播放RGB/YUV視頻像素數據。
simplest_video_play_direct3d_texture:使用Direct3D的Texture播放RGB視頻像素數據。
simplest_video_play_gdi:
使用GDI播放RGB/YUV視頻像素數據。
simplest_video_play_opengl:
使用OpenGL播放RGB/YUV視頻像素數據。
simplest_video_play_opengl_texture:
使用OpenGL的Texture播放YUV視頻像素數據。
simplest_video_play_sdl2:
使用SDL2播放RGB/YUV視頻像素數據。
生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈