ISD4004在具有接近功能的立体声语音系统中的应用
发布时间:2008/6/5 0:00:00 访问次数:628
1 isd4004芯片简介
isd4004芯片采用cmos技术,内含振荡器、防混淆滤波器、平滑滤波器、音频放大器、自动降噪及高密度多电平闪烁存贮阵列。引脚包括电源、时钟、语音信号模拟输入/输出端及mcu接口(spi接口)几部分。芯片采用多级存储技术,即声音无须a/d转换和d/a转换,采用模拟量直接存储技术,因此能够真实、自然地再现声音。isd4004系列单片录放时间根据不同的采样频率可有8~16 min不等,采样频率可为4.0 khz,5.3 khz,6.4 khz,8.0 khz,采样频率越低,录放时间越长,但音质有所下降。芯片的所有操作必须由微控制器控制,操作命令可通过串行通信接口(spi)送入。spi协议是一个同步串行数据传输协议,协议假定微控制器的spi移位寄存器在sclk的下降沿动作,因此对isd4004而言,在时钟上升沿锁存mosi引脚的数据,在时钟下降沿将数据送至miso引脚。isd4004详细参数可参考文献[3]。
2 立体声录放原理
虽然isd4004采用的是模拟量直接存储技术,能够真实、自然地再现声音,但是要想不失真地再现原始语音信号,其采样频率也必须满足采样定理:当采样频率fs大于信号最高频率fm的2倍时,在采样过程中就不会丢失信息,并且可以用采样后的信号重构原始信号。即:fs>2fm(2fm为最小采样频率,亦为“奈奎斯特频率”)
实际的语音信号常有一些低能量的频率分量超过采样频率的一半,如浊音的频谱超过4 khz的分量比其峰值要低40 db以上;而对于清音,即使超过8 khz,频率分量也没有下降,因此语音信号所占的频率范围可以到达10 khz以上。然而对语音清晰度有明显影响部分的最高频率为5.7 khz左右。ccitt(国际电报电话咨询委员会)提出的g.711标准建议采用采样频率为8 khz。
isd4004-8m的采样率为8.0 khz,满足采样定理的频率标准,虽然录放时间较短但是音质较好,甚至可满足播放简单背景音乐的需求。立体声录放的实现采用两片isd4004-8m芯片构成,如图1所示。
工作原理为:将输入的双声道语音信号分为左右声道分别接入两片isd4004-8m芯片信号输入端,录音时由单片机发出让两片芯片同时录音的指令,进行同步录音,使得输入的信号在存储的时候就能保证其原有的声级差,从而达到了双声道录音的目的。放音时由单片机同时发出放音指令,两片芯片同时放音,因存储时信号原有声级差已经保存,所以放音时可再现原始的立体声,也可以在放音时对两个芯片发送放音指令的时间间隔进行操作,可达到调整立体声的效果。原文位置3 具有接近功能的立体声系统的硬件原理
该系统的硬件原理如图2所示,本系统的硬件主要由单片机mega8l,语音芯片isd4004-8m,被动式红外传感器等构成。图中pir(sensor)为两元被动红外热释电传感器,其输出信号连接到cpu的中断1的输入端,当有人接近时该传感器输出一个高电平信号,使得cpu进入中断,然后cpu再对isd4004进行放音操作,使isd4004输出已录制好的音频信号,再经过功率放大器放大后送入扬声器。两个按键tape,paly是进行录音和放音的人工操作按键,相应有两个指示灯进行状态指示。mega8l还通过控制继电器k1来控制音频信号功率放大器的供电,在长时间没有放音时将自动切断其供电,这样降低了系统的功耗,避免了功率放大器长时间通电。
由于该系统的硬件设计针对的是语音模拟信号,所以在设计的时候应该注意模拟地和数字地的隔离,特别是在isd4004芯片的引脚上,须注意不同的接地引脚接相应的地。录音时的输入信号如果是单声道的信号,应在录音时使得左右声道的输入端均接入该信号,并在对两个语音芯片发送录音指令时中间应有短时的时间间隔,可使得单声道产生一定的声级差,从而达到非立体声转换为立体声的效果。
4 软件设计
系统上电后先进行初始化,软件实现的基本操作有:
(1)tape为录音按键,play为放音测试按
1 isd4004芯片简介
isd4004芯片采用cmos技术,内含振荡器、防混淆滤波器、平滑滤波器、音频放大器、自动降噪及高密度多电平闪烁存贮阵列。引脚包括电源、时钟、语音信号模拟输入/输出端及mcu接口(spi接口)几部分。芯片采用多级存储技术,即声音无须a/d转换和d/a转换,采用模拟量直接存储技术,因此能够真实、自然地再现声音。isd4004系列单片录放时间根据不同的采样频率可有8~16 min不等,采样频率可为4.0 khz,5.3 khz,6.4 khz,8.0 khz,采样频率越低,录放时间越长,但音质有所下降。芯片的所有操作必须由微控制器控制,操作命令可通过串行通信接口(spi)送入。spi协议是一个同步串行数据传输协议,协议假定微控制器的spi移位寄存器在sclk的下降沿动作,因此对isd4004而言,在时钟上升沿锁存mosi引脚的数据,在时钟下降沿将数据送至miso引脚。isd4004详细参数可参考文献[3]。
2 立体声录放原理
虽然isd4004采用的是模拟量直接存储技术,能够真实、自然地再现声音,但是要想不失真地再现原始语音信号,其采样频率也必须满足采样定理:当采样频率fs大于信号最高频率fm的2倍时,在采样过程中就不会丢失信息,并且可以用采样后的信号重构原始信号。即:fs>2fm(2fm为最小采样频率,亦为“奈奎斯特频率”)
实际的语音信号常有一些低能量的频率分量超过采样频率的一半,如浊音的频谱超过4 khz的分量比其峰值要低40 db以上;而对于清音,即使超过8 khz,频率分量也没有下降,因此语音信号所占的频率范围可以到达10 khz以上。然而对语音清晰度有明显影响部分的最高频率为5.7 khz左右。ccitt(国际电报电话咨询委员会)提出的g.711标准建议采用采样频率为8 khz。
isd4004-8m的采样率为8.0 khz,满足采样定理的频率标准,虽然录放时间较短但是音质较好,甚至可满足播放简单背景音乐的需求。立体声录放的实现采用两片isd4004-8m芯片构成,如图1所示。
工作原理为:将输入的双声道语音信号分为左右声道分别接入两片isd4004-8m芯片信号输入端,录音时由单片机发出让两片芯片同时录音的指令,进行同步录音,使得输入的信号在存储的时候就能保证其原有的声级差,从而达到了双声道录音的目的。放音时由单片机同时发出放音指令,两片芯片同时放音,因存储时信号原有声级差已经保存,所以放音时可再现原始的立体声,也可以在放音时对两个芯片发送放音指令的时间间隔进行操作,可达到调整立体声的效果。原文位置3 具有接近功能的立体声系统的硬件原理
该系统的硬件原理如图2所示,本系统的硬件主要由单片机mega8l,语音芯片isd4004-8m,被动式红外传感器等构成。图中pir(sensor)为两元被动红外热释电传感器,其输出信号连接到cpu的中断1的输入端,当有人接近时该传感器输出一个高电平信号,使得cpu进入中断,然后cpu再对isd4004进行放音操作,使isd4004输出已录制好的音频信号,再经过功率放大器放大后送入扬声器。两个按键tape,paly是进行录音和放音的人工操作按键,相应有两个指示灯进行状态指示。mega8l还通过控制继电器k1来控制音频信号功率放大器的供电,在长时间没有放音时将自动切断其供电,这样降低了系统的功耗,避免了功率放大器长时间通电。
由于该系统的硬件设计针对的是语音模拟信号,所以在设计的时候应该注意模拟地和数字地的隔离,特别是在isd4004芯片的引脚上,须注意不同的接地引脚接相应的地。录音时的输入信号如果是单声道的信号,应在录音时使得左右声道的输入端均接入该信号,并在对两个语音芯片发送录音指令时中间应有短时的时间间隔,可使得单声道产生一定的声级差,从而达到非立体声转换为立体声的效果。
4 软件设计
系统上电后先进行初始化,软件实现的基本操作有:
(1)tape为录音按键,play为放音测试按