重SD系列语音芯片开发平台的设计
发布时间:2008/5/28 0:00:00 访问次数:680
目前,市场上的语音芯片和语音板很多,从性能价格比上看,美国1sd公司的isd系列录放芯片可谓是一支独秀。1sd器件使用直接电平存储技术,省去了a/d、d/a转换;内部集成了大容量的eerpom,不再需要扩展存储器;控制简单,控制管脚与tfl电平兼容。具有集成度高、音质好、使用方便等优点,是一种理想的语音处理芯片。 在控制上,除去手动外,lsd器件也可以通过地址寻址来精确定位,但它的地址不是字节地址单元,而是信息段的基本组成单位。以isd2560为例,它内部的480kb的eeprom均匀地规划为600行,每个地址单元指向其中一行,有600个地址单元。isd2560的录放时间是60s,因此地址分辨率是100ms。lsd器件可进行多段地址操作,每一段称为一个信息段,它可以占用-行和多行存储空间。-个地址单元最多只能作为一个独立的段。因此,isd2560最多可以分为600个信息段m。
2当前isd芯片开发存在的问题
通常情况下,只能使用lsd器件提供的无需知道地址的操作模式,即手动模式,这只适合于开发语音玩具,而无法满足复杂操作或实时系统中应用的要求。为实现以上应用,最好使用对地址直接操作的办法。但在实用中,一些电路开发设计只是在基于语音信号已经写人芯片,并且段地址已经知道的基础上才能进行。然而,不可避免地要遇到必须将语音写入的时候。如果手动处理,采用按"录音"按键录音,"停止"按键停止,假如录音段数特别多,就要频繁地按上述按键,实在让人疲惫不堪。此外,手动按下"录音"及"停止"按键的时间也很难掌握,这就容易产生段间空白,造成芯片空间浪费,对语音段特别多,而语句又特别短的提示如一些单字、单词更是浪费严重。不仅这样,由于短句中空白时间过长,合成放音时出现语音不连贯。另外,直接对连接到1sd芯片的传声器录音会造成情绪紧张,容易出错,且无法对录入的语音进行高级处理。 3 解决方法
基于上述原因,需要设计一种lsd语音开发平台,借助传声器通过计算机的声卡将所有待写语音信号一并录入计算机,存储为*.wav文件,然后利用声音剪辑软件将各个词语(短句)分离出来。因为如果不是同时录音的话,对同一个人来说,其声音在不同时间、不同场合、不同情绪时都会有着很大的差别。如电子体重计,"您的体重是五十一公斤,您的身高是一百七十二厘米",应该是由"您的、体重、身高、是、公斤、厘米、五、十、一、百、七、二"等12个词合成后形成的,如果由于某种原因,引起了任何一个词与其它语调不同,提示时就会显得特别突出,听起来有种怪怪的感觉。
若用计算机录音,可以一并录入很多段话(并非一定是全部需要的),然后从中选出所需词语(短句)。因为这些话是在较短的时间内完成的,所以不会有很大的语调变化,将从中选出的词组合起来时也不会显得牵强,听起来感觉不到这些句子是由词语拼凑起来的。
除此之外,如果有专业语音库,还可以直接从其中抽出词语来组成所需的句子,并且还省去了请专业录音人员的开支。这样还有一个好处是修改方便,因为当需要修改句子内容时,恰巧已经录过的句子中并没有这样的词语,则还必须请录音员重录一次,这不但增加了额外的开支,还由于时间过了较久,录音员的语调同原来相比肯定会有些变化,所以原来的录音只能全部作废,所有的一切都要从头开始。
综上所述,采用计算机来分析组合以及剪辑语音的好处是处理直观、修改方便,语句连续性强,合成的句子更具有人性化。
不仅如此,采用该开发平台,还可直观地看出每个语句的详细信息,包括:开始地址、结束地址、语句所用时间、语句所占用芯片行的段数等对使用该语音芯片时碰到的比较敏感的信息。
为此,设计整个开发平台的结构框图如图1所示。
系统工作方式如下:首先,通过传声器将相关的大段语句经计算机声卡录制成为*,way文件并保存,然后借助于语音处理软件如cooledit剪辑出需要的单词(或短句)并去掉头尾的空白,将剪辑过的单词(或短句)每段都单独另存为新的·.wav文件,并把它们全部放人一个单独目录。启动1sd编程烧录器上位机开发软件,选中所有的待录*.wav文件,并点"开始烧录",所有过程将会自动完成。烧录结束后会有提示,并且自动记录一份工作信息表,包括工作时间、语音文件数、录音总时间、每一段语音在lsd芯片中的起始地址及结束地址,其占用时间等。有了这些数据,就可以较方便地修改甚至对某些地方重新录制。将录制过的芯片及各段语音的起始地址表交给其它下位机程序员,他们就可以利用单片机或dsp等控制器来随心所欲地开发相应的语音提示设备了。
4 -f位机软硬件
下位机硬件应包括
目前,市场上的语音芯片和语音板很多,从性能价格比上看,美国1sd公司的isd系列录放芯片可谓是一支独秀。1sd器件使用直接电平存储技术,省去了a/d、d/a转换;内部集成了大容量的eerpom,不再需要扩展存储器;控制简单,控制管脚与tfl电平兼容。具有集成度高、音质好、使用方便等优点,是一种理想的语音处理芯片。 在控制上,除去手动外,lsd器件也可以通过地址寻址来精确定位,但它的地址不是字节地址单元,而是信息段的基本组成单位。以isd2560为例,它内部的480kb的eeprom均匀地规划为600行,每个地址单元指向其中一行,有600个地址单元。isd2560的录放时间是60s,因此地址分辨率是100ms。lsd器件可进行多段地址操作,每一段称为一个信息段,它可以占用-行和多行存储空间。-个地址单元最多只能作为一个独立的段。因此,isd2560最多可以分为600个信息段m。
2当前isd芯片开发存在的问题
通常情况下,只能使用lsd器件提供的无需知道地址的操作模式,即手动模式,这只适合于开发语音玩具,而无法满足复杂操作或实时系统中应用的要求。为实现以上应用,最好使用对地址直接操作的办法。但在实用中,一些电路开发设计只是在基于语音信号已经写人芯片,并且段地址已经知道的基础上才能进行。然而,不可避免地要遇到必须将语音写入的时候。如果手动处理,采用按"录音"按键录音,"停止"按键停止,假如录音段数特别多,就要频繁地按上述按键,实在让人疲惫不堪。此外,手动按下"录音"及"停止"按键的时间也很难掌握,这就容易产生段间空白,造成芯片空间浪费,对语音段特别多,而语句又特别短的提示如一些单字、单词更是浪费严重。不仅这样,由于短句中空白时间过长,合成放音时出现语音不连贯。另外,直接对连接到1sd芯片的传声器录音会造成情绪紧张,容易出错,且无法对录入的语音进行高级处理。 3 解决方法
基于上述原因,需要设计一种lsd语音开发平台,借助传声器通过计算机的声卡将所有待写语音信号一并录入计算机,存储为*.wav文件,然后利用声音剪辑软件将各个词语(短句)分离出来。因为如果不是同时录音的话,对同一个人来说,其声音在不同时间、不同场合、不同情绪时都会有着很大的差别。如电子体重计,"您的体重是五十一公斤,您的身高是一百七十二厘米",应该是由"您的、体重、身高、是、公斤、厘米、五、十、一、百、七、二"等12个词合成后形成的,如果由于某种原因,引起了任何一个词与其它语调不同,提示时就会显得特别突出,听起来有种怪怪的感觉。
若用计算机录音,可以一并录入很多段话(并非一定是全部需要的),然后从中选出所需词语(短句)。因为这些话是在较短的时间内完成的,所以不会有很大的语调变化,将从中选出的词组合起来时也不会显得牵强,听起来感觉不到这些句子是由词语拼凑起来的。
除此之外,如果有专业语音库,还可以直接从其中抽出词语来组成所需的句子,并且还省去了请专业录音人员的开支。这样还有一个好处是修改方便,因为当需要修改句子内容时,恰巧已经录过的句子中并没有这样的词语,则还必须请录音员重录一次,这不但增加了额外的开支,还由于时间过了较久,录音员的语调同原来相比肯定会有些变化,所以原来的录音只能全部作废,所有的一切都要从头开始。
综上所述,采用计算机来分析组合以及剪辑语音的好处是处理直观、修改方便,语句连续性强,合成的句子更具有人性化。
不仅如此,采用该开发平台,还可直观地看出每个语句的详细信息,包括:开始地址、结束地址、语句所用时间、语句所占用芯片行的段数等对使用该语音芯片时碰到的比较敏感的信息。
为此,设计整个开发平台的结构框图如图1所示。
系统工作方式如下:首先,通过传声器将相关的大段语句经计算机声卡录制成为*,way文件并保存,然后借助于语音处理软件如cooledit剪辑出需要的单词(或短句)并去掉头尾的空白,将剪辑过的单词(或短句)每段都单独另存为新的·.wav文件,并把它们全部放人一个单独目录。启动1sd编程烧录器上位机开发软件,选中所有的待录*.wav文件,并点"开始烧录",所有过程将会自动完成。烧录结束后会有提示,并且自动记录一份工作信息表,包括工作时间、语音文件数、录音总时间、每一段语音在lsd芯片中的起始地址及结束地址,其占用时间等。有了这些数据,就可以较方便地修改甚至对某些地方重新录制。将录制过的芯片及各段语音的起始地址表交给其它下位机程序员,他们就可以利用单片机或dsp等控制器来随心所欲地开发相应的语音提示设备了。
4 -f位机软硬件
下位机硬件应包括
热门点击
推荐技术资料
| |