电视机智能声控选台系统设计与实现
发布时间:2008/6/5 0:00:00 访问次数:407
摘 要: 介绍了一种基于专用语音识别芯片tsg410的彩电智能声控选台系统,可以在不对彩电做任何改动的基础上,实现语音遥控电视机。 关键词: 语音识别 彩电遥控 智能声控选
|
随着电视频道数目的日益增多,传统的电视遥控方法弊端越来越明显。它需要观众记忆大量电视台对应频道,这是件很令人头疼的事情。我们利用专用语音识别芯片tsg410设计了一个彩电智能声控选台系统,可以较好地解决记忆频道这个难题。尤其对残疾朋友来讲,更具有特殊的意义。
该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有: ·开关电视:电视接通电源处于待命状态,操作者发出"开机"命令,则打开电视机;操作者发出"关机"命令,则关掉电视机; ·选台功能:操作者想看xx电视台的节目,只要发出"xx台"的命令,电视机自动跳转到该台。 ·识别主人功能:为防止误操作,该系统只对事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。 ·其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。
|
1 系统设计方案 我们最初考虑了两种设计方案(见图1和图2),它们各有优缺点。第一种电路不足之处是:电路稍复杂一点,而且要对电视机的选台控制电路做必要的改动(当然这对电视机生产厂家是不成问题的);其优点是:只需一个无线话筒便可声控选台,且不必对准电视机,甚至在另一个房间也可实现遥控。第二种电路的优点是:不必对电视机的选台控制电路做任何的改动;缺点是:所有电路只能靠电池供电,芯片选择要考虑耗电和工作电压问题。由于采用红外遥控发射来控制电视,该系统须对准电视机才能正常工作。综合考虑各方面因素,我们认为第二种设计方案较切实可行。 |
|
|
2 各个功能模块简介 2.1 语音命令提取单元 语音命令提取该单元(如图2)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。 |
|
mic选用驻极体送话器,它具有结构简单、重量轻、体积小、频率响应宽、保真度好等优点,但灵敏度较低,必须再加放大器才行。由于输出阻抗可高达108ω数量级,所以必须进行阻抗变换后才能与放大器配合使用。放大器采用差分放大电路,一个驻极体送话器面对送话者,其输出接放大器正向输入端;另一个驻极体送话器背对送话者,其输出接放大器负向输入端。由于两个送话器相对于电视机和其它噪声源的位置基本一样远,可以近似认为通过二者输入的干扰是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。放大器采用运放(op ampsmax495单电源供电+2.7v~+6v)。 2.2 语音识别单元 语音识别单元主要由tsg410和非易失性sram组成,大体构成如下图4所示。
|
|
语音识别功能由专用语音芯片tsg410完成,tsg410是一种新颖功能齐全的语音识别集成电路。它采用cmos大规模集成电路制作工艺制造,内含除sram以外语音识别所需的全部电路,如cpu、a/d转换器、rom、语音放大器、压缩器、滤波器、振荡器及接口电路等。tsg410具有双列直插和贴片两种封装方式,可工作在cpu控制和人工控制两种模式下。语音识别的响应时间典型值为300ms,最长不超过600ms。 识别容量大,最多可识别40个字段,且分段方式灵活。为了cpu管理方便,将40个字段分成四组,编号为1~4,每组10个字段。这样,第一个字段编号为10,第二个为11,第三个为12…依次类推,第40个字段编号为49。在操作显示时,十位数显示组号,个位数显示序号。因此,建立语音样本时,应注意显示数字和电视机选择频率之间的换算关系,以免语音命令和控制结果对应不起来。各段功能分配如表1所示。 |
|
人数扩展方式满足各种需要,也可以采用让tsg410工作在cpu控制方式的办法。此时识别容量不受40字段限制,但需增加单片机(如8031)作控制用。 2.3 控制面板 为了能输入字段号,以便建立语音样本,tsg410配置了外接
摘 要: 介绍了一种基于专用语音识别芯片tsg410的彩电智能声控选台系统,可以在不对彩电做任何改动的基础上,实现语音遥控电视机。 关键词: 语音识别 彩电遥控 智能声控选
|
随着电视频道数目的日益增多,传统的电视遥控方法弊端越来越明显。它需要观众记忆大量电视台对应频道,这是件很令人头疼的事情。我们利用专用语音识别芯片tsg410设计了一个彩电智能声控选台系统,可以较好地解决记忆频道这个难题。尤其对残疾朋友来讲,更具有特殊的意义。
该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有: ·开关电视:电视接通电源处于待命状态,操作者发出"开机"命令,则打开电视机;操作者发出"关机"命令,则关掉电视机; ·选台功能:操作者想看xx电视台的节目,只要发出"xx台"的命令,电视机自动跳转到该台。 ·识别主人功能:为防止误操作,该系统只对事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。 ·其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。
|
1 系统设计方案 我们最初考虑了两种设计方案(见图1和图2),它们各有优缺点。第一种电路不足之处是:电路稍复杂一点,而且要对电视机的选台控制电路做必要的改动(当然这对电视机生产厂家是不成问题的);其优点是:只需一个无线话筒便可声控选台,且不必对准电视机,甚至在另一个房间也可实现遥控。第二种电路的优点是:不必对电视机的选台控制电路做任何的改动;缺点是:所有电路只能靠电池供电,芯片选择要考虑耗电和工作电压问题。由于采用红外遥控发射来控制电视,该系统须对准电视机才能正常工作。综合考虑各方面因素,我们认为第二种设计方案较切实可行。 |
|
|
2 各个功能模块简介 2.1 语音命令提取单元 语音命令提取该单元(如图2)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。 |
|
mic选用驻极体送话器,它具有结构简单、重量轻、体积小、频率响应宽、保真度好等优点,但灵敏度较低,必须再加放大器才行。由于输出阻抗可高达108ω数量级,所以必须进行阻抗变换后才能与放大器配合使用。放大器采用差分放大电路,一个驻极体送话器面对送话者,其输出接放大器正向输入端;另一个驻极体送话器背对送话者,其输出接放大器负向输入端。由于两个送话器相对于电视机和其它噪声源的位置基本一样远,可以近似认为通过二者输入的干扰是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。放大器采用运放(op ampsmax495单电源供电+2.7v~+6v)。 2.2 语音识别单元 语音识别单元主要由tsg410和非易失性sram组成,大体构成如下图4所示。
|
|
语音识别功能由专用语音芯片tsg410完成,tsg410是一种新颖功能齐全的语音识别集成电路。它采用cmos大规模集成电路制作工艺制造,内含除sram以外语音识别所需的全部电路,如cpu、a/d转换器、rom、语音放大器、压缩器、滤波器、振荡器及接口电路等。tsg410具有双列直插和贴片两种封装方式,可工作在cpu控制和人工控制两种模式下。语音识别的响应时间典型值为300ms,最长不超过600ms。 识别容量大,最多可识别40个字段,且分段方式灵活。为了cpu管理方便,将40个字段分成四组,编号为1~4,每组10个字段。这样,第一个字段编号为10,第二个为11,第三个为12…依次类推,第40个字段编号为49。在操作显示时,十位数显示组号,个位数显示序号。因此,建立语音样本时,应注意显示数字和电视机选择频率之间的换算关系,以免语音命令和控制结果对应不起来。各段功能分配如表1所示。 |
|
人数扩展方式满足各种需要,也可以采用让tsg410工作在cpu控制方式的办法。此时识别容量不受40字段限制,但需增加单片机(如8031)作控制用。 2.3 控制面板 为了能输入字段号,以便建立语音样本,tsg410配置了外接
热门点击
推荐技术资料
| |