教育教学

相关链接:

教室安排

课程信息

当前位置: 首页 > 教育教学 > 研究生教育 > 课程信息

语音信号处理  101M4007H

学期:2016-2017学年秋 | 课程属性:专业核心课 | 任课教师:颜永红等
课程编号: 101M4007H 课时: 50 学分: 3.0
课程属性: 专业核心课 主讲教师:颜永红等
英文名称: Speech signal processing

教学目的、要求

本课程为电子信息学科研究生的学科基础课。本课程以数字信号处理和信号与线性系统为基础,重点讲述面向语音信号处理的基础理论和方法及应用,包括:语音生成与听觉感知、语音信号分析基础理论与方法、语音信号处理的典型应用(语音识别、语音增强、声源定位、音频水印等)内容。

预修课程

数字信号处理、信号与线性系统

教 材

[1] Discrete-Time Speech Signal Processing: Principles and Practices, Thomas F. Quatieri, Cloth, 816 pp. ISBN: 013242942X Published, 2001 [2] A Guide to Speech Production and Perception, Mark Tatham and Katherine Morton, Edinburgh University Press Ltd.

主要内容

第一章	课程介绍
语音信号处理的发展历史
语音信号处理的主要研究内容及其应用前景
语音信号处理的新发展
第二章	语音生成与听觉感知
语音生成机理及模型
语音听觉感知机理及模型
第三章	语音信号短时分析方法
语音信号短时分析基础
语音信号时域短时分析方法
语音信号频域短时分析方法
第四章	语音信号线性预测
语音信号的生成的全极点建模
线性预测系数的求解
第五章	多源语音信号分离
多源语音场景的建模
多源信号的解混响
基于独立成份分析的分离方法
基于非负矩阵分解的分离方法
第六章	多源语音定位
多源语音定位的基本模型
宽带信号的定位方法
基于语音稀疏特性的定位方法
第七章	语音活动性检测方法
语音活动性检测的基本假设与模型
语音活动检测的常用声学特征
基于统计模型的检测方法
基于DNN的活动检测方法
第八章	语音增强原理与应用
语音增强基础理论
单通道语音增强
多通道语音增强
第九章	三维音频原理与应用
空间听觉感知基础
三维音频技术及应用
第十章	语音识别基础原理及应用
瘾马尔可夫模型
声学模型
语言模型
解码
第十一章	说话人识别与语种识别
说话人和语种识别的背景和相关评测介绍
说话人识别原理和系统
语种识别原理和系统
第十二章	深度神经网络在语音处理中的应用
深度神经网络的bp算法,拓扑结构等基本原理
深度神经网络的最新研究进展
语音处理领域的应用
第十三章	音频水印技术与应用
数字水印系统基本概念
数字水印系统的应用和挑战
数字水印的通信模型
数字水印算法分类简介
第十四章	音乐信号处理基础
音乐信号处理中的时频分析方法
音符起始点检测方法
复音音乐的自动记谱

参考文献

[1]	The Speech Chain: The Physics and Biology of Spoken Language, Peter B. Denes, Elliot N. Pinson, W.H. Freeman and Company, 2nd edition, 1993.
[2]	Fundamentals of Speech Recognition, L. Rabiner and B. Juang, Prentice-Hall SignalProcessing Series, Pages: 507, Year of Publication: 1993, ISBN:0-13-015157-2
[3]	Tatham, M. & Morton, K. (2005). Developments in speech synthesis. Chichester: John Wiley & Sons.
[4]	Speech Enhancement (Signals and Communication Technology), Jacob Benesty, Jingdong Chen, Shoji Makino, ISBN: 3642063179, Springer, 2010 
[5]	Digital Signal Processing, John G. Proakis, Dimitris G. Manolakis, Prentice Hall of India Private Limited, 2007 

授课时间: 星期四, 第5、6、7节
授课地点: 学2-304
授课周次: 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20

版权所有©中国科学院大学

地址:北京市怀柔区雁栖湖东路1号 邮编:101408