李楠 - 语音处理研究员

关于我

我是天津师范大学的讲师。我于天津大学获得计算机科学与技术博士学位（2020.9-2025.3），师从王龙标教授和党建武教授。我的研究专注于语音信号处理领域，包括语音增强、语音分离、语音识别、语音端点检测等方向。曾在日本北陆先端科学技术大学院大学（JAIST）和新加坡国立大学进行联合培养，拥有丰富的国际研究经验。

研究方向

语音增强语音分离声学语音端点检测语音识别语音大模型麦克风阵列深度学习听觉感知

教育经历

博士 - 计算机科学与技术

天津大学 | 2020.9 - 2025.3

研究方向：语音增强 | 学位：博士

导师：王龙标 & 党建武

联合培养博士

新加坡国立大学 (National University of Singapore) | 2023.11 - 2024.11

天津大学和新加坡国立大学联合培养博士生（国家留学基金委奖学金）

导师：Haizhou Li (IEEE Fellow) & 王龙标 & 党建武

硕士 - 计算机技术

天津大学 | 2017.9 - 2020.6

研究方向：远场语音识别 | 学位：工学硕士

导师：王龙标 & 党建武

硕士 - 情报学系（计算机）/UNOKI-研

日本北陆先端科学技术大学院大学 (JAIST) | 2019.4 - 2020.4

天津大学双学位项目 | 研究方向：语音端点检测 | 学位：理学硕士

导师：Masashi Unoki & Masato Akagi

本科 - 电子信息科学与技术

山东理工大学 | 2012.9 - 2016.9

学位：工学学士

发表论文

期刊论文 (Journal Papers)

中科院 1 区 Top

Dual-stream Noise and Speech Information Perception based Speech Enhancement

Li, Nan, Ge, M., Wang, L., & Dang, J.

Expert Systems With Applications (ESWA), 2024

中科院 2 区 · 语音顶级期刊 · CCF-B

Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network

Li Nan, Wang L, Ge M, et al.

Speech Communication, 2024, 157: 103024

中科院 2 区 · 语音顶级期刊 · CCF-B

HC-APNet: Harmonic Compensation Auditory Perception Network for Low-complexity Speech Enhancement

Li Nan, Wang L, Ge M, et al.

Speech Communication, 2024

会议论文 (Conference Papers)

CCF-B

Speech and noise dual-stream spectrogram refine network with speech distortion loss for robust speech recognition

Lu Haoyu, Li Nan*, Song T, et al.

ICASSP 2023

CCF-B

Robust Voice Activity Detection Using a Masked Auditory Encoder Based Convolutional Neural Network

Li, Nan, Wang, L., Unoki, M., Li, S., Wang, R., Ge, M., & Dang, J.

ICASSP 2021, pp. 6828-6832

CCF-B

Global Signal-to-noise Ratio Estimation Based on Multi-subband Processing Using Convolutional Neural Network

Li, Nan, Ge, M., Wang, L., Unoki, M., Li, S., & Dang, J.

INTERSPEECH 2022

CCF-C

A Fast Convolutional Self-attention Based Speech Dereverberation Method for Robust Speech Recognition

Li, Nan, Ge, M., Wang, L., & Dang, J.

ICONIP, pp. 295-305

CCF-C

Dual-stream Speech Dereverberation Network Using Long-term and Short-term Cues

Li, Nan, Ge, M., Wang, L., & Dang, J.

IJCNN 2022, pp. 1-5

CCF-B

Svad: A robust, low-power, and light-weight voice activity detection with spiking neural networks

Yang Q, Liu Q, Li Nan, et al.

ICASSP 2024, pp. 221-225

📚 最新发表论文

我的研究论文在Google Scholar上持续更新

🔗 在 Google Scholar 查看所有论文

包括 Expert Systems With Applications、Speech Communication、ICASSP、INTERSPEECH 等期刊和会议论文

专利

一种基于听觉感知的低复杂度语音增强方法

专利号：CN117219102A

发明人：王龙标, 李楠, 党建武

基于听觉滤波器组和卷积神经网络的全局信噪比估计方法

专利号：CN112885375A

发明人：王龙标, 李楠, 党建武

基于生成对抗网络的深度特征的语音去混响方法

专利号：CN109887489B

发明人：王龙标, 李楠, 党建武

一种利用 CNN 的 U-NET 结构进行远场语音去混响的方法

专利号：CN109949821B

发明人：李楠, 关波

荣誉奖项

2023 Intel Neuromorphic Deep Noise Suppression Challenge Top 2
2023 China Scholarship Council (CSC)
2022 Audio Deep Synthesis Detection (ADD) Challenge Top 4
2019 IFly Dialect Recognition Challenge Algorithm Elite Award
- -

审稿人经历

🔍 同行评审服务

我定期担任语音处理、信号处理和机器学习领域顶级期刊和会议的审稿人。我的审稿工作有助于维护这些领域学术研究的质量和完整性。

IEEE Transactions on Neural Networks and Learning Systems (TNNLS)

IEEE

神经网络与深度学习

Speech Communication

Elsevier

语音处理与声学

INTERSPEECH

ISCA

语音通信与技术

审稿统计

50+

审稿论文数量

3

期刊/会议数量

2

活跃年限

参与项目

国家重点研发计划"智能机器人"专项 (No. 2018YFB1305200)

参与人

2019年6月 - 2022年5月

基于语言认知机制的类脑自然语言识别与交互研究
国家自然科学基金面上项目 (No. 62176182)

参与人

2022年1月 - 2025年12月

复杂场景下的声纹识别与反欺诈研究
国家自然科学基金面上项目 (No. 61771333)

参与人

2018年1月 - 2021年12月

混响环境下的多口音语音识别研究
天津市科技重大专项 (No. 18ZXZNGX00330)

参与人

2018年10月 - 2021年9月

复杂环境下机器人语音对话关键技术及系统实现
华为横向项目 - 华为智能音幕

参与人

2021年7月 - 2022年6月
新大陆横向项目 - 鲁棒性语音识别和声纹识别研究

参与人

2021年8月 - 2022年7月
滴滴出行横向项目 - 基于分布式麦克风的语音增强方法

参与人

2021年11月 - 2022年10月

关于我

研究方向

教育经历

博士 - 计算机科学与技术

联合培养博士

硕士 - 计算机技术

硕士 - 情报学系（计算机）/UNOKI-研

本科 - 电子信息科学与技术

发表论文

期刊论文 (Journal Papers)

Dual-stream Noise and Speech Information Perception based Speech Enhancement

Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network

HC-APNet: Harmonic Compensation Auditory Perception Network for Low-complexity Speech Enhancement

会议论文 (Conference Papers)

Speech and noise dual-stream spectrogram refine network with speech distortion loss for robust speech recognition

Robust Voice Activity Detection Using a Masked Auditory Encoder Based Convolutional Neural Network

Global Signal-to-noise Ratio Estimation Based on Multi-subband Processing Using Convolutional Neural Network

A Fast Convolutional Self-attention Based Speech Dereverberation Method for Robust Speech Recognition

Dual-stream Speech Dereverberation Network Using Long-term and Short-term Cues

Svad: A robust, low-power, and light-weight voice activity detection with spiking neural networks

📚 最新发表论文

专利

一种基于听觉感知的低复杂度语音增强方法

基于听觉滤波器组和卷积神经网络的全局信噪比估计方法

基于生成对抗网络的深度特征的语音去混响方法

一种利用 CNN 的 U-NET 结构进行远场语音去混响的方法

荣誉奖项

审稿人经历

🔍 同行评审服务

审稿统计

参与项目

国家重点研发计划"智能机器人"专项 (No. 2018YFB1305200)

国家自然科学基金面上项目 (No. 62176182)

国家自然科学基金面上项目 (No. 61771333)

天津市科技重大专项 (No. 18ZXZNGX00330)

华为横向项目 - 华为智能音幕

新大陆横向项目 - 鲁棒性语音识别和声纹识别研究

滴滴出行横向项目 - 基于分布式麦克风的语音增强方法

🗺️ 访客地理位置