李楠 (Li Nan)

天津师范大学 讲师

关于我

我是天津师范大学的讲师。我于天津大学获得计算机科学与技术博士学位(2020.9-2025.3),师从王龙标教授和党建武教授。我的研究专注于语音信号处理领域,包括语音增强、语音分离、语音识别、语音端点检测等方向。曾在日本北陆先端科学技术大学院大学(JAIST)和新加坡国立大学进行联合培养,拥有丰富的国际研究经验。

研究方向

语音增强 语音分离 声学 语音端点检测 语音识别 语音大模型 麦克风阵列 深度学习 听觉感知

教育经历

博士 - 计算机科学与技术

天津大学 | 2020.9 - 2025.3
研究方向:语音增强 | 学位:博士
导师:王龙标 & 党建武

联合培养博士

新加坡国立大学 (National University of Singapore) | 2023.11 - 2024.11
天津大学和新加坡国立大学联合培养博士生(国家留学基金委奖学金)
导师:Haizhou Li (IEEE Fellow) & 王龙标 & 党建武

硕士 - 计算机技术

天津大学 | 2017.9 - 2020.6
研究方向:远场语音识别 | 学位:工学硕士
导师:王龙标 & 党建武

硕士 - 情报学系(计算机)/UNOKI-研

日本北陆先端科学技术大学院大学 (JAIST) | 2019.4 - 2020.4
天津大学双学位项目 | 研究方向:语音端点检测 | 学位:理学硕士
导师:Masashi Unoki & Masato Akagi

本科 - 电子信息科学与技术

山东理工大学 | 2012.9 - 2016.9
学位:工学学士

发表论文

期刊论文 (Journal Papers)

中科院 1 区 Top

Dual-stream Noise and Speech Information Perception based Speech Enhancement

Li, Nan, Ge, M., Wang, L., & Dang, J.
Expert Systems With Applications (ESWA), 2024
中科院 2 区 · 语音顶级期刊 · CCF-B

Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network

Li Nan, Wang L, Ge M, et al.
Speech Communication, 2024, 157: 103024
中科院 2 区 · 语音顶级期刊 · CCF-B

HC-APNet: Harmonic Compensation Auditory Perception Network for Low-complexity Speech Enhancement

Li Nan, Wang L, Ge M, et al.
Speech Communication, 2024

会议论文 (Conference Papers)

CCF-B

Speech and noise dual-stream spectrogram refine network with speech distortion loss for robust speech recognition

Lu Haoyu, Li Nan*, Song T, et al.
ICASSP 2023
CCF-B

Robust Voice Activity Detection Using a Masked Auditory Encoder Based Convolutional Neural Network

Li, Nan, Wang, L., Unoki, M., Li, S., Wang, R., Ge, M., & Dang, J.
ICASSP 2021, pp. 6828-6832
CCF-B

Global Signal-to-noise Ratio Estimation Based on Multi-subband Processing Using Convolutional Neural Network

Li, Nan, Ge, M., Wang, L., Unoki, M., Li, S., & Dang, J.
INTERSPEECH 2022
CCF-C

A Fast Convolutional Self-attention Based Speech Dereverberation Method for Robust Speech Recognition

Li, Nan, Ge, M., Wang, L., & Dang, J.
ICONIP, pp. 295-305
CCF-C

Dual-stream Speech Dereverberation Network Using Long-term and Short-term Cues

Li, Nan, Ge, M., Wang, L., & Dang, J.
IJCNN 2022, pp. 1-5
CCF-B

Svad: A robust, low-power, and light-weight voice activity detection with spiking neural networks

Yang Q, Liu Q, Li Nan, et al.
ICASSP 2024, pp. 221-225

📚 最新发表论文

我的研究论文在Google Scholar上持续更新

🔗 在 Google Scholar 查看所有论文

包括 Expert Systems With Applications、Speech Communication、ICASSP、INTERSPEECH 等期刊和会议论文

专利

一种基于听觉感知的低复杂度语音增强方法

专利号:CN117219102A
发明人:王龙标, 李楠, 党建武

基于听觉滤波器组和卷积神经网络的全局信噪比估计方法

专利号:CN112885375A
发明人:王龙标, 李楠, 党建武

基于生成对抗网络的深度特征的语音去混响方法

专利号:CN109887489B
发明人:王龙标, 李楠, 党建武

一种利用 CNN 的 U-NET 结构进行远场语音去混响的方法

专利号:CN109949821B
发明人:李楠, 关波

荣誉奖项

审稿人经历

🔍 同行评审服务

我定期担任语音处理、信号处理和机器学习领域顶级期刊和会议的审稿人。 我的审稿工作有助于维护这些领域学术研究的质量和完整性。

IEEE Transactions on Neural Networks and Learning Systems (TNNLS)
IEEE
神经网络与深度学习
Speech Communication
Elsevier
语音处理与声学
INTERSPEECH
ISCA
语音通信与技术

审稿统计

50+
审稿论文数量
3
期刊/会议数量
2
活跃年限

参与项目

... 总访问量
... 独立访客
... 本页浏览

🗺️ 访客地理位置

📍 实时访客位置追踪(最近50位访客)