雷震春
- 作品数:28 被引量:32H指数:3
- 供职机构:江西师范大学计算机信息工程学院更多>>
- 发文基金:国家自然科学基金江西省教育厅科学技术研究项目江西省学位与研究生教育教学改革研究项目更多>>
- 相关领域:自动化与计算机技术电子电信文化科学动力工程及工程热物理更多>>
- 一种基于加权成对约束度量学习算法的说话人识别方法
- 本发明提供一种基于加权成对约束度量学习算法的说话人识别方法,该方法包括以下步骤:根据加权约束对度量学习算法(WPCML),最小化同类样本间距离,同时最大化非同类样本间距离,获得用于计算样本间马氏距离的半正定矩阵;根据半正...
- 雷震春杨印根朱明华
- 文献传递
- 多阶GMM-Res Net融合在语音伪造检测中的研究
- 2025年
- 近年来,自动说话人识别技术取得了显著进步,但同时也容易受到合成或转换语音的伪造攻击,语音伪造检测系统致力于解决这一问题。本文根据不同阶数GMM中高斯分量之间的相关性和ResNet模型中不同层次残差块输出的特征信息,提出了一种多阶GMM-ResNet融合模型进行语音伪造检测。该模型主要包含两部分:多阶对数高斯概率(Log Gaussian Probability, LGP)特征融合和多尺度特征聚合ResNet(Multi-Scale Feature Aggregation ResNet, MFA-ResNet)。GMM描述了语音特征在其空间的分布情况,不同阶数的GMM则具有不同描述能力来形成对特征分布的平滑近似。此外,根据不同阶数GMM计算出来的LGP特征也就在不同阶上捕获语音信息。多阶LGP特征融合将基于不同阶数的GMM得到的三种不同阶LGP特征进行加权融合,从而促进不同阶LGP特征之间的信息交换。另一方面,神经网络模型中第一层或中间层获得的特征信息对于分类任务也是非常有用的。基于这一经验, MFA-ResNet模块通过对每个ResNet块输出的特征进行聚合,充分融合网络内不同层级的特征信息,从而提高网络的特征提取能力。在ASVspoof 2019逻辑访问场景下, LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.0353和1.16%,比基线系统LFCC+GMM分别相对降低了83.3%和85.7%。在ASVspoof2021逻辑访问场景下,LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.2459和2.50%,比基线系统LFCC+GMM分别相对降低了57.3%和87.1%,比基线系统LFCC+LCNN分别相对降低了28.6%和73.0%。与目前最先进模型相比,本文模型也非常具有竞争力。
- 曹明明雷震春杨印根周勇
- 一种基于孪生卷积神经网络进行欺骗性语音检测的方法
- 本发明公开了一种基于孪生卷积神经网络进行欺骗性语音检测的方法,包括如下步骤:(1)提取语音的高斯概率特征:(a)对所有原始语音进行预处理;(b)对预处理后的语音进行CQCC特征提取;(c)对CQCC特征训练得到两个高斯混...
- 雷震春马明磊杨印根
- 文献传递
- 一种基于生成对抗网络过采样的网络入侵检测方法
- 本发明公开了一种基于生成对抗网络过采样的网络入侵检测方法,先选取网络入侵检测数据集中的主要特征,对主要特征进行数据预处理,得到训练集,再通过CGAN模型对训练集中的不平衡数据过采样,然后输入到网络入侵检测模型中进行训练,...
- 雷震春马明磊杨印根
- 文献传递
- 一种基于多路径网络的说话人确认欺骗检测方法
- 本申请提供一种基于多路径网络的说话人确认欺骗检测方法,包括:获取说话人真实语音数据和欺骗语音数据;采用编解码器对所获取的语音进行数据增强,提取所有语音数据的线性频率倒谱系数特征;将编解码方式不同的语音视为来自不同的域,用...
- 雷震春周勇
- 一种基于多尺度GMM-ResNet模型的语音伪造检测方法
- 本发明属于语音伪造检测技术领域,具体为一种基于多尺度GMM‑ResNet模型的语音伪造检测方法,获取说话人真实语音数据及伪造语音数据作为原始语音数据,多尺度GMM‑ResNet模型主要包含两部分:多尺度对数高斯概率特征融...
- 雷震春周勇马明磊
- 一种基于孪生卷积神经网络进行欺骗性语音检测的方法
- 本发明公开了一种基于孪生卷积神经网络进行欺骗性语音检测的方法,包括如下步骤:(1)提取语音的高斯概率特征:(a)对所有原始语音进行预处理;(b)对预处理后的语音进行CQCC特征提取;(c)对CQCC特征训练得到两个高斯混...
- 雷震春马明磊杨印根
- 一种概率序列核在说话人识别中的应用
- 2011年
- 以说话人识别中的背景模型为基础,根据模型中的各个高斯分量,构造出说话人特征空间,将长度不一样的语句映射成为空间中大小相同的向量,且经过相关矩阵进行规整后,采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式,结合语句映射后的向量,提出四种不同的规整方法:均值/方差规整、权重规整、WLOG规整和球形规整,并与概率序列核进行比较研究。根据语音特征向量序列中相邻的特征向量的前后转移关系,结合提出的概率序列核,构造出转移概率序列核。实验在NIST2001库上进行,结果表明概率序列核模型识别性能接近经典的UBM-MAP模型,将这两类模型得分进行融合,可非常明显地提高识别性能,进一步融合转移概率序列核后,性能还可提高19.1%。
- 雷震春
- 关键词:说话人识别支持向量机
- 基于内嵌GMM核的支持向量机模型的说话人识别方法
- 本发明涉及一种基于内嵌GMM核的支持向量机模型的说话人识别方法,首先对每个说话人的语音进行特征提取,然后根据每个说话人的语音训练得到一个高斯混合模型,根据此高斯混合模型,可以将一条语句映射到一个固定大小的高维向量上,并将...
- 杨莹春吴朝晖雷震春
- 文献传递
- 基于内嵌GMM核的支持向量机模型的说话人识别方法
- 本发明涉及一种基于内嵌GMM核的支持向量机模型的说话人识别方法,首先对每个说话人的语音进行特征提取,然后根据每个说话人的语音训练得到一个高斯混合模型,根据此高斯混合模型,可以将一条语句映射到一个固定大小的高维向量上,并将...
- 杨莹春吴朝晖雷震春
- 文献传递