米吉提·阿不里米提
- 作品数:23 被引量:39H指数:4
- 供职机构:新疆大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划新疆维吾尔自治区高校科研计划更多>>
- 相关领域:自动化与计算机技术电子电信语言文字理学更多>>
- 不同水平的普通话学习者单字调声调感知研究被引量:7
- 2020年
- 首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名不同水平学习者对普通话声调学习的感知情况。按学习者对汉语9个单元音的4个声调感知和12个复合元音的4个声调的单字调辨认,以及阳平-上声的区分实验数据,统计学习者的辨认准确率、各调类的偏误率和反应时间,最后利用SPSS数据分析软件从统计的角度进行了辨认准确率和反应时间的相关性分析,分别对声调感知的准确率和反应时间的显著性差异进行检验。
- 帕丽扎提·克依木古力努尔·艾尔肯米吉提·阿不里米提艾斯卡尔·艾木都拉
- 关键词:声调感知单字调偏误分析
- 维-哈-柯多语言词素切分集成环境研究被引量:1
- 2020年
- 开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带来了巨大便利。系统基于词-词素平行语料库,从语音、词素、词以及句子等多个层面出发,对3种派生类黏着性语言进行声学和形态分析层面的分析,将繁杂的归一化、单元切分等工作集成到一个工程内。系统在语言和功能上可扩展,可嵌入独立的统计模型,对维-哈-柯语的词素切分准确率分别达到96%、92%和88%。
- 穆凯代姆罕·伊敏江沙尔旦尔·帕尔哈提艾斯卡尔·艾木都拉米吉提·阿不里米提
- 关键词:多语言形态学词干提取
- 资源匮乏多语言的语种辨识技术研究
- 2022年
- 针对现有的语种识别方法对资源丰富、同语系语言的研究较为密集,而对资源匮乏、跨语系语言的研究较少等问题,通过对MFCC、FBank、语谱图等多个特征以及CNN、GRU等多个模型的研究对比,提出了一种基于语谱图特征的CNN-BiGRU的语种识别模型。模型提取语音数据的语谱图,采用卷积网络获取语谱图的视觉特征;通过双向门控循环网络获取时序信息特征;使用全连接网络输出语言种类,实现了资源匮乏、同语系语言以及跨语系多语言的语种识别。在东方语种数据集上进行实验,获得了良好的结果并验证了该方法的有效性。
- 毛雪丽米吉提·阿不里米提艾斯卡尔·艾木都拉
- 关键词:语种识别语谱图资源匮乏多语言
- 基于不同单元的端到端语音识别被引量:1
- 2024年
- 端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序分类(CTC)的基础上,实现维吾尔语不同粒度的端到端的语音识别系统,且在较少的语料库(THUYG公开语料库)上将该方法和传统的HMM语音识别框架进行比较。单音素基础上端到端方法的表现超过传统HMM-GMM框架,CER下降10.6%,而且经过稍微减少冗余后的以单字符作为建模单元的端到端语音识别系统对比基于三音素的HMM-GMM系统CER下降2.23%。对于资源匮乏语言,粒度单元的优化方法将是提高性能的下一个研究目标。
- 张岩艾斯卡尔·艾木都拉米吉提·阿不里米提
- 关键词:语音识别维吾尔语
- 词干单元和卷积神经网络的哈萨克短文本分类被引量:1
- 2020年
- 针对哈萨克文本分类中词干提取效率低以及传统框架下特征表示维度高、数据稀疏、分类准确率不高等问题,提出基于哈萨克语形态分析的词干提取方法以及wor2vec_TFIDF融合特征表示和卷积神经网络(CNN)的哈萨克短文本分类方法.首先,根据哈萨克语的词素和语音规则,用词-词素平行训练语料训练高效词干提取模型,并用该模型从网上下载的哈萨克短文本中提取词干.其次,用word2vec算法训练词干向量来分布式地表示文本内容,再用TFIDF算法对其进行加权.最后,用CNN进行文本分类实验,得到95.39%的分类准确率.实验结果表明,稳健词素切分及加权词干向量表示和深度学习方法相比传统机器学习方法更能提高哈萨克短文本分类任务的效率.
- 沙尔旦尔·帕尔哈提米吉提·阿不里米提艾斯卡尔·艾木都拉
- 关键词:哈萨克语词干提取文本分类形态学
- 信号频域变换的教学方法思考
- 2019年
- 从多年的教学工作当中发现很多学生在信号的变换域等抽象概念的理解方面有较大困难,对抽象概念理解非常模糊。由于概念抽象、学习进度快、相关理论知识覆盖面广,大部分学生很难从大量资料中系统地理解相关概念。而且大部分教材和参考文献过分注重概念及数学公式的普遍性和通用性以及解题技巧上,在理论联系实际及应用过程的详解甚少,导致学生越学越吃力,通用公式联系不到各种不同的实际应用场合等情况。因此,有必要针对基本抽象概念的实例讲解来解释信息处理中核心概念,即信号的变换域。
- 米吉提·阿不里米提吾米提·尤努斯艾斯卡尔·艾木都拉
- 关键词:信号处理傅立叶变换变换域离散信号正交变换
- 跨信道环境下语种识别方法的研究
- 2022年
- 针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降。为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对比MFCC、FBANK、LPCC等不同语音特征的识别效果。实验证明FBANK特征在跨信道环境下的识别效果更好,引入注意力机制能够关注跨信道语音片段中与语种相关的信息,忽略非语种信息。所提方法在东方语种识别竞赛两个跨信道数据集(AP19⁃OLR和AP20⁃OLR)上进行实验,通过与基线系统X⁃VECTOR等语种识别方法进行对比,得出所提方法在两个数据集上的等错误率(EER)降低3.48%和5.66%。实验结果表明,基于注意力机制的BiLSTM语种识别方法能够有效提高语种识别任务中的特征提取能力,并改善跨信道环境下的语种识别性能。
- 迪力扎提·伊力哈木米吉提·阿不里米提郑方艾斯卡尔·艾木都拉
- 关键词:语种识别特征提取
- 维语词法分析器研究开发
- 维语是一种粘性语言,在这一类语言中词是由词根加词缀构成,理论上维语的词汇量是无限的。维语词的词根-词缀切分、音节切分的规律对维吾尔语自然语言处理方面提供更多方便。本文从不同的方面讨论了词法分析的关键技术问题。讨论维文词法...
- 米吉提·阿不里米提艾斯卡尔·艾木都拉吐尔地·托合提
- 关键词:维吾尔语词缀
- 文献传递
- 基于深度神经网络的维语语音关键词检索被引量:3
- 2021年
- 语音识别中的一个重要的分支就是关键词检索。虽然在英语上的关键词检索已经成熟,但是低资源的语音,比如维语的语音关键词检索研究缓慢,仍需要更深入的研究。文章在维吾尔语语数据集thuyg20上,先在GMM-HMM(Gaussian Mixture Model Hidden Markov Model)声学模型,DNN-HMM(Hidden Markov Model Deep Neural Network)声学模型,LSTM-HMM(Long Short-term Memory Hidden Markov Model)声学模型解码产生的网格lattice上捕捉关键词,将DNN-HMM和LSTM-HMM解码产生的网格进行融合,再在融合的网格lattice上进行关键词检索。实验结果表明,融合后的结果在准确率和召回率方面要优于DNN-HMM和LSTM-HMM模型的检索性能。
- 张伟涛米吉提·阿不里米提郑方艾斯卡尔·艾木都拉
- 关键词:维吾尔语
- 基于双向改进门控循环单元维吾尔语语音识别被引量:2
- 2022年
- 为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的计算复杂度,加快模型收敛;采用双向的结构不仅可以有效帮助模型捕捉到过去和未来的语义时序信息,而且可以有效提升识别准确率。在THUYG-20维吾尔语数据集上实验结果表明,与基线传统深度神经网络进行对比,基于双向改进门控循环单元网络词错误率下降2.34%;与标准双向长短期记忆网络(LSTM)比较每个迭代周期平均训练时间减少13.4%。
- 李连振米吉提·阿不里米提郑方艾斯卡尔·艾木都拉
- 关键词:维吾尔语语音识别声学模型