您的位置: 专家智库 > >

李沐

作品数:4 被引量:11H指数:3
供职机构:微软公司更多>>
发文基金:国家自然科学基金天津市应用基础与前沿技术研究计划天津市科技发展战略研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 3篇统计机器
  • 3篇统计机器翻译
  • 3篇机器翻译
  • 3篇翻译
  • 1篇短语
  • 1篇一致性
  • 1篇语言处理
  • 1篇日志
  • 1篇日志挖掘
  • 1篇神经网
  • 1篇神经网络
  • 1篇排序
  • 1篇判别式
  • 1篇拼写
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇校正方法
  • 1篇解码
  • 1篇解码方法
  • 1篇基于神经网络

机构

  • 4篇微软公司
  • 2篇天津大学
  • 1篇东北大学
  • 1篇香港科技大学
  • 1篇中国科学技术...

作者

  • 4篇李沐
  • 1篇张冬冬
  • 1篇朱靖波
  • 1篇何丕廉
  • 1篇周明
  • 1篇段楠
  • 1篇张扬
  • 1篇李强
  • 1篇向伟
  • 1篇杨南

传媒

  • 2篇中文信息学报
  • 1篇北京大学学报...
  • 1篇软件学报

年份

  • 2篇2016
  • 1篇2013
  • 1篇2008
4 条 记 录,以下是 1-4
排序方式:
一种基于判别式重排序的拼写校正方法被引量:3
2008年
提出一种基于判别模型的拼写校正方法.它针对已有拼写校正系统Aspell的输出进行重排序,使用判别模型Ranking SVM来改进其性能.将现今较为成熟的拼写校正技术(包括编辑距离、基于字母的n元语法、发音相似度和噪音信道模型)以特征的形式整合到该模型中来,显著地提高了基准系统Aspell的初始排序质量,同时性能也超过了一些商用系统(如Microsoft Word 2003)的拼写校正模块.此外,还提出了一种在搜索引擎查询日志链中自动抽取拼写校正训练对的方法.基于这种方法训练的模型获得了基于人工标注数据所得结果相近的性能,它们分别将基准系统的错误率降低了32.2%和32.6%.
张扬何丕廉向伟李沐
关键词:日志挖掘
统计机器翻译中一致性解码方法比较分析
2013年
该文对近年来统计机器翻译研究中出现的多种一致性解码方法进行比较与分析。根据现有一致性解码方法对(单个或多个)统计机器翻译系统输出结果使用方式的不同,首先将其归纳为两大类:基于翻译假设重排序的一致性解码方法和基于翻译假设重组合的一致性解码方法;然后,针对每类方法,分别回顾其最具代表性的研究工作;最后,通过在大规模中—英机器翻译评测数据上的对比实验,对该文中介绍的多种方法进行比较,并对该课题未来研究方向进行展望。
段楠李沐周明
关键词:自然语言处理统计机器翻译
基于神经网络的统计机器翻译的预调序模型被引量:5
2016年
长距离调序是统计机器翻译的一个主要挑战。之前的研究工作表明预调序是解决这个问题的一个可能的途径。在该工作中,我们沿着预调序这个研究方向,将神经网络建模结合到线性排序的框架之下,提出了一个基于神经网络的预调序模型。这个的预调序模型能够利用从海量未标注数据中抽取的句法和语意信息,从而更好的对不同语言之间的语序差异进行预测。我们在中文到英文以及日文到英文的机器翻译任务上进行了实验,实验结果表明了该方法的有效性。
杨南李沐
关键词:统计机器翻译神经网络
统计机器翻译中实例短语对研究被引量:3
2016年
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上,与基线系统相比,该方法在多个测试集上明显提高了翻译系统的翻译质量,在部分测试集上BLEU值可提高1%左右。
李强李沐张冬冬朱靖波
关键词:统计机器翻译
共1页<1>
聚类工具0