吕琳
- 作品数:15 被引量:79H指数:5
- 供职机构:北京理工大学管理与经济学院更多>>
- 发文基金:国家自然科学基金国家部委预研基金更多>>
- 相关领域:自动化与计算机技术文化科学环境科学与工程经济管理更多>>
- 文本自动分类技术和算法研究综述
- 2004年
- 文本自动分类技术是面向Internet搜索引擎的重要研究方向和关键技术。它是指在给定的分类体系下,根据文本的内容自动确定文本关联类别的过程。本文总结和跟踪了各种常用和最新的文本分类的技术、算法及其适用范围,对评价与比较分类器性能的定理和方法进行了分析,并简述了独立于算法的机器学习。
- 吕琳刘玉树
- 关键词:文本自动分类分类器文本分类搜索引擎定理
- KNN及其改进方法研究
- 文章分别从基本思想、向量表示、距离度量、收敛性和误差率、计算复杂度等方面对KNN算法作了全面的概述,并分析了其优点和不足.总结和评价了KNN的一系列改进方法.最后,指出它们的发展方向.
- 吕琳刘玉树
- 关键词:向量表示计算复杂度
- 文献传递
- 面向通信技术领域的中美专利情报对比分析
- 以通信技术领域的中美专利数据为基本数据源,利用数理统计原理,集成数据挖掘、技术组(群)智能识别、技术组(群)的关联模型和关联关系表达技术等当今的信息前沿技术与管理方法,结合传统的统计学文献计量学、科学计量学理论,开展大型...
- 吕琳朱东华刘玉琴
- 关键词:专利情报情报分析专利数据数据挖掘
- 文献传递
- 美国专利关键技术检索系统的设计与实现
- 以美国专利数据库为后台数据库,综合利用全文索引、海量数据输入输出、远程登录和异地存储等多项技术,设计与实现了美国专利关键技术检索系统。该系统成功实现了对美国专利数据库的摘要和标题字段中的专利关键技术词及短语的简单检索、任...
- 吕琳雷孝平朱东华
- 关键词:全文索引海量数据
- 文献传递
- 最大熵和Brill方法结合识别英语BaseNPs被引量:7
- 2006年
- 为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.
- 吕琳刘玉树
- 关键词:基本名词短语短语识别最大熵
- 面向数据仓库的数据预处理研究综述
- 从定义、任务、内容、方法、算法等多角度,对数据预处理技术进行了全方位的探讨,强调了其对于构建数据仓库的重要性和必要性。通过建立美国专利数据挖掘系统,设计出数据预处理的通用框架。最后总结了数据预处理未来的研究方向。
- 吕琳朱东华刘玉琴
- 关键词:数据预处理数据仓库数据挖掘
- 文献传递
- 技术强国对华出口限制的分析与战略高技术选择
- 朱东华胡望斌汪雪锋文胜荆雷李波任智军刘嵩郭颖王丹云孙吉吕琳刘玉琴雷孝平赖院根
- 该项目从技术进口受限与技术发展两者之间的辩证关系出发,应用数据挖掘、知识发现等计算机前沿技术,开展基于互联网环境下对瓦瑟纳尔协议(WA)、澳洲集团(AG)等国际出口管制组织以及美国、日本、欧盟等技术强国针对中国实施的技术...
- 关键词:
- 利用炼钢二次灰作脱硫剂的初步研究被引量:4
- 1998年
- 研究利用炼钢二次灰作为脱硫剂的可能性,方法到炼钢厂定期采样,分析其主要成分及碱性物在不同pH值和不同搅拌时间下的浸出情况.结果二次灰碱性物含量(折合为CaO)高达50.2%以上;定量二次灰的碱性物析出量随pH值的降低而升高(pH为5时可析出65.0%以上),且析出很快(在pH为4~6时,仅20min即可析出50.0%).结论炼钢二次灰是很好的脱硫剂.
- 王泉增陈晋南薄以匀薄以匀吕琳
- 关键词:烟气脱硫炼钢脱硫剂大气污染
- 文本自动分类技术和算法研究综述
- 文本自动分类技术是面向Internet搜索引擎的重要研究方向和关键技术.它是指在给定的分类体系下,根据文本的内容自动确定文本关联类别的过程.本文总结和跟踪了各种常用和最新的文本分类的技术、算法及其适用范围,对评价与比较分...
- 吕琳刘玉树
- 关键词:文本分类非线性函数分类器
- 文献传递
- 基于权利要求结构信息的中文专利无效检索模型被引量:6
- 2008年
- 中文专利独立权利要求分为前序部分和特征部分。文中构建的专利无效检索模型,充分考虑了这一信息,从专利数据库中统计出40个分割词对独立权利要求进行分割处理。具体检索中采用两步检索:第一步进行布尔检索以提高召回率;第二步对申请专利与第一步返回专利独立权利要求的前序部分和特征部分分别进行相似度计算,适当组合后作为整体的相似度。实验中对分割前后以及分割后不同的词语权重选择方法对检索效果的影响作了比较,结果显示该模型是非常有效的。
- 刘玉琴汪雪锋吕琳
- 关键词:中文专利权利要求