梁时木
- 作品数:4 被引量:17H指数:3
- 供职机构:四川大学计算机学院更多>>
- 发文基金:四川省科技厅公益性研究计划项目更多>>
- 相关领域:自动化与计算机技术机械工程更多>>
- Nave Bayes分类器制导的专业网页爬取算法被引量:3
- 2010年
- 从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术。在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件。该文对中文专业网页的爬取问题进行了研究,基于KL距离验证了网页内容与链接前后文在分布上的差异,在此基础上提出了以链接锚文本及其前后文为特征、Nave Bayes分类器制导的中文专业网页爬取算法,设计了自动获取带链接类标的训练数据的算法。以金融专业网页的爬取为例,分别对所提出的算法进行了离线和在线测试,结果表明,Nave Bayes分类器制导的网络爬虫可以达到近90%的专业网页收割率。
- 韩国辉陈黎梁时木唐小棚王亚强于中华
- 关键词:中文信息处理BAYESIANCLASSIFIER
- 混合遗传算法在制造元设计中的应用研究
- 制造元设计是将机器和零部件组成制造单元的一个过程,已被证明是一个NP问题。本文提出了一种将改进模拟退火算法引入遗传算法的混合遗传算法。通过用改进后的模拟退火方法替换传统的变异算子和把当代最优解进行退火,大大提高了算法的局...
- 梁时木于中华唐小棚李娜娜
- 关键词:模拟退火混合遗传算法整数规划成组技术
- 文献传递
- 基于免疫克隆选择算法的固定费用运输问题优化被引量:7
- 2009年
- 固定费用运输问题(fcTP)是物流运输中的高级问题,属于NP难题,较难得到最优解。针对现有方法存在的不足,提出了基于免疫克隆选择的fcTP求解算法。在该算法中,抗体采用矩阵形式编码,初始抗体群随机产生,通过迭代进行克隆选择、克隆抑制、基因变异等操作,对潜在解空间进行寻优搜索。实验结果表明,对于fcTP的优化,免疫克隆选择算法能够快速收敛于全局最优解,克服了遗传算法收敛速度慢和容易陷入局部最优的缺点。
- 秦子玄陈霞唐小鹏梁时木漆杨于中华
- 关键词:克隆免疫克隆选择算法遗传算法
- 基于SVM预测的金融主题爬虫被引量:7
- 2010年
- 随着Internet上信息的爆炸,利用通用搜索引擎检索用户相关的信息变得越来越困难,而主题爬虫成为WEB上检索主题相关信息的重要工具.目前大部分基于分类器预测的主题爬虫的训练数据是不同类别网页的内容,但是在实际预测过程只能根据父网页中的一些链接信息进行预测,所以造成主题爬虫的预测的准确率较低.本文使用SVM分类器对标注了类别的URL以及上下文和锚文本进行训练,并分别使用了DF和信息增益两种不同的特征选择方法进行特征筛选,对影响分类器的各种因素进行了实验对比,并对分类器进行了在线的实验.实验证明这种方法在实际预测过程中效率很高.
- 陈黎李志蜀琚生根唐小棚梁时木韩国辉
- 关键词:主题爬虫分类器支持向量机金融