梁莘燊
- 作品数:2 被引量:5H指数:1
- 供职机构:中国科学院研究生院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于CUDA架构的GPU的并行数据挖掘技术研究被引量:5
- 2010年
- 数据挖掘是从海量数据中挖掘有价值的、新颖的、可理解的知识的技术,目前在很多领域都已有重要的应用。但是,由于计算量很大,已有的数据挖掘软件很难满足应用的实时性需要,多是以后台模式进行处理。因此,人们对并行数据挖掘技术的需求十分强烈。图形处理器(GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。另外,基于GPU的CUDA编程模型为程序员提供了充足的类似于C语言的API,便于程序员发挥GPU的并行计算能力。本文将介绍GUCAS-CUMiner(在GPU+CPU并行计算平台上实现的数据挖掘算法),包括CU-Apriori、CU-KNN和CU-K-means。GPU承担了各个算法中的计算密集部分,一些优化技术被用来最大化并发程度和带宽。我们在安装了Tesla C1060GPU的HP xw8600工作站上进行了算法的性能测试。实验结果表明,并行算法在人工合成数据和真实应用的数据上都表现出很好的加速性能。本研究结果表明基于CUDA架构的并行数据挖掘是提高数据挖掘技术性能的一个行之有效的途径。
- 刘莹菅立恒梁莘燊李小君高洋王琤
- 关键词:并行计算数据挖掘CUDA关联规则
- 基于效能的学术资源推荐算法研究
- 随着互联网上信息的迅猛增长,在学术界和工业界,推荐系统的研究和应用越来越受到科研人员的重视。它提供了一种主动向用户提供个性化信息的方法。在学术文献推荐领域,现有的推荐算法往往基于文献内容或者被引用频率进行推荐计算。然而,...
- 梁莘燊刘莹
- 关键词:推荐系统学术资源个性化PLSA
- 文献传递