祝然威
- 作品数:5 被引量:4H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 在时间序列数据库中查找给定时间序列的近似序列的方法
- 本发明属于数据挖掘技术领域,具体为一种在海量时间序列数据库中查找给定时间序列的近似序列的方法。该方法包括:采用树状索引的结点表示方式;根据索引的算法框架,逐条构建索引;选择最优策略进行结点分裂;最后基于DSTree索引进...
- 王鹏汪卫汪洋祝然威
- 基于计数的数据流频繁项挖掘算法
- 挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差。SRoEC,SReEC和RFreq算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应...
- 祝然威王鹏刘马金
- 关键词:数据挖掘
- 基于时间窗口的数据流频繁项挖掘算法
- 数据流上的频繁项挖掘是数据流上的一项重要技术,它在各个研究和应用领域都起着重要的作用。现有的数据流上的频数挖掘算法主要包括基于计数的算法和基于摘要的算法,前者常用于频繁项挖掘,后者常用于数据项分布统计。目前的经典频繁项挖...
- 祝然威
- 关键词:数据流频繁项
- 在时间序列数据库中查找给定时间序列的近似序列的方法
- 本发明属于数据挖掘技术领域,具体为一种在海量时间序列数据库中查找给定时间序列的近似序列的方法。该方法包括:采用树状索引的结点表示方式;根据索引的算法框架,逐条构建索引;选择最优策略进行结点分裂;最后基于DSTree索引进...
- 王鹏汪卫汪洋祝然威
- 文献传递
- 基于计数的数据流频繁项挖掘算法被引量:4
- 2011年
- 挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差.SRoEC(segment rotative efficient count),SReEC(segment reserve efficient count)和RFreq(reserve frequent)算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应的操作,以期提高频数统计准确度并减小"噪音"影响.实验和数据分析表明,这些算法不仅能够保证频数超过阈值的数据项都能被找到,而且大大提高了频繁项频数统计的准确性.在同样空间代价下,算法无论在模拟数据集和真实数据集实验中,都表现出较高的频数准确率、较低的频数偏差率和较高的频数保有率,尤其是数据分布较平缓时,算法优势更加明显.
- 祝然威王鹏刘马金
- 关键词:频繁项数据流数据挖掘