您的位置: 专家智库 > >

张丹丹

作品数:14 被引量:29H指数:3
供职机构:上海超级计算中心更多>>
发文基金:国家高技术研究发展计划国家自然科学基金博士研究生创新基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 6篇会议论文
  • 5篇期刊文章
  • 1篇科技成果

领域

  • 11篇自动化与计算...

主题

  • 4篇性能分析
  • 4篇格子BOLT...
  • 3篇内存
  • 3篇内存优化
  • 3篇编程
  • 3篇CACHE优...
  • 3篇并行计算
  • 2篇多核
  • 2篇多线程
  • 2篇性能比较
  • 2篇运行性
  • 2篇运行性能
  • 2篇线程
  • 2篇魔方
  • 2篇编程模型
  • 2篇NPB
  • 2篇FDTD
  • 2篇GPU集群
  • 2篇MPI
  • 2篇U

机构

  • 12篇上海超级计算...
  • 3篇复旦大学
  • 3篇上海大学

作者

  • 12篇张丹丹
  • 9篇徐磊
  • 9篇徐莹
  • 3篇赵鹏
  • 2篇李根国
  • 1篇吴建成
  • 1篇汪鲁兵
  • 1篇刘波
  • 1篇张挺
  • 1篇陈家慧
  • 1篇王涛
  • 1篇钱跃竑
  • 1篇徐彬
  • 1篇时伟
  • 1篇魏玉琪
  • 1篇寇大治
  • 1篇田振夫
  • 1篇刘杰
  • 1篇刘晶
  • 1篇姜恺

传媒

  • 3篇计算机工程与...
  • 1篇计算机应用与...
  • 1篇微电子学与计...
  • 1篇2008年全...
  • 1篇2009年全...
  • 1篇2009年全...
  • 1篇2013全国...
  • 1篇2008年全...

年份

  • 2篇2013
  • 1篇2012
  • 2篇2011
  • 4篇2009
  • 3篇2008
14 条 记 录,以下是 1-10
排序方式:
GPU集群上的三维UPML-FDTD算法的实现及优化
高性能计算领域,拥有强大浮点计算性能的协处理器正在快速的发展。近年来,利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题。本文在GPU集群上买现了三维UPML—FDTD算法并进行了...
徐磊徐莹蒋荣琳张丹丹
关键词:FDTDGPU集群MPI
SSearch基于众核加速的并行模型分析
2012年
介绍SSearch核心算法的特点,分析该算法的并行性,并以GPU以及类Cell处理器为例分析算法对众核系统的适用性。在此基础上提出众核系统下的SSearch并行模型。
张丹丹徐莹徐磊李根国
超算中心Xfinity高性能计算平台软件v1.0
李根国姜恺吴建成刘杰徐彬魏玉琪邓雪滨张挺刘波刘晶张伟刘祎洋徐磊张丹丹陈家慧徐莹薛刚戴坚君邹伟新王涛寇大治时伟
该软件面向高性能计算用户,整合上海超级计算中心及用户内部资源,为用户提供方便、快捷的使用资源的方式,包括文件管理、作业提交、作业管理、动态信息查询、统计信息查询、交流空间、命令行以及用户管理、项目管理等功能;保证用户使用...
关键词:
基于“魔方”的不同编程模型下科学应用性能比较被引量:2
2009年
本文基于魔方(曙光5000A)"超并行"系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi-Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨节点采用混合编程模型能获得更好性能,测试结果为百万亿次系统的使用及应用性能的提升起到指导作用。
张丹丹徐磊徐莹
关键词:NPB
格子Boltzmann并行程序的优化与性能分析被引量:3
2008年
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提高.
赵鹏张丹丹汪鲁兵田振夫钱跃竑
关键词:格子BOLTZMANNCACHE优化内存优化并行计算
格子Boltzmann并行程序的优化与性能分析
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提...
赵鹏张丹丹汪鲁兵田振夫钱跃竑
关键词:格子BOLTZMANNCACHE优化内存优化并行计算
文献传递
异构平台下格子Boltzmann方法实现及性能分析
论文对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA, MPI+CUDA, MPI+OpenMP+CUDA多级并行算法。 结果表明,算法具有较好的加速性能;提出的根据...
张丹丹徐莹徐磊
关键词:异构平台并行编程模式负载均衡图形处理单元
基于“魔方”的不同编程模型下科学应用性能比较
本文基于魔方(曙光5000A)“超并行”系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨...
张丹丹徐磊徐莹
关键词:系统架构
文献传递
多核构架下OpenMP多线程应用运行性能的研究被引量:16
2009年
多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编译器绑定接口以及Linux内核API的方式实现OpenMP线程与核之间的绑定,使用STREAM Benchmark和NPB在上海超级计算中心的"魔方"超级计算机刀片上测试、比较绑定前后的应用程序的性能。结果证明,使用绑定方案将有可能提升OpenMP应用程序的性能。
徐磊徐莹张丹丹
关键词:NPB
格子Boltzmann并行程序的优化与性能分析
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提...
赵鹏张丹丹汪鲁兵田振夫钱跃竑
关键词:格子BOLTZMANNCACHE优化内存优化并行计算
文献传递
共2页<12>
聚类工具0