公共文化服务平台

2025年9月11日星期四

|

欢迎来到上海浦东图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

张丹丹: 作品数：14 被引量：29H指数：3; 供职机构：上海超级计算中心更多>>; 发文基金：国家高技术研究发展计划国家自然科学基金博士研究生创新基金更多>>; 相关领域：自动化与计算机技术理学更多>>

合作作者

徐莹上海超级计算中心
徐磊上海超级计算中心
赵鹏上海大学
钱跃竑上海市应用数学和力学研究所
李根国上海超级计算中心

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

6篇会议论文
5篇期刊文章
1篇科技成果

领域

11篇自动化与计算...

主题

4篇性能分析
4篇格子BOLT...
3篇内存
3篇内存优化
3篇编程
3篇CACHE优...
3篇并行计算
2篇多核
2篇多线程
2篇性能比较
2篇运行性
2篇运行性能
2篇线程
2篇魔方
2篇编程模型
2篇NPB
2篇FDTD
2篇GPU集群
2篇MPI
2篇U

机构

12篇上海超级计算...
3篇复旦大学
3篇上海大学

作者

12篇张丹丹
9篇徐磊
9篇徐莹
3篇赵鹏
2篇李根国
1篇吴建成
1篇汪鲁兵
1篇刘波
1篇张挺
1篇陈家慧
1篇王涛
1篇钱跃竑
1篇徐彬
1篇时伟
1篇魏玉琪
1篇寇大治
1篇田振夫
1篇刘杰
1篇刘晶
1篇姜恺

传媒

3篇计算机工程与...
1篇计算机应用与...
1篇微电子学与计...
1篇2008年全...
1篇2009年全...
1篇2009年全...
1篇2013全国...
1篇2008年全...

年份

2篇2013
1篇2012
2篇2011
4篇2009
3篇2008

共 14 条记录，以下是 1-10

全选清除导出

排序方式：

GPU集群上的三维UPML-FDTD算法的实现及优化: 高性能计算领域，拥有强大浮点计算性能的协处理器正在快速的发展。近年来，利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题。本文在GPU集群上买现了三维UPML—FDTD算法并进行了...; 徐磊徐莹蒋荣琳张丹丹; 关键词：FDTD GPU集群 MPI

SSearch基于众核加速的并行模型分析: 2012年; 介绍SSearch核心算法的特点,分析该算法的并行性,并以GPU以及类Cell处理器为例分析算法对众核系统的适用性。在此基础上提出众核系统下的SSearch并行模型。; 张丹丹徐莹徐磊李根国

超算中心Xfinity高性能计算平台软件v1.0: 李根国姜恺吴建成刘杰徐彬魏玉琪邓雪滨张挺刘波刘晶张伟刘祎洋徐磊张丹丹陈家慧徐莹薛刚戴坚君邹伟新王涛寇大治时伟; 该软件面向高性能计算用户，整合上海超级计算中心及用户内部资源，为用户提供方便、快捷的使用资源的方式，包括文件管理、作业提交、作业管理、动态信息查询、统计信息查询、交流空间、命令行以及用户管理、项目管理等功能；保证用户使用...; 关键词：

基于“魔方”的不同编程模型下科学应用性能比较被引量：2: 2009年; 本文基于魔方(曙光5000A)"超并行"系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi-Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨节点采用混合编程模型能获得更好性能,测试结果为百万亿次系统的使用及应用性能的提升起到指导作用。; 张丹丹徐磊徐莹; 关键词：NPB

格子Boltzmann并行程序的优化与性能分析被引量：3: 2008年; 基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提高.; 赵鹏张丹丹汪鲁兵田振夫钱跃竑; 关键词：格子BOLTZMANN CACHE优化内存优化并行计算

格子Boltzmann并行程序的优化与性能分析: 基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提...; 赵鹏张丹丹汪鲁兵田振夫钱跃竑; 关键词：格子BOLTZMANN CACHE优化内存优化并行计算; 文献传递

异构平台下格子Boltzmann方法实现及性能分析: 论文对CPU+GPU异构平台下的多种并行编程模式进行了研究，并针对格子Boltzmann方法实现了CUDA， MPI+CUDA， MPI+OpenMP+CUDA多级并行算法。结果表明，算法具有较好的加速性能;提出的根据...; 张丹丹徐莹徐磊; 关键词：异构平台并行编程模式负载均衡图形处理单元

基于“魔方”的不同编程模型下科学应用性能比较: 本文基于魔方(曙光5000A)“超并行”系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨...; 张丹丹徐磊徐莹; 关键词：系统架构; 文献传递

多核构架下OpenMP多线程应用运行性能的研究被引量：16: 2009年; 多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编译器绑定接口以及Linux内核API的方式实现OpenMP线程与核之间的绑定,使用STREAM Benchmark和NPB在上海超级计算中心的"魔方"超级计算机刀片上测试、比较绑定前后的应用程序的性能。结果证明,使用绑定方案将有可能提升OpenMP应用程序的性能。; 徐磊徐莹张丹丹; 关键词：NPB

格子Boltzmann并行程序的优化与性能分析: 基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80％的Cache缺失,性能提高20％,而且经过预处理的并行程序性能也有很大提...; 赵鹏张丹丹汪鲁兵田振夫钱跃竑; 关键词：格子BOLTZMANN CACHE优化内存优化并行计算; 文献传递

全选清除导出

共2页<1 2>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张