您的位置: 专家智库 > >

管茂林

作品数:44 被引量:0H指数:0
供职机构:江南计算技术研究所更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 44篇中文专利

领域

  • 16篇自动化与计算...

主题

  • 17篇异构
  • 17篇编译器
  • 14篇代码
  • 11篇链接
  • 10篇链接器
  • 7篇用户
  • 7篇用户程序
  • 7篇插桩
  • 7篇处理器
  • 5篇线程
  • 5篇向量
  • 5篇内存
  • 5篇函数
  • 5篇编程
  • 4篇动线
  • 4篇掩码
  • 4篇异构平台
  • 4篇源程序
  • 4篇片上存储器
  • 4篇主存

机构

  • 44篇江南计算技术...

作者

  • 44篇管茂林
  • 35篇王飞
  • 35篇钱宏
  • 32篇沈莉
  • 31篇吴伟
  • 26篇肖谦
  • 6篇尉红梅
  • 5篇漆锋滨
  • 4篇何王全
  • 2篇郑方
  • 2篇过锋
  • 2篇陈芳园

年份

  • 1篇2025
  • 1篇2024
  • 21篇2022
  • 17篇2021
  • 1篇2019
  • 1篇2018
  • 2篇2016
44 条 记 录,以下是 1-10
排序方式:
面向容量受限的程序栈空间深度追溯方法
本发明公开一种面向容量受限的程序栈空间深度追溯方法,包括以下步骤:S1、在链接器中建立函数信息的数据结构,形成函数调用关系流程图;S2、获取所有的函数符号信息,建立相应的函数信息数据结构,并将函数的名称、PC值范围、自身...
肖谦王飞尉红梅沈莉钱宏管茂林朱琪周文浩
文献传递
基于编译实现的可扩展向量掩码功能的方法和装置
本发明公开一种基于编译实现的可扩展向量掩码功能的方法和装置,包括以下步骤:S1、编译器输入用户程序,根据目标平台翻译出正确的掩码向量接口;S2、编译器前端模块对S1中获得的掩码向量接口进行关键字识别,选择对应平台的中端处...
沈莉王飞钱宏管茂林朱琪吴伟肖谦武文浩
一种面向连续不对界向量数据访问的编译优化方法
本发明提供了一种面向连续不对界向量数据访问的编译优化方法,包括:对一个基本块内的所有指令按照依赖性关系自底向上进行遍历搜索;当搜索到存在不对界向量数据访问关系的第一访存指令和第二访存指令时,对第一访存指令和第二访存指令进...
漆锋滨肖谦管茂林吴伟
文献传递
一种异构代码融合的编译和生成方法
本发明提供了一种异构代码融合的编译和生成方法,包括:利用运算控制核心编译器和运算核心编译器分别为运算控制核心和运算核心生成第一对象文件和第二对象文件;运算核心编译器自动实现对第一对象文件中的函数的重命名,在函数名的前加上...
王飞尉红梅沈莉管茂林漆锋滨
缓解假共享问题的编译器支持方法
本发明公开一种缓解假共享问题的编译器支持方法,包括以下步骤:S1、用户在程序中,对多线程Cache之间可能存在假共享的变量声明分别使用__attribute__((cacheline))接口;S2、编译器将声明树节点的基...
王飞杨涛吴伟钱宏管茂林朱琪樊行健
针对循环内条件转移指令的转移预测优化方法
本发明公开一种针对循环内条件转移指令的转移预测优化方法,包括以下步骤:S11、判断一次循环内的指令条数是否能够满足带条件标记的运算指令在带条件转移标志位的条件转移指令之前至少提前N条的条件;S12、如果满足条件,编译器直...
钱宏朱琪王飞吴伟肖谦管茂林沈莉周文浩
异构平台下宽度非对称向量兼容性的编译处理方法和装置
本发明公开一种异构平台下宽度非对称向量兼容性的编译处理方法和装置,包括以下模块:编译器预处理模块,用于对非对称异构向量的统一声明,还用于通过编译选项来控制对应的数据和接口调用的target预处理,转换为对应平台自身适应的...
王飞钱宏沈莉吴伟管茂林周文浩朱琪武文浩
文献传递
面向处理器指令cache的低功耗编译方法
本发明公开一种面向处理器指令cache的低功耗编译方法,包括以下步骤:S1、寻找最内层循环;S2、判断寻找到的最内层循环是否可以展开;S3、结合L0 cache计算展开次数:即根据循环体的最大伪指令条数MAX_UNROL...
尉红梅吴伟朱琪王飞沈莉钱宏肖谦管茂林
文献传递
面向主从融合架构处理器的指令调度优化装置和方法
本发明公开一种面向主从融合架构处理器的指令调度优化装置和方法,基于以下模块:指令调度模块,用于接收含有目标机信息和指令序列的代码,还用于根据指令模板选择器提供的指令模板,对接收到的指令序列进行调度;指令模板选择器,用于接...
吴伟朱琪管茂林沈莉钱宏武文浩
文献传递
基于异构众核处理器的卷积加速方法
本发明公开一种基于异构众核处理器的卷积加速方法,包括以下步骤:S1、根据异构众核处理器的核数,确定输入特征图和卷积核的多核划分方法,实现众核并行加速,S2、各计算核心将划分后的数据通过DMA的方式传输至片上存储器,实现片...
王飞周文浩肖谦吴伟朱琪钱宏沈莉管茂林
共5页<12345>
聚类工具0