芯片架构特性分析
设计特定代码,间接测试芯片架构中的诸如寄存器数量、访存带宽、片上缓存带宽等潜在特性,为开展优化奠定基础。

内存访问优化
综合采用合并内存访问、共享内存(Shared Memory)缓存、内存对齐与预取等技术,优化内存访问性能。

计算并行度优化
综合采用数据分块与复用、最大化占用率、向量指令优化等技术,提高计算单元的利用率。

流水并行优化
多个任务之间,交错执行访存和计算,减少任务执行过程中的“气泡”,缩短整体任务响应时间。
