科学计算
用于物理模拟、气候建模、分子动力学等。
深度学习
加速模型训练和推理。
计算机视觉
用于图像识别、目标检测等。
密码学
加速加密解密操作。
解决痛点
GPU种类多,编写GPU算子代码工作量巨大。
景嘉微、凌久微、摩尔线程、芯动、沐曦等国产GPU代码编写难度高。
使用开源工具生成的代码无法充分发挥GPU性能。
常见的算子类型无法满足业务需求。
产品优势
  • 算子代码
    自动生成
  • 算子自定义
  • GPU全面兼容
  • 代码性能高效
  • 多类型GPU
    代码生成
通过确定算子类型和GPU型号,可自动化生成高性能的GPU代码(OpenCL或CUDA),能极大减少手动编写代码的工作量。
支持用户自定义算子,使用Python或tvm原语对算子进行自定义,即可生成算子相应的GPU代码,用户可以针对问题的特征和数据结构设计算法,以获得更好的性能和效果。
兼容景嘉微、凌久微等国产GPU以及英伟达、AMD等国外GPU。
针对不同GPU芯片架构和硬件参数,结合具体的计算任务,使用并行计算、内存访问模式优化、向量化等技术,可以生成高效的GPU代码,充分发挥GPU性能。
麟卓GPU算子自动生成工具可针对不同场景,生成包含通用核和张量核的不同类型的GPU代码,应用于科学计算、深度学习等多种领域。