2)CUDA兼容性问题:基本都是将CUDA代码在预编译阶段转为自己编写的运行库的接口。个别公司是直接兼容TensorRT和PyTorch的接口,如果有自定义算子,需要将可执行文 件做转编译。3)海光的深算这几天逛WAIC人工智能大会心得:1)国产算力进展:23年6月到24年6月,国产计算卡厂商主要投入在了算子库和运行库的编写、优化工作中,万卡互联有望突破。2)CUDA兼容性问题:基本都是将CUDA代码在预编译阶段转为自己编写的运行库的接口。个别公司是直接兼容TensorRT和PyTorch的接口,如果有自定义算子,需要将可执行文 件做转编译。3)海光的深算三号发布时间,深算二号AI版用单精度的K100AI计算单元替代了双精度的K1 00,FP16和FP8算力有提升。 4)燧原、天数智芯、摩尔线程等目前还都是DDR的显存。 5)应用目前依然没有大的变化和突破,需要模型底座的进一步技术进步和迭代。