远程环境为Ubuntu,CUDA12.2
- 找到
nsight-compute
的执行路径,为/usr/local/cuda-12.2/nsight-compute-2023.2.2/ncu
. - 使用
sudo
来执行ncu
命令1
sudo /usr/local/cuda-12.2/nsight-compute-2023.2.2/ncu --target-processes all --set detailed -o ./test_llm_detail.ncu-rep ./test_llm
--target-processes all
表示分析所有子进程,-o ./test_llm_detail.ncu-rep
表示设置输出目录为当前路径下的test_llm_detail.ncu-rep
文件。 - 将生成的
ncu-rep
文件scp
到本地,使用nsight-compute
程序open File
即可查看