5月21和22日上午,上海交通大学信息与电子工程学院(集成电路学院)邀请到了英伟达两位专家分别为学院本科生和研究生进行校企课程共建讲座,主讲人为卢欣和尹文志,讲座由孙亚男老师和杨志老师共同主持。本学期本科生校企共建系列讲座由新思科技支持,研究生校企共建系列讲座由亚德诺半导体技术有限公司(ADI)支持。
课程介绍
5月21日上午10点,首场讲座在东上院112顺利展开,主题为“GPU的矩阵乘法(GEMM)实现”,卢欣作为主讲人,为同学们带来矩阵乘的基本算法及其在深度学习网络中应用的讲解。卢欣2017年加入英伟达,目前担任英伟达深度学习计算架构师。卢欣以最常见的矩阵乘算子作为本次讲座的切入点,介绍了目前矩阵乘在英伟达GPU CUDA Core上执行的一般流程,以及使用Tensor Core执行的优势,同时总结GPU GEMM 性能分析的基本模型以及性能优化的方法,包括shared memory优化策略,分块(tiling)优化策略等。同时卢欣还为同学们介绍了矩阵乘算子GEMM在目前深度学习中的应用,包括对不同网络结构(CNN、RNN以及transformer)的支持,如何将网络各层的计算转化为矩阵乘法,从而映射到GPU上执行,实现加速。
5月22日上午10点,第二场讲座在东上院101顺利展开,主题为“CUDA Programming”,尹文志作为主讲人,为同学们带来CUDA Programming的讲解。尹文志2019年加入英伟达,目前主要从事深度学习相关的高性能算子开发的工作。尹文志从GPU与CPU的对比作为切入点,介绍了GPU独特的架构,重点讲解了SIMT架构。接着,尹文志正式开始CUDA Programming的讲解,尹文志首先介绍了CUDA的基本概念,然后介绍了CUDA的核心(Kernels)以及CUDA与其它编程语言的区别和优势。紧接着,尹文志从一个CUDA的程序演示开始引入,介绍了在CUDA编程中最重要的思想并行编程,然后尹文志介绍了在CUDA编程中的矩阵乘和一些优化算法,强调了优化计算方法对于软硬件资源的高效使用以及提升程序性能的重要性。
课堂现场
现场同学认真听讲,拍照记录专家讲座的内容。课间,同学们就GEMM,CUDA Programming以及GPU在深度学习中的应用和专家讨论交流。最后,卢欣特地展示了同学们课前提出的问题,并就这些问题耐心做了回答。相信本次关于英伟达系列讲座一定会为不同研究方向的同学带来不小的收获。