岗位职责:
1、负责在自研AI芯片上,使用底层编程模型(C++/特定DSL)或汇编语言,开发并实现高效、优化的AI算子库。
2、负责算子的通用性设计,确保支持不同的张量形状、数据类型等。
3、深度挖掘芯片硬件潜力,优化算子性能,确保将芯片的理论算力发挥至最大化。
4、与编译器团队协作,高效实现各类算子融合模式,提升模型整体性能。
5、参与芯片早期软硬件协同调试,协助定位并解决算子层面和系统层面的性能瓶颈。
6、持续关注业界前沿的AI算法和模型优化技术,将其转化为高效的算子实现。
任职要求:
1、计算机科学、软件工程、微电子或相关专业本科及以上学历。
2、扎实的C/C++编程能力,熟悉模板编程,具备良好的代码风格和软件工程实践。
3、具备优秀的算法基础,深刻理解时间复杂度和空间复杂度的计算方法,并能应用于性能优化。
4、出众的软件调试(Debug)能力,能够高效、精准地定位和解决复杂问题。
5、理解深度学习基本理论和主流模型结构(尤其是大模型),熟悉TensorFlow/PyTorch等至少一种开源深度学习框架的内部机制。
6、具备CPU/GPU/DSP上底层函数库(如BLAS、cuDNN、MKL等)功能开发或性能优化经验者优先。
7、具备较强的快速学习能力、良好的团队合作精神和高效的沟通能力。
加分项:
有汇编语言编程及性能优化经验。
熟悉计算机体系结构,对AI芯片架构有深入理解,并有相关的性能调优经验。
联系我时就说是在 上海市中小企业人才网 上看到的
职位发布者