端上大语言模型推理优化
OPPO 研究院高级机器学习算法工程师,负责机器学习平台系统相关工作。曾主导多个机器学习、隐私计算平台、大模型推理平台的设计,开发及落地工作。参与发表机器学习专著一部,发表机器学习论文、专利数篇。
演讲题目:端上大语言模型推理优化