专注于超大规模参数模型的微调与工程化落地。精通分布式训练架构、模型切片、LoRA高效微调及百亿级模型权重合并技术,致力于打破算力瓶颈。
设计并主导多模态 RAG 框架与 Agentic 复杂工作流。通过图谱检索与智能体编排,赋予大模型强大的业务推理、工具调用与自主规划能力。
从算法探索到企业级高并发架构的全面覆盖。擅长构建异步推理流水线、GPU资源调度管理,以及数字人等多模态技术的系统级集成与优化。