职位描述
岗位职责:
1.参与基于大语言模型(LLM)、多模态模型等前沿AI技术的应用研发与工程化落地;
2.负责大模型在实际业务场景中的调优、微调、蒸馏、部署及性能优化;
3.构建面向行业场景的AI应用系统,如行业助手、内容生成、知识问答、Agent系统等;
4.结合业务场景进行数据处理、算法建模及调优,提升模型性能与泛化能力;
5.持续跟进AI技术的最新研究进展,探索前沿技术在业务中的应用价值。
任职要求:
1.硕士及以上学历,计算机、数学、统计、人工智能等相关专业;
2.熟悉主流深度学习框架(如 PyTorch、TensorFlow),掌握 HuggingFace 生态;
3.熟悉 LLM 相关技术(如 GPT、ChatGLM、LLaMA、Qwen 等),具备模型训练、微调、推理和部署经验;
4.掌握 RAG、Prompt Engineering、Agent 架构、Function Calling 等典型应用场景;
5.熟悉模型压缩、量化、蒸馏、LoRA 微调等优化手段;
6.熟练使用 Python 编程,具备良好的代码规范和工程实践能力;
7.熟悉 Linux 开发环境,了解 Docker、Kubernetes 等云原生技术者优先;
8.对 AI 技术有强烈兴趣,愿意持续探索和创新,具备良好沟通能力和团队协作精神。