职位描述
岗位职责
1.预训练语言模型开发:负责大规模预训练语言模型的训练和优化工作。
2.人机对话系统优化:负责人机对话算法的实现和优化,涵盖情感对话、数据驱动的对话生成、知识增强的对话生成、基于用户信息的对话生成等。
3.前沿技术探索:负责追踪和探索NLP领域的前沿技术,并推动这些技术在实际项目中的应用和落地。
4.技术方案设计:设计基于大语言模型的技术方案,包括Document QA、结构化信息抽取、私有函数调用等场景。
5.端到端研发:负责大语言模型技术方案的端到端研发流程,包括数据清洗、prompt tuning、指令跟随微调、领域知识注入、模型性能提升、模型效果评测等。
任职要求
1.精通大规模语言预训练、人机对话、文本生成等相关算法和技巧。
2.5年以上相关领域的工作经验。
3.具有大规模语言预训练、人机对话、文本生成等项目的实际开发经验、工程化经历。
4.具备强烈的主动学习能力,能够跟进NLP领域的最新进展,并对现有模型进行性能和效果的持续优化。
5.计算机相关专业本科及以上学历,具备论文复现能力和算法工程交付经验。
6.熟练使用Python语言,具有严谨高效的代码风格。
7.熟练掌握深度学习框架Pytorch,以及算法框架huggingface-transformers。
8.具备团队意识,有良好的文档习惯和合作意识。
加分项:
1.多任务熟悉度:熟悉多种自然语言处理子任务,如问答系统、序列标注、情感分析、摘要生成及抽取、知识图谱等。
2.模型了解:了解NLP主流预训练语言模型,如GPT、LLaMA、PaLM、GLM、Bloom、BERT等。