职位描述
工作地点:北京
实习时长:3-6个月(全职优先,每周≥4天)
团队定位:聚焦大模型在金融场景的垂直应用,推动业务流程智能化升级
核心职责:
1. 金融文档智能处理系统开发
- 构建基于LLM的代销文件解析Pipeline(PDF/Excel结构化信息抽取)
- 开发合同关键条款比对、风险点自动标注工具
- 设计多模态文档(文本 表格)的智能审核解决方案
2. 运营智能体研发
- 搭建RAG增强的金融知识库问答系统(监管文件/产品说明书查询)
- 实现自动化报表生成与数据校验工具(对接Wind/Choice等金融数据库)
- 开发工作流引擎,实现公告解读、合规检查等场景的端到端自动化
3. 场景化模型优化
- 针对金融文本进行领域优化(财报/研报/招股书微调)
- 优化模型对数字、单位、专业术语的敏感度(如合规性校验)
- 构建金融实体识别与关系抽取专用模型
任职要求:
- 计算机/金融工程/AI相关专业硕士及以上在读
- 熟练使用Python及NLP库(PyTorch/Transformers),掌握LangChain等应用框架
- 熟悉文档解析技术(PyPDF2/OCR/表格提取),有PDFMiner或Camelot使用经验
- 具备金融数据结构化处理能力(正则表达式/XBRL解析)
加分项
- 有金融行业实习经历或CFA/FRM知识基础
- 熟悉智能体开发框架(AutoGen/GPT Engineer)
- 了解金融大模型合规要求(数据脱敏/权限管控)
- 参与过金融NLP竞赛(如CHIP金融信息抽取)
招聘人数:2人