当前位置:首页>职位列表>职位详情
数据采集工程师-上海 面议
应届毕业生 不限
科锐尔人力资源服务(苏州)有限公司 2026-03-16 21:12:40 1825人关注
职位描述
1 项目背景
针对外文语料数据采集工作,目前已经对预训练数据采集、全站数据采集或者文
件文档下载类的需求已经开发了采集系统或者采集平台进行需求覆盖。但是由于需求种类多样还有较多类型的采集需求(定向采集,数据字段高定,目标站点反爬比较严重等)数据系统与平台无法进行覆盖需求,需要铺设较多开发人员进行单站点或者单需求进行数据采集研发工作。
2 预算与人员资质要求
• 需求人数:2人
• 期望到岗时间:2025年11月初
• 岗位级别:中级采集工程师
• 教育背景与工作经验
o 本科及以上学历,计算机相关专业
o 2年以上数据采集工作经验
• 核心技能
o 精通 JavaScript 逆向工程
o 有主流站点 Web端大规模数据采集经验
o 具备多类型验证码处理能力:包括滑块、点选、GooglereCAPTCHA、
旋转验证码等
o 熟悉 APP 脱壳、逆向、反编译及自动化相关技术
o 具备 AST 反混淆 JavaScript 代码及 JSVMP 算法还原能力
• 附加技能(优先考虑):具有风控应对经验(如 Akamai 并发、Cloudflare 等
反爬虫策略处理经验)
3 岗位描述
3.1负责大模型相关数据采集,包括不限于海内外文本,图片,音视频数据;
3.2负责对目标网站或APP进行反爬突破、协议破解和提取关键数据;
3.3负责反爬虫策略研究,代理、验证码识别等采集支撑服务建设;
3.4 参与大规模数据处理流程的设计与开发,包括但不限于数据采集、清洗、转
换、存储等过程。
4 服务范围与内容
4.1 服务目标
协助开展各类数据采集业务(包括但不限于预训练数据采集、全站数据采
集、文件文档下载等),针对多样化的需求种类,特别是定向采集、高定数
据字段以及目标站点反爬严重等情况,提供定制化解决方案。具体包含但不
限于以下内容:
1. 大模型相关数据采集
o 海内外文本、图片、音视频等数据采集
o 保证数据多样性及高质量
2. 反爬虫策略研究与实施
o 深度分析目标网站或APP
o 突破反爬措施(协议破解、代理使用、验证码识别等)
o 提供反爬支撑服务建设
3. 大规模数据处理流程设计与开发
o 数据采集、清洗、转换、存储的全流程实现
o 确保数据准确性与可用
联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:徐汇区上海库帕思科技有限公司A
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    投递简历
      马上投递
      投递简历
        马上投递

        企业
        服务热线

        • 400-6680-889
        1. 登录
        2. 注册
        客户服务热线:
        400-6680-889
        在线客服:
        点击这里给我发消息 898995850
        工作日:
        8:30-18:00