职位描述
学历与专业:计算机 / 软件工程博士,深耕分布式系统、并行计算领域,具备扎实的系统理论与算法基础。
技术能力:精通微服务架构、容器化技术(Kubernetes/Docker)、云原生开发(AWS/Azure),熟悉 AI 训练框架(TensorFlow/PyTorch)及高性能计算优化。
经验:5 年以上大型分布式系统架构经验,主导过云平台或 AI 基础设施设计,具备高并发、低延迟系统开发及 DevOps 全流程经验。
领域知识:熟悉 AI 训练资源调度、任务队列管理、模型生命周期管理,掌握分布式存储(HDFS/Ceph)与消息队列(Kafka/RabbitMQ)技术。
协作创新:擅长跨团队技术方案设计,推动云原生、边缘计算等前沿技术落地,具备复杂问题拆解与系统重构能力