Overview
Job-type |
Contract |
Job Category |
IT - Software |
Industries |
IT |
Salary |
RMB 25,000
- 35,000
/Month
|
Who you'll be working for
Large US-based chip company
What requirements you'll need to be eligible
1. 本科学历以上,计算机科学、软件工程或相关专业;
2. 2年以上golang开发经验;
3. 具备Kubernetes的生产环境实践经验,具备CRD与控制器/操作器的搭建/维护经验;
4. 对云计算和容器化技术有基本理解,掌握云原生相关技术,如网络 / 容器网络接口(CNI)、Helm/Kustomize 工具、GitOps 理念及 CI/CD 流程。
5. 掌握指标监控、告警配置、链路追踪和Dashboards搭建,能够独立完成服务埋点,有效完成on-call工作
6. 对机器学习和AI模型部署有浓厚兴趣;
加分项:
1. 具备AI或LLM模型的训练/推理部署经验,熟悉GPU集群架构,了解AI模型训练/推理过程的性能指标和基准测试方法
2. 掌握Kubernetes调度器扩展技术
3. 具备云服务性能/规模优化经验,熟练使用性能分析工具、负载测试工具,能独立完成容量规划;
4. 熟悉数据库与Infra技术,如:PostgreSQL, Redis, Kafka, 对象储、NVMe/Ceph/Weka(存储技术)及 RDMA/RoCE(高性能网络技术)
What you'll be doing on the job
1. 基于Golang设计和开发高度可扩展的云原生应用,支持AI 模型训练部署的功能和服务;
2. 利用 controller-runtime(如管理器、调和器)扩展 Kubernetes 的CRD和容器化工具,参与调度器策略 / 插件的开发;
3. 与团队协作,通过CI/CD流程进行代码集成和部署,并参与GitOps实践,以保证代码质量和服务可用性,提升平台稳定性;
4. 支持模型训练/推理的性能测试与验证工作,如设计基准测试方案,检测吞吐量、分析计算、网络、存储层面的性能瓶颈;
5. 输出性能基准报告与调优指南助力优化AI应用性;
6. 与 算法模型团队协作,整合模型训练 / 推理工作流,验证方案改进效果,确保更新安全实施。
Consultant Contact
Sound interesting?
Apply!