大模型数据平台工程师
岗位职责:
- 独立与产研团队对接内容生产/数据标注类需求,并根据需求制定初步的生产/审核标准;
- 语料爬虫系统搭建:设计并实现高效稳定的网络爬虫系统,用于抓取各类高质量语料,沉淀数据资产,内容工具等产品;
- 数据平台的需求拆解与开发
岗位要求:
- 对大模型有基本的认知了解;
- 有数据标注类(sft. rm等)项目经验,了解大模型训练数据标注模式和流程;
- 对采集. 大数据内容应用产品有一定了解,对负责领域做未来判断和规划
- 熟练使用python或golang,有llamaindex或者langchain等开发经验优先
- 了解包括mysq. redis. zilliz等在内的数据库和向量数据库
- 学习能力强,有一定的抗压能力;
- 有大模型训练类项目经验的优先,有项目管理经验的优先。
公司提供无限token额度的GPT4o使用
联系电话: 17812095413