PromptEvaluationDataLanguage

PORTFOLIO / 2025

X

AI 数据训练师

Prompt / Evaluation / Data / Language

以语言为尺，校准智能的边界。

让数据更准确，让模型更理解人。

关于

About

两年 AI 数据工程实践，专注大语言模型训练的数据工作。

从数据标注到模型评测，从 RAG 知识库到对话系统——关注训练全链路中每一环的质量。

兼具项目统筹与一线执行的双重视角。运动康复的学业背景，让我对医疗健康场景有更深的业务理解。

细致、逻辑、审美——这三件事决定了工作质量。

能力

Focus Areas

数据标注

对话数据、偏好数据、多轮标注的质量标准与一致性。

模型评测

准确性、流畅性、安全性、指令遵从度等多维度评估。

RAG 知识库

文档解析、向量入库、召回验证与效果监控。

项目管理

标注团队协调、进度把控、质量体系搭建与流程优化。

医疗健康

运动康复专业背景，熟悉健康管理业务逻辑与 AI 应用场景。

实践

Practice

项目经验摘要。

对话数据工程

Dialogue & RLHF

统筹健康咨询场景的对话数据采集、标注与质量体系建设。

模型评测体系

Evaluation

设计多维度评测框架，为模型迭代提供数据支撑。

RAG 知识库建设

RAG & Knowledge Base

主导垂直领域知识库搭建，优化召回效果与内容覆盖。

多模态数据标注

Data Annotation

执行 3D 扫描数据的精准标注与质量把控。

观察

Observations

关于 AI、数据与语言的实践思考。

2025.05

关于 Prompt 的细微差异

同一个问题，措辞顺序不同，模型输出可能完全不同。Prompt 的敏感性远比表面看起来复杂。

2025.04

为什么数据标注需要「手感」

标注不是机械劳动。对语义边界的判断、对模糊 case 的处理，需要长期积累的经验与直觉。

2025.03

当模型「看起来正确」

输出自然流畅不代表逻辑准确。评测体系必须从多维度拆解，不能只看表面。

2025.01

RAG 知识库的质量闭环

文档切分策略、向量召回效果、内容覆盖率——知识库建设是一个持续迭代的过程。

行迹

Journey

2025统筹 AI 客服机器人数据项目，搭建模型评测体系

2024进入 AI 数据训练领域，从数据标注到 RM 模型数据构建

2020进入运动康复专业学习，建立健康管理知识基础

山外

Beyond

阅读

《窄门》
《有限游戏与无限游戏》
《思考，快与慢》

关注

RLHF 与人类反馈
数据标注标准化
中文 NLP 评测
运动康复与 AI

审美

东方庭院
宣纸肌理
极简建筑
宋代瓷器

来信

Get in touch

如果你正在寻找认真、细致、关注质量的人，

欢迎交流。

广东佛山 · 可远程

联系我WRITE TO ME