关于 Prompt 的细微差异
同一个问题,措辞顺序不同,模型输出可能完全不同。Prompt 的敏感性远比表面看起来复杂。
点击跳过
PORTFOLIO / 2025
AI 数据训练师
Prompt / Evaluation / Data / Language
以语言为尺,校准智能的边界。
让数据更准确,让模型更理解人。
About
两年 AI 数据工程实践,专注大语言模型训练的数据工作。
从数据标注到模型评测,从 RAG 知识库到对话系统——关注训练全链路中每一环的质量。
兼具项目统筹与一线执行的双重视角。运动康复的学业背景,让我对医疗健康场景有更深的业务理解。
细致、逻辑、审美——这三件事决定了工作质量。
Focus Areas
对话数据、偏好数据、多轮标注的质量标准与一致性。
准确性、流畅性、安全性、指令遵从度等多维度评估。
文档解析、向量入库、召回验证与效果监控。
标注团队协调、进度把控、质量体系搭建与流程优化。
运动康复专业背景,熟悉健康管理业务逻辑与 AI 应用场景。
Practice
项目经验摘要。
Dialogue & RLHF
统筹健康咨询场景的对话数据采集、标注与质量体系建设。
Evaluation
设计多维度评测框架,为模型迭代提供数据支撑。
RAG & Knowledge Base
主导垂直领域知识库搭建,优化召回效果与内容覆盖。
Data Annotation
执行 3D 扫描数据的精准标注与质量把控。
Observations
关于 AI、数据与语言的实践思考。
同一个问题,措辞顺序不同,模型输出可能完全不同。Prompt 的敏感性远比表面看起来复杂。
标注不是机械劳动。对语义边界的判断、对模糊 case 的处理,需要长期积累的经验与直觉。
输出自然流畅不代表逻辑准确。评测体系必须从多维度拆解,不能只看表面。
文档切分策略、向量召回效果、内容覆盖率——知识库建设是一个持续迭代的过程。
Journey
Beyond