LLM 应用工程师(RAG / 工具调用 / 工作流)
工作内容(做什么) 举例 + 关注点
- 把业务问题转成可落地的 LLM 方案:确定输入/输出格式、失败兜底、成本与延迟约束。
- 搭建 RAG:语料清洗→切分→向量化(embedding)→检索→(可选)重排(rerank)→生成回答,并做引用溯源。
- 做评测与迭代:建立测试集、定义指标(准确/召回/幻觉率/满意度),对比不同提示词与检索策略。
- 工程化交付:API/服务化(FastAPI)、缓存与限流、日志与可观测性(trace)、灰度发布。
AI Agent / 智能体工程(任务自动化)
工作内容(做什么) 举例 + 关注点
- 把复杂任务拆成可执行步骤:规划(plan)→调用工具(tool)→检查结果→必要时重试/改写。
- 接入外部工具:搜索、数据库、表格、邮件、日程、代码执行等,处理鉴权与权限边界。
- 让系统“更可靠”:状态管理、超时/失败兜底、幂等、循环检测(避免无限自我调用)。
- 可观测与调试:为每一步记录输入输出、token 消耗、失败原因,方便复盘与回归测试。
Prompt / LLM 解决方案(偏评测与落地)
工作内容(做什么) 举例 + 关注点
- 把需求写成“可验收任务”:定义正确输出的标准、边界条件、拒答规则与格式约束。
- 构建数据集:收集真实样例、覆盖常见问题与难例(边界、歧义、对抗输入)。
- 设计与迭代提示词:模板化(system/instructions)、few-shot 示例、结构化输出(JSON)。
- 建立评测闭环:离线评测 + 线上 A/B(若有条件),跟踪准确率、稳定性与用户满意度。
机器学习 / 深度学习工程(研一主攻方向)
工作内容(做什么) 举例 + 关注点
- 负责模型训练与实验:数据预处理、训练循环、调参、对比基线、复现实验记录。
- 把模型从“能跑”做到“可解释”:做误差分析(哪些类别/场景容易错,为什么错)。
- 落地到线上或产品:导出推理模型、做性能优化(延迟/吞吐),并与工程团队对齐接口。
- 跟进论文/开源:复现经典方法,逐步积累“可复现 + 可对比”的研究能力。
NLP 工程 / 算法(文本分类、抽取、检索)
工作内容(做什么) 举例 + 关注点
- 围绕文本任务做模型与数据:分类、实体抽取、相似度检索、问答等。
- 建设检索链路:BM25/向量检索 + 重排(cross-encoder),提升召回与排序质量。
- 数据标注与质量控制:标注规范、抽检一致性、难例维护(这点常被低估)。
- 评估与上线:定义指标(F1/Recall@K/NDCG),持续迭代并做回归。
多模态 / CV 应用(图文检索、识别、OCR 相关)
数据分析 / 数据科学(AI 相关团队常招)
工作内容(做什么) 举例 + 关注点
- 做图像/多模态任务:分类、检测、OCR、图文检索等,重点是数据与评估。
- 利用预训练模型:ViT/CLIP 等,用少量数据做微调或做检索式应用。
- 工程落地:推理速度、模型大小、设备适配(GPU/CPU/端侧)。
- 构建数据闭环:收集失败样例、补充数据、迭代提升鲁棒性。
工作内容(做什么) 举例 + 关注点
- 定义与维护指标:漏斗、留存、转化、满意度;把口径说清楚(避免“各说各的”)。
- 做实验与因果:A/B 测试设计、样本量估计、显著性判断、结果解释。
- 辅助模型与产品迭代:用数据定位问题段(例如检索召回不足、回答幻觉高发)。
- 搭建看板与监控:异常报警、分组对比、版本前后效果对比。
MLOps / 模型工程(训练流水线 & 部署)
AI 产品经理(大模型/智能助手方向)
工作内容(做什么) 举例 + 关注点
- 让训练与上线可规模化:训练流水线、数据版本、模型版本、实验记录与复现。
- 模型部署与发布:容器化、灰度、回滚、接口契约、依赖管理。
- 可观测与监控:延迟、吞吐、错误率、漂移监控;建立回归评测与报警。
- 成本控制:算力/存储/调用成本评估与优化。
工作内容(做什么) 举例 + 关注点
- 把“模型能力”翻译成“用户功能”:明确场景、用户目标、成功标准与失败兜底。
- 写 PRD/原型:流程、异常、权限、提示与引用展示、成本与延迟约束。
- 制定评测与指标:离线评测集(覆盖/难例)、线上指标(满意度、留存、转化)。
- 推动跨团队落地:对齐研发/算法/测试/运营的交付物与验收口径。
AI 质量/评测工程(LLM Eval / 回归测试)
工作内容(做什么) 举例 + 关注点
- 搭建 LLM 评测体系:评测集、指标、自动评分/人工抽检流程。
- 维护回归用例:版本迭代时防止“修了 A 坏了 B”(尤其在提示词与检索策略迭代中)。
- 对齐质量标准:覆盖率、难例分桶、违规/越狱/敏感内容拦截测试。
- 输出可行动的结论:把问题归因到“检索、提示、模型、数据、工具调用”的哪一段。
AI 运营(增长/内容/社区,数据驱动)
工作内容(做什么) 举例 + 关注点
- 用数据驱动增长:拉新-激活-留存-转化漏斗拆解,制定运营动作与触达策略。
- 内容与活动:围绕用户问题产出内容(教程、模板、案例),用指标评估效果。
- 用户分层:新手/活跃/高价值用户差异化运营;建立触达节奏与复盘机制。
- 与产品/算法协作:反馈高频需求与失败案例,推动产品迭代。
如果对毕业论文内容不擅长:不必强行“绑定论文方向”。简历可以换叙事:
研一能力建设 + 作品集 + 可复现实验。论文只保留为“完成过端到端数据任务”的证明即可。