AI/人工智能热门岗位路线图

岗位推荐（可筛选）

按岗位/技能搜索。匹配度：结合研一可准备的门槛与落地性给出优先级建议。

⌕

LLM 应用工程师（RAG / 工具调用 / 工作流）

当前热门且更“可项目化”：做一个带评测的 RAG 或 Agent Demo，比空谈模型更有说服力。

匹配度：高

核心：Python / API 调用 / 数据处理核心：RAG（切分/向量检索/重排）加分：LLM 评测（准确率/召回/幻觉）加分：向量库（FAISS/Milvus）边界：隐私/合规/安全

AI Agent / 智能体工程（任务自动化）

偏工程化：关键在“任务分解 + 工具集成 + 可靠性”。适合把“应用”做得稳。

匹配度：中高

核心：工具调用 / 状态管理 / 失败兜底核心：日志与可观测性（trace）加分：结构化输出 / 约束解码思路加分：评测集与回归测试通用：后端基础（FastAPI）

Prompt / LLM 解决方案（偏评测与落地）

“只会写提示词”不够，核心竞争力是：任务定义、数据集构建、指标与迭代闭环。

匹配度：中

核心：任务拆解 / 规范输出 / 失败案例库核心：离线评测 + A/B 线上验证加分：对齐与安全（敏感/越狱）通用：文档表达

机器学习 / 深度学习工程（研一主攻方向）

如果目标是“纯算法”，建议从 PyTorch + 经典任务入手，再过渡到微调与训练工程。

匹配度：中高

核心：PyTorch / 训练与调参核心：数据集与实验复现加分：LoRA/PEFT 微调边界：算力/工程复杂度

NLP 工程 / 算法（文本分类、抽取、检索）

可用小项目快速起步：文本分类/实体抽取/检索重排，并做系统性评估。

匹配度：中

核心：Transformers 基础加分：检索/重排（BM25 + Cross-Encoder）加分：标注规范与一致性通用：英语论文阅读

多模态 / CV 应用（图文检索、识别、OCR 相关）

如果她对图像更感兴趣：从 ViT/CLIP 等做应用型项目（检索/分类），再拓展到多模态。

匹配度：中

核心：PyTorch + 训练/评估加分：CLIP/对比学习直觉加分：向量检索/相似度搜索边界：数据与标注成本

数据分析 / 数据科学（AI 相关团队常招）

更稳的“入口岗”：先进入 AI 团队做分析/实验/指标，后续转算法或 AI 产品。

匹配度：高

核心：SQL + 指标体系核心：统计/实验（A/B）加分：建模（LR/GBDT）通用：报告表达

MLOps / 模型工程（训练流水线 & 部署）

热门但门槛偏工程：适合愿意做“平台化与稳定性”的同学，作品要体现可观测与版本管理。

匹配度：中低

核心：Docker / Linux / CI 加分：模型版本/数据版本管理加分：监控与回归评测

AI 产品经理（大模型/智能助手方向）

当前也很热门。核心是：把“模型能力”变成“可用功能”，并用指标与评测闭环迭代。

匹配度：高

核心：PRD/原型/验收标准核心：评测与指标（准确/幻觉/满意度）加分：RAG/Agent 基础概念通用：跨团队推动

AI 质量/评测工程（LLM Eval / 回归测试）

很多团队在补“评测体系”。如果她偏严谨细致，这个方向含金量高且缺口大。

匹配度：中高

核心：测试用例设计 + 回归核心：评测集构建（覆盖/难例）加分：自动化（Pytest）边界：评测主观性控制

AI 运营（增长/内容/社区，数据驱动）

适合对用户与内容敏感的人：用数据定位增长点，用实验做策略迭代。

匹配度：中

核心：增长指标/漏斗核心：Excel/SQL 分析加分：内容策略/活动策划通用：沟通与复盘

关键提醒
如果她对毕业论文内容不擅长：不必强行“绑定论文方向”。简历可以换叙事： 研一能力建设 + 作品集 + 可复现实验。论文只保留为“完成过端到端数据任务”的证明即可。

研一准备路线（可执行）

建议先选 1 条主线（LLM 应用 / DL 算法 / AI 产品&评测），再用作品集证明能力。

通用底座（先补齐，再分支） 2–4 周打底

Python 工程：虚拟环境、依赖管理、日志、单元测试（pytest）。
数据处理：Pandas/NumPy，基本可视化，数据清洗套路。
ML 基础：评估指标、过拟合/正则、交叉验证、误差分析。
基础工具：Git、Linux、Docker（了解即可）。

路线 1：LLM 应用（RAG/Agent）最容易做作品

掌握：文本切分、向量检索、重排、引用/溯源、提示模板。
重点：评测（准确、召回、幻觉、稳定性）与回归测试。
产出：一个可运行 Demo（Web/CLI）+ 一份评测报告（含难例）。

路线 2：深度学习/算法（PyTorch）更硬核、更慢热

掌握：训练循环、优化器、学习率策略、可复现实验（seed/日志）。
选择：NLP 或 CV 一个方向做 1–2 个任务跑通（并复现论文/开源）。
产出：训练代码 + 实验表格 + 误差分析（不是只给准确率）。

路线 3：AI 产品 / AI 评测（更偏非纯技术）就业面更广

掌握：PRD/原型、验收标准、指标与埋点、A/B 测试。
重点：把“模型能力”写成可验收功能（输入/输出/失败兜底/成本）。
产出：PRD + 原型 + 评测集（或测试用例）+ 复盘报告。

如何快速定方向（建议 1 周内完成）
给她一个“试错法”：每条路线做一个 3–5 天的 mini-作品。做完后看哪条更愿意继续投入。方向不是想出来的，是做出来的。
愿意持续做 = 更适合；只想完成任务 = 不适合。

作品集建议（热门 AI 岗位更看重“作品 + 评测”）

下面给 6 个“可展示”的作品方向；每个都建议：代码仓库 + README + 截图/演示 + 评测表。

作品 A：RAG 问答（带引用与评测）

用一套固定语料（课程资料/论文/公司文档）做 RAG，必须输出引用；并做评测集与难例库。

输出：引用溯源 + 评测报告加分：重排/多查询/去幻觉策略

作品 B：Agent 自动化（邮件/表格/网页任务）

做一个“工具调用工作流”：任务分解 → 调用工具 → 失败重试/回滚 → 生成结构化结果。

输出：可观测日志 + 回归用例加分：权限/安全/成本控制

作品 C：LLM 评测小框架（最稀缺）

从 0 搭一个 eval：样本集、指标、自动评分/人工抽检、版本对比与回归报警。

输出：评测流水线加分：难例分桶/误差归因

作品 D：文本分类/抽取（PyTorch/Transformers）

做一个严谨的小任务：数据处理、训练、调参、对比基线，重点写清“为什么提升”。

输出：对比实验 + 误差分析适配：NLP/算法

作品 E：AI 产品 PRD（功能 + 成本 + 评测）

选一个“智能助手/搜索/总结”功能，写 PRD、原型、验收标准，并补一份评测与灰度方案。

输出：PRD + 原型 + 指标加分：成本测算（token/调用）

作品 F：API 测试 + 自动化（为 AI 服务兜底）

为作品 A/B 做接口用例与回归脚本（含异常、限流、超时、幂等），输出测试报告模板。

输出：用例集 + Pytest 适配：测试/质量/平台

作品打分标准（面试官最常看）
可运行（能复现） → 有评测（能比较） → 有解释（能归因） → 能上线（有工程化）。
只展示界面/只贴模型名，通常不够。