中级算法工程师简历怎么写——从「调包炼丹」到「驱动业务增长」

上个月帮一个做了三年推荐算法的朋友看简历。他在某中型互联网公司，召回、粗排、精排全链路都碰过，DeepFM、DIN、MMoE 玩得挺熟。但投了一个月，面试邀约一只手数得过来。我把他的简历打开，项目经历第一条写着：

负责推荐系统排序模型优化，使用 DeepFM 替换原 LR 模型，参与特征工程建设和 AB 实验评估。

看完我就知道问题在哪了。这句话，换任何一个做了三年推荐算法的都能原封不动抄走。面试官翻到这一页，脑子里浮现的画面是——这人把 LR 换成了 DeepFM。然后呢？效果怎么样？对业务有什么影响？为什么选 DeepFM 不选别的？全都没有。

中级算法简历最致命的坑：你把三年积累的算法深度，写成了一份「模型实验记录本」。

中级算法工程师的级别定位

先说明白一个事：中级算法（3-5年）跟初级到底差在哪？

初级算法（1-2年）的核心任务是「能跑模型」。给你一个明确的方向和标注好的数据，你能把模型训出来、能上线、不出明显事故，就算合格。

但中级算法不一样。面试官对中级算法的期望是：你不光能调参炼丹，你还知道为什么炼这炉丹、炼出来对业务意味着什么、下一步应该炼什么。具体来说：

不是「用了 DeepFM」，而是「为什么在这个场景下 DeepFM 比 Wide&Deep 更合适，上线后 CTR 提升了多少」
不是「做过特征工程」，而是「从业务逻辑出发挖掘了哪类关键特征，单特征贡献了多少 AUC 增益」
不是「会跑 AB 实验」，而是「设计了什么实验方案、怎么控制辛普森悖论、实验结果如何驱动了产品决策」
不是「知道 Transformer」，而是「针对自己的业务场景对模型结构做了什么针对性改进，为什么这样改」

如果一份中级简历写的还停留在「用了什么模型」「跑了什么实验」，面试官读完之后对你的判断就是——这人三年了还停留在初级炼丹师的水平。

下面从四个维度拆开讲：项目经验的深度写法、业务指标量化、技术决策展示、自我评价。每个维度都有改前改后的案例——不是编的，是把算法工程师日常真正在做的「深度活」还原到简历上。

一、项目经验：从「用了什么模型」到「解决了什么业务问题」

中级算法简历最常见的写法，是把每个项目写成一段模型清单：

改前案例

负责首页推荐排序优化，基于 DeepFM 搭建排序模型，使用用户画像特征、物品特征和交叉特征进行训练。通过 AB 实验验证效果，线上 CTR 有所提升。

这段话说了三件事：你用了 DeepFM、你做了特征工程、你跑了 AB 实验。但面试官看完脑子里浮现的是——你拿着 DeepFM 在一个标准推荐场景下跑了一轮。没有任何信息能证明你比别人更深入。

问题在哪？你写的每一句都在回答「用了什么」，没有一句在回答「为什么用、怎么针对业务优化的、优化完了业务指标动了多少」。

改后案例（聚焦一个业务问题、一次深度优化）

首页推荐排序优化：针对推荐 Feed 流首屏 CTR 长期停滞在 6.8%、用户 session 时长无明显增长的瓶颈，主导排序模型从 LR 到 DeepFM 的升级及配套特征体系重构。

模型升级上：LR 阶段特征全靠人工交叉，高阶组合特征覆盖有限。选择 DeepFM 而非 Wide&Deep 的核心原因——首页场景用户行为稀疏，Wide 侧需要大量人工设计的交叉特征才能发挥作用，而 DeepFM 的 FM 侧自动学习二阶特征交互，在行为稀疏的用户群上 AUC 比 Wide&Deep 高 0.8 个百分点。上线后首屏 CTR 从 6.8% 提升至 8.1%，人均 session 时长从 11.2 分钟提升至 14.6 分钟。

特征体系重构上：原特征体系最致命的问题是特征时效性——用户实时行为要等 T+1 才能进入模型。主导搭建了实时特征 pipeline，将用户最近 30 分钟的点击、加购、收藏行为以实时 embedding 方式注入模型。这个改动带来的增益比模型升级本身还大——实时特征上线后 CTR 额外提升了 1.2 个百分点，且用户冷启动阶段的首屏 CTR 从 3.2% 提升至 5.5%。

这版为什么比原版好？ 面试官读完之后，脑子里会浮现出好几个画面：这人在选模型时做过对比实验并能说清取舍逻辑、这人知道特征时效性是瓶颈并且主导过 pipeline 改造、这人做的每一步都有明确的业务指标验证。每一个画面都在证明同一件事——这个三年经验的算法工程师，不是在「用模型」，而是在「用模型驱动业务增长」。

中级算法项目经验的写作公式

遇到了什么业务问题（要具体，不要「推荐效果不好」）→ 你分析了什么原因（定位问题的过程）→ 你的方案是什么（为什么这样选）→ 上线后业务指标变化（AB 实验数据）

这个结构跟 STAR 原则最大的区别在于：中级算法要多写一层「你的分析过程」和「方案的选择逻辑」。 因为分析和选择能力是区分中级和初级的核心信号——初级等别人告诉他「换 DeepFM 试试」，中级能自己从数据中发现问题、设计对比方案、做出技术取舍。

二、指标量化：算法工程师的数字该怎么写

算法工程师比后端更容易出数据，但也更容易写出「虚假的充实感」。我见过最多的三种写法：

写法一：只写动作，没有数字

优化了排序模型，提升了推荐效果。

「提升了」是什么？CTR？CVR？用户时长？什么都没有，面试官没法判断你的工作价值。

写法二：有数字但不可信

优化后模型 AUC 提升了 2%。

AUC 是离线指标。面试官第一反应就是：「线上线下一致吗？上线后 CTR 动了多少？」只写离线指标、不写线上业务指标，面试官会默认你的优化可能没上线，或者上线后效果并不好。

写法三：写了业务指标但没有基线

CTR 提升至 8.5%。

8.5% 是高是低？原来是多少？面试官没法判断这 8.5% 是你的功劳还是产品侧改版带来的。

算法简历数字的铁律：永远写「从 X 到 Y」，永远同时给离线 + 线上指标

差的写法	好的写法
模型 AUC 提升明显	排序模型 AUC 从 0.712 提升至 0.738；线上首屏 CTR 从 6.8% 提升至 8.1%（AB 实验，p<0.01）
推荐效果优化	推荐页人均点击次数从 2.3 提升至 3.1，用户次日留存率从 34% 提升至 38%
特征工程优化	新增实时行为序列特征，离线 AUC +1.8pp，线上 CTR +2.3%（贡献了总增益的 60%）
模型推理加速	模型 P99 推理延迟从 120ms 降至 35ms，支撑了首页全量实时排序（日请求量 5000 万+）

算法最该量化的四类指标

1. 离线实验指标（基础项，必须有）

AUC、LogLoss、NDCG、Precision/Recall 等

差：模型 AUC 提升。
好：在五周滚动窗口测试集上，AUC 从 0.723 提升至 0.746（+2.3%），LogLoss 降低 4.1%。

2. 线上业务指标（核心项，最值钱）

CTR、CVR、用户时长、留存率、GMV 等

好：排序模型上线后，推荐 Feed CTR 从 5.2% 提升至 6.4%（相对提升 23%），人均 feed 浏览深度从 12.8 条提升至 16.5 条。AB 实验持续两周，样本量 300 万用户，p-value < 0.01。

3. 工程性能指标（工程化能力的证明）

推理延迟、QPS、模型大小、特征计算耗时

好：将排序模型从 TensorFlow Serving 迁移至 TensorRT 推理，P99 延迟从 85ms 降至 28ms，单卡 QPS 从 1200 提升至 3500，节省了 4 张 GPU 推理卡（月成本约 2 万元）。

这类数字在中级阶段是重要的加分项——它说明你不只会炼丹，你还懂怎么让模型高效地服务线上流量。

4. 业务增益归因（高级感最强的数字）

说明你的贡献在整体增益中的占比

好：推荐系统季度改版整体 CTR 提升 15%，其中排序模型优化贡献 8pp，实时特征贡献 5pp，UI 改版贡献 2pp。

这种归因拆解是面试官最想看到的——它说明你对整个系统的增益来源有清晰的认知，不是「大家一起做了个需求，我说不清自己贡献了多少」。

三、技术决策：让面试官看到你的「算法选型思维」

中级算法跟初级算法最大的一个分水岭是：初级问「这个模型怎么用」，中级问「这个场景为什么选这个模型」。

但很多算法简历上完全看不到这一点。全篇都是「使用 DeepFM 做排序」「使用 BERT 做文本分类」「使用 DSSM 做召回」——看起来模型用得很全，但面试官真正的疑问是：你为什么选这些？是你主动选的，还是同事搭好的你跟着用？

改前案例

搜索相关性优化：使用 BERT 模型替换原 TF-IDF + 逻辑回归方案，提升搜索召回相关性。

这句话有两个问题：第一，「使用 BERT」没解释为什么是 BERT 而不是更轻量的方案。第二，「提升相关性」没数字。

改后案例

搜索相关性优化：电商搜索场景下，原 TF-IDF + LR 方案长尾 query 的 NDCG@10 只有 0.58，大量用户搜索「黑色显瘦连衣裙适合梨形身材」这类自然语言 query 时结果相关性很差。

评估了三种方案：FastText（轻量但语义理解弱）、Sentence-BERT（推理速度尚可，对长 query 效果好）、Cross-Encoder BERT（效果最好但推理延迟无法满足在线要求）。最终选择 Sentence-BERT 做 Query-Item 双塔，离线 NDCG@10 从 0.58 提升至 0.72。但上线后的挑战是——QPS 从 3000 翻到 8000 后 P99 延迟到了 150ms。通过模型蒸馏（12 层 → 4 层）+ 量化（FP32 → INT8），在 NDCG 仅降 0.02 的前提下将 P99 降至 35ms。搜索无结果率从 11.3% 降至 4.7%，搜索结果页 CVR 提升 8%。

看到区别了吗？原版只是在说「我用 BERT 做了文本匹配」，改版在说「我在三个方案里做了精度和速度的 trade-off，并且自己解决了上线后的工程瓶颈」。

技术决策的写法公式

面临什么业务问题 → 评估了哪几种方案（各自的优劣） → 为什么选了 A 而不是 B → 落地过程中遇到了什么挑战、怎么解决的 → 最终效果如何

不需要每个项目都写技术选型。挑 1-2 个你真正跑过对比实验、做过方案 trade-off 的项目来写。面试官看这一两条，就会知道你不是「别人让你用什么模型你就用什么」的初级选手。

四、自我评价：别写「精通推荐算法」，证明你用算法驱动过什么业务增长

算法工程师的自我评价是重灾区。十个中级算法的自我评价，八个长这样：

精通推荐算法，熟悉排序模型（DeepFM/DIN/MMoE），熟悉 NLP 预训练模型（BERT/GPT），具备扎实的机器学习基础，有良好的数据分析和实验设计能力。3 年推荐系统经验，独立负责过多个模型迭代项目。

面试官看到这段话，直接跳过。因为每一个三年算法都能抄走——「精通推荐算法」不用考试，「良好的数据分析能力」不用认证，「独立负责迭代项目」迭代了啥不知道。

改前 vs 改后

改前：

3 年推荐算法经验，精通排序模型和特征工程，熟悉 AB 实验设计，有从召回、粗排到精排的全链路优化经验。逻辑清晰，善于从数据中发现问题。

改后：

3 年推荐算法经验，专注 Feed 流场景的用户增长。独立负责过千万 DAU 产品的首页推荐排序优化——从 LR 到 DeepFM 的模型升级、实时特征体系搭建到 AB 实验评估体系全链路主导，将首屏 CTR 从 6.8% 提升至 9.5%，人均 session 时长从 11 分钟提升至 17 分钟。在召回侧主导过多路召回融合方案，将召回覆盖率从 62% 提升至 85%，长尾内容曝光占比提升 40%。

改前每一句都在「自我描述」，改后每一句都在「自我证明」：

「精通排序模型和特征工程」→ 改成了「从 LR 到 DeepFM 的模型升级、实时特征体系搭建全链路主导」。不是在说你会，而是在说你用它干过一个有规模的项目。
「熟悉 AB 实验设计」→ 改成了有具体数据验证的业务结果。面试官不用猜你能不能科学评估效果——数字摆在那。
「逻辑清晰，善于从数据中发现问题」→ 这句直接删了，因为上一段项目经验里已经展示了你从数据中定位问题的过程。不需要「宣称」，项目描述本身就是证明。

中级算法自我评价的核心原则

遮掉名字给别人看，对方能说出「这是一个做什么方向（推荐/NLP/CV）、在什么规模场景下解决过什么业务问题、对什么技术有深度理解的算法工程师」吗？

如果能说出来，合格。如果只能说「这是一个做推荐的/做 NLP 的」，说明你写的还是通用版，需要重写。

长度上，三到四句话足够。控制在一个让面试官 5 秒能读完的篇幅里。

五、不同算法方向的案例侧重点

算法工程师不是一个统一岗位，推荐、NLP、CV、搜广推各有各的叙事逻辑。以下按方向给出案例侧重：

NLP/搜索方向

侧重：相关性优化、Query 理解、语义匹配、长尾问题

案例：「针对 30% 的长尾 query 无结果问题，引入 Query 改写模块——基于大模型对长尾 query 做意图拆解和同义改写，改写后 query 的召回命中率从 58% 提升至 89%，无结果率从 11% 降至 4%。」

CV/视觉方向

侧重：模型精度 vs 推理速度的 trade-off、数据增强、业务场景适配

案例：「针对商品图背景杂乱导致类目识别准确率仅 82% 的问题，设计了两阶段方案——先做主体检测裁剪背景，再送入分类模型。端到端准确率提升至 95%，同时通过模型剪枝将推理延迟从 200ms 压缩至 45ms。」

搜广推方向（搜索广告/推荐广告）

侧重：商业指标（CPM/CPC/ROI）、竞价机制、流量分配效率

案例：「广告排序优化：在 CTR 预估模型基础上引入 CVR 预估和出价因子，构建 eCPM 排序公式。通过校准 CVR 预估的 overestimation 问题（校准前预估 CVR 是实际的 2.3 倍），将广告平台 RPM 提升 18%，广告主 ROI 提升 12%。」

六、中级算法简历四个容易被忽略的细节

1. 模型列表不如一个讲透的业务 case

差：

熟悉 LR、FM、DeepFM、DIN、DIEN、MMoE、DSSM、Youtube DNN、Transformer、BERT、GPT……

这一排模型名在面试官眼里只传递了一个信号：「我把我知道的模型全写上了，但你没说用它们解决了什么问题」。

好：

排序模型从 DeepFM 升级到 DIN——核心动机是 DeepFM 无法建模用户行为序列中的兴趣演化，而 Feed 流场景下用户兴趣漂移是 CTR 天花板的核心瓶颈。DIN 上线后长 session（>10 分钟）用户的人均点击从 3.2 提升至 5.1，验证了兴趣建模对用户留存的关键作用。

同一个模型名，前者是名词堆砌，后者是一个有因果逻辑的业务故事。

2. 「参与」和「主导」的区别就是面试官判断你段位的依据

「参与」这个词在算法简历里也是最危险的信号之一。它告诉面试官：你在这个项目里不是核心角色，你可能只是跑了几个实验或者写了几行特征代码。如果全篇都是「参与」「协助」「支持」，面试官会默认你三年的经验都是跟在别人后面做执行。

如果你确实只是参与——那你也要把你参与的那部分写到有深度。「参与排序模型优化」不如「在排序模型优化中独立负责用户行为序列特征的构建与消融实验，验证了行为序列长度从 50 扩展到 200 对长 session 用户体验的关键影响（AUC +0.9pp），推动团队将序列长度设为 200。」

3. 不要只写离线实验，没有线上效果

算法简历里最常见的问题之一：AUC 提了不少，但看不到一个上线后的业务指标。

面试官的直觉反应：「这人是只在离线环境里跑实验，还是真的把模型推上线了？」如果你只写离线指标，面试官会默认你是前者——因为在很多公司，离线跑实验和模型上线之间隔着巨大的工程鸿沟，很多人卡在了离线阶段。

规则：每个项目至少有一个线上业务指标。 如果确实没上线（比如实验没推全量），就写「推动模型上线至 10% 流量，AB 实验显示……」并诚实标注流量比例。

4. 实验设计能力要写出来，这是中级和初级的核心分水岭

初级的实验：跑个 AB，看 CTR 涨了就推全量。
中级的实验：做 AA 验证、控制辛普森悖论、做长期留存观测、算最小样本量。

如果你的简历里有一处写了实验设计的严谨性，面试官对你的判断会直接上一个台阶：

AB 实验设计：考虑到推荐系统的网络效应（实验组用户的点击会影响全局热门内容，可能污染对照组），采用用户侧分桶 + 内容侧降权的双重隔离方案。实验持续 14 天，最小样本量按 1% MDE（最小可检测效应）计算需要 120 万用户。核心指标 CTR 提升 4.7%（p=0.003），且长期留存指标在第 7 天开始收敛（证明不是 novelty effect）。

写完后的自检清单

每一段项目经历开头是不是写清楚了「遇到了什么业务问题」，而不是直接从「我负责……」开始？
每个效果数据是不是「从 X 到 Y」的格式，并且同时给了离线指标和线上业务指标？
有没有至少 1-2 个技术决策写出了「为什么选 A 不选 B」的对比分析和取舍逻辑？
自我评价里有没有哪句话删掉之后，换一个同样三年经验的算法工程师也能原封不动抄走？如果有，重写。
模型/技术栈部分是不是只写了你真的能聊深的模型？有没有把「看过论文但没用过」的也列上去了？
从头到尾读完，「参与」「协助」「支持」这些词出现了多少次？能不能把其中至少一半改成「主导」「独立完成」或具体的个人贡献描述？
有没有至少一个项目写了实验设计细节（分流方案、样本量、显著性检验）？
面试官读完你的简历，能不能一句话说清楚「这是一个做什么方向、在什么规模产品上解决过什么业务问题的中级算法工程师」？

说到底，中级算法的简历不是一份「我做过哪些模型实验」的实验报告，而是一份「我能用算法驱动什么级别的业务增长」的能力证明。你把业务问题写清楚了、把分析定位的过程写出来了、把方案选择的思考放进去了、把量化的业务结果摆出来了，面试官自然想把面试的 40 分钟全花在你身上。

如果你照着上面的维度改了一轮，还是不确定自己写得到不到位——说实话，自己看自己的简历确实很难，尤其是你已经跟它「太熟了」。好简历的免费诊断可以从成果量化、技术关键词匹配、表达清晰度几个维度帮你做一次全面扫描，告诉你哪些项目描述还不够深、哪些数字还可以更硬。

→ 免费诊断简历

中级算法工程师简历怎么写——从「调包炼丹」到「驱动业务增长」

本篇重点

带着这些问题去复盘

中级算法工程师的级别定位

一、项目经验：从「用了什么模型」到「解决了什么业务问题」

改前案例

改后案例（聚焦一个业务问题、一次深度优化）

中级算法项目经验的写作公式

二、指标量化：算法工程师的数字该怎么写

算法简历数字的铁律：永远写「从 X 到 Y」，永远同时给离线 + 线上指标

算法最该量化的四类指标

三、技术决策：让面试官看到你的「算法选型思维」

改前案例

改后案例

技术决策的写法公式

四、自我评价：别写「精通推荐算法」，证明你用算法驱动过什么业务增长

改前 vs 改后

中级算法自我评价的核心原则

五、不同算法方向的案例侧重点

推荐算法方向

NLP/搜索方向

CV/视觉方向

搜广推方向（搜索广告/推荐广告）

六、中级算法简历四个容易被忽略的细节

1. 模型列表不如一个讲透的业务 case

2. 「参与」和「主导」的区别就是面试官判断你段位的依据

3. 不要只写离线实验，没有线上效果

4. 实验设计能力要写出来，这是中级和初级的核心分水岭

写完后的自检清单