← 返回招聘知识频道
五、简历写作:从表达经历到突出竞争力适合:3-5年中级算法工程师阅读:12 分钟更新:2026-06-21

中级算法工程师简历怎么写——从「调包炼丹」到「驱动业务增长」

3-5年的算法工程师,最大的坑是把简历写成「模型实验记录本」——列一堆模型名和调参经历,却说不清每个实验对业务到底产生了什么影响。本文从项目经验深度、业务指标量化、技术决策展示、自我评价四个维度,拆解中级算法简历的写作方法,每个维度都有真实案例。

本篇重点

  • Replace responsibility lists with quantified outcomes
  • Show role-specific capabilities with concrete evidence

带着这些问题去复盘

  • Does the resume show measurable impact?
  • Are project examples aligned to the target role?

上个月帮一个做了三年推荐算法的朋友看简历。他在某中型互联网公司,召回、粗排、精排全链路都碰过,DeepFM、DIN、MMoE 玩得挺熟。但投了一个月,面试邀约一只手数得过来。我把他的简历打开,项目经历第一条写着:

负责推荐系统排序模型优化,使用 DeepFM 替换原 LR 模型,参与特征工程建设和 AB 实验评估。

看完我就知道问题在哪了。这句话,换任何一个做了三年推荐算法的都能原封不动抄走。面试官翻到这一页,脑子里浮现的画面是——这人把 LR 换成了 DeepFM。然后呢?效果怎么样?对业务有什么影响?为什么选 DeepFM 不选别的?全都没有。

中级算法简历最致命的坑:你把三年积累的算法深度,写成了一份「模型实验记录本」。


中级算法工程师的级别定位

先说明白一个事:中级算法(3-5年)跟初级到底差在哪?

初级算法(1-2年)的核心任务是「能跑模型」。给你一个明确的方向和标注好的数据,你能把模型训出来、能上线、不出明显事故,就算合格。

但中级算法不一样。面试官对中级算法的期望是:你不光能调参炼丹,你还知道为什么炼这炉丹、炼出来对业务意味着什么、下一步应该炼什么。具体来说:

  • 不是「用了 DeepFM」,而是「为什么在这个场景下 DeepFM 比 Wide&Deep 更合适,上线后 CTR 提升了多少」
  • 不是「做过特征工程」,而是「从业务逻辑出发挖掘了哪类关键特征,单特征贡献了多少 AUC 增益」
  • 不是「会跑 AB 实验」,而是「设计了什么实验方案、怎么控制辛普森悖论、实验结果如何驱动了产品决策」
  • 不是「知道 Transformer」,而是「针对自己的业务场景对模型结构做了什么针对性改进,为什么这样改」

如果一份中级简历写的还停留在「用了什么模型」「跑了什么实验」,面试官读完之后对你的判断就是——这人三年了还停留在初级炼丹师的水平

下面从四个维度拆开讲:项目经验的深度写法、业务指标量化、技术决策展示、自我评价。每个维度都有改前改后的案例——不是编的,是把算法工程师日常真正在做的「深度活」还原到简历上。


一、项目经验:从「用了什么模型」到「解决了什么业务问题」

中级算法简历最常见的写法,是把每个项目写成一段模型清单:

改前案例

负责首页推荐排序优化,基于 DeepFM 搭建排序模型,使用用户画像特征、物品特征和交叉特征进行训练。通过 AB 实验验证效果,线上 CTR 有所提升。

这段话说了三件事:你用了 DeepFM、你做了特征工程、你跑了 AB 实验。但面试官看完脑子里浮现的是——你拿着 DeepFM 在一个标准推荐场景下跑了一轮。没有任何信息能证明你比别人更深入。

问题在哪?你写的每一句都在回答「用了什么」,没有一句在回答「为什么用、怎么针对业务优化的、优化完了业务指标动了多少」。

改后案例(聚焦一个业务问题、一次深度优化)

首页推荐排序优化:针对推荐 Feed 流首屏 CTR 长期停滞在 6.8%、用户 session 时长无明显增长的瓶颈,主导排序模型从 LR 到 DeepFM 的升级及配套特征体系重构。

模型升级上:LR 阶段特征全靠人工交叉,高阶组合特征覆盖有限。选择 DeepFM 而非 Wide&Deep 的核心原因——首页场景用户行为稀疏,Wide 侧需要大量人工设计的交叉特征才能发挥作用,而 DeepFM 的 FM 侧自动学习二阶特征交互,在行为稀疏的用户群上 AUC 比 Wide&Deep 高 0.8 个百分点。上线后首屏 CTR 从 6.8% 提升至 8.1%,人均 session 时长从 11.2 分钟提升至 14.6 分钟。

特征体系重构上:原特征体系最致命的问题是特征时效性——用户实时行为要等 T+1 才能进入模型。主导搭建了实时特征 pipeline,将用户最近 30 分钟的点击、加购、收藏行为以实时 embedding 方式注入模型。这个改动带来的增益比模型升级本身还大——实时特征上线后 CTR 额外提升了 1.2 个百分点,且用户冷启动阶段的首屏 CTR 从 3.2% 提升至 5.5%。

这版为什么比原版好? 面试官读完之后,脑子里会浮现出好几个画面:这人在选模型时做过对比实验并能说清取舍逻辑、这人知道特征时效性是瓶颈并且主导过 pipeline 改造、这人做的每一步都有明确的业务指标验证。每一个画面都在证明同一件事——这个三年经验的算法工程师,不是在「用模型」,而是在「用模型驱动业务增长」。

中级算法项目经验的写作公式

遇到了什么业务问题(要具体,不要「推荐效果不好」)→ 你分析了什么原因(定位问题的过程)→ 你的方案是什么(为什么这样选)→ 上线后业务指标变化(AB 实验数据)

这个结构跟 STAR 原则最大的区别在于:中级算法要多写一层「你的分析过程」和「方案的选择逻辑」。 因为分析和选择能力是区分中级和初级的核心信号——初级等别人告诉他「换 DeepFM 试试」,中级能自己从数据中发现问题、设计对比方案、做出技术取舍。


二、指标量化:算法工程师的数字该怎么写

算法工程师比后端更容易出数据,但也更容易写出「虚假的充实感」。我见过最多的三种写法:

写法一:只写动作,没有数字

优化了排序模型,提升了推荐效果。

「提升了」是什么?CTR?CVR?用户时长?什么都没有,面试官没法判断你的工作价值。

写法二:有数字但不可信

优化后模型 AUC 提升了 2%。

AUC 是离线指标。面试官第一反应就是:「线上线下一致吗?上线后 CTR 动了多少?」只写离线指标、不写线上业务指标,面试官会默认你的优化可能没上线,或者上线后效果并不好。

写法三:写了业务指标但没有基线

CTR 提升至 8.5%。

8.5% 是高是低?原来是多少?面试官没法判断这 8.5% 是你的功劳还是产品侧改版带来的。

算法简历数字的铁律:永远写「从 X 到 Y」,永远同时给离线 + 线上指标

差的写法好的写法
模型 AUC 提升明显排序模型 AUC 从 0.712 提升至 0.738;线上首屏 CTR 从 6.8% 提升至 8.1%(AB 实验,p<0.01)
推荐效果优化推荐页人均点击次数从 2.3 提升至 3.1,用户次日留存率从 34% 提升至 38%
特征工程优化新增实时行为序列特征,离线 AUC +1.8pp,线上 CTR +2.3%(贡献了总增益的 60%)
模型推理加速模型 P99 推理延迟从 120ms 降至 35ms,支撑了首页全量实时排序(日请求量 5000 万+)

算法最该量化的四类指标

1. 离线实验指标(基础项,必须有)

AUC、LogLoss、NDCG、Precision/Recall 等

差:模型 AUC 提升。
好:在五周滚动窗口测试集上,AUC 从 0.723 提升至 0.746(+2.3%),LogLoss 降低 4.1%。

2. 线上业务指标(核心项,最值钱)

CTR、CVR、用户时长、留存率、GMV 等

好:排序模型上线后,推荐 Feed CTR 从 5.2% 提升至 6.4%(相对提升 23%),人均 feed 浏览深度从 12.8 条提升至 16.5 条。AB 实验持续两周,样本量 300 万用户,p-value < 0.01。

3. 工程性能指标(工程化能力的证明)

推理延迟、QPS、模型大小、特征计算耗时

好:将排序模型从 TensorFlow Serving 迁移至 TensorRT 推理,P99 延迟从 85ms 降至 28ms,单卡 QPS 从 1200 提升至 3500,节省了 4 张 GPU 推理卡(月成本约 2 万元)。

这类数字在中级阶段是重要的加分项——它说明你不只会炼丹,你还懂怎么让模型高效地服务线上流量。

4. 业务增益归因(高级感最强的数字)

说明你的贡献在整体增益中的占比

好:推荐系统季度改版整体 CTR 提升 15%,其中排序模型优化贡献 8pp,实时特征贡献 5pp,UI 改版贡献 2pp。

这种归因拆解是面试官最想看到的——它说明你对整个系统的增益来源有清晰的认知,不是「大家一起做了个需求,我说不清自己贡献了多少」。


三、技术决策:让面试官看到你的「算法选型思维」

中级算法跟初级算法最大的一个分水岭是:初级问「这个模型怎么用」,中级问「这个场景为什么选这个模型」。

但很多算法简历上完全看不到这一点。全篇都是「使用 DeepFM 做排序」「使用 BERT 做文本分类」「使用 DSSM 做召回」——看起来模型用得很全,但面试官真正的疑问是:你为什么选这些?是你主动选的,还是同事搭好的你跟着用?

改前案例

搜索相关性优化:使用 BERT 模型替换原 TF-IDF + 逻辑回归方案,提升搜索召回相关性。

这句话有两个问题:第一,「使用 BERT」没解释为什么是 BERT 而不是更轻量的方案。第二,「提升相关性」没数字。

改后案例

搜索相关性优化:电商搜索场景下,原 TF-IDF + LR 方案长尾 query 的 NDCG@10 只有 0.58,大量用户搜索「黑色显瘦连衣裙适合梨形身材」这类自然语言 query 时结果相关性很差。

评估了三种方案:FastText(轻量但语义理解弱)、Sentence-BERT(推理速度尚可,对长 query 效果好)、Cross-Encoder BERT(效果最好但推理延迟无法满足在线要求)。最终选择 Sentence-BERT 做 Query-Item 双塔,离线 NDCG@10 从 0.58 提升至 0.72。但上线后的挑战是——QPS 从 3000 翻到 8000 后 P99 延迟到了 150ms。通过模型蒸馏(12 层 → 4 层)+ 量化(FP32 → INT8),在 NDCG 仅降 0.02 的前提下将 P99 降至 35ms。搜索无结果率从 11.3% 降至 4.7%,搜索结果页 CVR 提升 8%。

看到区别了吗?原版只是在说「我用 BERT 做了文本匹配」,改版在说「我在三个方案里做了精度和速度的 trade-off,并且自己解决了上线后的工程瓶颈」。

技术决策的写法公式

面临什么业务问题 → 评估了哪几种方案(各自的优劣) → 为什么选了 A 而不是 B → 落地过程中遇到了什么挑战、怎么解决的 → 最终效果如何

不需要每个项目都写技术选型。挑 1-2 个你真正跑过对比实验、做过方案 trade-off 的项目来写。面试官看这一两条,就会知道你不是「别人让你用什么模型你就用什么」的初级选手。


四、自我评价:别写「精通推荐算法」,证明你用算法驱动过什么业务增长

算法工程师的自我评价是重灾区。十个中级算法的自我评价,八个长这样:

精通推荐算法,熟悉排序模型(DeepFM/DIN/MMoE),熟悉 NLP 预训练模型(BERT/GPT),具备扎实的机器学习基础,有良好的数据分析和实验设计能力。3 年推荐系统经验,独立负责过多个模型迭代项目。

面试官看到这段话,直接跳过。因为每一个三年算法都能抄走——「精通推荐算法」不用考试,「良好的数据分析能力」不用认证,「独立负责迭代项目」迭代了啥不知道。

改前 vs 改后

改前:

3 年推荐算法经验,精通排序模型和特征工程,熟悉 AB 实验设计,有从召回、粗排到精排的全链路优化经验。逻辑清晰,善于从数据中发现问题。

改后:

3 年推荐算法经验,专注 Feed 流场景的用户增长。独立负责过千万 DAU 产品的首页推荐排序优化——从 LR 到 DeepFM 的模型升级、实时特征体系搭建到 AB 实验评估体系全链路主导,将首屏 CTR 从 6.8% 提升至 9.5%,人均 session 时长从 11 分钟提升至 17 分钟。在召回侧主导过多路召回融合方案,将召回覆盖率从 62% 提升至 85%,长尾内容曝光占比提升 40%。

改前每一句都在「自我描述」,改后每一句都在「自我证明」:

  • 「精通排序模型和特征工程」→ 改成了「从 LR 到 DeepFM 的模型升级、实时特征体系搭建全链路主导」。不是在说你会,而是在说你用它干过一个有规模的项目。
  • 「熟悉 AB 实验设计」→ 改成了有具体数据验证的业务结果。面试官不用猜你能不能科学评估效果——数字摆在那。
  • 「逻辑清晰,善于从数据中发现问题」→ 这句直接删了,因为上一段项目经验里已经展示了你从数据中定位问题的过程。不需要「宣称」,项目描述本身就是证明。

中级算法自我评价的核心原则

遮掉名字给别人看,对方能说出「这是一个做什么方向(推荐/NLP/CV)、在什么规模场景下解决过什么业务问题、对什么技术有深度理解的算法工程师」吗?

如果能说出来,合格。如果只能说「这是一个做推荐的/做 NLP 的」,说明你写的还是通用版,需要重写。

长度上,三到四句话足够。控制在一个让面试官 5 秒能读完的篇幅里。


五、不同算法方向的案例侧重点

算法工程师不是一个统一岗位,推荐、NLP、CV、搜广推各有各的叙事逻辑。以下按方向给出案例侧重:

推荐算法方向

侧重:全链路(召回→粗排→精排→重排)的优化闭环、多目标建模、冷启动、实时化

案例:「在精排阶段引入多目标 MMOE 架构,同时优化 CTR 和用户时长两个目标,通过动态权重调整解决两个目标冲突问题,最终 CTR 提升 3% 的同时用户时长提升 8%。」

NLP/搜索方向

侧重:相关性优化、Query 理解、语义匹配、长尾问题

案例:「针对 30% 的长尾 query 无结果问题,引入 Query 改写模块——基于大模型对长尾 query 做意图拆解和同义改写,改写后 query 的召回命中率从 58% 提升至 89%,无结果率从 11% 降至 4%。」

CV/视觉方向

侧重:模型精度 vs 推理速度的 trade-off、数据增强、业务场景适配

案例:「针对商品图背景杂乱导致类目识别准确率仅 82% 的问题,设计了两阶段方案——先做主体检测裁剪背景,再送入分类模型。端到端准确率提升至 95%,同时通过模型剪枝将推理延迟从 200ms 压缩至 45ms。」

搜广推方向(搜索广告/推荐广告)

侧重:商业指标(CPM/CPC/ROI)、竞价机制、流量分配效率

案例:「广告排序优化:在 CTR 预估模型基础上引入 CVR 预估和出价因子,构建 eCPM 排序公式。通过校准 CVR 预估的 overestimation 问题(校准前预估 CVR 是实际的 2.3 倍),将广告平台 RPM 提升 18%,广告主 ROI 提升 12%。」


六、中级算法简历四个容易被忽略的细节

1. 模型列表不如一个讲透的业务 case

差:

熟悉 LR、FM、DeepFM、DIN、DIEN、MMoE、DSSM、Youtube DNN、Transformer、BERT、GPT……

这一排模型名在面试官眼里只传递了一个信号:「我把我知道的模型全写上了,但你没说用它们解决了什么问题」。

好:

排序模型从 DeepFM 升级到 DIN——核心动机是 DeepFM 无法建模用户行为序列中的兴趣演化,而 Feed 流场景下用户兴趣漂移是 CTR 天花板的核心瓶颈。DIN 上线后长 session(>10 分钟)用户的人均点击从 3.2 提升至 5.1,验证了兴趣建模对用户留存的关键作用。

同一个模型名,前者是名词堆砌,后者是一个有因果逻辑的业务故事。

2. 「参与」和「主导」的区别就是面试官判断你段位的依据

「参与」这个词在算法简历里也是最危险的信号之一。它告诉面试官:你在这个项目里不是核心角色,你可能只是跑了几个实验或者写了几行特征代码。如果全篇都是「参与」「协助」「支持」,面试官会默认你三年的经验都是跟在别人后面做执行。

如果你确实只是参与——那你也要把你参与的那部分写到有深度。「参与排序模型优化」不如「在排序模型优化中独立负责用户行为序列特征的构建与消融实验,验证了行为序列长度从 50 扩展到 200 对长 session 用户体验的关键影响(AUC +0.9pp),推动团队将序列长度设为 200。」

3. 不要只写离线实验,没有线上效果

算法简历里最常见的问题之一:AUC 提了不少,但看不到一个上线后的业务指标。

面试官的直觉反应:「这人是只在离线环境里跑实验,还是真的把模型推上线了?」如果你只写离线指标,面试官会默认你是前者——因为在很多公司,离线跑实验和模型上线之间隔着巨大的工程鸿沟,很多人卡在了离线阶段。

规则:每个项目至少有一个线上业务指标。 如果确实没上线(比如实验没推全量),就写「推动模型上线至 10% 流量,AB 实验显示……」并诚实标注流量比例。

4. 实验设计能力要写出来,这是中级和初级的核心分水岭

初级的实验:跑个 AB,看 CTR 涨了就推全量。
中级的实验:做 AA 验证、控制辛普森悖论、做长期留存观测、算最小样本量。

如果你的简历里有一处写了实验设计的严谨性,面试官对你的判断会直接上一个台阶:

AB 实验设计:考虑到推荐系统的网络效应(实验组用户的点击会影响全局热门内容,可能污染对照组),采用用户侧分桶 + 内容侧降权的双重隔离方案。实验持续 14 天,最小样本量按 1% MDE(最小可检测效应)计算需要 120 万用户。核心指标 CTR 提升 4.7%(p=0.003),且长期留存指标在第 7 天开始收敛(证明不是 novelty effect)。


写完后的自检清单

  • 每一段项目经历开头是不是写清楚了「遇到了什么业务问题」,而不是直接从「我负责……」开始?
  • 每个效果数据是不是「从 X 到 Y」的格式,并且同时给了离线指标和线上业务指标?
  • 有没有至少 1-2 个技术决策写出了「为什么选 A 不选 B」的对比分析和取舍逻辑?
  • 自我评价里有没有哪句话删掉之后,换一个同样三年经验的算法工程师也能原封不动抄走?如果有,重写。
  • 模型/技术栈部分是不是只写了你真的能聊深的模型?有没有把「看过论文但没用过」的也列上去了?
  • 从头到尾读完,「参与」「协助」「支持」这些词出现了多少次?能不能把其中至少一半改成「主导」「独立完成」或具体的个人贡献描述?
  • 有没有至少一个项目写了实验设计细节(分流方案、样本量、显著性检验)?
  • 面试官读完你的简历,能不能一句话说清楚「这是一个做什么方向、在什么规模产品上解决过什么业务问题的中级算法工程师」?

说到底,中级算法的简历不是一份「我做过哪些模型实验」的实验报告,而是一份「我能用算法驱动什么级别的业务增长」的能力证明。你把业务问题写清楚了、把分析定位的过程写出来了、把方案选择的思考放进去了、把量化的业务结果摆出来了,面试官自然想把面试的 40 分钟全花在你身上。

如果你照着上面的维度改了一轮,还是不确定自己写得到不到位——说实话,自己看自己的简历确实很难,尤其是你已经跟它「太熟了」。好简历的免费诊断可以从成果量化、技术关键词匹配、表达清晰度几个维度帮你做一次全面扫描,告诉你哪些项目描述还不够深、哪些数字还可以更硬。

→ 免费诊断简历