跳转至

00 知识地图

整个知识体系按“稳定底座 → 通用 AI 能力 → 专业方向 → 产出材料”组织。先看完这一页,再进入具体板块。

AI 算法与工程知识体系地图


一、整体架构

层级 板块 性质
稳定底座 01 计算机系统基础 / 02 数学统计优化 / 03 编程与工程能力 / 04 数据结构与算法 长期稳定,支撑所有上层方向
通用 AI 能力 05 机器学习基础 / 06 深度学习与 PyTorch 进入推荐、大模型、多模态之前的通用能力
专业方向 07 推荐搜索广告 / 08 大模型 / 09 多模态 可以独立深耕,也会互相交叉
产出材料 10 项目实验与面试 / 11 论文精读 项目、面试、实验、论文阅读的沉淀区

设计原则:基础是底盘,方向是模块。新增技术方向时,优先判断它属于“底层能力、模型算法、系统工程、应用工程、业务场景”中的哪一类。


二、板块定位

01 计算机系统基础

理解程序和模型在真实机器上如何运行。

子目录 是什么
01_硬件 CPU/GPU、内存层级、存储、总线、显存
02_操作系统 进程线程、内存管理、文件系统、IO
03_计算机网络 TCP/IP、HTTP、DNS、WebSocket
04_数据库 SQL、索引、事务、NoSQL
05_分布式系统 CAP、一致性、RPC、消息队列

02 数学统计优化

ML、DL、RL、LLM 共享的数学语言。

子目录 是什么
01_线性代数 向量、矩阵、特征分解、SVD
02_微积分与矩阵求导 导数、梯度、Jacobian、Hessian
03_概率统计 分布、最大似然、贝叶斯、假设检验
04_信息论 熵、交叉熵、KL 散度
05_优化算法 SGD、Momentum、Adam、AdamW、学习率调度
06_强化学习数学基础 MDP、策略梯度、PPO、GAE

03 编程与工程能力

把想法写成可运行、可维护、可协作的代码。

子目录 是什么
01_Python 语法、面向对象、装饰器、生成器、并发
02_Linux_Git_Shell 命令行、版本控制、Shell 脚本
03_软件工程 测试、调试、模块化、性能分析
04_数据工程 日志、特征处理、数据清洗、实验管理

04 数据结构与算法

刷题与工程算法能力的主战场。

子目录 是什么
01_数据结构 数组、链表、栈/队列、哈希表、堆、树、图
02_算法思想 双指针、滑窗、二分、DP、贪心、回溯、图搜索
03_算法工具 排序、并查集、单调栈/队列、前缀和/差分
04_题型归纳 Hot100 对比、解题切入点、题型地图

05 机器学习基础

深度学习之前的经典机器学习体系,工业场景仍大量使用。

子目录 是什么
01_监督学习 线性回归、逻辑回归、SVM、决策树
02_无监督学习 聚类、降维、表示学习基础
03_特征工程与评估 特征构造、AUC/PR/F1、交叉验证
04_经典模型 GBDT、XGBoost、LightGBM、随机森林

06 深度学习与 PyTorch

神经网络原理与 PyTorch 工程实现。

子目录 是什么
01_神经网络基础 MLP、反向传播、CNN、RNN/LSTM
02_Transformer Attention、位置编码、归一化、激活函数
03_PyTorch工程 Tensor、autograd、nn、DataLoader、训练循环
04_训练工程 AMP、DDP/FSDP、显存优化、推理加速

07 推荐搜索广告

互联网商业系统里的召回、排序、重排和业务工程。

子目录 是什么
01_召回 双塔、向量召回、ANN、HNSW/Faiss
02_粗排精排 CTR/CVR 预估、特征交叉、DIN/DIEN/SIM
03_重排与多目标 多样性、多目标、列表建模、长期价值
04_序列推荐与生成式推荐 SASRec、BERT4Rec、TIGER、OneRec
05_业务系统 样本构造、负采样、特征体系、A/B 实验
06_搜索与广告 搜索相关性、广告拍卖、出价机制

08 大模型

大模型是一个最大目录,内部按三层组织。

大模型核心算法层:模型怎么被造出来、怎么变强
大模型系统层:模型怎么训得动、跑得快、服务得稳
大模型应用层:模型怎么被接入真实任务和真实系统
子目录 是什么
02_大模型核心算法 Tokenizer、Transformer、预训练、后训练、偏好对齐、高效微调、评测安全
03_大模型系统层 训练系统、推理系统、服务系统、硬件通信、框架引擎
04_大模型应用层 Prompt、RAG、Tool Calling、MCP、Agent、记忆状态、场景落地

判断规则:

问题 所属层次
改模型参数、结构或训练目标 大模型核心算法层
改训练/推理/服务效率和稳定性 大模型系统层
改模型的使用方式、工具连接和任务流程 大模型应用层

RAG 放在应用层。它通常不改变模型权重,而是通过外部知识检索、rerank、上下文构造和答案校验增强整个应用系统的能力。

Agent 也放在应用层。它不是“更大的模型”,而是把 LLM、工具、状态、记忆和多步执行组织成可运行系统。

09 多模态

多模态是“模态维度”的扩展,不是 Agent 子集,也不只是 LLM 子集。

子目录 是什么
01_模态编码 图像、音频、视频如何变成向量
02_跨模态对齐 CLIP、BLIP、ALIGN、SigLIP
03_VLM 视觉编码器 + 投影层/Q-Former/Resampler + LLM
04_多模态指令微调 图文问答、OCR、视觉推理、图表理解
05_多模态生成 Diffusion、文生图、文生视频、ControlNet
06_多模态推荐与内容理解 短视频理解、多模态召回、多模态排序

10 项目实验与面试

跨方向的产出材料区。

子目录 是什么
01_面试题 概念题、业务题、系统设计题
02_手撕题 算法手撕、模型手撕、工程手撕
03_项目复盘 项目背景、技术方案、指标收益、问题复盘
04_实验记录 训练日志、消融实验、问题定位
05_简历素材 项目表达、STAR 叙述、亮点提炼

11 论文精读

论文不再作为孤立方向,而是作为跨方向沉淀区。

子目录 是什么
通用 通用模型、基础方法、经典论文
大模型 LLM、后训练、推理、Agent 相关论文
多模态 VLM、多模态对齐、多模态生成
推荐系统 召回、排序、生成式推荐、推荐大模型

三、学习路径

  • 新手主线:01 → 03 → 04 → 05 → 06。
  • 转大模型:06 Transformer → 08 大模型核心算法 → 08 系统层 → 08 应用层。
  • 做推荐:05 经典模型 → 07 推荐搜索广告 → 08/09 中与推荐交叉的内容。
  • 做多模态:08 核心算法基础 → 09 多模态编码/对齐/VLM → 09 多模态生成或应用。
  • 做 Agent 应用:08 应用层 Prompt/RAG/Tool Calling → Agent 工程 → 可观测与评测 → 具体场景落地。