00 知识地图¶
整个知识体系按“稳定底座 → 通用 AI 能力 → 专业方向 → 产出材料”组织。先看完这一页,再进入具体板块。
一、整体架构¶
| 层级 | 板块 | 性质 |
|---|---|---|
| 稳定底座 | 01 计算机系统基础 / 02 数学统计优化 / 03 编程与工程能力 / 04 数据结构与算法 | 长期稳定,支撑所有上层方向 |
| 通用 AI 能力 | 05 机器学习基础 / 06 深度学习与 PyTorch | 进入推荐、大模型、多模态之前的通用能力 |
| 专业方向 | 07 推荐搜索广告 / 08 大模型 / 09 多模态 | 可以独立深耕,也会互相交叉 |
| 产出材料 | 10 项目实验与面试 / 11 论文精读 | 项目、面试、实验、论文阅读的沉淀区 |
设计原则:基础是底盘,方向是模块。新增技术方向时,优先判断它属于“底层能力、模型算法、系统工程、应用工程、业务场景”中的哪一类。
二、板块定位¶
01 计算机系统基础¶
理解程序和模型在真实机器上如何运行。
| 子目录 | 是什么 |
|---|---|
01_硬件 |
CPU/GPU、内存层级、存储、总线、显存 |
02_操作系统 |
进程线程、内存管理、文件系统、IO |
03_计算机网络 |
TCP/IP、HTTP、DNS、WebSocket |
04_数据库 |
SQL、索引、事务、NoSQL |
05_分布式系统 |
CAP、一致性、RPC、消息队列 |
02 数学统计优化¶
ML、DL、RL、LLM 共享的数学语言。
| 子目录 | 是什么 |
|---|---|
01_线性代数 |
向量、矩阵、特征分解、SVD |
02_微积分与矩阵求导 |
导数、梯度、Jacobian、Hessian |
03_概率统计 |
分布、最大似然、贝叶斯、假设检验 |
04_信息论 |
熵、交叉熵、KL 散度 |
05_优化算法 |
SGD、Momentum、Adam、AdamW、学习率调度 |
06_强化学习数学基础 |
MDP、策略梯度、PPO、GAE |
03 编程与工程能力¶
把想法写成可运行、可维护、可协作的代码。
| 子目录 | 是什么 |
|---|---|
01_Python |
语法、面向对象、装饰器、生成器、并发 |
02_Linux_Git_Shell |
命令行、版本控制、Shell 脚本 |
03_软件工程 |
测试、调试、模块化、性能分析 |
04_数据工程 |
日志、特征处理、数据清洗、实验管理 |
04 数据结构与算法¶
刷题与工程算法能力的主战场。
| 子目录 | 是什么 |
|---|---|
01_数据结构 |
数组、链表、栈/队列、哈希表、堆、树、图 |
02_算法思想 |
双指针、滑窗、二分、DP、贪心、回溯、图搜索 |
03_算法工具 |
排序、并查集、单调栈/队列、前缀和/差分 |
04_题型归纳 |
Hot100 对比、解题切入点、题型地图 |
05 机器学习基础¶
深度学习之前的经典机器学习体系,工业场景仍大量使用。
| 子目录 | 是什么 |
|---|---|
01_监督学习 |
线性回归、逻辑回归、SVM、决策树 |
02_无监督学习 |
聚类、降维、表示学习基础 |
03_特征工程与评估 |
特征构造、AUC/PR/F1、交叉验证 |
04_经典模型 |
GBDT、XGBoost、LightGBM、随机森林 |
06 深度学习与 PyTorch¶
神经网络原理与 PyTorch 工程实现。
| 子目录 | 是什么 |
|---|---|
01_神经网络基础 |
MLP、反向传播、CNN、RNN/LSTM |
02_Transformer |
Attention、位置编码、归一化、激活函数 |
03_PyTorch工程 |
Tensor、autograd、nn、DataLoader、训练循环 |
04_训练工程 |
AMP、DDP/FSDP、显存优化、推理加速 |
07 推荐搜索广告¶
互联网商业系统里的召回、排序、重排和业务工程。
| 子目录 | 是什么 |
|---|---|
01_召回 |
双塔、向量召回、ANN、HNSW/Faiss |
02_粗排精排 |
CTR/CVR 预估、特征交叉、DIN/DIEN/SIM |
03_重排与多目标 |
多样性、多目标、列表建模、长期价值 |
04_序列推荐与生成式推荐 |
SASRec、BERT4Rec、TIGER、OneRec |
05_业务系统 |
样本构造、负采样、特征体系、A/B 实验 |
06_搜索与广告 |
搜索相关性、广告拍卖、出价机制 |
08 大模型¶
大模型是一个最大目录,内部按三层组织。
大模型核心算法层:模型怎么被造出来、怎么变强
大模型系统层:模型怎么训得动、跑得快、服务得稳
大模型应用层:模型怎么被接入真实任务和真实系统
| 子目录 | 是什么 |
|---|---|
02_大模型核心算法 |
Tokenizer、Transformer、预训练、后训练、偏好对齐、高效微调、评测安全 |
03_大模型系统层 |
训练系统、推理系统、服务系统、硬件通信、框架引擎 |
04_大模型应用层 |
Prompt、RAG、Tool Calling、MCP、Agent、记忆状态、场景落地 |
判断规则:
| 问题 | 所属层次 |
|---|---|
| 改模型参数、结构或训练目标 | 大模型核心算法层 |
| 改训练/推理/服务效率和稳定性 | 大模型系统层 |
| 改模型的使用方式、工具连接和任务流程 | 大模型应用层 |
RAG 放在应用层。它通常不改变模型权重,而是通过外部知识检索、rerank、上下文构造和答案校验增强整个应用系统的能力。
Agent 也放在应用层。它不是“更大的模型”,而是把 LLM、工具、状态、记忆和多步执行组织成可运行系统。
09 多模态¶
多模态是“模态维度”的扩展,不是 Agent 子集,也不只是 LLM 子集。
| 子目录 | 是什么 |
|---|---|
01_模态编码 |
图像、音频、视频如何变成向量 |
02_跨模态对齐 |
CLIP、BLIP、ALIGN、SigLIP |
03_VLM |
视觉编码器 + 投影层/Q-Former/Resampler + LLM |
04_多模态指令微调 |
图文问答、OCR、视觉推理、图表理解 |
05_多模态生成 |
Diffusion、文生图、文生视频、ControlNet |
06_多模态推荐与内容理解 |
短视频理解、多模态召回、多模态排序 |
10 项目实验与面试¶
跨方向的产出材料区。
| 子目录 | 是什么 |
|---|---|
01_面试题 |
概念题、业务题、系统设计题 |
02_手撕题 |
算法手撕、模型手撕、工程手撕 |
03_项目复盘 |
项目背景、技术方案、指标收益、问题复盘 |
04_实验记录 |
训练日志、消融实验、问题定位 |
05_简历素材 |
项目表达、STAR 叙述、亮点提炼 |
11 论文精读¶
论文不再作为孤立方向,而是作为跨方向沉淀区。
| 子目录 | 是什么 |
|---|---|
通用 |
通用模型、基础方法、经典论文 |
大模型 |
LLM、后训练、推理、Agent 相关论文 |
多模态 |
VLM、多模态对齐、多模态生成 |
推荐系统 |
召回、排序、生成式推荐、推荐大模型 |
三、学习路径¶
- 新手主线:01 → 03 → 04 → 05 → 06。
- 转大模型:06 Transformer → 08 大模型核心算法 → 08 系统层 → 08 应用层。
- 做推荐:05 经典模型 → 07 推荐搜索广告 → 08/09 中与推荐交叉的内容。
- 做多模态:08 核心算法基础 → 09 多模态编码/对齐/VLM → 09 多模态生成或应用。
- 做 Agent 应用:08 应用层 Prompt/RAG/Tool Calling → Agent 工程 → 可观测与评测 → 具体场景落地。