00 知识地图¶

整个知识体系按“稳定底座 → 通用 AI 能力 → 专业方向 → 产出材料”组织。先看完这一页，再进入具体板块。

AI 算法与工程知识体系地图

一、整体架构¶

层级	板块	性质
稳定底座	01 计算机系统基础 / 02 数学统计优化 / 03 编程与工程能力 / 04 数据结构与算法	长期稳定，支撑所有上层方向
通用 AI 能力	05 机器学习基础 / 06 深度学习与 PyTorch	进入推荐、大模型、多模态之前的通用能力
专业方向	07 推荐搜索广告 / 08 大模型 / 09 多模态	可以独立深耕，也会互相交叉
产出材料	10 项目实验与面试 / 11 论文精读	项目、面试、实验、论文阅读的沉淀区

设计原则：基础是底盘，方向是模块。新增技术方向时，优先判断它属于“底层能力、模型算法、系统工程、应用工程、业务场景”中的哪一类。

理解程序和模型在真实机器上如何运行。

ML、DL、RL、LLM 共享的数学语言。

子目录	是什么
`01_线性代数`	向量、矩阵、特征分解、SVD
`02_微积分与矩阵求导`	导数、梯度、Jacobian、Hessian
`03_概率统计`	分布、最大似然、贝叶斯、假设检验
`04_信息论`	熵、交叉熵、KL 散度
`05_优化算法`	SGD、Momentum、Adam、AdamW、学习率调度
`06_强化学习数学基础`	MDP、策略梯度、PPO、GAE

把想法写成可运行、可维护、可协作的代码。

刷题与工程算法能力的主战场。

深度学习之前的经典机器学习体系，工业场景仍大量使用。

神经网络原理与 PyTorch 工程实现。

子目录	是什么
`01_神经网络基础`	MLP、反向传播、CNN、RNN/LSTM
`02_Transformer`	Attention、位置编码、归一化、激活函数
`03_PyTorch工程`	Tensor、autograd、nn、DataLoader、训练循环
`04_训练工程`	AMP、DDP/FSDP、显存优化、推理加速

互联网商业系统里的召回、排序、重排和业务工程。

大模型是一个最大目录，内部按三层组织。

大模型核心算法层：模型怎么被造出来、怎么变强
大模型系统层：模型怎么训得动、跑得快、服务得稳
大模型应用层：模型怎么被接入真实任务和真实系统

子目录	是什么
`02_大模型核心算法`	Tokenizer、Transformer、预训练、后训练、偏好对齐、高效微调、评测安全
`03_大模型系统层`	训练系统、推理系统、服务系统、硬件通信、框架引擎
`04_大模型应用层`	Prompt、RAG、Tool Calling、MCP、Agent、记忆状态、场景落地

判断规则：

RAG 放在应用层。它通常不改变模型权重，而是通过外部知识检索、rerank、上下文构造和答案校验增强整个应用系统的能力。

Agent 也放在应用层。它不是“更大的模型”，而是把 LLM、工具、状态、记忆和多步执行组织成可运行系统。

多模态是“模态维度”的扩展，不是 Agent 子集，也不只是 LLM 子集。

子目录	是什么
`01_模态编码`	图像、音频、视频如何变成向量
`02_跨模态对齐`	CLIP、BLIP、ALIGN、SigLIP
`03_VLM`	视觉编码器 + 投影层/Q-Former/Resampler + LLM
`04_多模态指令微调`	图文问答、OCR、视觉推理、图表理解
`05_多模态生成`	Diffusion、文生图、文生视频、ControlNet
`06_多模态推荐与内容理解`	短视频理解、多模态召回、多模态排序

跨方向的产出材料区。

论文不再作为孤立方向，而是作为跨方向沉淀区。