📌 路线图 ⏱️ 6-12 个月 🎯 入门到高级

生成式 AI (Generative AI)

掌握当前最热门的 AI 技术:从 Transformer 架构到大语言模型(LLM)、图像生成模型,学习 Prompt Engineering、RAG、Fine-tuning 等实战技能。

#生成式AI #LLM #GPT #Stable Diffusion #Prompt Engineering
🗺️

结构化学习

共包含 6 个阶段、20 个知识点,循序渐进掌握核心技能。

⏱️

预计时长

推荐学习时长约为 6-12 个月,可根据自身节奏灵活调整。

🎯

关键能力

生成式AI · LLM · GPT

交互式路线图

拖拽查看节点关系,点击节点了解详细说明。 登录后可追踪学习进度与收藏路线图。

🔐 登录以保存进度

学习阶段拆解

6 个阶段 · 20 个节点

阶段 1

基础架构

Transformer 和预训练技术基础

包含 4 个知识点

注意力机制 (Attention)

理解 Seq2Seq 模型和 Attention 机制的核心思想

Attention Seq2Seq 基础
⏱️ 1-2 周 🚀 中级

Transformer 架构

掌握 Self-Attention、Multi-Head Attention、Position Encoding

Transformer 架构 核心
⏱️ 2-3 周 🚀 中级

预训练与微调

理解预训练-微调范式,Transfer Learning 在 NLP 的应用

预训练 微调 迁移学习
⏱️ 1-2 周 🚀 中级

BERT 及变体

双向 Encoder 模型,掌握 Masked Language Modeling

BERT Google Encoder
⏱️ 2-3 周 🚀 中级

阶段 2

大语言模型

GPT、Claude、Gemini 等语言模型

包含 3 个知识点

GPT 系列模型

自回归 Decoder 模型:GPT、GPT-2、GPT-3、GPT-4

GPT OpenAI Decoder
⏱️ 3-4 周 ⚡ 高级

大语言模型基础

理解 LLM 的能力涌现、规模法则、上下文学习

LLM 规模法则 涌现
⏱️ 2-3 周 ⚡ 高级

Claude、Gemini 等模型

了解 Anthropic Claude、Google Gemini、Meta Llama 等模型

Claude Gemini Llama
⏱️ 1-2 周 ⚡ 高级

阶段 3

实践技能

Prompt Engineering、RAG、微调等实战技能

包含 4 个知识点

Prompt Engineering

掌握提示词设计、Chain-of-Thought、Few-Shot Learning

Prompt CoT 实践
⏱️ 2-3 周 🌱 入门

RAG (检索增强生成)

结合向量数据库和 LLM,构建知识问答系统

RAG 向量数据库 检索
⏱️ 2-3 周 🚀 中级

LLM 微调技术

掌握 LoRA、QLoRA、PEFT 等高效微调方法

Fine-tuning LoRA PEFT
⏱️ 3-4 周 ⚡ 高级

LangChain & Agent

使用 LangChain 构建 LLM 应用和 AI Agent

LangChain Agent 工具
⏱️ 2-3 周 🚀 中级

阶段 4

图像生成

GAN、VAE、Diffusion、Stable Diffusion 等

包含 5 个知识点

生成对抗网络 (GAN)

理解 GAN 的原理:Generator、Discriminator、对抗训练

GAN 图像生成 对抗学习
⏱️ 3-4 周 ⚡ 高级

变分自编码器 (VAE)

理解 VAE 的概率生成模型框架

VAE 概率模型 编码器
⏱️ 2-3 周 ⚡ 高级

扩散模型 (Diffusion)

掌握 DDPM、DDIM 等扩散模型原理

Diffusion DDPM 前沿
⏱️ 3-4 周 ⚡ 高级

Stable Diffusion

使用 Stable Diffusion 生成图像,理解 Latent Diffusion

Stable Diffusion 文生图 应用
⏱️ 2-3 周 🚀 中级

DALL-E & Midjourney

了解 OpenAI DALL-E、Midjourney 等商业图像生成模型

DALL-E Midjourney 商业模型
⏱️ 1-2 周 🚀 中级

阶段 5

多模态模型

视觉语言模型、视频生成等

包含 3 个知识点

CLIP 多模态模型

理解视觉-语言对比学习,CLIP 的原理和应用

CLIP 多模态 对比学习
⏱️ 2-3 周 ⚡ 高级

多模态大模型

GPT-4V、Gemini、Claude 3 等视觉语言模型

GPT-4V 多模态 VLM
⏱️ 2-3 周 ⚡ 高级

视频生成模型

Sora、Runway、Pika 等视频生成技术

Sora 视频生成 前沿
⏱️ 2-3 周 ⚡ 高级

阶段 6

实战项目

构建实际的 AI 应用

包含 1 个知识点

LLM 应用开发

构建聊天机器人、写作助手、代码助手等实际应用

应用开发 实践 产品
⏱️ 持续学习 🚀 中级

📚 配套学习资源

精选课程、文章、工具等资源,帮助你在每个阶段深入学习

11 个资源
🔗 打开
📄

Attention Is All You Need (2017)

论文 ✓ 免费

Transformer 原始论文,深度学习的里程碑

⭐⭐ 中级
点击卡片查看资源 立即查看
🔗 打开
📝

The Illustrated Transformer

文章博客 ✓ 免费

图解 Transformer,最易懂的 Transformer 教程

⭐ 入门
点击卡片查看资源 立即查看
🔗 打开
📄

GPT-3 Paper (OpenAI 2020)

论文 ✓ 免费

Language Models are Few-Shot Learners

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
🔗 打开
📚

Prompt Engineering Guide

在线课程 ✓ 免费

全面的 Prompt Engineering 教程

⭐ 入门
点击卡片查看资源 立即查看
🔗 打开
📚

LangChain Documentation

在线课程 ✓ 免费

LangChain 官方文档和教程

⭐⭐ 中级
点击卡片查看资源 立即查看
🔗 打开
📄

Stable Diffusion Paper

论文 ✓ 免费

High-Resolution Image Synthesis with Latent Diffusion Models

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
🔗 打开
📄

CLIP Paper (OpenAI)

论文 ✓ 免费

Learning Transferable Visual Models From Natural Language Supervision

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
🔗 打开
📝

Sora Technical Report (OpenAI)

文章博客 ✓ 免费

OpenAI Sora 视频生成模型技术报告

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
🔗 打开
📄

LoRA Paper (Microsoft)

论文 ✓ 免费

LoRA: Low-Rank Adaptation of Large Language Models

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
▶️ 观看
🎥

大模型应用开发(中文课程)

视频教程 ✓ 免费

吴恩达和 OpenAI 联合推出的 LLM 应用开发课程

⭐ 入门
点击卡片观看视频 立即观看
🔗 打开
📚

AI Agents for Beginners (Microsoft)

在线课程 ✓ 免费

微软官方 AI Agents 入门课程,系统化学习如何构建智能 Agent,包含实践项目和代码示例

⭐ 入门
点击卡片查看资源 立即查看