📌 路线图 ⏱️ 6-12 个月 🎯 入门到高级

生成式 AI (Generative AI)

掌握当前最热门的 AI 技术:从 Transformer 架构到大语言模型(LLM)、图像生成模型,学习 Prompt Engineering、RAG、Fine-tuning 等实战技能。

#生成式AI #LLM #GPT #Stable Diffusion #Prompt Engineering
🗺️

结构化学习

共包含 7 个阶段、22 个知识点,循序渐进掌握核心技能。

⏱️

学习建议

推荐学习时长约为 6-12 个月,可根据自身节奏灵活调整。

🎯

关键能力

生成式AI · LLM · GPT

循序渐进的学习计划

按阶段结构化的学习路径,帮助你系统掌握核心技能。每个阶段都有明确的学习目标和配套资源。

难度筛选:
7
学习阶段
22
知识点
6-12 个月
学习建议

阶段 1

入门基础

生成式AI基本概念和实践入门,适合零基础学习者

📝 2 个知识点
🌱

生成式AI入门基础

入门

理解生成式AI的基本概念、应用场景和发展历史,了解不同类型的生成模型及其特点

⏱️ 1-2 周
🌱

实践基础与工具

入门

学习生成式AI的实际应用,掌握主流工具和平台的使用,通过项目实践理解核心概念

⏱️ 3-4 周

阶段 2

基础架构

Transformer 和预训练技术基础

📝 4 个知识点

阶段 3

大语言模型

GPT、Claude、Gemini 等语言模型

📝 3 个知识点

阶段 4

实践技能

Prompt Engineering、RAG、微调等实战技能

📝 4 个知识点

阶段 5

图像生成

GAN、VAE、Diffusion、Stable Diffusion 等

📝 5 个知识点

阶段 6

多模态模型

视觉语言模型、视频生成等

📝 3 个知识点

阶段 7

实战项目

构建实际的 AI 应用

📝 1 个知识点

📚 配套学习资源

精选课程、文章、工具等资源,帮助你在每个阶段深入学习

59 个资源
🔗 打开
📚

Generative AI for Beginners (Microsoft)

在线课程 ✓ 免费

🔗 生成式AI入门基础

微软官方出品的生成式AI入门课程,包含12个精心设计的课程,涵盖从基础概念到实际应用的完整学习路径,配有丰富的代码示例和实践项目

Microsoft ⭐ 入门 ⏱️ 4-6周 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Attention Is All You Need (2017)

论文 ✓ 免费

🔗 注意力机制 (Attention)

Transformer架构的原始论文,深度学习的里程碑之作

Google ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

The Illustrated Transformer

文章博客 ✓ 免费

🔗 注意力机制 (Attention)

图解Transformer架构,最通俗易懂的Transformer教程

Jay Alammar ⭐ 入门 ⏱️ 30分钟 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Attention Mechanism Explained

文章博客 ✓ 免费

🔗 注意力机制 (Attention)

深入浅出地解释注意力机制的工作原理

Towards Data Science ⭐⭐ 中级 ⏱️ 45分钟 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Transformer from Scratch

文章博客 ✓ 免费

🔗 Transformer 架构

从零开始实现Transformer模型的详细教程

Peter Bloem ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Transfer Learning in NLP

文章博客 ✓ 免费

🔗 预训练与微调

NLP中的迁移学习全面指南,涵盖预训练和微调的核心概念

Sebastian Ruder ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Pre-training and Fine-tuning Explained

文章博客 ✓ 免费

🔗 预训练与微调

Hugging Face官方文档,详细解释预训练和微调的最佳实践

Hugging Face ⭐⭐ 中级 ⏱️ 45分钟 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

BERT Paper (Google 2018)

论文 ✓ 免费

🔗 BERT 及变体

BERT模型的原始论文,开创了双向预训练语言模型的新时代

Google ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

RoBERTa, ALBERT, ELECTRA

文章博客 ✓ 免费

🔗 BERT 及变体

BERT的各种变体模型介绍,包括RoBERTa、ALBERT、ELECTRA等改进版本

Hugging Face ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

BERT Fine-tuning Tutorial

在线课程 ✓ 免费

🔗 BERT 及变体

BERT模型微调的实战教程,包含完整的代码示例和数据集处理

Hugging Face ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

GPT-3 Paper (OpenAI 2020)

论文 ✓ 免费

🔗 GPT 系列模型

GPT-3模型的原始论文,展示了大规模语言模型的few-shot学习能力

OpenAI ⭐⭐⭐ 高级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

GPT-4 Technical Report

论文 ✓ 免费

🔗 GPT 系列模型

GPT-4的官方技术报告,详细介绍了模型架构、训练方法和性能表现

OpenAI ⭐⭐⭐ 高级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Emergent Abilities of LLMs

论文 ✓ 免费

🔗 大语言模型基础

研究大语言模型涌现能力的经典论文,解释了规模效应带来的能力跃升

Jason Wei et al. ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Scaling Laws for Neural Language Models

论文 ✓ 免费

🔗 大语言模型基础

神经网络语言模型规模法则的开创性研究,为模型规模扩展提供理论指导

OpenAI ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

In-Context Learning Explained

文章博客 ✓ 免费

🔗 大语言模型基础

深入解释上下文学习机制,帮助理解现代大模型的核心工作原理

Stanford AI ⭐⭐⭐ 高级 ⏱️ 45分钟 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Claude Technical Reports

文章博客 ✓ 免费

🔗 Claude、Gemini 等模型

Anthropic官方技术报告,包含Claude系列模型的最新进展

Anthropic ⭐⭐⭐ 高级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Gemini Technical Report

文章博客 ✓ 免费

🔗 Claude、Gemini 等模型

Google Gemini模型的官方技术报告和文档

Google DeepMind ⭐⭐⭐ 高级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Llama 2 & 3 Papers

文章博客 ✓ 免费

🔗 Claude、Gemini 等模型

Meta Llama系列模型的官方文档和相关论文

Meta ⭐⭐⭐ 高级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

Prompt Engineering Guide

在线课程 ✓ 免费

🔗 Prompt Engineering

最全面的Prompt Engineering教程,涵盖从基础到高级的所有技巧

DAIR.AI ⭐ 入门 ⏱️ 3小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Chain-of-Thought Prompting

论文 ✓ 免费

🔗 Prompt Engineering

Chain-of-Thought推理的原始论文,展示了如何让模型进行逐步推理

Google ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

OpenAI Prompt Examples

文章博客 ✓ 免费

🔗 Prompt Engineering

OpenAI官方的Prompt Engineering最佳实践指南,包含大量实例

OpenAI ⭐ 入门 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Anthropic Prompt Library

文章博客 ✓ 免费

🔗 Prompt Engineering

Anthropic官方的Claude提示词库,包含各类应用的实用模板

Anthropic ⭐ 入门 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

RAG Paper (Meta)

论文 ✓ 免费

🔗 RAG (检索增强生成)

RAG(检索增强生成)的原始论文,提出了结合检索和生成的新范式

Meta ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

LangChain RAG Tutorial

在线课程 ✓ 免费

🔗 RAG (检索增强生成)

使用LangChain构建RAG聊天机器人的实战教程

LangChain ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

Building RAG Applications

在线课程 ✓ 免费

🔗 RAG (检索增强生成)

DeepLearning.AI的RAG应用构建课程,理论与实践并重

DeepLearning.AI ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

LoRA Paper (Microsoft)

论文 ✓ 免费

🔗 LLM 微调技术

LoRA(Low-Rank Adaptation)的原始论文,高效微调的开创性工作

Microsoft ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

QLoRA: Efficient Finetuning

论文 ✓ 免费

🔗 LLM 微调技术

QLoRA论文,实现了在单个GPU上微调65B参数模型的技术突破

Tim Dettmers et al. ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Hugging Face PEFT Library

文章博客 ✓ 免费

🔗 LLM 微调技术

Hugging Face PEFT库官方文档,支持LoRA、QLoRA等高效微调方法

Hugging Face ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

LangChain Documentation

文章博客 ✓ 免费

🔗 LangChain & Agent

LangChain官方文档,构建LLM应用的完整框架指南

LangChain ⭐⭐ 中级 ⏱️ 3小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

Building LLM Agents

在线课程 ✓ 免费

🔗 LangChain & Agent

使用LangChain构建LLM Agents的课程,包含ReAct、工具使用等概念

DeepLearning.AI ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

LlamaIndex Guide

文章博客 ✓ 免费

🔗 LangChain & Agent

LlamaIndex官方文档,专注于数据增强的LLM应用开发框架

LlamaIndex ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

AI Agents for Beginners (Microsoft)

在线课程 ✓ 免费

🔗 LangChain & Agent

微软官方 AI Agents 入门课程,系统化学习如何构建智能 Agent,包含实践项目和代码示例

⭐ 入门
点击卡片查看资源 立即查看
🔗 打开
📄

GAN Paper (Goodfellow 2014)

论文 ✓ 免费

🔗 生成对抗网络 (GAN)

生成对抗网络的原始论文,深度生成学习的里程碑

Ian Goodfellow ⭐⭐⭐ 高级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

DCGAN, StyleGAN, StyleGAN2

在线课程 ✓ 免费

🔗 生成对抗网络 (GAN)

DCGAN和StyleGAN系列模型的实现教程和技巧

Various ⭐⭐ 中级 ⏱️ 3小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

GAN Tutorial

在线课程 ✓ 免费

🔗 生成对抗网络 (GAN)

Google出品的GAN教程,包含理论基础和实践代码

Google ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

VAE Paper (Kingma & Welling)

论文 ✓ 免费

🔗 变分自编码器 (VAE)

变分自编码器的原始论文,概率生成模型的基础

Diederik Kingma & Max Welling ⭐⭐⭐ 高级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Variational Autoencoders Explained

文章博客 ✓ 免费

🔗 变分自编码器 (VAE)

VAE的详细解释教程,包含数学推导和直观理解

Jaan Altosaar ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

VQ-VAE

论文 ✓ 免费

🔗 变分自编码器 (VAE)

VQ-VAE论文,向量量化变分自编码器

DeepMind ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Denoising Diffusion Probabilistic Models

论文 ✓ 免费

🔗 扩散模型 (Diffusion)

DDPM扩散模型的原始论文,现代图像生成的基础

Jonathan Ho et al. ⭐⭐⭐ 高级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

DDIM Paper

论文 ✓ 免费

🔗 扩散模型 (Diffusion)

DDIM论文,实现了扩散模型的确定性采样加速

Jiaming Song et al. ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Diffusion Models Explained

文章博客 ✓ 免费

🔗 扩散模型 (Diffusion)

扩散模型的全面解释,包含数学原理和实现细节

Lilian Weng ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Stable Diffusion Paper

论文 ✓ 免费

🔗 Stable Diffusion

Stable Diffusion的原始论文,潜在扩散模型的突破

Stability AI ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

SD WebUI Tutorial

文章博客 ✓ 免费

🔗 Stable Diffusion

AUTOMATIC1111的Stable Diffusion WebUI使用教程

AUTOMATIC1111 ⭐ 入门 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

ComfyUI Guide

文章博客 ✓ 免费

🔗 Stable Diffusion

ComfyUI节点式界面指南,高级图像生成工具

comfyanonymous ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

DALL-E 2 Paper (OpenAI)

论文 ✓ 免费

🔗 DALL-E & Midjourney

DALL-E 2模型的原始论文,CLIP引导的图像生成

OpenAI ⭐⭐ 中级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

DALL-E 3 Technical Report

论文 ✓ 免费

🔗 DALL-E & Midjourney

DALL-E 3的技术报告,改进的文本到图像生成

OpenAI ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Midjourney Prompting Guide

文章博客 ✓ 免费

🔗 DALL-E & Midjourney

Midjourney官方文档和提示词指南

Midjourney ⭐ 入门 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

CLIP Paper (OpenAI)

论文 ✓ 免费

🔗 CLIP 多模态模型

Learning Transferable Visual Models From Natural Language Supervision

⭐⭐⭐ 高级
点击卡片查看资源 立即查看
🔗 打开
📝

CLIP Applications

文章博客 ✓ 免费

🔗 CLIP 多模态模型

CLIP模型的应用示例和代码实现

OpenAI ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

GPT-4V System Card

文章博客 ✓ 免费

🔗 多模态大模型

GPT-4V的系统安全报告和技术说明

OpenAI ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Gemini Multimodal Capabilities

文章博客 ✓ 免费

🔗 多模态大模型

Gemini多模态能力的详细介绍

Google DeepMind ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Claude 3 Vision Features

文章博客 ✓ 免费

🔗 多模态大模型

Claude 3 Vision模型的功能介绍和使用指南

Anthropic ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Sora Technical Report (OpenAI)

论文 ✓ 免费

🔗 视频生成模型

Sora视频生成模型的技术报告

OpenAI ⭐⭐⭐ 高级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📄

Video Diffusion Models

论文 ✓ 免费

🔗 视频生成模型

视频扩散模型的综述论文

Various ⭐⭐⭐ 高级 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Runway Gen-2

文章博客

🔗 视频生成模型

Runway Gen-2视频生成平台介绍

Runway ⭐⭐ 中级 ⏱️ 1小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📚

Building LLM Applications

在线课程 ✓ 免费

🔗 LLM 应用开发

DeepLearning.AI的LLM应用构建课程

DeepLearning.AI ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

ChatGPT API Guide

文章博客 ✓ 免费

🔗 LLM 应用开发

OpenAI ChatGPT API的官方使用指南

OpenAI ⭐ 入门 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

Claude API Guide

文章博客 ✓ 免费

🔗 LLM 应用开发

Anthropic Claude API的官方使用指南

Anthropic ⭐ 入门 ⏱️ 1.5小时 🌐 英文
点击卡片查看资源 立即查看
🔗 打开
📝

LLM Application Examples

文章博客 ✓ 免费

🔗 LLM 应用开发

OpenAI官方的LLM应用示例代码库

OpenAI ⭐⭐ 中级 ⏱️ 2小时 🌐 英文
点击卡片查看资源 立即查看