生成式 AI (Generative AI)

Generative AI for Beginners (Microsoft)

• Microsoft • ⭐ 入门 • ⏱️ 4-6周 • 🌐 英文

🔗 生成式AI入门基础

微软官方出品的生成式AI入门课程，包含12个精心设计的课程，涵盖从基础概念到实际应用的完整学习路径，配有丰富的代码示例和实践项目

Attention Is All You Need (2017)

• Google • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 注意力机制 (Attention)

Transformer架构的原始论文，深度学习的里程碑之作

The Illustrated Transformer

• Jay Alammar • ⭐ 入门 • ⏱️ 30分钟 • 🌐 英文

🔗 注意力机制 (Attention)

图解Transformer架构，最通俗易懂的Transformer教程

Attention Mechanism Explained

• Towards Data Science • ⭐⭐ 中级 • ⏱️ 45分钟 • 🌐 英文

🔗 注意力机制 (Attention)

深入浅出地解释注意力机制的工作原理

Transformer from Scratch

• Peter Bloem • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 Transformer 架构

从零开始实现Transformer模型的详细教程

Transfer Learning in NLP

• Sebastian Ruder • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

🔗 预训练与微调

NLP中的迁移学习全面指南，涵盖预训练和微调的核心概念

Pre-training and Fine-tuning Explained

• Hugging Face • ⭐⭐ 中级 • ⏱️ 45分钟 • 🌐 英文

🔗 预训练与微调

Hugging Face官方文档，详细解释预训练和微调的最佳实践

BERT Paper (Google 2018)

• Google • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

🔗 BERT 及变体

BERT模型的原始论文，开创了双向预训练语言模型的新时代

RoBERTa, ALBERT, ELECTRA

• Hugging Face • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

🔗 BERT 及变体

BERT的各种变体模型介绍，包括RoBERTa、ALBERT、ELECTRA等改进版本

BERT Fine-tuning Tutorial

• Hugging Face • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 BERT 及变体

BERT模型微调的实战教程，包含完整的代码示例和数据集处理

GPT-3 Paper (OpenAI 2020)

• OpenAI • ⭐⭐⭐ 高级 • ⏱️ 2小时 • 🌐 英文

🔗 GPT 系列模型

GPT-3模型的原始论文，展示了大规模语言模型的few-shot学习能力

GPT-4 Technical Report

• OpenAI • ⭐⭐⭐ 高级 • ⏱️ 1.5小时 • 🌐 英文

🔗 GPT 系列模型

GPT-4的官方技术报告，详细介绍了模型架构、训练方法和性能表现

Emergent Abilities of LLMs

• Jason Wei et al. • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 大语言模型基础

研究大语言模型涌现能力的经典论文，解释了规模效应带来的能力跃升

Scaling Laws for Neural Language Models

• OpenAI • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 大语言模型基础

神经网络语言模型规模法则的开创性研究，为模型规模扩展提供理论指导

In-Context Learning Explained

• Stanford AI • ⭐⭐⭐ 高级 • ⏱️ 45分钟 • 🌐 英文

🔗 大语言模型基础

深入解释上下文学习机制，帮助理解现代大模型的核心工作原理

Claude Technical Reports

• Anthropic • ⭐⭐⭐ 高级 • ⏱️ 2小时 • 🌐 英文

🔗 Claude、Gemini 等模型

Anthropic官方技术报告，包含Claude系列模型的最新进展

Gemini Technical Report

• Google DeepMind • ⭐⭐⭐ 高级 • ⏱️ 1.5小时 • 🌐 英文

🔗 Claude、Gemini 等模型

Google Gemini模型的官方技术报告和文档

Llama 2 & 3 Papers

🔗 Claude、Gemini 等模型

Meta Llama系列模型的官方文档和相关论文

• Meta • ⭐⭐⭐ 高级 • ⏱️ 2小时 • 🌐 英文

Prompt Engineering Guide

• DAIR.AI • ⭐ 入门 • ⏱️ 3小时 • 🌐 英文

🔗 Prompt Engineering

最全面的Prompt Engineering教程，涵盖从基础到高级的所有技巧

Chain-of-Thought Prompting

• Google • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

🔗 Prompt Engineering

Chain-of-Thought推理的原始论文，展示了如何让模型进行逐步推理

OpenAI Prompt Examples

• OpenAI • ⭐ 入门 • ⏱️ 2小时 • 🌐 英文

🔗 Prompt Engineering

OpenAI官方的Prompt Engineering最佳实践指南，包含大量实例

Anthropic Prompt Library

• Anthropic • ⭐ 入门 • ⏱️ 1.5小时 • 🌐 英文

🔗 Prompt Engineering

Anthropic官方的Claude提示词库，包含各类应用的实用模板

RAG Paper (Meta)

🔗 RAG (检索增强生成)

RAG（检索增强生成）的原始论文，提出了结合检索和生成的新范式

• Meta • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

LangChain RAG Tutorial

• LangChain • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 RAG (检索增强生成)

使用LangChain构建RAG聊天机器人的实战教程

Building RAG Applications

• DeepLearning.AI • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 RAG (检索增强生成)

DeepLearning.AI的RAG应用构建课程，理论与实践并重

LoRA Paper (Microsoft)

• Microsoft • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 LLM 微调技术

LoRA（Low-Rank Adaptation）的原始论文，高效微调的开创性工作

QLoRA: Efficient Finetuning

• Tim Dettmers et al. • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 LLM 微调技术

QLoRA论文，实现了在单个GPU上微调65B参数模型的技术突破

Hugging Face PEFT Library

• Hugging Face • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

🔗 LLM 微调技术

Hugging Face PEFT库官方文档，支持LoRA、QLoRA等高效微调方法

LangChain Documentation

• LangChain • ⭐⭐ 中级 • ⏱️ 3小时 • 🌐 英文

🔗 LangChain & Agent

LangChain官方文档，构建LLM应用的完整框架指南

Building LLM Agents

🔗 LangChain & Agent

使用LangChain构建LLM Agents的课程，包含ReAct、工具使用等概念

• DeepLearning.AI • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

LlamaIndex Guide

🔗 LangChain & Agent

LlamaIndex官方文档，专注于数据增强的LLM应用开发框架

• LlamaIndex • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

AI Agents for Beginners (Microsoft)

🔗 LangChain & Agent

微软官方 AI Agents 入门课程，系统化学习如何构建智能 Agent，包含实践项目和代码示例

GAN Paper (Goodfellow 2014)

• Ian Goodfellow • ⭐⭐⭐ 高级 • ⏱️ 2小时 • 🌐 英文

🔗 生成对抗网络 (GAN)

生成对抗网络的原始论文，深度生成学习的里程碑

DCGAN, StyleGAN, StyleGAN2

• Various • ⭐⭐ 中级 • ⏱️ 3小时 • 🌐 英文

🔗 生成对抗网络 (GAN)

DCGAN和StyleGAN系列模型的实现教程和技巧

GAN Tutorial

🔗 生成对抗网络 (GAN)

Google出品的GAN教程，包含理论基础和实践代码

• Google • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

VAE Paper (Kingma & Welling)

• Diederik Kingma & Max Welling • ⭐⭐⭐ 高级 • ⏱️ 1.5小时 • 🌐 英文

🔗 变分自编码器 (VAE)

变分自编码器的原始论文，概率生成模型的基础

Variational Autoencoders Explained

• Jaan Altosaar • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

🔗 变分自编码器 (VAE)

VAE的详细解释教程，包含数学推导和直观理解

VQ-VAE

🔗 变分自编码器 (VAE)

VQ-VAE论文，向量量化变分自编码器

• DeepMind • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

Denoising Diffusion Probabilistic Models

• Jonathan Ho et al. • ⭐⭐⭐ 高级 • ⏱️ 2小时 • 🌐 英文

🔗 扩散模型 (Diffusion)

DDPM扩散模型的原始论文，现代图像生成的基础

DDIM Paper

🔗 扩散模型 (Diffusion)

DDIM论文，实现了扩散模型的确定性采样加速

• Jiaming Song et al. • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

Diffusion Models Explained

• Lilian Weng • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

🔗 扩散模型 (Diffusion)

扩散模型的全面解释，包含数学原理和实现细节

Stable Diffusion Paper

• Stability AI • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

🔗 Stable Diffusion

Stable Diffusion的原始论文，潜在扩散模型的突破

SD WebUI Tutorial

🔗 Stable Diffusion

AUTOMATIC1111的Stable Diffusion WebUI使用教程

• AUTOMATIC1111 • ⭐ 入门 • ⏱️ 2小时 • 🌐 英文

ComfyUI Guide

🔗 Stable Diffusion

ComfyUI节点式界面指南，高级图像生成工具

• comfyanonymous • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

DALL-E 2 Paper (OpenAI)

• OpenAI • ⭐⭐ 中级 • ⏱️ 1.5小时 • 🌐 英文

🔗 DALL-E & Midjourney

DALL-E 2模型的原始论文，CLIP引导的图像生成

DALL-E 3 Technical Report

• OpenAI • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

🔗 DALL-E & Midjourney

DALL-E 3的技术报告，改进的文本到图像生成

Midjourney Prompting Guide

• Midjourney • ⭐ 入门 • ⏱️ 1.5小时 • 🌐 英文

🔗 DALL-E & Midjourney

Midjourney官方文档和提示词指南

CLIP Paper (OpenAI)

🔗 CLIP 多模态模型

Learning Transferable Visual Models From Natural Language Supervision

CLIP Applications

🔗 CLIP 多模态模型

CLIP模型的应用示例和代码实现

• OpenAI • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

GPT-4V System Card

🔗 多模态大模型

GPT-4V的系统安全报告和技术说明

• OpenAI • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

Gemini Multimodal Capabilities

• Google DeepMind • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 多模态大模型

Gemini多模态能力的详细介绍

Claude 3 Vision Features

• Anthropic • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 多模态大模型

Claude 3 Vision模型的功能介绍和使用指南

Sora Technical Report (OpenAI)

• OpenAI • ⭐⭐⭐ 高级 • ⏱️ 1小时 • 🌐 英文

🔗 视频生成模型

Sora视频生成模型的技术报告

Video Diffusion Models

• Various • ⭐⭐⭐ 高级 • ⏱️ 1.5小时 • 🌐 英文

🔗 视频生成模型

视频扩散模型的综述论文

Runway Gen-2

🔗 视频生成模型

Runway Gen-2视频生成平台介绍

• Runway • ⭐⭐ 中级 • ⏱️ 1小时 • 🌐 英文

Building LLM Applications

• DeepLearning.AI • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 LLM 应用开发

DeepLearning.AI的LLM应用构建课程

ChatGPT API Guide

🔗 LLM 应用开发

OpenAI ChatGPT API的官方使用指南

• OpenAI • ⭐ 入门 • ⏱️ 1.5小时 • 🌐 英文

Claude API Guide

🔗 LLM 应用开发

Anthropic Claude API的官方使用指南

• Anthropic • ⭐ 入门 • ⏱️ 1.5小时 • 🌐 英文

LLM Application Examples

• OpenAI • ⭐⭐ 中级 • ⏱️ 2小时 • 🌐 英文

🔗 LLM 应用开发

OpenAI官方的LLM应用示例代码库