加载中

👩🏻‍💻搞懂「LLMs」按阶段学习课程计划

白木 2026年3月5日 2026年3月4日 89

第一阶段：夯实基础——搞懂 LLM 核心概念（1～2天）

目标：不被术语绕晕，能看懂论文标题、技术方案，建立对LLM的整体认知。

学习模块	核心内容	推荐资料/方式
---	---	---
基础术语	大语言模型（LLM）、生成式AI、Transformer、Encoder/Decoder、预训练/微调/对齐、Prompt、上下文、Token、Embedding、Attention	短视频科普、技术博客极简解读（推荐链接：20个大模型术语科普，清晰解读LLM核心术语）
核心原理入门	Transformer 核心逻辑、LLM 基本工作流程（逐词预测）	《Transformer 图解》（推荐链接：The Illustrated Transformer）、《Attention Is All You Need》极简解读（推荐链接：Transformer核心解读，含论文核心思想；论文原文：https://arxiv.org/pdf/2008.02217.pdf）
主流模型认知	GPT系列、Llama系列、GLM、Qwen、字节豆包系列开放模型	各模型官方文档（简化版）、技术测评文章（推荐链接：GLM体验链接：chatglm.cn；Qwen开源地址：HuggingFace Qwen主页；豆包开放平台：豆包开发者平台）

关键任务：搞清楚3件事——LLM 能做什么、不能做什么（幻觉、长文本、实时性局限）、你能用它解决什么业务问题（如网站智能客服、内容生成）。

第二阶段：入门实操——会用 LLM（2～3天）

目标：会写高质量提示词，能直接将LLM应用到简单场景，为后续对接网站打基础。

学习模块	核心技能	小实战任务
---	---	---
提示词工程（Prompt Engineering）	角色设定+任务+格式+约束、少样本学习（Few-shot）、思维链（CoT）（推荐链接：OpenAI提示词工程官方指南，新手友好）	设计智能客服Prompt、内容生成Prompt、知识库问答Prompt
工具使用	熟练使用在线大模型（豆包、GPT、Claude）、了解主流API平台（推荐链接：豆包在线体验：www.doubao.com；阿里云百炼API平台：阿里云百炼）	用在线工具完成文案改写、问答、翻译等基础任务
API 入门	了解API Key、请求/响应逻辑，知道如何调用大模型API	查看各平台API文档，熟悉调用流程（推荐链接：豆包API官方文档、OpenAI API文档）

第三阶段：开发衔接——将 LLM 接入网站（3～5天）

目标：能独立写代码调用LLM API，实现前后端对接，将LLM集成到网站中。

必备基础	核心技能	必做小项目
---	---	---
编程语言（Python/JS二选一）、HTTP基础、API原理（推荐链接：Python基础：Python菜鸟教程；HTTP基础：MDN HTTP文档）	调用大模型REST API、实现流式输出（打字机效果）、前后端分离架构（前端→后端→LLM API）（推荐链接：豆包API调用示例，含流式输出代码）	1. 命令行聊天机器人；2. 网页版简易AI助手；3. 将AI接口接入个人/企业网站后台

第四阶段：进阶核心——RAG 知识库（最实用、必学）（5～7天）

目标：让AI回答网站/企业的专属知识，减少幻觉，提升回答准确性，适配个性化需求。

学习模块	核心技术栈	实战任务
---	---	---
RAG核心逻辑	检索增强生成（RAG）、文档切分、Embedding、向量数据库（推荐链接：LangChain RAG官方教程，含核心逻辑讲解）	将个人网站文档/企业手册做成AI问答系统
工具与框架	向量库（Chroma/FAISS/Milvus三选一）、框架（LangChain/LlamaIndex二选一）（推荐链接：LangChain官方文档：docs.langchain.com；FAISS教程：FAISS官方Wiki）	搭建私有知识库客服，实现专属内容问答
流程掌握	检索→重排→生成全流程，优化检索准确性	测试不同检索策略，提升AI回答的精准度

第五阶段：高阶实操——动手微调 LLM（7～10天）

目标：用自己的专属数据训练模型，让LLM更贴合自身业务场景（如网站专属话术、行业知识）。

前置条件	核心技术	训练流程	推荐开源模型
---	---	---	---
熟练使用Python、拥有GPU（云服务器即可）	SFT监督微调、LoRA/QLoRA（轻量微调，必学）、数据格式规范（对话/指令格式）（推荐链接：LLaMA-Factory微调教程，支持多种模型微调）	数据准备→格式清洗→模型训练→效果测试→模型合并	Llama 3、Qwen 通义千问、ChatGLM、豆包系列开放模型（推荐链接：Llama 3官方：meta.com/models/llama；Qwen官方：qwenlm.github.io；ChatGLM官方：chatglm.cn）

第六阶段：落地上线——LLM 私有化部署（3～5天）

目标：将微调后的模型或开源模型部署到服务器，实现内网/外网可用，供网站、小程序等调用。

部署方案	核心技术	部署形式	上线目标
---	---	---	---
API封装、模型量化、推理优化	FastAPI/Flask（API封装）、INT4/INT8（量化）、vLLM/TensorRT-LLM（推理引擎）（推荐链接：FastAPI文档：fastapi.tiangolo.com；vLLM教程：docs.vllm.ai）	单GPU部署、内网私有部署、对接网站后端	搭建私有化AI接口，供网站/小程序/APP稳定调用

第七阶段：终极路线图（极简版）

按以下顺序推进，高效落地，避免无效学习：

懂概念：掌握LLM核心术语与基础逻辑

会Prompt：能写出高质量提示词，完成基础任务

会API调用：能通过代码调用LLM接口，对接前后端

会RAG知识库：搭建专属问答系统（最实用，优先掌握）

会LoRA微调：用自有数据训练专属模型

会私有化部署：将模型上线，供网站调用

集成落地：将LLM完整集成到自己的网站项目中

购买服务器

购买雨云服务器

云服务器、网站搭建、游戏云、对象存储、裸金属物理机

！~诶？！~！

白木_ShiRoKi

商务微信：Misaka1662
添加请备注「来意」，否则不会通过哟~😝
商务邮箱：Misaka273@outlook.com
「半碗残星~呜呜呜~再来！我还能...」

上一次更新已经跑远惹✨ 计算中...

(‾◡◝) 本内容里的一些消息，可能已经跟不上时间啦～

查看评论列表

暂无评论

发表评论取消回复

访客未填写邮箱

[填写昵称邮箱后可以评论]

插入代码

📖 文章导读