0%
boxmoe_header_banner_img

加载中

👩🏻‍💻搞懂「LLMs」按阶段学习课程计划


avatar
白木 2026年3月5日 2026年3月4日 21

第一阶段:夯实基础——搞懂 LLM 核心概念(1~2天)

目标:不被术语绕晕,能看懂论文标题、技术方案,建立对LLM的整体认知。

学习模块 核心内容 推荐资料/方式
--- --- ---
基础术语 大语言模型(LLM)、生成式AI、Transformer、Encoder/Decoder、预训练/微调/对齐、Prompt、上下文、Token、Embedding、Attention 短视频科普、技术博客极简解读(推荐链接:20个大模型术语科普,清晰解读LLM核心术语)
核心原理入门 Transformer 核心逻辑、LLM 基本工作流程(逐词预测) 《Transformer 图解》(推荐链接:The Illustrated Transformer)、《Attention Is All You Need》极简解读(推荐链接:Transformer核心解读,含论文核心思想;论文原文:https://arxiv.org/pdf/2008.02217.pdf
主流模型认知 GPT系列、Llama系列、GLM、Qwen、字节豆包系列开放模型 各模型官方文档(简化版)、技术测评文章(推荐链接:GLM体验链接:chatglm.cn;Qwen开源地址:HuggingFace Qwen主页;豆包开放平台:豆包开发者平台

关键任务:搞清楚3件事——LLM 能做什么、不能做什么(幻觉、长文本、实时性局限)、你能用它解决什么业务问题(如网站智能客服、内容生成)。


第二阶段:入门实操——会用 LLM(2~3天)

目标:会写高质量提示词,能直接将LLM应用到简单场景,为后续对接网站打基础。

学习模块 核心技能 小实战任务
--- --- ---
提示词工程(Prompt Engineering) 角色设定+任务+格式+约束、少样本学习(Few-shot)、思维链(CoT)(推荐链接:OpenAI提示词工程官方指南,新手友好) 设计智能客服Prompt、内容生成Prompt、知识库问答Prompt
工具使用 熟练使用在线大模型(豆包、GPT、Claude)、了解主流API平台(推荐链接:豆包在线体验:www.doubao.com;阿里云百炼API平台:阿里云百炼 用在线工具完成文案改写、问答、翻译等基础任务
API 入门 了解API Key、请求/响应逻辑,知道如何调用大模型API 查看各平台API文档,熟悉调用流程(推荐链接:豆包API官方文档OpenAI API文档

第三阶段:开发衔接——将 LLM 接入网站(3~5天)

目标:能独立写代码调用LLM API,实现前后端对接,将LLM集成到网站中。

必备基础 核心技能 必做小项目
--- --- ---
编程语言(Python/JS二选一)、HTTP基础、API原理(推荐链接:Python基础:Python菜鸟教程;HTTP基础:MDN HTTP文档 调用大模型REST API、实现流式输出(打字机效果)、前后端分离架构(前端→后端→LLM API)(推荐链接:豆包API调用示例,含流式输出代码) 1. 命令行聊天机器人;2. 网页版简易AI助手;3. 将AI接口接入个人/企业网站后台

第四阶段:进阶核心——RAG 知识库(最实用、必学)(5~7天)

目标:让AI回答网站/企业的专属知识,减少幻觉,提升回答准确性,适配个性化需求。

学习模块 核心技术栈 实战任务
--- --- ---
RAG核心逻辑 检索增强生成(RAG)、文档切分、Embedding、向量数据库(推荐链接:LangChain RAG官方教程,含核心逻辑讲解) 将个人网站文档/企业手册做成AI问答系统
工具与框架 向量库(Chroma/FAISS/Milvus三选一)、框架(LangChain/LlamaIndex二选一)(推荐链接:LangChain官方文档:docs.langchain.com;FAISS教程:FAISS官方Wiki 搭建私有知识库客服,实现专属内容问答
流程掌握 检索→重排→生成全流程,优化检索准确性 测试不同检索策略,提升AI回答的精准度

第五阶段:高阶实操——动手微调 LLM(7~10天)

目标:用自己的专属数据训练模型,让LLM更贴合自身业务场景(如网站专属话术、行业知识)。

前置条件 核心技术 训练流程 推荐开源模型
--- --- --- ---
熟练使用Python、拥有GPU(云服务器即可) SFT监督微调、LoRA/QLoRA(轻量微调,必学)、数据格式规范(对话/指令格式)(推荐链接:LLaMA-Factory微调教程,支持多种模型微调) 数据准备→格式清洗→模型训练→效果测试→模型合并 Llama 3、Qwen 通义千问、ChatGLM、豆包系列开放模型(推荐链接:Llama 3官方:meta.com/models/llama;Qwen官方:qwenlm.github.io;ChatGLM官方:chatglm.cn

第六阶段:落地上线——LLM 私有化部署(3~5天)

目标:将微调后的模型或开源模型部署到服务器,实现内网/外网可用,供网站、小程序等调用。

部署方案 核心技术 部署形式 上线目标
--- --- --- ---
API封装、模型量化、推理优化 FastAPI/Flask(API封装)、INT4/INT8(量化)、vLLM/TensorRT-LLM(推理引擎)(推荐链接:FastAPI文档:fastapi.tiangolo.com;vLLM教程:docs.vllm.ai 单GPU部署、内网私有部署、对接网站后端 搭建私有化AI接口,供网站/小程序/APP稳定调用

第七阶段:终极路线图(极简版)

按以下顺序推进,高效落地,避免无效学习:

  1. 懂概念:掌握LLM核心术语与基础逻辑
  1. 会Prompt:能写出高质量提示词,完成基础任务
  1. 会API调用:能通过代码调用LLM接口,对接前后端
  1. 会RAG知识库:搭建专属问答系统(最实用,优先掌握)
  1. 会LoRA微调:用自有数据训练专属模型
  1. 会私有化部署:将模型上线,供网站调用
  1. 集成落地:将LLM完整集成到自己的网站项目中

 

购买雨云服务器

购买服务器

购买雨云服务器

云服务器、网站搭建、游戏云、对象存储、裸金属物理机

 

 

白木_ShiRoKi

  •  商务微信:Misaka1662
  •  添加请备注「来意」,否则不会通过哟~😝
  •  商务邮箱:Misaka273@outlook.com
  •  「半碗残星~呜呜呜~再来!我还能...」

 

GEO
上一次更新已经跑远惹✨ 计算中...
(‾◡◝) 本内容里的一些消息,可能已经跟不上时间啦~
感谢您的支持
微信赞赏

微信扫一扫

支付宝赞赏

支付宝扫一扫



评论(0)

查看评论列表

暂无评论


发表评论

表情 颜文字
插入代码

北京时间 (Asia/Shanghai)

后退
前进
刷新
复制
粘贴
全选
删除
返回首页
0%
目录
顶部
底部
📖 文章导读