水果派解说 水果派解说» 贸大掠影
邹雨衡,人工智能与数据科学学院2025届硕士毕业生。现任小红书人工智能工程师,国内知名AI开源组织Datawhale成员,《Happy-LLM:从零开始构建大模型》作者,《Self LLM》《LLM Cookbook》等多个大模型开源项目负责人,负责项目累计获Github星标十万余次。
《Happy-LLM:从零开始构建大模型》是由Datawhale社区发起、人民邮电出版社出版的大模型入门教程。这本书源于斩获Github 3万星标、数十次登上热榜的Datawhale热门开源项目《Happy LLM》,旨在结合理论深度与实战精度带领读者从零动手搭建一个大模型,帮助读者走进LLM的浩瀚世界,探索LLM的无限可能。

缘起:从惠园走进社区
《Happy-LLM》的种子,播种在惠园的土壤中。在惠园求学时,学校并不把我们框在课堂里,相对自由的探索氛围,让我得以一头扎进开源社区Datawhale。千里之行,始于足下。基于学院学习、科研探索打下的知识基础,我从担任助教、修复项目里一个个小 bug 开始,发现学习者需求、站出来打出自己的项目,最终成为《LLM-Cookbook》《LLM-Universe》等多个开源教程的负责人。
随着开源项目学习者越来越多,我们在反馈中一次次看到学习者对大模型原理由浅入深从零实现的需求,但目前并没有一个合适的从零开始、融汇理论与实战的教程。于是,秉承贸大“求索笃行”的精神,在Datawhale社区的支持与朱信忠教授的指导下,我与宋志学等几位伙伴一起,搭建出了这本从零开始的大模型教程。
匠心:兼顾理论与实战
惠园求学六载,学院“经贸+数据科学”的交叉培养,让我从一开始就习惯了两件事一起做:既往下钻原理,也往外问落地——一项技术不只问“它怎么实现”,还要问“它能为谁解决什么”。这本书的骨架,正是这种思维方式的延伸。我们既要把原理讲透,又要带领读者亲手搭出来一个完整的大模型。
这本书分基础与实战两部分共七章,从NLP的基本研究方法出发,沿着LLM的思路与原理逐层深入,依次剖析架构基础和训练过程,并结合主流代码框架,手把手演练如何搭建和训练一个LLM。
本书不是零散知识点的堆砌,而是一张精心设计的知识网络,每一个概念都从为什么需要它讲起,再解释它是什么,最后落实到怎么用。例如,讲解多头注意力时,不仅给出数学公式,还通过图示和代码注释说明每一维度的含义。书中对LLM及NLP的核心思路进行了深入剖析,帮助读者建立“举一反三”的能力。

同时,我们也提供完整、可运行的Python脚本,每一段关键代码都配有逐行解析。从基于PyTorch亲手搭建大模型,到借助Transformers框架实现训练、微调,再到RAG和Agent的完整实现,读者可以一边看书一边敲代码,真正做到“所学即所用”。

回响
星火点点,终将成海,念念不忘,必有回响。从怀揣着热爱与理想立项《Happy-LLM》,到最终正式出版,得到了多位专家、无数读者的认可,一路走来,颇感不易,也倍觉感激。是学院鼓励探索的自由空间让自己有出发的勇气,也是在学校里萌发的热爱给自己一路坚持的决心。从在惠园敲下第一行代码,到手写的教程落地出版,感谢恩师手把手带领“不知代码为何物”的自己在AI的道路上渐入佳境,也感谢学院为当年青涩懵懂的少年打开了新世界的门窗。学院曾是托起我的那一级台阶,如今,我也希望这本书能成为更多人的阶梯,以自由、平等的开源精神,拥抱更恢宏而辽阔的 LLM 世界。