文献类型:专著 浏览次数:115
  • 题名:大模型轻量化:模型压缩与训练加速
  • 责任者:梁志远著
  • 出版社清华大学出版社
  • 出版年:2025
  • ISBN:978-7-302-68600-2
  • 定价:129.00
  • 载体形态项:384页 24cm
  • 个人责任者:梁志远著
  • 学科主题:人工智能
  • 中图法分类号:TP18
  • 提要文摘附注:本书分为3部分, 共10章。第1部分 (第1-5章), 介绍大模型的背景与面临的问题, 以及Transformer和MoE架构的基本原理; 重点讲解模型压缩、训练加速和推理优化等核心技术, 包括量化、蒸馏和剪枝等, 并通过实际案例验证其效果。第2部分 (第6、7章), 重点介绍端侧学习与计算引擎优化策略, 尤其是动态Batch和异构执行的工程实现。第3部分 (第8-10章), 针对高性能算子库与手工算子开发, 分别以cuDNN、NEON、CUDA等为代表, 揭示算子优化的细节, 最后, 以国产开源模型DeepSeek-V3为例, 展现从训练到推理的综合优化方案。
  • 统一资源定位(URL):
总体评价(共0票) 评价
索书号 条码号 年卷期 馆藏地 排架号 书刊状态 流通类型 流通状态 定位

书籍封面

相关资源

图书馆微博二维码

图书馆微信公众号二维码