<aside> 💡 在Lecture5中,我们首先深入了解了大模型的特点,包括其庞大的规模以及在部署过程中面临的挑战。接着,我们详细学习了LMDeploy框架的三个核心功能,分别是轻量化、推理引擎TurboMind和服务。此外,我们还进行了实际的安装、部署和量化操作,以加深对这些概念的理解和应用。

</aside>

<aside> ❓ 课前的一些问题~

</aside>

什么是LMDeploy

LMDeploy是大语言模型在英伟达设备上部署的全流程方案。包括模型轻量化、推理和服务。(还没有涉及到移动端),项目地址

什么是量化?为什么要量化?

显存降低了,存储空间增多了,同样的设备下能够容纳更多,提高速度。

一、大模型部署背景

<aside> 📎 什么是模型部署?

</aside>

<aside> 🔑 大模型特点:

</aside>

<aside> 🔑 大模型部署的挑战:

</aside>

<aside> 👉 大模型部署方案

</aside>