<aside>
💡 在Lecture5中,我们首先深入了解了大模型的特点,包括其庞大的规模以及在部署过程中面临的挑战。接着,我们详细学习了LMDeploy
框架的三个核心功能,分别是轻量化、推理引擎TurboMind
和服务。此外,我们还进行了实际的安装、部署和量化操作,以加深对这些概念的理解和应用。
</aside>
<aside> ❓ 课前的一些问题~
</aside>
什么是LMDeploy
?
LMDeploy
是大语言模型在英伟达设备上部署的全流程方案。包括模型轻量化、推理和服务。(还没有涉及到移动端),项目地址
什么是量化?为什么要量化?
显存降低了,存储空间增多了,同样的设备下能够容纳更多,提高速度。
<aside> 📎 什么是模型部署?
</aside>
<aside> 🔑 大模型特点:
</aside>
<aside> 🔑 大模型部署的挑战:
</aside>
<aside> 👉 大模型部署方案
</aside>