压缩概述和功能

DeepSpeed 压缩是一个专门为研究人员和从业人员构建的库,旨在简化模型压缩,同时提供更快的速度、更小的模型尺寸和显著降低的压缩成本。有关更多详细信息,请参阅我们的博客

DeepSpeed 压缩提供新颖的、最先进的压缩技术,以实现更快的模型压缩,并获得更好的模型质量和更低的压缩成本。DeepSpeed 压缩还采用端到端的方法,通过高度优化的推理引擎提高压缩模型的计算效率。此外,我们的库具有多种内置的最先进的压缩方法。它支持这些方法的协同组合和系统优化,提供两全其美的方案,同时允许一个无缝且易于使用的管道,用于高效的 DL 模型推理。我们强烈建议您也阅读我们的博客,以更多地了解(高级别)我们为什么构建 DeepSpeed 压缩以及它为用户提供了哪些好处。要尝试使用 DeepSpeed 压缩库压缩您的模型,请查看我们的教程