DeepSpeed-FastGen:通过 MII 和 DeepSpeed-Inference 实现高吞吐量文本生成的 LLM 2023 年 11 月 5 日 直接链接 Twitter Facebook LinkedIn 上一篇 下一篇