博客

DeepSpeed-FastGen：通过 MII 和 DeepSpeed-Inference 实现 LLM 高吞吐量文本生成 永久链接

2023年11月5日

DeepSpeed-FastGen: MIIとDeepSpeed-InferenceによるLLMのための高速なテキスト生成 永久链接

2023年11月5日

DeepSpeed-FastGen：通过 MII 和 DeepSpeed-Inference 实现 LLM 高吞吐量文本生成 永久链接

2023年11月5日

DeepSpeed-VisualChat：多轮图像+文字，为你展现不一样的AI聊天魅力 永久链接

2023年10月3日

DeepSpeed-VisualChat: 複数ラウンド・複数画像の入力が可能なAIチャット体験を実現 永久链接

2023年10月3日

DeepSpeed-VisualChat：多轮图像+文字，为你展现不一样的AI聊天魅力 永久链接

2023年10月3日

DeepSpeed4Science：利用先进的AI系统优化技术实现科学发现 永久链接

2023年9月18日

DeepSpeed4Scienceイニシアティブ: 洗練されたAIシステムのテクノロジーにより大規模な科学的発見を可能に 永久链接

2023年9月18日

DeepSpeed4Science：利用先进的AI系统优化技术实现科学发现 永久链接

2023年9月18日

ZeRO 推理

2023年9月12日

标题：“ZeRO-Inference：通过权重 W 量化和 KV 缓存卸载实现 20 倍更快的推理” 摘要：“” 链接：https://github.com/deepspeedai/DeepSpeedE...

DeepSpeed Ulysses: 训练极长序列Transformer模型的系统优化 永久链接

2023年8月23日

DeepSpeed Ulysses: Transformerモデルを非常に長いシーケンスで訓練するための最適化 永久链接

2023年8月23日

DeepSpeed Ulysses: 训练极长序列Transformer模型的系统优化 永久链接

2023年8月23日

DeepSpeed ZeRO++：降低4倍网络通信，显著提高大模型及类ChatGPT模型训练效率 永久链接

2023年6月21日

DeepSpeed ZeRO++: LLMやチャットモデルの訓練を劇的に高速化 – 通信オーバヘッドを1/4に大幅削減 - 永久链接

2023年6月21日

DeepSpeed ZeRO++：降低4倍网络通信，显著提高大模型及类ChatGPT模型训练效率 永久链接

2023年6月21日

DeepSpeed主要技術の概要紹介

2023年6月6日

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍 永久链接

2023年4月23日

DeepSpeed Chat: ChatGPTライクなモデルを簡単・高速・低コストに、あらゆるスケールで学習 永久链接

2023年4月23日

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍 永久链接

2023年4月23日

使用 VL-MoE 扩展大规模生成式专家混合多模态模型

2023年3月30日

DeepSpeed 数据效率：一个可组合库，能更好地利用数据、提高训练效率并改善模型质量

2022年12月11日

DeepSpeed-MII：在 24,000 多个开源 DL 模型上实现即时加速，推理成本降低高达 40 倍

2022年10月10日

ZeRO-推理：普及大规模模型推理

2022年9月9日

Azure 利用 DeepSpeed 支持易用、高性能和超大规模的模型训练

2022年7月25日

使用 DeepSpeed 在 AMD Instinct GPU 上支持高效的大型模型训练 永久链接

2022年3月20日

DeepSpeed：推进 MoE 推理和训练，为下一代 AI 规模提供动力 永久链接

2022年1月18日

DeepSpeed-MoE for NLG：将语言模型的训练成本降低 5 倍

2021年12月9日

自动调优：自动发现可提供良好训练速度的最佳 DeepSpeed 配置

2021年11月16日

DeepSpeed 以高性能支持 8 倍更大的 MoE 模型训练 永久链接

2021年8月17日

DeepSpeed：通过系统优化和压缩加速大规模模型推理和训练 永久链接

2021年5月14日

量化混合：一种新颖的量化方法，可在对精度影响最小的情况下减小模型大小

2021年5月4日

DeepSpeed 推理：支持自定义推理内核和量化的多 GPU 推理

2021年3月15日

DeepSpeed ZeRO-3 卸载

2021年3月7日

渐进层丢弃

2020年10月28日

DeepSpeed 稀疏注意力

2020年9月8日

使用流水线并行训练万亿参数模型

2020年9月8日

通过一位 Adam 实现通信量减少高达 5 倍，训练速度加快 3.4 倍

2020年9月8日

使用一位 Adam 的 DeepSpeed：通信量减少 5 倍，训练速度加快 3.4 倍

2020年9月8日

使用 ZeRO-Offload 在单个 GPU 上训练 10 倍大的模型

2020年9月8日

通过 DeepSpeed 稀疏注意力支持 10 倍更长的序列和 6 倍更快的执行

2020年9月8日

DeepSpeed 微软研究院网络研讨会现已提供点播 永久链接

2020年8月6日

DeepSpeed 微软研究院网络研讨会，2020年8月6日 永久链接

2020年7月23日

微软 DeepSpeed 实现最快的 BERT 训练时间

2020年5月27日

ZeRO-2 & DeepSpeed：打破深度学习速度与规模的障碍 永久链接

2020年5月18日

使用 ZeRO-2 实现规模更大、速度快一个数量级的训练

2020年5月18日

通过优化的 Transformer 内核实现最快、最有效的 BERT 训练

2020年5月18日

通信量减少的 ZeRO 阶段 1

2020年3月17日

分区感知的 ZeRO，通信时间减少高达 2 倍！

Turing-NLG：微软推出的 170 亿参数语言模型 永久链接

2020年2月13日

DeepSpeed 被用于训练全球最大的语言模型。

ZeRO & DeepSpeed：新的系统优化支持训练超过千亿参数的模型 永久链接

2020年2月13日