
TensorWave Inc.成立于2023年,总部位于美国内华达州拉斯维加斯,TensorWave 是一个专基于 AMD 技术的云平台,利用 AMD Instinct GPU 和 ROCm 来支持高性能 AI 工作负载。

#TensorWave
TensorWave Inc.美股百科
TensorWave 提供专为人工智能工作负载设计的云基础设施,让用户能够使用基于 AMD GPU 的计算资源来进行模型训练、微调和推理。该公司提供一个全栈式 AI 平台,集成了计算、存储、网络、编排和托管服务,旨在支持机器学习应用程序的部署与扩展。
TensorWave 基于 AMD Instinct™ 系列 GPU 构建,并支持 PyTorch、TensorFlow、JAX、Hugging Face 以及基于 Kubernetes 的环境等主流 AI 框架与工具,提供高带宽、内存优化的基础设施,可根据最苛刻的训练和推理工作负载进行扩展。在 Magnetar、AMD Ventures 和 Nexus Venture Partners 等投资者的资金支持下,TensorWave 运营着全球最大的全 AMD GPU 云之一,并正在迅速扩张以满足全球需求。
此外,TensorWave 还提供一系列企业级功能,包括工作负载监控、安全管控、托管 Kubernetes 和 Slurm 服务,以及协助企业在整个模型生命周期内管理 AI 运营的软件层。
TensorWave 公司致力于提供开放且可扩展的基础设施,使企业无需依赖专有硬件生态系统,即可开发、训练并运行 AI 模型。
TensorWave Inc.产品百科
1、Bare Metal AMD Instinct™ Infrastructure
TensorWave 的裸金属 AI 基础设施基于最新的 AMD Instinct™ 加速器构建,提供完全的控制权、零虚拟化开销以及对硬件的直接访问能力。
2、Accelerators
(1)AMD Instinct™ MI455X
AMD Instinct™ MI455X 是 TensorWave 面向“AI Factory”级别算力部署推出的新一代 GPU 加速器方案,重点不是单卡销售,而是把 MI455X 放进 AMD Helios™ 机架级架构中交付。Helios 单机架最多可集成 72 块 MI400 系列 GPU(如 MI455X),并提供超过 31TB 的总 HBM4 显存,配合 UALink 互连、以太网优先架构和直接液冷设计,用于大规模 AI 训练、推理和前沿模型工作负载。
MI455X 的卖点是超大显存和高带宽:预期配置包括 432GB HBM4、19.6TB/s 内存带宽,预期性能约为 40 PFLOPS FP4 dense、20 PFLOPS FP8;架构上采用 12 组 HBM4 堆栈、约 3200 亿晶体管、2nm/3nm chiplet 和 3.5D 封装。
(2)AMD Instinct™ MI355X
AMD Instinct™ MI355X 是 TensorWave 提供的高密度 AI GPU 加速器,定位于大模型训练、前沿模型开发、大规模推理和 HPC 工作负载。它基于 AMD CDNA4 架构,采用 TSMC 3nm/6nm FinFET 工艺,配备 288GB HBM3E 显存、8TB/s 峰值内存带宽、16,384 个流处理器、1,024 个 Matrix Cores 和 256 个计算单元;其支持 ROCm 软件栈,可兼容 PyTorch、JAX、vLLM、Ray、Hugging Face Transformers 等主流 AI 框架。
TensorWave 不是把 MI355X 当作单卡产品来卖,而是以液冷裸金属集群形式提供。其标准节点配置为 8 块液冷 AMD Instinct MI355X、2 颗 AMD Turin 9575F CPU、3TiB DDR5 6000MT/s 内存、8 块 3.84TB NVMe 加 2 块 893GB M.2,本地节点互连为 3.2Tb/s,并可选 Managed Kubernetes 和 Slurm;起步价格为每 GPU 每小时 2.95 美元。
(3)AMD Instinct™ MI325X
AMD Instinct™ MI325X 是 TensorWave 提供的一款偏“显存优化”的 AMD GPU 加速器,主要面向大规模 AI 训练和生产级推理。它基于 AMD CDNA3 架构,采用 TSMC 5nm/6nm FinFET 工艺,配备 256GB HBM3E 显存、6TB/s 峰值内存带宽、19,456 个流处理器、1,216 个 Matrix Cores、304 个计算单元,并支持 AMD ROCm、Infinity Architecture、RAS、SR-IOV 等企业级特性。MI325X 的核心卖点是大显存、高带宽和较强的性价比,适合需要承载大参数模型、长上下文推理或多节点训练的 AI 工作负载。
在 TensorWave 的交付方式中,MI325X 主要以液冷裸金属集群节点提供,而不是普通单卡产品。其标准节点配置为 8 块液冷 AMD Instinct MI325X、2 颗 AMD Turin 9575F CPU、3TB DDR5 6000MT/s 内存、4 块 3.84TB NVMe 加 2 块 893GB M.2、本地节点互连 3.2Tb/s,并可选 Managed Kubernetes 和 Slurm;起步价格为每 GPU 每小时 2.25 美元。
(4)AMD Instinct™ MI300X
AMD Instinct™ MI300X 是 TensorWave 面向生成式 AI 推理和模型微调提供的 AMD GPU 加速器,主打“更低 TCO + 更高性能”。它基于 AMD CDNA3 架构,采用 TSMC 5nm/6nm FinFET 工艺,配备 192GB HBM3/HBM3E 级别显存、5.3TB/s 峰值内存带宽、19,456 个流处理器、1,216 个 Matrix Cores、304 个计算单元,FP16 峰值算力为 1.3 PFLOPS,结构化稀疏下可达 2.61 PFLOPS;同时支持 AMD ROCm、Infinity Architecture、RAS、SR-IOV 等企业级功能。
MI300X 主要以裸金属节点/集群方式交付,适合需要高显存 GPU 的 AI 推理、模型微调和从开发到生产的部署场景。其标准节点配置为 8 块 AMD Instinct MI300X、2 颗 AMD Genoa 9654 CPU、2.3TB DDR5 4800MT/s 内存、4 块 3.84TB NVMe 加 2 块 960GB M.2、本地节点互连 3.2Tb/s,并可选 Managed Kubernetes 和 Slurm;起步价格为每 GPU 每小时 1.71 美元。
TensorWave Inc.融资百科
2024年1月23日——2024年10月8日,TensorWave Inc.分4次完成种子轮约4600万美元融资,FundNV和 Nexus Venture Partners领投, Battle Born Venture、 Angel Collective、 Translink Capital、 Javelin Venture Partners、AMD和Maverick Capital跟投。
2025年5月14日,TensorWave Inc.完成 AMD Ventures 和 Magnetar Capital 领投的1亿美金A轮融资,Nexus Venture Partners、 Prosperity7 Ventures 和 Maverick Capital 跟投。
2026年6月10日,TensorWave Inc.完成 AMD Ventures 和 Magnetar Capital 领投的3.5亿美金B轮融资,Nexus Venture Partners、 Western Frontier 和 Maverick Capital 跟投。
TensorWave Inc.美股投资
参考资料:
