Xilinx 推出史上最强大加速器卡 Alveo U55C ,专为 HPC 与大数据工作负载打造
2021 年 11 月 16 日,中国北京 –自适应计算的领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ: XLNX))今日在SC21 全球超级计算大会上宣布,推出 Alveo™ U55C 数据中心加速器卡,以及一款基于标准、API-driven 的集群解决方案,用于大规模部署 FPGA。Alveo U55C 加速器可为高性能计算( HPC )和数据库工作负载提供卓越的单位功耗性能,同时还能通过赛灵思® HPC 集群解决方案简便扩展。
全新 Alveo U55C 卡专为 HPC 和大数据工作负载而构建,是赛灵思史上最强大的 Alveo 加速器卡,能够提供 Alveo 加速器产品系列中的最高计算密度和 HBM 容量。结合赛灵思基于 RoCE v2 的全新集群解决方案,可令运行大规模计算工作负载的各类客户大获裨益,支持其利用现有数据中心基础架构和网络,实现强大的基于 FPGA 的 HPC 集群。
赛灵思执行副总裁兼数据中心事业部总经理 Salil Raje 表示:“现在,针对目标 HPC 工作负载扩展 Alveo 计算能力比以往更简单、更高效、更强大。在架构层面,以 Alveo 卡为代表的 FPGA 加速器,能够以最低成本为众多计算密集型工作负载提供最高性能。我们引入了基于标准的方法,其支持利用客户的现有基础架构和网络创建 Alveo HPC 集群。借助这一方法,我们正将这些主要优势大规模应用于任意数据中心。这是实现 Alveo 和自适应计算在数据中心更广泛应用的一次重大飞跃。”
专为 HPC 和大数据应用打造
Alveo U55C 卡融合了当前 HPC 工作负载所需的众多关键特性。它能提供更高的数据流水线并行度、卓越的存储器管理、优化的整个流水线的数据迁移,以及 Alveo 产品系列中最高的单位功耗性能。
Alveo U55C 卡采用单插槽、全高半长( FHHL )外形尺寸,最大功耗低至 150W。与前一代双插槽 Alveo U280 卡相比,Alveo U55C 提供了优异的计算密度,还将 HBM2 容量翻倍至 16GB。U55C 以更小的外形尺寸提供了更高的算力,有助于创建基于 Alveo 加速器的密集集群。它专为需要性能扩展的高密度流式数据、高 I/O 数学和大型计算问题而开发,例如大数据分析和 AI 应用。
通过利用 RoCE v2 和数据中心桥接技术,再结合 200 Gbps 带宽,这款 API-driven 的集群解决方案使 Alveo 网络可在性能和时延方面媲美 InfiniBand 网络,且无需对厂商加锁。MPI (信息传递接口)集成功能使 HPC 开发人员能以赛灵思 Vitis™ 统一软件平台.扩展 Alveo 数据流水线。利用现有开放标准和框架,现在能跨数百张 Alveo 卡上进行性能扩展,无需考虑服务器平台和网络基础架构,同时还能共享工作负载和存储器。
借助面向应用和集群的高层次编程,软件开发者和数据科学家能够运用 Vitis 平台,解锁 Alveo 和自适应计算的优势。赛灵思大力投入于 Vitis 开发平台和工具流程,旨在令不具备硬件专业知识的软件开发者和数据科学家,也能更容易地使用自适应计算。Vitis 平台支持 Pytorch 和 Tensorflow 等主流 AI 框架,还支持 C、C++ 和 Python 等高层次编程语言,使开发者能利用特定 API 和库来构建领域解决方案,或者使用赛灵思软件开发套件,从而在现有数据中心内轻松加速关键 HPC 工作负载。
HPC 客户用例
CSIRO 是澳大利亚的国立研究机构,拥有全球最大的射电天文望远镜天线阵列。CSIRO 现正使用 Alveo U55C 卡,用于其平方公里阵列( Square Kilometer Array )射电望远镜的信号处理。将 Alveo 卡部署为配备 HBM 的网络附加加速器,能够在整个 HPC 信号处理集群中实现大规模吞吐量。基于 Alveo 加速器的集群使 CSIRO 能够处理海量计算任务,从 13.1 万根天线中实时聚合、过滤、准备和处理数据。420 张 Alveo U55C 卡通过支持 P4 语言的 100Gbs 交换机实现完全联网,在整个信号处理集群中提供了 460GBs 的 HBM2 带宽。Alveo U55C 集群的处理性能可达 15Tb/s 的总吞吐量,功耗更低且更具成本效益,显著节省了成本。CSIRO 现正完成一项 Alveo 参考设计,以助力其他射电天文学或相邻产业获得同样的成功。
Ansys LS-DYNA 碰撞仿真软件几乎用于全球所有的汽车公司。安全性和结构系统的设计往往取决于模型性能,因其能以计算机辅助设计有限元方法( FEM )仿真来降低物理碰撞测试的成本。FEM 求解器是驱动具备数亿个自由度仿真的主要算法,而这些庞大的算法可以细分为更基本的求解器,如 PCG、稀疏矩阵、ICCG。与 x86 CPU 相比,利用超并行数据流水线在大量 Alveo 卡上进行性能扩展,LS-DYNA 能够实现超过 5 倍的性能加速。这能在一个 Alveo 流水线中提高单位时钟周期的工作效率,令 LS-DYNA 客户受益于突破性的仿真时间。
Ansys 战略合作伙伴总监 Wim Slagter 表示:“秉持不懈创新的精神,我们很高兴与赛灵思展开合作,在我们的 LS-DYNA 仿真应用中大幅加速有限元求解器,表征隐式有限元方法 90% 的负载特性。我们期待在赛灵思加速的助力下,实现支持创新者设计未来的使命。”
TigerGraph 是一家领先的图分析平台提供商,正使用多张 Alveo U55C 卡为两种最高效算法进行集群与加速,以驱动基于图的推荐和集群引擎。对于数据科学家而言,图数据库可谓一种颠覆性平台。图从信息孤岛中采集数据并重点关注数据间的关系。图领域的下一个前沿是实时查找答案。Alveo U55C 将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与基于 CPU 的集群相比,使用多张 U55C 卡扩展分析所提供的出色计算能力和存储器带宽,可将图查询速度提升高达 45 倍。质量评分也提升高达 35%,从而显著提升置信度,将误报几率降至低个位数。
产品供货与轻松评估
Alveo U55C 卡目前可通过 China.xilinx.com 和赛灵思授权分销商购买。该产品还可通过基于公有云的 FaaS( FPGA-as-a-Service,FPGA 即服务 )供应商进行简便评估,也可以通过选定的托管数据中心进行专属预览。集群解决方案现已提供专属预览,预计将于明年第二季度全面问世。