Graphcore新推出的GC200 AI处理器有何特点？（graphcore）

DaoYiKang 5 0 2024-03-10

大家好，今天小编关注到一个比较有意思的话题，就是关于graphcore的问题，于是小编就整理了1个相关介绍graphcore的解答，让我们一起看看【Graphcore新推出的GC200 AI处理器有何特点？】。

Graphcore新推出的GC200 AI处理器有何特点？

Graphcore新推出的GC200 AI处理器有何特点？

7月15日消息，Graphcore今日正式发布第二代IPU以及用于大规模系统级产品IPU-Machine: M2000（IPU-M2000）。新产品比第一代Graphcore IPU性能提升8倍。中国很可能成为Graphcore最新推出的第二代处理器技术最先实现商业化落地的区域之一。

Graphcore新推出的GC200 AI处理器有何特点？（graphcore）

据介绍，IPU-M2000是一款即插即用的机器智能刀片式计算单元，由Graphcore全新的7纳米 Colossus 第二代 GC200 IPU提供动力，并由Poplar软件栈提供全面支持。其设计便于部署，并支持可扩展至大规模的系统。这款纤薄的1U刀片机可提供1个PetaFlop的机器智能计算，并集成了针对AI扩展优化的网络技术。

Graphcore第二代Colossus IPU处理器：GC200

Graphcore IPU-M2000

IPU-M2000可构建成IPU-POD64这一Graphcore全新模块化机架规模解决方案，可用于极大型机器智能横向扩展，提供前所未有的AI计算可能性，以及完全的灵活性和易于部署的特性。它可以从一个机架式本地系统扩展到高度互连的超高性能AI计算设施中的1000多个IPU-POD64系统。

“随着IPU-M2000和IPU-POD64的推出，Graphcore进一步扩大了我们在机器智能领域的产品竞争优势。”Graphcore首席执行官Nigel Toon指出：“Graphcore通过技术创新实现更强有力的产品线，这些创新能够提供客户所期望的行业领先性能。对于寻求将机器智能计算添加到数据中心的客户而言，Graphcore最新推出的IPU-M2000凭借其强大的算力、易于扩展的灵活性和突出的易用性，将具有极强的可行性和价值提升潜力。”

Mk1 IPU产品的用户可以确信，他们现有的模型和系统可以在这些新的Mk2 IPU系统上无缝运行。与第一代Graphcore IPU产品相比，第二代产品的性能还将提高8倍。

Mk1 IPU产品与Mk2 IPU产品性能对比

IPU-M2000的设计使客户可以在IPU-POD配置中构建多达64,000个IPU的数据中心规模系统，提供16ExaFlops的机器智能计算能力。新的IPU-M2000甚至能够处理最艰巨的机器智能训练或大规模部署工作负载。

Graphcore全新的IPU-Fabric技术使大规模连接IPU-M2000和IPU-POD成为可能，该技术是专为机器智能通信而从头设计的，并提供了专用的低时延结构，可在整个数据中心内连接IPU。

Graphcore IPU-Fabric技术

Graphcore的Virtual-IPU软件与工作量管理和编排软件集成在一起，可以轻松地为许多不同的用户提供训练和推理服务，并允许根据工作情况调整和重新配置可用的资源。

Graphcore的最新产品线是通过三大颠覆性技术创新实现的，这些创新可提供客户期望的行业领先性能：

计算：每个IPU-M2000的核心都是Graphcore新的Graphcore ColossusMk2 GC200 IPU。该芯片采用台积电最新的7纳米工艺技术开发，每个芯片在一个823平方毫米的裸片上包含超过594亿个晶体管，使其成为有史以来最复杂的处理器。数据：每个IPU都有大量的In-Processor Memory。Graphcore新型Mk2 GC200在处理器内部具有史无前例的900MB超高速SRAM，在每个处理器内核旁边都设有大量RAM，以实现每位最低能量的访问。Graphcore的Poplar软件还允许IPU通过Graphcore独特的Exchange-Memory通信访问Streaming Memory。这甚至可以支持具有数千亿个参数的最大模型。每个IPU-M2000都可以支持密度高达450GB的Exchange-Memory，以及前所未有的180TB/秒的带宽。通信：IPU-M2000具有内置的专用AI联网IPU-Fabric。Graphcore创建了一个新的Graphcore GC4000 IPU-Gateway芯片，该芯片可提供令人难以置信的低时延和高带宽，每个IPU-M2000均可提供2.8Tbps。在从数十个IPU扩展到数以万计个IPU的过程中，IPU-Fabric技术使通信时延几乎保持恒定。

“将强劲算力与网络能力相结合，我们能够处理全球最先进、最复杂的算法模型。”Graphcore高级副总裁兼中国区总经理卢涛表示：“这样的算法模型，对中国本地的AI算法落地场景，如云计算、互联网和通信等场景都会产生推动作用，并将为AI产业者提供巨大的价值。”

Graphcore是一家英国AI芯片硬件设计初创公司，成立于2016年，总部位于英国布里斯托，Graphcore的主要业务是设计用于AI应用程序的处理器，为云服务等应用提供产品支持。其16纳米IPU GC2处理器已量产。

Graphcore 是一家资金雄厚且志向高远的英国芯片设计企业。

其于近日发布了世界上最复杂的 Colossus MK2（又名 GC200 IPU）处理器，宣称拥有 594 亿个晶体管，性能是上一代 Colossus MK1 芯片的八倍。

作为对比，英伟达在今年早些时候宣布的 A100 人工智能芯片，晶体管数量为 540 亿个。

【GC200 IPU 采用 7nm 制程，拥有 594 亿个晶体管。来自：Graphcore】

据悉，每颗 GC200 芯片具有 1472 个独立的运算核心 / 8832 个独立的并行线程，所有这些均由内置的 900MB 随机存取器（RAM）提供支撑。

Graphcore 将为自家最新的 IPU 机型（M2000）配备 GC200 芯片，其在一个披萨盒大小的盒子中包含了四颗 GC200 芯片，总算力 1 Peta-Flops 。

宣布这一消息的同时，人工智能正在对芯片世界产生重大的影响。因为 AI 模型的训练需要借助高度并行的处理器，除了催生新的市场参与者（Graphcore），还激励谷歌等科技巨头加速采用自研芯片。

该公司称，新硬件完全支持即插即用，允许客户将多达 64000 个 IPU 节点连接到一起，以达成 16 Exa-Flops 的算力。

截止目前，英伟达已经抢占了 AI 计算的大部分市场。该公司起初专为视频游戏提供加速的 GPU，已被证明相当适合 AI 运算。

即便如此，Graphcore 仍试图向英伟达的市场主导地位发起挑战，并且已经吸引了微软、戴尔等科技巨头的资金和支持。

今年早些时候，Graphcore 宣布已在新一轮融资中吸引 1.5 亿美元的研发资金，总估值也达到了 19.5 亿美元。

作为一家成立于 2012 年的企业，当时深度学习的趋势刚刚开始兴起。不过该公司最大的优势，就是其芯片在设计之初就完全考虑到了 AI 应用。

Moor Insights ＆ Strategy 分析师 Karl Freund 在接受 TheVerge 采访时称，其对 Graphcore 的最新产品感到印象深刻。而软件方面的升级，对正确利用 AI 所需的巨大并行处理能力显得尤为重要。

Graphcore 不仅将重心放在了 AI 芯片上，还考虑到了系统层面的整合。因为训练有意义的神经网络，不能只依赖于单颗芯片，而是必须在成千、乃至上万的芯片平台上完成，但可扩展性让 Graphcore 真正脱颖而出。

karl Freund 补充道：对于初创企业来说，Graphcore 的软件支持已经相当完备。其不仅能够与各种 AI 框架进行交互，还提供了使工作人员能够充分利用其硬件性能的工作负载监视工具。

到此，以上就是【Graphcore新推出的GC200 AI处理器有何特点？】小编对于graphcore的问题就介绍到这了，希望介绍关于graphcore的1点解答对大家有用。

本文内容来自网络整理，本站不为其真实性负责，如有异议或侵权请及时留言联系，本站将立即删除!