CPU也可以完美运行大模型英特尔第五代至强重磅发布

互联网 2023-12-28 21:35:01 自媒体

　　大语言模型（LLM）已经在多个领域展示出了卓越的性能和巨大的潜力，然而，要想真正发挥出这些模型的强大能力，需要强大的算力基础设施，而芯片是关键。

　　千呼万唤始出来，第五代英特尔®️ 至强®️ 可扩展处理器，它来了！

　　若是用一句话来概括它的特点，那就是——AI味道越发得浓厚。

　　以训练、推理大模型为例：

　　● 与第四代相比，训练性能提升多达29%，推理性能提升高达42%；

　　● 与第三代相比，AI训练和推理性能提升高达14倍。

CPU也可以完美运行大模型英特尔第五代至强重磅发布

　　什么概念？

　　现在若是将不超过200亿参数的模型“投喂”给第五代至强®️ 可扩展处理器，那么时延将低到不超过100毫秒！

　　也就是说，现在在CPU上跑大模型，着实是更香了。

　　而这也仅是英特尔在此次发布中的一隅，还包括打破自家“祖制”、被称为四十年来最重大架构转变的酷睿™️ Ultra。

　　此举亦是将AI的power注入到消费级PC中，用于加速本地的AI推理。

　　除此之外，具体到英特尔长期在各行各业扎根的AI实战应用，包括数据库、科学计算、生成式AI、机器学习、云服务等等，也随着第五代至强®️ 可扩展处理器的到来，在其内置的如英特尔®️ AMX、英特尔®️ SGX/TDX等其他内置加速器的帮助下，得到了更大的降本增效。

　　总而言之，纵观英特尔此次整场的发布，AI可谓贯穿始终。

　　最新英特尔处理器，AI更Power了

　　我们先来继续深入了解一下第五代至强®️ 可扩展处理器披露的更多细节。

　　例如在性能优化方面，英特尔将各种参数做了以下提升：

　　● CPU核心数量增加到64个，单核性能更高，每个内核都具备AI加速功能

　　● 采用全新I/O技术（CXL、PCIe5），UPI速度提升

　　● 内存带宽从4800 MT/s提高至5600 MT/s

　　我们再来纵向，与英特尔前两代产品做个比较，那么性能提升的结果是这样的：

　　● 与上一代产品相比，相同热设计功耗下平均性能提升21%；与第三代产品比，平均性能提升87%。

　　● 与上一代产品相比，内存带宽提升高达16%，三级缓存容量提升至近3倍之多。

　　不难看出，第五代至强®️ 可扩展处理器与“前任们”相比，在规格与性能上着实是有了不小的提升。

　　但英特尔可不仅仅是披露，而是已经将第五代至强®️ 可扩展处理器用起来，并把实打实的使用效果展示了出来。

　　例如在大模型的推理方面，京东云便在现场展示了搭载第五代至强®️ 可扩展处理器的新一代自研服务器所呈现的能力——

　　全部以超过20%的性能提升“姿势”亮相！

CPU也可以完美运行大模型英特尔第五代至强重磅发布

　　具体而言，京东云与上一代自研服务器有了如下的性能提升：

　　● 整机性能提升达123%；

　　● AI计算机视觉推理性能提升至138%；

　　● Llama 2推理性能提升至151%。

　　这也再一次证明了在五代至强®️ 上搞大模型，是越发得吃香了。

　　而除了大模型之外，像涉及AI的各种细分领域，如整机算力、内存宽带、视频处理等等，也有同样的实测结果。

　　这份结果则是来自采用了第五代英特尔® 至强® 可扩展处理器的火山引擎——

　　其全新升级的第三代弹性计算实例，整机算力提升39%；应用性能最高提升43%。

CPU也可以完美运行大模型英特尔第五代至强重磅发布

　　而且在性能提升的基础上，据火山引擎透露，通过其独有的潮汐资源并池能力，构建了百万核弹性资源池，能够用近似包月的成本提供按量使用体验，上云成本更低了！

　　这是由于使用内置于第五代至强®️ 可扩展处理器中的加速器时，可将每瓦性能平均提升10倍；在能耗低至105W的同时，也有已针对工作负载优化的高能效SKU。

　　可以说是实打实的降本增效了。

　　在云计算和安全性方面，亮出实测体验的同样是来自国内的大厂——阿里云。

　　在搭载第五代英特尔® 至强® 可扩展处理器及其内置的英特尔® AMX、英特尔® TDX加速引擎后，阿里云打造了“生成式AI模型及数据保护“的创新实践，使第8代ECS实例在安全性和AI性能上都获得了显著提升，抖客网，且保持实例价格不变，普惠客户。

　　包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%，以及音视频性能提升15%。

CPU也可以完美运行大模型英特尔第五代至强重磅发布

　　值得一提的是，内置的英特尔®️ SGX/TDX还可以为企业分别提供更强也更易用的应用隔离能力和虚拟机 (VM) 层面的隔离和保密性，为现有应用提供了一条更简便的向可信执行环境迁移的路径。

　　以及第五代英特尔® 至强® 可扩展处理器在软件和引脚上是与上一代兼容的，还可以大大减少测试和验证工作。

　　总的来说，第五代至强® 可扩展处理器可谓“诚意满满”、表现非常亮眼，而它背后所透露出来的，正是英特尔在AI领域一直都非常重视落地的态度。

　　背后是一部AI落地史

　　事实上，作为服务器/工作端芯片，英特尔® 至强® 可扩展处理器从2017年第一代产品开始就利用英特尔®️ AVX-512技术的矢量运算能力对AI进行加速上的尝试；而2018年在第二代至强®️ 可扩展处理器中导入深度学习加速技术（DL Boost）更是让至强成为“CPU跑AI”的代名词；在之后第三代到第五代至强®️ 可扩展处理器的演进中，从BF16的增添再到英特尔®️ AMX的入驻，可以说英特尔一直在充分利用CPU资源的道路上深耕，以求每一代处理器CPU都能支持各行各业推进AI实战。

　　起先是在传统行业。

　　例如第二代至强®️ 就发力智能制造，帮助企业解决海量实时数据处理挑战，提升生产线系统效率，完成“肉眼可见”的产能扩展。

　　随后，至强® 可扩展处理器开始在大模型界大展身手。

　　在AlphaFold2掀起的蛋白质折叠预测热潮之中，第三代和第四代至强® 可扩展处理器连续接力，不断优化端到端通量能力。实现比GPU更具性价比的加速方案，直接拉低AI for Science的入场门槛。

CPU也可以完美运行大模型英特尔第五代至强重磅发布

　　这其中就有从第四代开始内置于CPU中，面向深度学习应用推出的创新AI加速引擎——英特尔® AMX的功劳。作为矩阵相关的加速器，它能显著加速基于CPU平台的深度学习推理和训练，提升AI整体性能，对INT8、BF16等低精度数据类型都有着良好的支持。

原标题：【CPU也可以完美运行大模型英特尔第五代至强重磅发布】
内容摘要：大语言模型（LLM）已经在多个领域展示出了卓越的性能和巨大的潜力，然而，要想真正发挥出这些模型的强大能力，需要强大的算力基础设施，而芯片是关键。千呼万唤始出来，第五代英特 ...
文章网址：https://www.doukela.com/zmt/260719.html；
免责声明：抖客网转载此文目的在于传递更多信息，不代表本网的观点和立场。文章内容仅供参考，不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品，请与我们取得联系，我们会及时修改或删除。

标签：发布(7067)运行(275)重磅(1715)完美(384)大模型(148)英特尔(63)也可以(14)五代(16)