人工智能转高性能计算？人工智能计算_人工智能

人工智能转高性能计算？人工智能计算

mandy 0 2023-12-22

大家好，今天来为大家解答人工智能转高性能计算这个问题的一些问题点，包括人工智能计算也一样很多人还不知道，因此呢，今天就来为大家分析分析，现在让我们一起来看看吧！如果解决了您的问题，还望您关注下本站哦，谢谢~

本文目录

人工智能和新一代人工智能的区别
支撑AI的高性能数据中心网络架构如何设计？
lhr显卡对于AI计算的影响
通用算力和人工智能算力的区别

人工智能和新一代人工智能的区别

区别如下：

处理方式不同：人工智能是计算机智能，是封闭性的人工智能，是通过算例算法和数据，解决的是确定性的问题；新一代人工智能是开放式的人工智能，是通过交互学习和记忆实现的，解决的是不确定性的问题。

功能不同：人工智能是单一功能性的，新一代人工智能是多功能性的。

应用领域不同：人工智能主要应用于计算机领域，新一代人工智能主要应用于医疗、教育、金融等领域。

支撑AI的高性能数据中心网络架构如何设计？

近日，工信部印发《促进新一代人工智能产业发展三年行动计划（2018-2020年）》，意在加快人工智能从战略到落地，推动人工智能和实体经济深度融合。在新工业革命的背景下，大数据、计力、算法等快速迭代，正驱动人工智能进入新阶段。2017年Q3，全球AI公司融资金额突破77亿美元，是2012年的70余倍。可能会有人说这是“泡沫”，而我更愿意相信这是人工智能发展的必然结果。

在AI技术的应用过程中，各个企业都在寻找能够更好支撑高性能计算的基础网络解决方案。在《数据中心基础网络架构最佳实践及未来发展趋势》这篇文章中，我分享了如何设计一个稳定可靠的数据中心网络，下面我们再来探讨支撑AI应用的高性能无损网络应该如何设计。

前面提到大数据、计算力、算法等快速迭代，正驱动人工智能进入新阶段，而这些技术的实现对网络的低时延、无丢包、高性能这三个方面提出更高要求。

▲AI应用的技术体系及对数据中心网络的要求

高性能和无丢包比较好理解，就是指网络带宽性能的提升以及网络中不存在拥塞导致的丢包。产生时延的环节较多，要实现端到端的低时延，需要多角度分析：

其中，光电传输时延和数据串行时延相对较小，且很难通过架构设计来优化，我们应重点关注主机处理时延和设备转发时延。在各大企业积极寻求的高性能计算方案中，基于以太网的RDMA（RemoteDirectMemoryAccess）凭借其高性能和低成本优势逐渐取代InfiniBand而成为主流技术。RoCEv2（RDMAoverConvergedEthernet）技术基于UDP协议，对于建设支撑AI应用的高性能无损以网络变得尤为重要。

结合设备转发层面的时延优化手段，高性能无损网络的实现取决于两个要素：

无带宽收敛（1:1）的网络架构设计基于PFC（Priority-BasedFlowControl）和ECN（explicitcongestionnotification）功能的优先队列管理和拥塞管理

综上，AI集群高性能计算和网络方案实践思路如下图所示：

▲AI集群高性能方案关键技术组合

在这里，我以25G网络为例，结合业界主流产品形态，分享AI网络架构设计和实现思路。

主要设计理念：

核心设备全线速高性能转发，核心之间不互联，采用Fabric架构，隔离核心故障，最大程度降低核心故障的影响；三层路由组网，通过ECMP提高冗余度，降低故障风险；TOR上下行收敛比严格实现1:1，通过提高核心设备接口密度扩展单集群服务器规模；应用PFC+ECN功能，实现低延时无损网络。

网络架构设计：

1.中小型（集群规模1000台）

▲架构设计

架构特性：

每台TOR采用8*100GE上联8台32口100GBOX交换机，OSPF/BGP组网适用集群规模1000台每台TOR下联32台Servers，IDC内收敛比1:1，集群带宽25Tbps

2.中型（集群规模2000台）

▲架构设计

架构特性：

每台TOR采用8*100GE上联8台64口100GBOX，OSPF/BGP组网适用集群规模2000台每台TOR下联32台Servers，IDC内收敛比1:1，集群带宽50Tbps

3.大型（集群规模2000-18000台）

▲架构设计

架构特性：

每台TOR采用8*100GE上联4~8台核心（机框式），BGP组网适用集群规模2000~18000台每台TOR下联32台Servers，IDC内收敛比1:1，集群带宽50~450Tbps

4.超大型（集群规模20000+台）

▲架构设计

架构特性：

单POD集群规模1000~2000台，数据中心集群规模20000+，BGP组网POD内收敛比1:1，单POD集群带宽25Tbps，总集群带宽500Tbps+POD内收敛比和上行带宽根据集群带宽需求灵活配置，适用与非AI应用混合部署

在数据中心网络中，PFC和ECN功能将部署在Leaf和Spine设备上。PFC作用于设备互联端口，通过反压影响上游端口队列的发送速率，而ECN是作用在设备转发过程，最终影响的是数据流的发送方，通过降低某条数据流发送速率规避数据丢包。

PFC机制将以太链路上的流量区分为不同的等级，基于每条流量单独发送“不许可证”。相对于PAUSE帧而言，PFC可以将链路虚拟出8条不同等级的虚拟通道，当某条通道出现拥塞后不会影响其它通道。RoCEv2定义了RoCEv2CongestionManagement（RCM），其中拥塞管理用的特性ECN（RFC3168）是在交换机出口（egressport）发起的拥塞控制机制。当交换机的出口buffer达到设定的阈值时，交换机会改变数据包头中的ECN位来给数据打上ECN标签，当带ECN标签的数据到达接收端以后，接收端会生成CNP（CongestionNotificationPacket）并将它发送给发送端。CNP包含了导致拥塞的flow或QP的信息，当发送端收到CNP后，会采取措施降低发送速度。由于PFC作用于整个队列，而ECN只针对产生拥塞的具体会话，在设置PFC和ECN相关水线时，应做到先触发ECN后再触发PFC。

从外卖订单和叫车订单的智能调度，到电商平台的智能推荐，再到人脸识别支付以及即将实现的全自动无人驾驶汽车量产，AI技术的应用已在方方面面影响着人们的生活和工作，让大家的生活越来越便捷、时间利用越来越合理。但是，这都离不开基础设施的支撑。锐捷网络将凭借在数据通信领域近20年的技术积累和行业经验，创新出更好的产品和解决方案，助力AI技术的蓬勃发展。

lhr显卡对于AI计算的影响

LHR显卡对于计算的影响是显著的。LHR（LiteHashRate）技术限制了显卡在加密货币挖矿中的性能，但对于AI计算来说，这并不是一个问题。

AI计算通常依赖于显卡的计算能力和内存带宽，而不是挖矿所需的算力。

因此，LHR显卡在AI计算中仍然能够提供高性能和效率，为AI模型训练和推理等任务提供支持。

此外，LHR显卡还可以降低能源消耗和热量产生，对于长时间运行的AI计算任务来说，这是非常重要的优势。总之，LHR显卡对于AI计算的影响是积极的，能够提供高性能和能效。

通用算力和人工智能算力的区别

1.通用算力和人工智能算力是不同的，两者的差异在于算法和应用场景不同。2.通用算力在处理数据时采用的是常见的逻辑处理、算数运算等基本计算方式，适合处理大量数据，如图形图像处理、物流管理等领域。而人工智能算力则是针对人工智能的深度学习、机器学习等算法模型进行的算力优化，能够应用于自然语言处理、智能推荐等领域，更注重模型训练和推理计算。3.从硬件角度上来说，通用计算机采用的是中央处理器CPU，而人工智能算力则采用了图形处理器GPU和深度神经网络处理器DNN，其目的是通过专门的硬件设备来提高人工智能处理的效率和速度，减少耗时和成本。

OK，关于人工智能转高性能计算和人工智能计算的内容到此结束了，希望对大家有所帮助。

版权所属：链圈子
文章作者：mandy
本文地址：http://www.xinning123.cn/ai/185323.html
版权声明：版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 931614094@qq.com 举报，一经查实，本站将立刻删除。

人工智能影响哪些领域(什么是人工智能)

15 2024-06-04

人工智能转高性能计算？人工智能计算

人工智能和新一代人工智能的区别

支撑AI的高性能数据中心网络架构如何设计？

lhr显卡对于AI计算的影响

通用算力和人工智能算力的区别

人工智能领域选题？人工智能领域

人工智能医疗领域方向人工智能医疗是什么意思

人工智能领域考研院校排名，人工智能硕士专业

人工智能应用领域工资？人工智能收入

人工智能最顶级领域人工智能十大期刊

人工智能影响哪些领域(什么是人工智能)

今日推荐

热门文章

人工智能转高性能计算？人工智能 计算

人工智能和新一代人工智能的区别

支撑AI的高性能数据中心网络架构如何设计？

lhr显卡对于AI计算的影响

通用算力和人工智能算力的区别

相关推荐

人工智能领域选题？人工智能领域

人工智能医疗领域方向 人工智能医疗是什么意思

人工智能领域考研院校排名，人工智能硕士专业

人工智能应用领域工资？人工智能收入

人工智能最顶级领域 人工智能十大期刊

人工智能影响哪些领域(什么是人工智能)

今日推荐

热门文章

人工智能转高性能计算？人工智能计算

人工智能医疗领域方向人工智能医疗是什么意思

人工智能最顶级领域人工智能十大期刊