最新新闻
起亚电动SUV EV9升级,动力与软件得到全面提升 上汽大众新款SUV途岳正式上市,售价15.86-21.66万元 福特领衔投资45亿美元,将在印尼建立镍加工厂 主机厂召开座谈会,探讨国六B切换情况 特斯拉在墨西哥大举投资,助力其成为电动汽车大国 特斯拉推出版Giga啤酒,啤迷大喜过望 西安特斯拉中心车间揭秘,让你近距离了解制造 宝马、特斯拉等豪掷重金,墨西哥将成电动车大国 本田雅阁e:HEV亮相:能否成为雅阁救世主? 特斯拉中国首次败诉,需退一赔三 AI伦理员工大量裁减引发业界担忧,微软、谷歌等科技巨头被指责 AI过于强大,人类面临危险?马斯克、图灵奖得主呼吁暂停GPT-4模型后续研发 微软早期阶段将广告植入GPT-4版必应搜索 故意毁灭证据:美法庭对谷歌Play商店垄断诉讼开出罚单 元宇宙仍是未来,但实现需要时间——Meta重申在计算领域的地位 AI老板发出警告:无法解释的推理能力可能导致人类灭亡 监管机构开始对特斯拉Model X的问题展开调查 追溯OpenAI的历史,揭示其与马斯克的众多纷争 GitHub裁员,印度团队成最大受害者 微软与OpenAI强力结盟,共同致力于网络安全领域 AI视频素材来源不明,百度文心一言创作者面临版权风暴 OpenAI神秘CTO只有35岁,是ChatGPT之母 马斯克脑机接口公司开始寻找合作伙伴 推进人体试验 芝麻信用黑灰产生意:购买会员、薅羊毛可轻松提升信用分 比尔盖茨遭马斯克批评 AI 理解有限 AI越来越智能,你的工作还能保住吗?现实不容忽视 微软研究惊艳科学界:GPT-4能力接近人类,AI朝“天网”迈进? 推特泄露部分源代码,GitHub受命删除,安全问题引人担忧 谁在制造泰国游客流失的恐慌?真相揭秘 为何马斯克和OpenAI撕破脸了?马斯克为何实际控制被拒?
您的位置:首页 >资讯 > 科技 >

NVIDIA和AMD积极考虑AI和HPC来积极构建下一代GPU

2020-07-16 15:40:22   来源:
导读 随着主要技术公司集中大量资源来满足每年对更高性能的需求,人工智能领域正在看到快速发展。我们已经看到NVIDIA和AMD积极考虑AI和HPC来积极

随着主要技术公司集中大量资源来满足每年对更高性能的需求,人工智能领域正在看到快速发展。我们已经看到NVIDIA和AMD积极考虑AI和HPC来积极构建下一代GPU,但看来英国AI芯片设计师Graphcore的竞争已经到来,后者发布了第二代AI芯片,直接与NVIDIA的竞争对手竞争。A100 Tensor Core GPU加速器。

Graphcore的GC200是用于AI任务的大型7nm芯片,旨在与NVIDIA的A100 GPU竞争-IPU可提供多达250 Teraflops的AI计算

为此,Graphcore宣布了其新型Colossus MK2 GC200 IPU或专门为机器智能提供动力的智能处理单元。就像它的名字一样,该芯片本身具有巨大的设计,并且比其前身MK1的性能提高了8倍。

微软与Graphcore合作,为Azure云中的AI应用程序提供动力

“我们100%专注于AI的硅处理器,以及可插入现有中心的构建系统。如果已经可以正常工作,为什么我们要构建CPU或GPU?这只是一个不同的工具箱。” 通过Graphcore的首席执行官Nigel Toon

Colossus MK2 GC200在台积电的7nm工艺节点上制造,管芯尺寸为823 mm2。相比之下,它几乎与NVIDIA A100 GPU加速器一样大,后者的尺寸为826mm2。该芯片不仅在尺寸上是个庞然大物,而且在密度方面也很强大,板载总共594亿个晶体管,而NVIDIA A100 GPU上只有542亿个晶体管。与NVIDIA旗舰芯片加速器相比,它在Graphcore芯片上​​显示出更高的密度。

为了使GC200正常工作,它配置了1472个IPU标题,每个标题都具有IPU内核和处理器内存储器。每个IPU内核有6个并行执行的线程,这使芯片中的线程总数为8832(1472个内核/串行处理器)。对于内存,该芯片采用了一个片上解决方案,该解决方案可为每个IPU提供900 MB的容量,并提供47.5 TB / s的内存带宽。Graphcore的容量较小,但带宽解决方案更高,并表示从理论上讲,一次使用多个机架可以得到更大的容量,并且与由A100 GPU组成的机架相比,内存池最终会更高。

为了实现互连,该芯片使用IPU-Exchange结构,该结构为所有IPU提供8 TB / s的带宽。该芯片由10条IPU链路组成,其中芯片到芯片的带宽为320 GB / s。MK200还支持PCIe Gen 4(x16)接口。至于计算输出,MK200可提供250个峰值FP16(具有稀疏性)的TFLOP和62.5个TFPOP(具有稀疏性)峰值的FP32性能。NVIDIA A100 GPU总共提供312个TFLOP FP16(624个TFLOP具有稀疏性)和19.5个TFLOP FP32(具有156个TFLOP具有稀疏性)。

免责声明:本文由用户上传,如有侵权请联系删除!