巨型芯片,表现惊人
如果您希望可以时常见面,欢迎标星收藏哦~
模拟物质在原子尺度上的行为方式的能力正在彻底改变材料科学及其相关领域。这种方法正在生产具有奇异特性的新材料、用于核能的弹性合金以及对蛋白质折叠的新理解,这只是其中的几个应用。
这些进步很大程度上得益于越来越强大的计算机,其目的是使模拟更大、更快、更长。
这是目标,但现实情况则更加微妙。更强大的计算机让研究人员能够模拟包含数万亿个原子的庞大物质团块。但即使在世界上最强大的百亿亿次级计算机上,整整一个月的计算也只能产生几微秒的模拟时间。
更糟糕的是,增加更多 CPU 也无济于事。这是因为在这些芯片之间传输信息所需的时间是这些计算的限制因素。增加更多芯片只会使这个瓶颈更加严重。
原子撞击
现在,这一切都在改变,这要归功于加州芯片制造商 Cerebras Systems 的 Kylee Santos 以及桑迪亚国家实验室、劳伦斯利弗莫尔国家实验室和洛斯阿拉莫斯国家实验室的科学家的努力。这个团队找到了一种将原子级模拟速度提高两个数量级的方法,其结果可能会对材料科学产生变革性影响。
芯片间互连引入的时间延迟是最大规模计算中众所周知的问题,因为在最大规模计算中需要将数以万计的芯片连接在一起。
这些芯片通常有许多内核,每个内核都能独立计算。事实上,高端台式机 CPU 通常有几十个内核。最大的优势在于,由于所有内核都刻在同一块硅片上,因此它们可以快速交换数据。
Cerebras 成立的目的是消除芯片制造过程中的奇怪现象。硅芯片最初是纯硅的圆形晶片,每个晶片的大小与一个大餐盘相当。这些晶片上可以容纳数十或数百个芯片,具体取决于它们的大小。在制造过程结束时,晶片被分解成单个芯片,然后单独出售。
但在超级计算机中,芯片必须重新连接在一起才能交换数据。Cerebras 的伟大想法是将整个硅片变成一个巨大的芯片,该公司称之为“晶圆级引擎”。最大的优势是,在这些晶圆内部,所有核心都可以快速通信。
最终,我们打造出了一款非凡的芯片。该公司的 Wafer-Scale Engine-2 是一款单芯片,内含 850,000 个内核,片上内存为 40 GB,内存带宽为每秒 20 PB。所有这些仅消耗 23 千瓦的功率 — 仅用于单芯片!
桑托斯和同事们对这台机器进行了测试,以模拟物质的行为。该团队使用每个核心来模拟一块材料中的单个原子,该材料包含超过 800,000 个原子。这相当于一块约 60 x 60 x 2 纳米大小的薄片。
晶界
材料科学的一个关键问题是了解当一个金属晶体与相邻的晶体取向不同时,它们如何相互作用。这些所谓的晶粒边界非常复杂,因为尽管原子在晶体内排列完美,但在边界处,它们的排列更为复杂,而且会随时间而变化。
模拟需要考虑在飞秒级发生的原子振动,同时模拟在微秒级发生的物理和化学变化,例如原子相对于其邻居的位置变化。这是九个数量级的量级差异。这就是为什么实现更长的模拟时间如此重要。
现在,Santos 等人已将这一技术应用于铜、钨和钽,而且进一步的进展看起来极有可能实现。“通过为每个模拟原子配备一个处理器核心,我们实现了每秒时间步长 179 倍的提升,”Santos 等人表示。这使得一天之内就能实现相当于传统百亿亿次级计算机 6 个月的运行时间。
Santos 及其同事表示,当这一技术应用于材料科学的未解问题时,将带来巨大的回报。他们表示:“将每年的运行时间缩短到两天,可以解锁目前无法获得的缓慢微观结构转变过程的时间尺度,这对于理解材料的行为和功能至关重要。”
“我们的工作表明,新型晶圆级计算机架构可以大幅提高复杂原子系统的最大模拟速率。”
预计很快还会有更多进展。目前的工作使用了该公司于 2021 年推出的 Cerebras WSE-2 晶圆。今年早些时候,该公司推出了专为 AI 应用设计的 WSE-3。它的功能非常值得关注。
点这里加关注,锁定更多原创内容
今天是《半导体行业观察》为您分享的第3776期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。
热门头条