的主板架构,身上黄芒闪烁,显然心情不错。
“guangyuan?”方豫略一思索,便明白了什么意思,橘子产地啊。
“广源架构下,最高可支持120 TFLOPS双精度算力,最多可以支持4块芯片的并联,支持128G的DDR4内存,采用Y-Link专用数据总线接口,提供256G的带宽,用于支持芯片间和芯片与主板其他组件的高速通讯。”
方豫翻看了一下资料。
柚子搞的这个广源架构,专用性很强,只适用于其配套的橘子大模型计算芯片OrangeCore橘核。
“橘核是500平方毫米的大尺寸芯片,一个300毫米直径的标准晶圆可以生产106片芯片,其中内置了柚子框架指令集以及橘子大模型专用指令集,针对大规模矩形运算、非线性激活函数、卷积运算都有相应的指令集进行支持。”
“经过测算,目前并不需要多核心设计,因此橘核是一款单核心芯片。”
“橘核配备了高速缓存和高带宽内存接口,支持高效的数据传输。内存架构专为大规模深度学习模型的内存需求进行优化,确保数据可以在最短时间内到达计算单元。”
“由于整个芯片采用了高度简化设计,因此它可以更加专注于计算的精度和效率,在进行橘子大模型的推理计算时,双精度算力能够达到单核25TFLOPS。”
!!!!
相较M60是15倍以上的提升!
英伟达公布的P100,算力应该也不过是三倍的提升而已!
“橘核的主要优势就在于其架构的系统性简化,虽然采用更低的制程会进一步提升算力,但因目前其他硬件设备的瓶颈限制,单芯片25TFLOPS的算力已经是极限,没有必要再降低制程,因此,第一款橘核处理器采用的仍旧是成熟的60纳米制程。”
窝草窝草!
60纳米?
这应该已经是五六年前的制程了吧?
成熟好啊,成熟就能省成本。
一个300毫米直径的60纳米晶圆,瀛积电代工成本大约3000迈元,物料成本大约700迈元,平均到每一片橘核芯片上,大约35迈元。
算上封装等成本,控制合理的话,单芯片的成本能控制在50迈元以内!
当然,这只是生产和制造成本,真正的芯片生产还是要把研发和管理成本都摊进去的。
但我没有研发成本呀!
等等,我是不是看错了?
这图纸上面标注的功耗是多少?23瓦?极限负载下功耗41瓦?
“没错,主人,确实是这么大的功耗。”柚子探头过来看了看,洋洋得意,“这个功耗数字我计算过几遍,绝对不会错。”
“由于采用了模块化计算和模糊计算原理,在功耗方面,橘核在60纳米制程下的功耗就是23w,如果采用14纳米制程,功耗应该能控制在10w以内,不过没什么必要。”
窝草窝草窝草!
最大的成本就这么省下来了?
AI最终拼的是什么?
是能源!
是电!
就用M60举例子,一片芯片的功耗就是300w,算上其他乱七八糟的硬件,平均到一片芯片上就是约420w的功耗。
这里还没计算用电的另一个大头——冷却系统。
如果是一千片的计算中心,每天的用电就是至少两万五千度!
按照工业用电六毛三分五的电价,每天的电费就要小两万。
但现在,最大的功耗降下来了,发热也就降低了,冷却成本也会随之降低,一个1000片橘核的计算中心,每天的耗电量绝对能控制在八千度以内!
不,如果只是1000片的话,橘核可以四路并联,一个主板支撑4枚芯片,采用浸没式冷却技术,耗电量还能更低!
五月份等柚子把橘子大模型的底层法则完成分布式化后,就把一部分架构开源放出去,等到全世界都开始使用这个架构,就可以用芯片进行二次收割了!
一鱼两吃,美滋滋。
“主人……”柚子看方豫心情不错,小心翼翼试探道:“还需要有什么改进吗?”
方豫心情确实很好,虽然他没想好掌握了全球AI到底要干什么,但这种成为幕后boss感觉就是好啊。
就好像皇帝微服私访感觉一样好。
平