字体
关灯
返回目录 阅读足迹 更多章节
第(1/3)页
    “而且大模型人工智能都是计算的稠密矩阵,数据结构高度规范,加速卡的运算核心越多速度就越快。现在的加速卡舍弃不必要的高精度浮点运算,针对fp32、fp16和8位运算进行优化后,在使用最新的工艺制程,核心规模可以翻好多倍。”
    “加上精度降低后的运算速度提升,单张加速卡在处理这个大模型时候的算力至少是现有加速卡的十几倍。当然了这也需要软件方面的适配,在运算前对数据进行预处理,把各种运算放到合适的运算核心,最大发挥效率。”
    当下对人工智能小组的人员组成进行了讨论,对分工进行了安排,非常的高效,这也是研究院的一贯特点。
    等安排好后一位硬件专家提了一条意见。“院长,刚才只讨论了核心运算速度的事情,考虑数据传输。很显然这个优化后的计算核心需要极高的数据吞吐量,哪怕是给计算卡加满板载内存也很难满足。也不是容量的问题,而是板载内存和计算核心之间数据交换速度有限制,根本就赶不上。”
    会议室的人点了点头,都理解。就好比高速公路,每小时可通行辆车,但是收费站只能通行1000辆车,修的再好也发挥不了作用。
    班行远想了想说:“可不可以考虑设计单独的传输方式,将内存芯片和计算核心封装在一起,这样就能不经过板卡直接进行数据交换?”
    几位硬件专家眼睛一亮随即有些失望。“院长,这样的确能满足带宽的需要,但是封装基板面积有限,只能集成几个内存芯片,这样的话内存容量就成了限制。”
    “动动脑筋。面积有限就不能考虑垂直布置吗?另一个项目组在闪存垂直封装上取得了进展,可以把几十层上百层的闪存堆叠起来封装在一个芯片里,这样就能大幅提高单个芯片的容量,而且读写速度更快。这个技术会在几天后至微的发布会上公开。你们也可以考虑把多个内存芯片封装在一个颗粒里面。这样不就相当于增加了容量?”
    “当然了,考虑内存的发热,肯定不能像闪存那样堆个几十上百层,四五层应该是够用了。基本上能满足计算核心的数据需要。”
    这些科学家新算了一下,差不多够用了。当然了技术出来后肯定是委托至微代工,自己用可以用研究院最先进的光刻机生产,
第(1/3)页
本章还未完,请点击下一页继续阅读
上一章 目录 下一页
都在看:囚我三年?当你后爸不过分吧3366洛尘小娇娇软糯乖巧,腹黑权臣步步哄诱都市仙尊洛尘张小曼废柴修真记洛尘张小曼权力巅峰:重回商界当大亨张小曼洛尘二婚嫁豪门被宠疯,前夫和儿子眼睛哭瞎穿越1961:分家后,我盖房屯粮肉满仓!举报我卖假药,病情复发你哭啥?