重生之AI教父
首页

436. 新的冲击 DeepSeek

o1之上,使用旧有办法继续提升性能的空间并不太大了。

孟繁岐这边收效甚微,便给了追赶者们极大的机会。

原本性能差了closeai许多的诸多大厂们,都在过去的这段时间里大大缩短了大模型性能之间的差距。

“从根本上来看,硬件设备对我的限制其实远超软件算法。”孟繁岐此前一直认为自己失去先知优势后,无法继续软件上的突破将会是最大的问题。

如今看来并非如此,随着与孟繁岐关系亲近的那个男人下台,拜老登政府限制英伟达的计算设备出口中国。

这让一心想要走在算法技术最前沿倍感压力。

虽然以他和老黄以及英伟达的关系,可以通过诸多方式绕开此禁令。可不论如何,这都称得上是巨大的困扰。

倍感无奈的孟繁岐开始向内寻求算法突破,以期待能够降低自己对显卡设备的需求。

可原本孟繁岐比较看好的两个技术方向,都没有取得预期的成功。

其一,孟繁岐很早就意识到,早期深度学习模型大多依赖于FP32(32位浮点数)的高精度计算,虽然结果准确,但计算量和存储需求巨大。

根据前世的经验,孟繁岐早早就推动了FP16(16位浮点数)训练和推理。这种格式可以节约一半的计算资源,虽然会稍稍影响模型的性能,但在针对性的优化下几乎可以忽略不计,这也是前世的主流训练模式。

如今,被计算设备所限制的孟繁岐被迫探索准确度更差的FP8(8位浮点数)。

前世的通识是

本章未完,请点击下一页继续阅读! 第3页 / 共5页

相关小说

青山 都市 /
青山
会说话的肘子
本站提供(会说话的肘子)大神最新作品青山最新章节全文免费阅读,青山讲述的是洛城夜...
2382933字06-23
多我一个后富怎么了 都市 /
多我一个后富怎么了
渔雪
本站提供(渔雪)大神最新作品多我一个后富怎么了最新章节全文免费阅读,多我一个后富...
2655185字07-13
华娱从男模开始 都市 /
华娱从男模开始
河马不会叫
本站提供(河马不会叫)大神最新作品华娱从男模开始最新章节全文免费阅读,华娱从男模...
2212701字07-11
Z世代艺术家 都市 /
Z世代艺术家
起酥面包
本站提供(起酥面包)大神最新作品Z世代艺术家最新章节全文免费阅读,Z世代艺术家讲述...
1591848字07-17
我真没想下围棋啊! 都市 /
我真没想下围棋啊!
山中土块
本站提供(山中土块)大神最新作品我真没想下围棋啊!最新章节全文免费阅读,我真没想...
1909706字07-19
国民法医 都市 /
国民法医
志鸟村
本站提供(志鸟村)大神最新作品国民法医最新章节全文免费阅读,国民法医讲述的是尸体...
6679244字07-18