手机浏览器扫描二维码访问
前世的通识是,该模式计算效率极高,但精度损失更大,适用范围非常有限。
往往是在训练完成之后,进行FP8的格式转换,以节约模型的推理使用成本。直接在训练的时候采用这种格式是从未被证实过的。
为此,黄仁勋甚至在显卡的硬件设计上对FP8提供了一定的优化可支持,但半年的时间过去了,孟繁岐并没有看到自己预期的效果。
另一方面上,孟繁岐同时在寻求“稀疏”这一概念。这一条技术路线开启得更早,(见368-369章)。毕竟他很早就知晓,随着AI技术的发展,两个超级大国之间势必会因为世界地位的争夺而脱钩。
一旦形成对抗,硬件设备无疑将会被限制封锁。
可若要孟繁岐从根本上助力中国的硬件发展......他却也没有那个本事。
能做的,唯有投资点钱罢了。
国内的芯片技术,显然不可能跳过几代的制程,直接赶上英伟达。
换句话说,孟繁岐清楚国内硬件厂商所能提供的算力必然不如英伟达,这才提议了模型“稀疏”这一概念,以求节省资源。
模型稀疏与神经网络一样,都是对大脑行为的模仿。
从生物角度上说,大脑中的神经元连接并非全连接,而是高度稀疏的。每个神经元只与少数其他神经元相连,这种稀疏性使得大脑能够在低能耗下高效处理信息。
这给了大脑极高的能量效率,大脑在极低的能耗下完成复杂任务,部分得益于其稀疏的连接方式。
人体的总功耗才70-300w,其中大脑才仅仅只有15-30w。显卡动辄就300-500w,却完全无法与人脑的能力相比拟。
孟繁岐认为这是对计算资源的极大浪费,也已经取得了一定的成果证明稀疏方向的概念,可以在不怎么影响性能的情况下成倍地减少计算消耗。
但这件事情,却又被硬件的发展大大减缓了。
传统硬件常年来仅仅只针对密集计算优化,难以高效处理稀疏数据。
孟繁岐开发并证明技术的可行性,仅仅只用了两个多月的时间,可想要硬件良好支持,批量生产,不再等个一年,却是不大可能。
正在这AI领域逐渐陷入沉寂,总是只有小修小补的时刻,DeepSeek-R1的发布像是巨石入水,掀起了巨浪。
而令孟繁岐极为懊恼的事情是,DeepSeek取得巨大成功所依赖的技术方向,竟与他本人设想相差无几。
台湾娱乐1971情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的网游动漫小说,台湾娱乐1971-得闲读书-小说旗免费提供台湾娱乐1971最新清爽干净的文字章节在线阅读和TXT下载。...
末世:薪火崛起情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的科幻小说小说,末世:薪火崛起-梨哈哈哟-小说旗免费提供末世:薪火崛起最新清爽干净的文字章节在线阅读和TXT下载。...
天降雌性,兽神眷顾。天杀的系统坑爹的精灵外加一个破碎的她,别人穿越都是公主王妃小团宠,怎么她穿越就是从天而降被鬣狗追杀?带着受伤的雪狼被系统传送到蛇兽人洞穴,天!好美的男人!丹宝表示美男成真不要太幸福!而初遇蛇弃时为他的美色而心动,深入了解时不禁心疼这个看似高冷傲娇实则小心敏感的大醋包。既然人人都对你鄙夷弃之!那我......
帝都,四大家族。 韩家家主,已有三十,至今单身。 听闻,冷心冷血,有雷霆手段,冷面阎王之称。这样的一个强大的男人,整个帝都的人都觉得此生都不会有婚约。 一次,这个男人给了一只可怜兮兮的小松鼠一点剩饭。 然后,男人每天都会收到几颗松子…… 后来,这个令整个帝都闻风丧胆的男人结婚了,对象居然是个男人! 悄悄给你说哦,嘘,他对象是个妖精……...
混沌初开,乾坤始奠,武道起始。诸雄争霸!强者如云!世人只知源始一族,为天下共尊,却不知其为鹰犬。后世秦羽,封印绕身,一朝化龙,搅动寰宇。修无敌神功,凝最强体质,誓要打破牢笼。建势力,镇压万古,炼鸿蒙,执掌寰宇。看他鏖战寰宇,剑破九天,镇压万族,打破世间黑暗。......
长安贵女沈玉娇,明丽端庄,貌婉心娴,与河东裴瑕订下婚约。一朝突变,父兄入狱,满门流放。祸不延外嫁女,沈夫人给河东裴氏写信,盼能履行两家婚约,迎娶玉娇。直到流放当日,始终未见裴氏一...