首页>2024年股市行情回顾 > 第1329章 DeepSeek AI大模型训练成本革命与英伟达面临的挑战

第1329章 DeepSeek AI大模型训练成本革命与英伟达面临的挑战

目录

每一次技术革新都可能引发市场的巨震。

近日,deepseek-r1基准测试在国外大模型排名arena上的卓越表现,无疑为ai领域带来了一场地震。

1月24日,deepseek-r1在arena上攀升至全类别大模型第三,更在风格控制类模型(stylectrl)分类中与openai的o1并列第一。

这一成绩不仅彰显了deepseek的技术实力,更引发了全球对其背后ai训练成本革命的关注。

deepseek-v3的突破在于其以极低的成本实现了高效的大模型训练。

据悉,该模型仅使用2048块h800

gpu,便完成了6710亿参数模型的训练,成本仅为557.6万美元。

这一数字远低于其他顶级模型的训练成本,如gpt-4高达10亿美元的训练费用。

deepseek的低成本训练模式,无疑为ai领域带来了一股清流,也引发了市场对于英伟达等传统ai硬件巨头地位的担忧。

英伟达作为ai硬件领域的领头羊,其主导地位一直备受瞩目。

然而,deepseek的崛起,似乎正在悄然改变这一格局。

在deepseek的影响下,美股市场人工智能(ai)的狂欢开始颤动,投资者们开始重新审视ai领域的竞争格局。

deepseek的低成本训练模式,不仅降低了ai大模型的门槛,更可能颠覆英伟达等硬件商在ai领域的传统优势。

值得注意的是,英伟达的“老对手”

amd也迅速为deepseek“站台”

,宣布全新的deepseek-v3模型已集成至amd

instinct

gpu上。

这一合作不仅进一步巩固了amd与deepseek的长期合作关系,更可能使amd

gpu成为比英伟达更具有成本效益的替代品。

在deepseek的推动下,amd的市场地位有望得到显着提升。

deepseek的崛起,无疑给英伟达等传统ai硬件商带来了巨大的压力。

一方面,deepseek的低成本训练模式降低了ai大模型的门槛,使得更多的企业和研究机构能够参与到ai领域中来;另一方面,deepseek的技术突破也引发了市场对于ai硬件需求的重新评估。

未来,随着ai技术的不断发展,对于推理算力的需求将成为主要驱动力。

而英伟达等传统硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。

本章未完,点击下一页继续阅读



返回顶部