受美国 AI 芯片禁令影响,DeepSeek 团队不得不在性能较低的 H800 GPU(而非 H100)上进行多项优化创新,最终以低于 600 万美元的计算成本完成了模型训练(研发成本不计)。
上周,中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型,震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美,而且成本仅为其一小部分,而且免费提供。美国股市因此损失了 1 ...
如今的观点认为,DeepSeek的模型如此高效,以至于算力不再是瓶颈,整个市场因此出现了严重的算力过剩。然而,这种说法过于夸大。“杰文斯悖论” ...
智通财经APP获悉,国泰君安发布研报称,DeepSeek实现模型大幅降本,价值有望从模型层转移至应用层。DeepSeek成为全球DAU增速最快的AI应用,20天达成DAU 2000万,带来巨大的推理算力需求。推荐算力方面受益的英伟达 (NVDA.US ...
在2023年,科技浪潮席卷全球,尤其是AI技术的飞速发展,引领了新的产业话题。一批中国的AI创业者从硅谷归来,这次回访让他们重新审视了AI的发展脉络和未来机遇。我们将深入探讨这一现象对中美科技领域的影响,以及中国创业者如何在这些变化中寻找突破口。
2月5日消息,指数早盘走势分化,沪指弱势震荡,创指、深成指走强。板块方面,DeepSeek概念早盘大涨,安凯微、安恒信息、每日互动等20cm涨停;算力租赁概念走强,并行科技30cm涨停,优刻得、青云科技、云赛智联等盘中涨停;贵金属板块活跃,赤峰黄金涨 ...
开源证券 近日发布传媒行业周报:DeepSeek/OpenAI或加速Agent/多模态/端侧AI落地。 以下为研究报告摘要: ...
首席执行官向投资者介绍公司业绩时,措辞用语可能泄露心理健康问题。本月发表在《会计研究杂志》(Journal of Accounting Research)上的一项研究称,利用人工智能分析首席执行官的讲话录音就能判断是否存在抑郁。
本文来自微信公众号:华尔街见闻,作者:叶桢,原文标题:《DeepSeek惊艳全球,美国大模型两巨头齐发声:并不比我们先进》,题图来自:AI生成 DeepSeek ...
智通财经APP获悉,中信证券发布研报称,近期,DeepSeek爆火全球,其以强能力、低成本的特点著称,对全球AI产业链带来强借鉴意义。2025年1月20号发布的DeepSeek-R1性能对标OpenAI o1正式版,其强调强化学习技术路线,推理能力强、性价比突出。DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普及,加速AI应用全面落地;同时,其有望开启全新的Scaling Law ...
智通财经APP获悉,近日,Meta (META.US)召开了2024Q4业绩会。会上Susan ...