中国人工智能实验室DeepSeek能够使用数万个NVIDIA H100 AI GPU进行训练。其开发的AI模型DeepSeek R1被认为是世界上最先进的之一,可以与OpenAI的新o1和Meta的Llama AI模型相媲美。
AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)接受电视媒体公开采访时表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
DeepSeek成立于2023年,去年年底发布了一个免费开源的大语言模型。根据其论文,DeepSeek-R1在多个数学和推理基准测试中超越了行业领先的OpenAI等模型,在性能、成本、开放性等方面也表现出色。在一系列第三方基准测试中,DeepSeek ...
此外,DeepSeek此前在技术论文中介绍的降本方法,也已被Meta的研究小组列为重点研究对象 ,包括模型蒸馏(distillation)等技术。Meta希望通过这些努力,能够在即将发布的Llama 4中实现技术突破。
近日,一篇在匿名平台teamblind上发布的文章遭疯传, 有一位自称是Meta员工称公司内部因DeepSeek模型而进入恐慌模式,并提到DeepSeek-V3在基准测试中,已经让(Meta推出的)Llama ...
王先生表示,据他了解,DeepSeek 拥有大约五万个 H100 ,并且他们不能谈论这个,显然因为这违反了美国实施的出口管制,并补充说他们拥有的芯片比其他人预期的要多。 未来,对于中国获得先进的人工智能芯片,王先生表示:但从长远来看,它们也将受到我们现有的芯片管制和出口管制的限制。
IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 ...
在加利福尼亚联邦法院近期公开的庭审文件中,一起涉及meta Platforms的版权纠纷案再次引发了广泛关注。该案源于一群作家对meta在训练其Llama AI模型时,涉嫌未经授权使用盗版电子书和文章数据集的指控。
IT之家1 月 12 日消息,日前 Meta 首席执行官马克・扎克伯格在播客节目《乔・罗根体验》中发表了一系列引人注目的言论,涉及企业文化、性别平等以及公司政策调整等多个话题。此次访谈长达近三小时,扎克伯格在节目中表达了对当前企业文化“去男性化 ...
IT之家1 月 11 日消息,根据 TechCrunch 9 日的报道,在一起针对 Meta 的版权诉讼中,原告的律师表示,Meta CEO 马克・扎克伯格批准了公司 Llama AI 模型开发团队使用盗版电子书和文章的数据集来进行训练。 当地时间周三晚些时候提交给美国加州北区法院的最新文件中 ...