【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理 ...
DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论还在持续。 据DeepSeek介绍,DeepSeek-R1在Codeforces、GPQA ...
IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 ...
图片来源:Meta根据周二法院解封的内部消息,负责 Meta 人工智能工作的高管和研究人员在开发 Llama 3 时,专注于超越 OpenAI 的 GPT-4 模型,这与公司正在进行的人工智能版权案件 Kadrey 诉 Meta ...
尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距,公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出,Llama 3已经能与最先进的模型一争高下,并在某些领域处于领先。最终在2024年4月,Meta正式推出了Llama 3,这款开源模型在性能上与市场上的闭源模型不相上下,甚至打败了Mistral的开源模型。
在加利福尼亚联邦法院近期公开的庭审文件中,一起涉及meta Platforms的版权纠纷案再次引发了广泛关注。该案源于一群作家对meta在训练其Llama AI模型时,涉嫌未经授权使用盗版电子书和文章数据集的指控。
IT之家 10 月 27 日消息,继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 ...
近日,一场围绕meta人工智能版权问题的法律纠纷,意外揭露了这家科技巨头在AI领域的雄心壮志与内部竞争态势。在Kadrey诉meta一案中,法庭公开的meta高管及研究人员的通信记录,为人们提供了一个窥视其AI研发内部运作的窗口。 据这些文件显示,meta在打造其最新AI模型Llama ...
【突破算力限制 Meta开源“记忆层”,重塑Transformer架构大模型】 扎克伯格旗下Meta Platforms分享了一个创新研究——Memory layers(记忆层)。目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键, ...
本案检察官指控 Meta 高管在匆忙推出 AI 模型的过程中,存在使用受版权保护的书籍进行训练的行为。Touvron 在一份消息中指出,用于训练 Llama 2 的 ...
该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。