Meta Llama 2 - 搜索 News

来自MSN4 个月

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在手机上了

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理 ...

22 小时

DeepSeek新模型“火”到海外，Meta首席AI科学家称“开源在超越闭源了”

DeepSeek上周发布开源的DeepSeek-R1，并称该模型性能对标OpenAI o1正式版之后，海外AI业界对该模型的讨论还在持续。据DeepSeek介绍，DeepSeek-R1在Codeforces、GPQA ...

11 天on MSN

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

IT之家 1 月 15 日消息，周二，在一场涉及 Meta 的人工智能版权案件（Kadrey 诉 Meta 案）中，法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示，Meta 在开发其最新 AI 模型 Llama 3 ...

腾讯网12 天

速递｜Meta对内部超越OpenAI的GPT-4充满执念

图片来源：Meta根据周二法院解封的内部消息，负责 Meta 人工智能工作的高管和研究人员在开发 Llama 3 时，专注于超越 OpenAI 的 GPT-4 模型，这与公司正在进行的人工智能版权案件 Kadrey 诉 Meta ...

11 天

Meta挑战OpenAI，Llama 3的高风险训练之路

尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距，公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出，Llama 3已经能与最先进的模型一争高下，并在某些领域处于领先。最终在2024年4月，Meta正式推出了Llama 3，这款开源模型在性能上与市场上的闭源模型不相上下，甚至打败了Mistral的开源模型。

12 天on MSN

Meta陷盗版数据风波，LLama模型遭作家指控，内部文件保密请求被拒

在加利福尼亚联邦法院近期公开的庭审文件中，一起涉及meta Platforms的版权纠纷案再次引发了广泛关注。该案源于一群作家对meta在训练其Llama AI模型时，涉嫌未经授权使用盗版电子书和文章数据集的指控。

来自MSN3 个月

Meta 推出 Llama 3.2 1B/3B 模型量化版，功耗更低

IT之家 10 月 27 日消息，继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 ...

11 天on MSN

Meta争锋AI领域，为超越GPT-4，Llama 3训练数据引争议

近日，一场围绕meta人工智能版权问题的法律纠纷，意外揭露了这家科技巨头在AI领域的雄心壮志与内部竞争态势。在Kadrey诉meta一案中，法庭公开的meta高管及研究人员的通信记录，为人们提供了一个窥视其AI研发内部运作的窗口。据这些文件显示，meta在打造其最新AI模型Llama ...

华尔街见闻 on MSN12 天

【突破算力限制 Meta开源“记忆层”

【突破算力限制 Meta开源“记忆层”，重塑Transformer架构大模型】扎克伯格旗下Meta Platforms分享了一个创新研究——Memory layers（记忆层）。目前，Transformer架构的预训练大模型在存储、查询数据时，随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法，通过比较查询键与两个较小集合中的键，可以快速找到最相关的键， ...

新浪网11 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

本案检察官指控 Meta 高管在匆忙推出 AI 模型的过程中，存在使用受版权保护的书籍进行训练的行为。Touvron 在一份消息中指出，用于训练 Llama 2 的 ...

腾讯网1 个月

幻方量化旗下DeepSeek发布开源模型，超越阿里Qwen、Meta Llama

该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型，并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果