Ai Safety - 搜索 News

1 天

DeepSeek-R1、o1都低于10%，人类给AI的「最后考试」来了，贡献者名单 ...

从名字也能看出来，其背后必然有一个雄心勃勃的团队。据介绍，HLE 是一个「位于人类知识前沿的多模态基准」，其设计目标是成为「同类中具有广泛学科覆盖范围的终极封闭式学术基准。」 ...

1 天

全球人工智能安全指数发布：我国在AI安全领域走在国际前沿

2025年2月8日，全球人工智能安全指数（Global Index for AI ...

腾讯网15 天

人类最后一次考试，AI惨败正确率＜10%！数百专家出题，DeepSeek竟是王者

新智元报道编辑：KingHZ【新智元导读】AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中，所有顶尖LLM通过率不超过10%，而且模型都表现得过度自信。捍卫「人类智慧」最后一战!刚刚，Scale AI和Center for ...

14 天

人类最后一次考试，AI惨败正确率＜10%！数百顶级专家联手出题 ...

为此，Scale AI和CAIS推出了名为「人类最后的考试」（Humanity's Last Exam）的多模态基准测试，旨在成为这类封闭式学术基准测试的最终版本，覆盖广泛的学科领域。此外，任何被HLE接受的问题提交者，都有机会成为相关论文的共同作者，激励了众多高水平的专家参与，特别是那些拥有高级学位或在相关技术领域拥有丰富经验的专业人士。

1 天

全球人工智能安全指数发布，我国如何引领国际安全标准？

2025年2月，全球人工智能安全指数（Global Index for AI ...

3 天

美国人工智能安全研究所首任所长离职

美国人工智能安全研究所（U.S. AI Safety Institute）的所长埃莉莎白・凯利 (Elizabeth Kelly)于本周三宣布辞职，她在 LinkedIn ...

15 天

AI最终考试：深陷低迷的智能时代，DeepSeek逆袭成王者

在最近一场引起广泛关注的基准测试中，名为「人类最后一次考试」（Humanity’s Last Exam，简称HLE），最前沿的人工智能（AI）模型的表现让人失望，整体通过率不足10%。这一测试由ScaleAI和Center for AI ...

来自MSN1 天

全球人工智能安全指数发布，我国处于国际第一梯队

2月8日，记者从中国科学院自动化研究所人工智能伦理与治理中心获悉，由该中心、人工智能安全与超级对齐北京市重点实验室、远期人工智能研究中心等单位联合研究的全球人工智能安全指数（Global Index for AI ...

腾讯网2 天

China Daily｜梁正：中国正在塑造人工智能治理机制

点击蓝字关注我们梁正清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任、中国科技政策研究中心副主任、公共管理学院教授在人工智能（AI）技术迅猛发展的今天，全球正面临着前所未有的挑战与机遇。随着大型模型如ChatGPT和Sora的出现，AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果