Ai Safety - 搜索 News

1 天

全球人工智能安全指数发布：我国在AI安全领域走在国际前沿

2025年2月8日，全球人工智能安全指数（Global Index for AI ...

1 天

全球人工智能安全指数发布，我国如何引领国际安全标准？

2025年2月，全球人工智能安全指数（Global Index for AI ...

腾讯网1 天

全球人工智能安全指数发布，中国AI安全就绪度处于国际第一梯队

新京报贝壳财经讯（记者罗亦丹）新京报贝壳财经记者2月8日获悉，中国科学院自动化研究所人工智能伦理与治理中心、人工智能安全与超级对齐北京市重点实验室、远期人工智能研究中心等数家单位联合研究并正式发布了全球人工智能安全指数（Global Index ...

1 天

全球人工智能安全指数发布，我国处于国际第一梯队

2月8日，记者从中国科学院自动化研究所人工智能伦理与治理中心获悉，由该中心、人工智能安全与超级对齐北京市重点实验室、远期人工智能研究中心等单位联合研究的全球人工智能安全指数（Global Index for AI ...

3 天

美国人工智能安全研究所首任所长离职

美国人工智能安全研究所（U.S. AI Safety Institute）的所长埃莉莎白・凯利 (Elizabeth Kelly)于本周三宣布辞职，她在 LinkedIn ...

腾讯网1 天

DeepSeek-R1、o1都低于10%，人类给AI的「最后考试」来了，贡献者名单 ...

机器之心报道编辑：Panda随着 AI 大模型在一个又一个的任务上达到乃至超越人类水平，人类文明似乎已经进入了与 AI 共生的时代。为了跟踪 AI 的发展进度，适当的基准必不可少。但现在，由于 AI ...

15 天

人类最后一次考试揭晓：AI难敌高难度挑战，DeepSeek脱颖而出

在人工智能的快速发展中，评估其能力的标准一直是研究者们关注的焦点。最近，ScaleAI和Center for AI Safety (CAIS)联合发布了一个全新的AI基准测试——“人类最后一次考试”（Humanity's Last Exam, ...

Indonesia Shang Bao2 小时

通讯和数字部长代表总统出席巴黎人工智能行动峰会

通讯和数字部长Meutya Hafid（中）与该部门副部长Nezar Patria（左）和Angga Raka Prabowo（右）在雅加达议会大厦出席与国会第一委员会的工作会议。

15 天

AI最终考试：深陷低迷的智能时代，DeepSeek逆袭成王者

在最近一场引起广泛关注的基准测试中，名为「人类最后一次考试」（Humanity’s Last Exam，简称HLE），最前沿的人工智能（AI）模型的表现让人失望，整体通过率不足10%。这一测试由ScaleAI和Center for AI ...

腾讯网15 天

人类最后一次考试，AI惨败正确率＜10%！数百专家出题，DeepSeek竟是王者

新智元报道编辑：KingHZ【新智元导读】AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中，所有顶尖LLM通过率不超过10%，而且模型都表现得过度自信。捍卫「人类智慧」最后一战!刚刚，Scale AI和Center for ...

14 天

人类最后一次考试，AI惨败正确率＜10%！数百顶级专家联手出题 ...

为此，Scale AI和CAIS推出了名为「人类最后的考试」（Humanity's Last Exam）的多模态基准测试，旨在成为这类封闭式学术基准测试的最终版本，覆盖广泛的学科领域。此外，任何被HLE接受的问题提交者，都有机会成为相关论文的共同作者，激励了众多高水平的专家参与，特别是那些拥有高级学位或在相关技术领域拥有丰富经验的专业人士。

4 天

一件比OpenAI发布deep research更值得关注的事情

根据OpenAI发布的数据，在deep research这款Agent的加持下，OpenAI o3模型在“人类的最后考试”中取得了26.6%的准确率，与o1相比，该模型化学、人文和社会科学、数学领域的进步最为明显，而且OpenAI deep ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果