数据:
o3病毒学能力超越94%博士级专家,准确率43.8%; 博士级病毒学专家平均得分22.1%; 测试项目包含322道题目。
线索:
这项研究展示了顶尖AI在病毒学领域取得的显著进展,可能引发大量投资机会,但也带来了重大的安全风险,因为制造生物武器的门槛显著降低。随着技术的普及,恶意用途可能成为现实,这需要监管和管理的加强,以防止技术滥用。
正文:
最近的研究显示,o3病毒学的能力已经超过了94%的病毒学专家,准确率接近43.8%。来自多个研究机构的科研人员通过开发名为“毒学能力测试”(VCT)的基准测试,评估了顶尖大语言模型(LLM)在病毒学领域的实际操作能力。这个测试包含322道多选题,重点是实验室中实际操作的复杂问题,题目由57位病毒学家共同设计,并模拟了现实实验中难以在网上找到答案的情形。
研究的结果非常令人吃惊,o3的准确率为43.8%,而一些顶尖的AI模型如Gemini 2.5 Pro的准确率为37.6%。相较而言,博士级病毒学专家的平均得分仅为22.1%。这项发现同时也引发了警惕,论文合著者Seth Donoughe表示,这一结果令人紧张,因为对于某些人来说,AI的强大可能降低制造生物武器的门槛。
这意味着,历史上几乎任何人都可以访问“AI病毒学专家”的能力,从而大幅降低了制造生物武器的必要专业知识的门槛。随着AI技术的迅速发展,专业知识的壁垒被打破,而原本要求严格审批及专业培训的生物安全研究,如今也可能被恶意使用者进行滥用。
在这项研究中,各种前沿AI模型的表现均超越了平均人类专家的水平,表明在STEM(科学、技术、工程和数学)领域,AI的能力正在全面崛起。随着AI技术不断成熟,病毒学的专业知识如果被普及,可能会被一些不当人士利用,从而带来生物安全的隐患。研究警告说,如果这些能力被广泛滥用,制造致命病原体的概率可能会激增,因此不应等到风险真正显现出威胁时才采取行动。
发布时间:
2025-04-24 10:35:17
评论 ( 0 )