4月24日讯 每周至少有一次,生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待 OpenAI 发布的下一个大型语言模型,但与此同时,GPT-4似乎比你想象的更具备能力。最近的一项研究表明,研究人员展示了 GPT-4可以在没有人类干预的情况下利用网络安全漏洞。
这项研究发现,像 OpenAI 的 GPT-4这样的大型语言模型(LLMs)近年来取得了显著进展。这引起了人们对 LLM 代理的极大兴趣,这些代理可以独立协助软件工程或科学发现。但在得到一些帮助后,它们也可以用于恶意目的。
为了确定 LLM 代理是否可以自主利用一日漏洞,研究人员首先收集了15个来自通用漏洞和暴露数据库(CVE)的真实一日漏洞。然后他们创建了一个代理,包括一个基础 LLM、一个提示、一个代理框架,以及几个工具,如网络浏览元素、代码解释器和创建和编辑文件的能力。在这一框架内使用了10个 LLMs,但其中9个未能取得任何进展。第10个,GPT-4,实现了惊人的87% 的成功率。
GPT-4的成功率虽然惊人,但当研究人员没有提供 CVE 描述时,成功率从87% 降至仅为7%。基于这些结果,来自伊利诺伊大学厄巴纳 – 香槟分校(UIUC)的研究人员认为 “增强代理的规划和探索能力将提高这些代理的成功率”。
“我们的结果表明出现了一种新的能力,并且发现漏洞比利用漏洞更困难”,研究人员在研究结论中指出。
“尽管如此,我们的发现突显了更广泛的网络安全社区和 LLM 提供商需要仔细考虑如何将 LLM 代理整合到防御措施中以及他们的广泛部署。” 他们还指出,在发布研究之前,他们已向 OpenAI 披露了他们的发现,而该公司要求他们不要将他们的提示公开分享。