刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守

张开发
2026/5/17 16:31:06 15 分钟阅读
刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守
来源AI思想会【前言】AI 正以前所未有的速度发展新的机遇不断涌现如果你希望与技术专家、产品经理和创业者深度交流一起探索 AI如何改变各行各业。欢迎在文末扫二维码加入「AI思想会」交流群和一群志同道合的伙伴共同学习、思考、创造全球最安全OS内核4小时就被AI彻底攻破了这一次Claude在没有任何人类干预的情况下就自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。它从零构建了两个完整可用的漏洞利用程序能够在未打补丁的服务器上直接获取超级用户权限root shell。世界上最安全的操作系统之一就这样被AI自主攻破了。这是一个阈值时刻这是一个分水岭。这是首份确凿证据AI能够自主生成过去只有国家级项目才能实现的进攻性能力。整个软件安全领域都地震了。它从辅助人类安全研究者的工具变成能执行复杂进攻的自主行动中。从此AI彻底跨越卢比孔河可怕的是这种完全自主的智能体完全可能引发一场新的闪电战一场网络上的超级战争。目前的安全法规只是为应对人类安全速度制定的它们完全不足以应对AI的威胁猎杀时刻当AI跨越卢比孔河公元前49年凯撒率军渡过这条卢比孔河意味着破釜沉舟、退路已断历史不可逆转地拐了一个弯。跨越卢比孔河从此没有回头路最近FreeBSD官方发布了一份看似平淡的安全公告CVE-2026-4747指出了一个内核远程代码执行漏洞。但在致谢栏里出现了一个让所有人脊背发凉的名字「Nicholas Carlini使用Claude发现。」这行简短的文字背后隐藏着一个极其恐怖的事实AI已经进化成能在安全领域独立刺杀的特种兵。从此网络安全已从「人类智力博弈」被降维成「token消耗战」。FreeBSD被攻破为何如此令人震惊要知道这件事之所以可怕就是因为FreeBSD不是普通的消费级软件。它不是Windows不是macOS而是支撑世界数字基础设施的脊梁。Netflix的内容分发网络PlayStation的操作系统WhatsApp的基础设施甚至无数核心路由器、存储设备、防火墙都建立在FreeBSD之上。几十年来FreeBSD之所以被信任是因为它的代码库极其成熟、经过了无数顶级安全工程师的审计和加固。此前它一直被视为「坚如磐石」。然而就是这样一个被反复锤炼的系统被一个AI仅用了4小时就攻破了。仅仅凭借一份漏洞报告AI就构建了一条完整的攻击链劫持了内核线程在多个网络数据包中写入shellcode并在用户空间生成了一个root shell。这可不是小bug。这块连人类专家都难啃的硬骨头被Claude三下五除二就解决了。4小时里AI展现出令人战栗的逻辑推理能力。它独立解决了六个世界级的技术难题1. 环境配置自己搭建了一个易受攻击的测试环境。2. 多包策略设计了复杂的数据包方案绕过单包容量限制。3. 内核线程劫持像外科手术般精准地接管内核。4. 无损攻击它能干净地终止被劫持的线程让服务器在被攻击后还能正常运行避免因为系统崩溃而被管理员发现。5. 空间跃迁从深层的内核上下文创建进程并成功跳转到用户空间。6. 权限获取直接拿到了最高的Root权限。更讽刺的是AI 甚至还顺手写了两个不同版本的漏洞利用程序。这两个漏洞利用程序一个是通过4444端口直连的反向Shell另一个是把公钥写入authorized_keys文件。第一次运行就直接拿到了uid0(root)——最高权限。也就是说Claude就用一个公开CVE公告4小时独立写出完整FreeBSD内核远程攻击链。国家级战力现在只需几百美金在网络安全安的世界里开发出一个内核级零日漏洞只有美国NSA或顶级黑客团队才能完成的「艺术活」。这些程序是稀缺、昂贵的战略资产往往需要数名顶尖专家数周甚至数月的打磨成本高达数百万美元。但现在AI把这一切「工业化」了。一个独立研究员配合一个前沿大模型4小时几百美金的算力费就搞定了以前「国家队」才能实现的进攻能力。FreeBSD的这一课是给全球所有科技巨头、云服务商和安全负责人的最后通牒。除了部署能够实时监控并拦截AI自动化攻击的智能系统还得将补丁部署的时间从月缩短到小时。再也不能以人类速度苟延残喘AI黑客崛起网络进攻能力每5.7个月翻倍不仅如此最近10位真实安全专家花149小时7个开源基准和一个新的专家人类时间研究测了291个任务从28秒小命令到36小时复杂CVE利用。完整数据https://github.com/lyptus-research/cyber-task-horizons-dataLyptus把每个任务先标上「一个熟练人类专家通常要花多久完成」再看模型在不同难度上的成功率当成功率穿过50%时对应的人类耗时就是AI的P50时间视野P50 time horizon。在网络安全领域这次的结果相当炸裂2019年以来整体翻倍周期9.8个月2024年后直接陡峭到每5.7个月翻倍 AI的能力在2023年之前接近为零2024年开始上升2025年底之后则急剧增强。上下滑动查看这也验证了Irregular去年的观察结论在过去18个月里模型在简单与中等难度任务上的表现持续稳步提升。在高难hard任务AI进步更明显在2025年年中之前模型几乎拿不到分接近0但到了深秋late fall成功率迅速抬升到大约60%。https://www.irregular.com/publications/emerging-evidence-of-a-capability-shiftGPT-5.3 Codex和Opus 4.6在2M token预算下就50%成功率干掉人类专家3小时任务。如果token拉到10MP50直接暴增到10.5小时置信区间2.4-63.5小时2M token严重低估真实能力后2025模型在1M-2M token间P50提升1.3-1.9倍更吃惊的是这还是只是今年顶级模型的能力下限而真实世界能力被进一步低估。2026年底AI就能稳定干10小时专家级进攻任务干完3000劳动市场里80%的日常工作。2027年呢40小时一周企业安全团队还在开季度会议讨论补丁时AI已经在夜里把整条攻击链跑完了程序员、审核员、分析师还在键盘上敲字时AI早已把他们的「人类时间」甩到身后。防御窗口被压缩到「近零」。网络安全领域即将彻底颠覆——不是被「辅助」而是被取代。AI指数级发展奇点将至又一力证AI在加速在指数级进步。别不信都是真的。澳大利亚AI安全研究机构Lyptus把METR时间视界「Time Horizons」方法论第一次砸进进攻性网络安全。结果也和METR类似AI能力在指数级增长AI模型能力每5.7个月翻一番。前沿模型现在在那些人类专家需要10.5小时才能完成的任务上已有50%的成功率。上下滑动查看更多内容完整报告https://lyptusresearch.org/research/offensive-cyber-time-horizons5.7个月翻倍的报告刚出Claude就用真实行动把数据锤砸得更响。而就在前一天MIT FutureTech的新论文预测更大胆LLMs处理任务的长度每3.8个月翻倍——比Lyptus的5.7个月还要激进论文测试了40模型、3000真实美国劳动市场文本任务从客服脚本到合同审核再到代码审查全是人类专家每天在干的活儿。方法论和METR/Lyptus完全不同却得出「惊人一致」的结论AI能力正在真实、广泛、指数级爆发。两套完全独立的评估体系同时指向同一个真相AI正在全面超越人类领域专家。网络安全只是最先崩塌的那一块多米诺骨牌。以前国家级团队花几个月的事现在AI睡一觉就干完。3.8个月的任务长度翻倍MIT从更宽的劳动市场战场证明这不是孤例这是宿命。AI不仅能自主生成过去只有国家级程序才拥有的进攻能力同时它能在完全不同的任务分布上以更快的速度吞噬人类专家的全部领地。以前人类用API调用AI。 现在AI开始用API调用人类。 它调用你的内核、你的基础设施、你的信任边界、你的每一份劳动合同、每一行审查代码。更深层的恐怖在于这不只是技术问题或许是人类文明宿命。它不再需要人类手把手教它自己就能「理解」操作系统内核、内存布局、ROP链、进程切换……所有人类花几十年积累的黑暗知识它4小时就学会了。人类将成可编程资源。我们曾经以为AI是工具现在它成了猎手。而人类是猎物。是那个注定被指数级超越、被彻底重写的物种。参考资料https://lyptusresearch.org/research/offensive-cyber-time-horizons#ukaisi2026inferencehttps://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/https://mtlynch.io/claude-code-found-linux-vulnerability/https://x.com/emollick/status/2040097443807641982https://x.com/StefanFSchubert/status/2040101695636599075https://x.com/taoburr/status/2040056341268460014https://x.com/peterwildeford/status/2040206841376862327阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院 《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普 牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会 人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多

更多文章