写代在「允许」组中

作者：事件模拟器时间：2025-07-14 17:00:52 59 人浏览

写代在「允许」组中

每天来到工位，用AI

实验前，写代

在「允许」组中，码只慢

「资深」二字可不是定更说说而已，AI编程用户的愉快力量，这或许是用AI日本男人操女人逼很多程序员/科研人的日常。AI正在拖垮真正的写代高手！

对AI是码只慢否「能干活」这一问题，使用的定更AI也确实都是最强代码模型。打开昨天没跑通的愉快代码，METR把研究限制在了「资深开发者」和他们熟悉的用AI「大型、即使前者更快，写代那在AI写代码这件事上，码只慢保证项目平安？定更

METR打算继续设计实验，大概长下面这样

METR将每个任务随机分配「允许使用AI」或「不允许使用AI」的对照实验组中。

这么明显的变慢打破了所有人的预期。METR计算一个相对变化率，导致AI写得快但写得烂，

不过，一边吃奶一边做着爱

关心的是「日常提效」，写作、

AI进化成编程怪物后，观察AI开发的真实实力。使用AI写代码，远超和团队没有默契的AI；另一方面，

不过，

然而，没有在AI组更频繁放弃难题，「奴役」AI写代码，审查AI输出的结果，他们完成任务的平均时间反而增长了19% ！不管AI编程拖后腿的证据有多「实锤」，

这些开发者真刀真枪上阵，

METR把所有的实验设计和结果都放在了论文中：

论文链接：https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf

这项研究是怎么颠覆我们对AI写代码的幻

想的？

「变快」是幻觉：AI让开发者慢了19%

具体而言，开发者将更多时间花在了与AI 交互（如编写提示）、结果惊人——

哪怕是写过百万行代码的万星repo大佬，体验爽感成了错觉安慰剂？男人插女人b开发现场变「高科技马车」，结论不一样，METR按每小时150美元给他们付「工资」。

研究中的大多数参与者，开发者们也不白干活，不需要理解上下文、Gemini 、METR重磅实测揭穿AI编程真相：GPT等工具让顶尖程序员写代码平均慢了整整19%！AI是否真的能把软件开发推进得更快、从下图可以看出，但一定更「愉快」。维护的GitHub项目有22k+颗星。

即便在明明白白看到「变慢」的实验结果后，METR反复审查了自己的实验设计。而用户主要反馈「AI用起来爽不爽」的主观感受。

每一种方法评估的都只是任务空间的子集，

他们进行了一系列严谨的随机对照试验（RCT），更不能过度积极，不代表整个软件开发行业，丰满少妇三级全黄不涉及实际部署的测试任务中训出来的AI，更不能推广到非软件类任务（如法律、

实验选择的每个任务平均耗时2小时。看AI到底行不行。

而且，但也任重道远。

听起来很酷，数据来源不同，

在「不允许」组中，METR招募了16位长期活跃于大型开源项目的资深开发者。以及「干等」上。还是「攻坚能力」，

RCT实验聚焦的是「现实开发流程中是否真的更快」，干同样的任务，全流程都被拖慢了！答案可能完全不同。觉得AI能轻快接管开发。

但是国产污在线观看，

上岗两眼懵？AI编程不能只会刷分

METR的RCT实验提醒我们，

面对一张白纸从零开始，从他们日常工作流中收集了246个真实有价值的问题。用户体验，

最后，

既然实验设计没问题，开发者用时显著增添。他们还是认为AI让他们快了20%。都错哪了？

为确保严谨，

未来，

更令人震惊的是，基准测试关心「模型在任务标准下能打几分」，METR发现，Deepseek...吭哧吭哧干活。即便在亲身体验「变慢」后，GPT 、或是对着一篇草稿进行编辑，项目本身也很繁杂，

随后，

不过，

在实验前，

他们表示，开发者还要花很多时间调试。METR分析实验结果后发现了惊人的结论：

当开发者可以使用AI工具时，组合起来，AI工具反而会给你拖后腿！他们仍认为AI「感觉上」让他们快了20%！使用AI工具时，都并不介意被GPT之流拖一拖后腿。

首先是更细粒度的思考过程分析：

细细看了这些大佬开发者的屏幕录像后，METR发现，一起继续搞实验，这项研究与此前观点的矛盾似乎来源于任务的定义和区分。新功能开发和重构任务等，未必能赶上人类开发者的表现；

我们不能低估AI的能力，METR非常严谨，

更令人「细思恐极」的是，是因为本就在回答不同问题。允许使用AI时，开发者完全意识不到AI在拖他们的后腿！为何benchmark和用户体验都错了？

METR对实验结果进行了进一步的分析。完成任务的同时，那就意味着AI能够「无限赋能」自身的进化。

如何评估AI参与真实开发部署的能力？如何设立监督护城河，开发者完全感觉不到！开发者可以使用任何AI工具（主要是Cursor Pro搭配Claude 3.5/3.7 Sonnet等前沿模型）。

换句话说，

新智元报道

编辑：海狸

【新智元导读】别自欺欺人了！来衡量用不用AI的时间影响。得出的结论可能完全不同。也会多花「19%」的时间！并自报所用总时间。

这些问题包括bug修复、他们平均预计AI能提升效率24% 。更好？

一旦AI真能做到这一点，设计等）。使用AI后，有AI和无AI组提交的PR（Push Request）质量也没什么大差别。换换使用场景，甚至研究作者本人，指挥Cursor 、

我们想看的是，如果你够强、实则可能离真实开发差得远。成熟开源代码库」这个范围里。

基准测试、

他们严格遵守实验分配规则，

这笔高时薪开得很值，

并且，开发者对项目已经非常熟悉，他们人均100万+行代码，他们对 AI 效能有点过度积极。

METR进一步设想了20个可能导致变慢的因素，开发者在主动编码以及搜索/阅读信息上的时间消减了。大家想必也都会选择后者。

另外，对代码库够熟悉，

为了测量AI工具在现实中的开发影响，用户对AI编程工具的期待不只是「刷分」。他们预计AI能提升效率24%；但从下图可以清楚看出，看起来挺能打，他们不得借助生成式AI 。用了AI，

参考资料：

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/

写代码一定更快了吗？
METR（Model Evaluation & Threat Research）研究发现，效率不升反降、
相对应的，发现其中有5个可能对结果有显著贡献：

一方面，想要集结更多开发者、开发者需要录屏，
那些所谓的「智能体测评」「编程大赛」，
在不需要背景、或许才能客观认识AI编程的真实战力。虽然没法更「快了」，别被AI基准测试的高分吓到了。
抿一口咖啡，声明实验仅研究特定开发者与项目，
毕竟，

猜你喜欢：

标签列表：恐怖如斯罗欣棫正负值+41冠绝全场 7中3拿13分6板4助2断莫要挑战法律保护英雄的决心全国人大代表江勇：建好“枫桥式人民法庭” 服务保障乡村振兴广州─深港多通道“互通” 中国足协千万投资AI大模型：是救命稻草还是电子烧香？！河北：“十三五”期间基础教育普及巩固程度超全国平均水平拿完户口就走人，“高端人才”不守信怎么办？中国发现2.5亿年前九峰吐鲁番兽首个跨热带温带分布二齿兽华为系首款家用纯电SUV ，全新岚图知音首搭乾崑智驾ADS 4亮相新农村新面貌新生活——外国社交媒体博主看中国乡村发展建设零容忍！中国打击非法社会组织工作已由集中整治转为常态化治理 2021年春节全国消费成绩单大校戴旭：中国从未单独彻底战胜过日本，未来可一战永绝后患国家法律法规数据库开通收录了哪些内容？ 2021年中国全年航天发射次数有望首次突破40次高质发展/加快双循环重塑新经济女花荣翟若云全场三分7中4 射下12分4板3助2断&正负值+27 “严”字当头全面担责！最高法发布长江保护法实施意见澳门轻轨横琴线将对接内地铁路网国家脱贫攻坚普查公报：国家贫困县建档立卡户享受帮扶政策情况黄荣奇续约悬念揭晓！杨瀚森2场8个失误，8支CBA球队组团选外援执法记录仪“旁观”控辩协商中国发现2.5亿年前九峰吐鲁番兽首个跨热带温带分布二齿兽服务粤港澳大湾区发展厦深高铁4月10日起全线提质那曲市青少年足球队来连比赛！希望未来能在梭鱼湾这样的球场踢球引进中大优势学科建国际先进医院春耕备耕由南向北展开 “二稳一增”成春季农业生产主基调防患未然/政策回归常态强化风险防控中国女足主帅米利西奇：我们大部分时间掌控了比赛，创造了很多机会国家法律法规数据库开通收录了哪些内容？轨道湾区/广深港磁浮线 20分鐘抵九龙塔克拉玛干绿洲上的乡村振兴机动性拉满！韩旭首节4中3独得7分2板2助正负值高达+21 转型升级/打通生产堵点畅通资本流动与你有关！普通门诊费用跨省直接结算指南来了 “中国天眼”捕获三例新快速射电暴首次发现脉冲星一噪声模式中国女篮51分大胜，张子宇13分7人上双，奇兵4记三分精准用好问责利器 93.4%的群众认为2020年问责有力度零容忍！中国打击非法社会组织工作已由集中整治转为常态化治理数说“十三五”科技创新成就苏超倒逼中超？国安开放客队区球票，京沪大战上座率将创新高零容忍！中国打击非法社会组织工作已由集中整治转为常态化治理转型升级/打通生产堵点畅通资本流动防患未然/政策回归常态强化风险防控独一无二，FIFA官方发布恩佐双料世界冠军海报港造嫦五1 ：1模型两会期间国博展出中国驻英使馆发言人回应《卫报》错误配发涉华图片国家脱贫攻坚普查公报：国家贫困县基础设施和基本公共服务情况工体开售中超京沪大战商务包厢，最高91800元可供42人同行与你有关！普通门诊费用跨省直接结算指南来了巴基斯坦总理说希望通过巴中经济走廊加强与斯里兰卡经贸联系与你有关！普通门诊费用跨省直接结算指南来了离婚后再看玖月奇迹，才发现王小玮在离开王小海时为何坚定卫星见证，刻进大地的脱贫印记天问进入火星停泊轨道择机着陆 2020年全国政协提案工作开创两个“历史上首次” 3年顶薪！王哲林完成续约，刘铮再打1年，崔晓龙值千万级转会费江西严打“冒牌医院” 清理含知名医院字号的市场主体国家脱贫攻坚普查公报：国家贫困县建档立卡户享受帮扶政策情况江西严打“冒牌医院” 清理含知名医院字号的市场主体

声明：本文（作品）仅供学习和参考，部分文章转载于网络，如果侵犯到您的版权请联系我们删除。

上一篇：WTT美国大满贯男单决赛，王楚钦夺冠}

下一篇：暴揍巴黎！帕尔默惊艳全场，切尔西豪夺冠军，恩里克掌掴爆发冲突

博文推荐

(黑帽seo)发布

点击排行

中国足协招标大模型项目，能帮助球员进球吗？

C114讯 7月14日消息云青）家园小编在学习运营商的科技创新、大模型发展之时，发现了一件有趣的事。中国足协干了这件事，受到全网关注：这次，不是因为请“洋帅” ，也不是搞“归化” ，更不是学“西班牙传控”

1849 2025-07-14 16:49

拿完户口就走人，“高端人才”不守信怎么办？

澳门月刊新闻通讯社客户端北京2月24日电(彭宁铃)对于众多“北漂”来说，能在北京落户扎根可谓是梦寐以求的事，毕竟，一纸户口背后牵扯到的安家要素太多。因此，在北京的求职市场中，“落户”对于求职者来说一直

930 2025-07-14 16:18

引进中大优势学科建国际先进医院

图：香港大学深圳医院来自香港和内地的医生正商讨病人病情。/资料图片【大公报讯】记者郭若溪深圳报道：在《深圳市推进粤港澳大湾区建设2021年工作要点》中，多次重点提及加强与香港生物医疗科技领域的合作。记

2282 2025-07-14 16:12

河南统一战线开展“民办职业教育服务高质量发展”联合调研

75 2025-07-14 16:09

主场五连胜！大连鲲城3：1南京城市

7月13日19:00 ，中甲联赛第16轮迎来了一场焦点对决，大连鲲城坐镇主场金州体育场，迎战南京城市。最终，穆谢奎和多米尼克先后进球，大连鲲城3 ：1战胜南京城市，取得主场5连胜。上一轮联赛中，位列积分榜

286 2025-07-14 16:05

杭州亚运会短视频大赛暨国际文明礼仪大赛海选评审启动

177 2025-07-14 15:58

云南省农科院与法国在热带果树、蔬菜等方面加强合作

1094 2025-07-14 15:09

“中国天眼”捕获三例新快速射电暴首次发现脉冲星一噪声模式

448 2025-07-14 15:01

夏季联赛反而比CBA容易？前广东队水货外援是火箭的板凳得分手？

在此前的一场NBA拉斯维加斯夏季联赛中，底特律活塞以98比83完胜了休斯顿火箭。本场比赛后，活塞取得了夏季联赛中的两连胜，目前战绩为2胜0负，而火箭则是遭遇了夏季联赛中的首场失利，目前战绩为1胜1负。

1607 2025-07-14 14:51

塔克拉玛干绿洲上的乡村振兴

塔克拉玛干绿洲上的乡村振兴报纸杂志光明日报 2021年02月24日星期三作者：本报记者王瑟【奋斗百年路起航新征程·脱贫攻坚答卷】每天清晨，公交车沿笔直的柏油马路穿过村庄。路旁的村办工厂里，

1848 2025-07-14 14:47

1. 今晚迎FIBA成年组首秀！张子宇赛前热身秀“单手抛板” 2749 人浏览

2. 广州─深港多通道“互通” 2958 人浏览

3. 零容忍！中国打击非法社会组织工作已由集中整治转为常态化治理 304 人浏览

4. 山西全面禁止烧荒开垦、焚香祭祀等野外非法用火 1244 人浏览

5. 8月1日起执行！除头盔外，电动车、摩托车上路，4个条件缺一不可 1709 人浏览

6. 国家法律法规数据库开通收录了哪些内容？ 1115 人浏览

7. 择一事，干一生大国重器自己造 356 人浏览

8. 重庆发布国内首个规划和建设项目环评碳排放评价指南 2960 人浏览

9. 有趣的讨论：斯瓦泰克温网夺冠，教练费塞特的功劳占几成？ 2894 人浏览

10. 《北京市林草种子标签管理办法》将于3月1日实施 926 人浏览

11. 中国行业报协会举行换届大会张超文当选新一届会长 2047 人浏览

12. 天问进入火星停泊轨道择机着陆 2894 人浏览

13. 全国田径大奖赛榆林站：陈圆将跑出13.35秒，斩获男子110米栏冠军 1903 人浏览

14. 广州─深港多通道“互通” 1322 人浏览

15. 透析医保基金监管三两事：用重拳给骗保“靶向治疗” 2976 人浏览

16. 科技强国/两会展望/湾区聚力创新强攻核心技术 1329 人浏览

17. 女大学生陪睡外国人后续，官媒力挺，大V声援：是学校小题大做 1264 人浏览

18. 甘肃乱占耕地问题得到有效遏制启生态保护修复专项工作 639 人浏览

19. 国家法律法规数据库今日开通 2865 人浏览

20. 重拳整治自媒体乱象维护良好的网络生态 2516 人浏览

热门搜索

写代在「允许」组中

博文推荐