Stack Overflow 2025 Developer Survey(回答者49,000人超)によると、AIコーディングツールに対する最大のフラストレーションは「ほぼ正しいが微妙に違う出力」で、66%の開発者が経験している。45%は「AI生成コードのデバッグのほうが時間がかかる」と回答した[^so2025]。
完全に間違っていれば捨てて書き直せる。だがAIの出力は8割正しい。残り2割を直す作業が最も精神的にきつい。他人の設計判断を修正する感覚に近い。
そしてこの体感は数字にも表れている。METR(Model Evaluation & Threat Research)が2025年に実施したRCT(ランダム化比較試験)では、経験豊富なOSS開発者16名・246タスクを対象に、AIツール使用群は完了時間が19%増加した。にもかかわらず開発者本人はAIで24%速くなると事前予測し、実験後も20%速くなったと信じていた[^metr]。