content-forge/personal-context/烧了2000美金在AI写代码上,我发现了一个残酷真相.md

113 lines
8.9 KiB
Markdown
Raw Permalink Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## 前言
从cursor爆火到现在不到一年时间我基本把市面上能找到的AI代码工具都长期用过了个遍。
说实话作为一个AI Agent方向的创业者和全栈工程师我对这个AI Coding赛道有种近乎偏执的关注尤其是devin出来号称首个能干活的工程师在春节前体验后给我带来的冲击不亚于GPT时刻。从最早的百度Comate、Continue、FittenCode这样的代码补全插件到爆火出圈的Cursor、Windsurf再到传说中的Devin还有cline、roo-cline、kilocode、kiro当然还有最爱的Claude Code和Augment等等该花的钱我都花了该踩的坑我都踩了。
粗略算了下光是各种订阅费、token消耗、测试成本已经烧掉2000美金左右了。但这钱花得值因为我看到了一些很有意思的东西。
![图片](https://mmbiz.qpic.cn/mmbiz_png/5CFjicGaia6DKBErhV97DhBsCLLPMPG7utmW0MW8dmzUjp6iadPDLwd1uxP9fRic9V79Aib8ic5OvDLq1eWbz4l3sBhQ/640?wx_fmt=png&from=appmsg&watermark=1&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=0)
## AI写代码真香还是真坑
先说结论:**现阶段的AI Coding工具像极了一个很有天赋但经验不足的初级开发者。**
### 真香的部分
我承认,在某些场景下,这些工具确实让我刮目相看:
**代码阅读和理解**这个真的强。扔给它一个几万行的项目它能快速理解架构找到关键函数这比我自己读文档快多了。有时候接手别人的代码我会先让AI给我梳理一遍整体结构。
**多文件协同开发**当需求涉及多个文件修改时AI的全局视野确实比人类强它能同时考虑到各个文件之间的依赖关系这点我服。说到这整个行业要感谢Windsurf Casecade的贡献首次让agent能在coding领域变得可用。
**MVP和POC开发**这个是真的香。想要快速验证一个想法从0到1搭个小工具或者原型基本一天就能搞定。之前我用Cursor写了个任务Todo管理的小工具从想法到可用版本真就几个小时。还有之前文章提到一周内做的类似manus的全栈自主智能体 [做了两年AI Agent我发现99%的AI Agent项目都死在了Message Flow设计上](https://mp.weixin.qq.com/s?__biz=Mzg4MzAzNTA5Ng==&mid=2247484194&idx=1&sn=5db2099f5930874735b8e44ae12964de&scene=21#wechat_redirect)。
![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)
### 真坑的部分
但是,问题也是真的多:
**需求理解偏差**这个最要命。你说东它理解成西然后一本正经地给你写了一堆代码看起来很专业实际完全不是你想要的。特别是涉及业务逻辑的时候AI经常会"自作聪明"。
**多轮交互的噩梦**:当你发现它理解错了,想要纠正,往往需要好几轮对话。每一轮都可能产生新的偏差,最后你会发现,还不如自己重新写。
**Lint和代码质量**AI写的代码经常不符合项目的编码规范各种lint错误需要大量的人工修复。有时候修复的时间比重写还长似乎是开了雷达专找你薄弱的技术栈下手。
**死循环问题**这个真的很崩溃。AI发现有问题然后修复修复后又产生新问题再修复无限循环。我见过最夸张的是一个简单的函数被改了20多轮最后还是有问题。这种问题在claude code出来之前是所有vibe coding ide的通病cc出来后好很多因为上下文很多时候不用拆东墙补西墙了。
**复杂项目的熵增爆炸**当项目变得复杂时每次新增需求都可能打破现有的平衡。AI缺乏对整体架构的把控能力缺乏对现有项目的规范把握容易让代码变得越来越混乱。让这种情况更恶化的是二次开发你本来的项目就是有很多历史包袱的破车加个高速马达开得越快散的越块。
![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)
## Devin的成与败
说到Devin我觉得它的设计思路是对的但执行还差很远。
**成也沙盒**独立的开发环境确实是个好想法可以避免污染本地环境也能让AI更自由地试错。这种"给AI一个独立工作空间"的思路值得学习。这也启发了manus说实话manus出来第一眼用过devin的人就知道它借鉴了前者的computer的gui。
**败也沙盒**:但沙盒并没有解决核心问题。死循环依然存在,简单需求复杂化的毛病也没改。你会发现,给它一个简单的需求,它可能会搭建一套复杂的架构,然后在里面绕来绕去。
我特别关注Devin提到的几个概念
- • **自我学习和成长性知识库**理念很好但现实很骨感。AI确实需要能从之前的错误中学习建立自己的经验库。
- • **像人一样解决问题**:这个我认同。真正的程序员会去查资料、看文档、参考别人的代码,而不是凭空想象。
- • **注意力托管**这个概念很有意思让AI能脱机够持续专注在一个任务上而不是分散人的注意力。
但问题是,**距离一个合格的实习生,还差得很远。**
## 为什么单纯依靠模型还不够?
经过这么久时间的深度体验,我觉得问题的根源在于:**编程不只是一个语言任务,它是一个复杂的工程问题。**
### 模型的局限性
1. 1. **上下文窗口限制**:虽然现在模型的上下文越来越长,但真实项目的复杂度往往超出模型的处理范围。
2. 2. **缺乏持续学习能力**:模型无法从项目中积累经验,每次都是"从零开始"的状态。
3. 3. **没有真正的理解能力**:模型只是在做模式匹配,对业务逻辑的理解还是很表面。
4. 4. **缺乏工程思维**真正的程序员会考虑可维护性、可扩展性、性能等工程问题还有外部沟通产生的需求变更大厂程序员只有不到1/5的时间在写代码大部分时间在开会。而AI往往只关注功能实现。
### 需要的不只是更好的模型
我觉得要真正解决这些问题,需要的是一套完整的系统:
- • **持续学习的知识库**:能够积累项目经验,形成专属的编程规范和最佳实践。
- • **多模态的交互方式**:不只是文字,还需要图像、语音、甚至是直接操作界面。
- • **强化学习机制**:能够从反馈中改进,而不是每次都重新开始。
- • **工程化的思维模式**:考虑代码的长期维护和演进。
## 我的一些思考
作为一个在这个领域深度实践的人,我有几个不成熟的想法:
### 1\. 不要指望AI完全替代程序员
至少在可预见的未来AI更应该被定位为"超级助手"而不是"替代者"。最好的使用方式是让AI处理繁琐的基础工作让人类专注于架构设计、业务逻辑和创新。
### 2\. 垂直化可能是突破口
通用的AI coding工具很难做到完美但在特定领域做到专业化是有可能的。比如专门做React组件的AI、专门做数据处理脚本的AI等。
### 3\. 工具链的重要性
单纯的代码生成是不够的需要与现有的开发工具链深度集成。测试、部署、监控、调试这些都需要AI能够参与。
### 4\. 数据和反馈机制是关键
AI需要能够从真实的项目实践中学习而不只是从训练数据中学习。如何建立有效的反馈机制让AI不断进化这是个值得深入研究的问题。
## 写在最后
2000美金换来的最大启发是**AI写代码这件事我们还处在非常早期但PMF已经比较确定的阶段。我现在产品迭代的开发习惯基本已经离不开AI工具了。**
但是AI写代码距离完全替代一个程序员这件事还有很长的路要走呢。
如果你也在关注AI coding工具或者有什么有趣的体验想分享欢迎在评论区聊聊。毕竟这个钱烧得值不值还得看能不能和大家一起找到更好的答案。
* * *
栗子KK
一个在AI浪潮中游泳的AI产品Founder
欢迎点赞、在看、关注,一起聊科技、聊产品、聊未来 🚀