PPTkeyibagong  说实话,昨天深夜在算这几个月AI Coding开销的时候,我手稍微抖了一下。 **20,000 美金。** 这不是公司的融资款,也不是大厂报销的额度。这是过去4个月,我作为一个全栈开发者,为了打磨一款从底层架构到前端像素都“对味儿”的产品,自掏腰包交的“学费”。 ![图片](https://mmbiz.qpic.cn/mmbiz_png/5CFjicGaia6DLhGtBkMdvSDNaQKDLiaVRIH2kRC2AgKr0YNevgX1KGbWTVNVCPYqSicdCUx4Q9yj2flLUHRibHCCQEg/640?wx_fmt=png&from=appmsg&watermark=1&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=0) (近两个月某88code渠道的claudecode+codex消耗截图,共10628.55刀,还有两个备用渠道) 为什么要发这个图? 不是为了凡尔赛——毕竟换算下来这是一辆B级车了,看着是真肉疼。发出来只想证明一件事: **下面我说的每一个字,都是用真金白银和无数个熬夜修Bug的夜晚砸出来的血泪教训。** ![图片](https://mmbiz.qpic.cn/mmbiz_png/5CFjicGaia6DLhGtBkMdvSDNaQKDLiaVRIHsCnjlfd12aibsT9rLSfspwsFxF8JNPszbZ7jzUdjXpchAcCy8Frtosw/640?wx_fmt=png&from=appmsg&watermark=1&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=1) 4个月,完全0->1,571次commits。 今天,我的“孩子”—— **studio.atomstorm.ai (Beta)** 终于要把丑媳妇见公婆了。 这可能是我知道的,**全球第一款基于最新Anthropic Skills技术和Multi-Agents架构的生产级 Vibe Agent 产品**。 做这款产品,我经历了从兴奋到绝望,从砍掉Alpha版本重练到涅槃重生的全过程。今天不讲那些虚头巴脑的“赋能”和“生态”,只想和大家聊聊,一个真正的**超级个体**,如何在AI的浪潮里,既看清远方的高山,又倒出鞋里的沙子。 * * * ### 01 ### 对不起,我要给 "Vibe Coding" 泼盆冷水 最近 Andrej Karpathy 大神把“Vibe Coding”带火了。网上一堆人嗨了,觉得只要会打字、会写Prompt,就能做软件了。 **我得诚实地说:某种程度上,这是骗人的。** 至少在今天,**Vibe Coding ≠ AI Coding**。 Vibe Coding 能让你用一下午搓出一个无限白板画布,或者一个看起来很炫酷但只有一层皮的Mac操作系统。这叫MVP(最小可行性产品),甚至叫“一次性玩具”。 但如果你想做一个**可维护、可扩展、能承载千万级用户、对标融资公司**的复杂商业产品,光靠“Vibe(感觉)”是死路一条。 **我亲手砍掉过一个版本。** 早在去年7月,我就做出了这款产品的Alpha版,对标市面几家头部Agent产品的效果很能打。当时只要发出来,绝对能蹭上一波AI生成PPT的热度。 ![图片](https://mmbiz.qpic.cn/mmbiz_jpg/5CFjicGaia6DLhGtBkMdvSDNaQKDLiaVRIH0mVme6SNibFEx4RGDiat59PeN2slqtvlhwprHibwtib7siaKzqZic2X90r3A/640?wx_fmt=jpeg&from=appmsg&watermark=1&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=2) 但我把它砍了。代码全部推倒,从头再来。 为什么? 第一,**产品太糙**。基本处于原型阶段,发出来是对用户的不尊重。 第二,**架构腐蚀**。那是一个纯Next.js的“屎山”,所有的逻辑都堆在一起。一旦我想加个新功能,AI就开始胡言乱语,改了一个Bug冒出三个新Bug。这就好比用积木搭摩天大楼,地基都没打好,风一吹就倒。 第三,**甚至是背离了初心**。Build in Public营销是流行打法,但我不擅长当网红。我想,那就先解决问题。 这时候我才深刻理解《黑神话:悟空》制作人冯骥的那句话: > **“最让你难受的不是远方的高山,而是你鞋里的沙子。”** AI Coding带来的**架构腐蚀、认知负担、依赖冲突**,就是那一粒粒沙子。 这4个月,我有50%的时间不是在写代码,而是在**当裁判**——评审AI的逻辑,指正它的错误,规划它的路径。 **所以,你问我AI Coding行不行?** 行,太行了。这个商业项目100%的代码都是AI写的。 **但人还重要吗?** 比以前更重要。因为你的**决策力、审美和系统架构能力**,才是AI时代最值钱的硬通货。AI是极其强大的手脚,但你必须是那个清醒的大脑。 * * * ### 02 ### AtomStorm 到底是个啥? 铺垫了这么多,如果你还没关掉文章,说明你是真爱。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 简单说,**AtomStorm (studio.atomstorm.ai)** 是一个让你不需要任何专业提示词,跟着“直觉”就能做出设计大师级结果的智能体。 **它能做什么?** ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) PPT、架构图、海报、简历、落地页……统统拿下。 **既然市面上生成PPT的工具多了去了,为啥还要造这个轮子?** 因为我受够了那些“**伪智能体**”。 要么是简单套壳的ChatGPT。 要么死贵(生成个一个PPT要20块钱?抢钱呢?)。 要么就是让你填一堆表格,生出来的东西像上世纪90年代的遗物。 AtomStorm 有两个核心模式,我觉得特别有意思,也是我最想给你们看的: #### 🍌 Banana Mode(香蕉模式):傻瓜式快乐 不需要你会写Prompt。 输入个链接,或者传个文档,**Vibe一下**就行。 比NotebookLM、Manus强的是,我们是每一页一生成就可以实时预览。你不需要干等半小时,第一页Slide生成出来的时候,你就可以开始看、编辑、停止。这种爽感没法形容。 #### 👨‍💻 Code Mode(极客模式):真正的上帝视角 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 这是我最自豪的功能,也是区分我们和“玩具”的分水岭。 生成的每一页Slide,不仅仅是图片,而是**可编辑的代码**。我们采用了Coding领域的网页编辑技术,你可以像改代码一样改设计,但操作像PPT一样简单。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) - • 改文字?点一下。 - • 换布局?拖一下。 - • 插入视频/图片?直接扔进去。 - • 保存直接为新版本 **所见即所得,像素级可控。** ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) * * * ### 03 ### 为什么要死磕 Skills 和 Multi-Agent? 这一段可能有点硬核(Boring),但却是这款产品值钱的底层逻辑。 如果你是技术控,或者被Agent坑过,一定要看。 现在的Agent市场,90%都是在大模型外面套个壳。但 AtomStorm 率先用了 **Anthropic最新的Claude Skills技术** 和 Multi-Agents 技术。 #### 1\. 无限上下文的“技能包” (Infinity Context Skills) ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 传统的AI聊多了就忘事,或者变笨。 但基于Steps的渐进式披露设计,我们可以让Agent加载几乎无限的技能。每一个技能都配置了专属的MCP工具。 如“ppt\_creation\_code”、“ppt\_creation\_banana”,配置了convert\_to\_makrdown、search、artifact\_writer工具来完成任务。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) (直接Slide展示原理) 这意味着我们给AI装上了“USB接口”——即插即用。 我敢断言,**这绝对是2026年Agent开发最大的技术趋势,谁先用谁赢。** **我们架构支持skill扩展,为未来支持各种形式的Agent内容生成提供了广阔想象空间。** #### 2\. 多智能体协作 (Multi-Agents + Plan-Execute) 很多AI生成的PPT为什么前后逻辑混乱?因为它是一个“全才”在干活,脑子不够用。   演示案例是根据上传的pdf论文写PPT。  主智能体编排:内容整理->大纲生成->PPT制作三个智能体,其中大纲截断支持HITL(Human in the loop),编辑大纲后,需要你手动确认才开始制作PPT。![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) AtomStorm 采用的是**优化版的Plan-Execute框架**。 - • **主智能体(大脑):** 负责编排多个子智能体,协调工作。 - • **子智能体(手脚):** 上下文隔离,不仅各司其职,还能**并行执行工具调用**。 **这带来的效果是惊人的:** 以前生成15页PPT,可能要一杯咖啡的时间(25分钟)。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 现在?**5分钟搞定。** 因为我们支持多路并行。当你在看第1页的时候,第2、3、4、5页正在后台同时生成。这才是真正的生产力。 网络不好? 断网刷新? 临时关电脑开会? 无需担心,支持多智能体支持自主恢复执行,保存历史执行状态,而不仅仅是存储状态。 背后的支撑是多智能体的上下文传递、暂停恢复状态管理,中间还涉及websoket通信。 多智能体,耗费了至少1个月的调试和问题修正。  **如非必要,不建议一上来就构建多智能体,坑太多。** #### 3\. Skill扩展场景实测:一张架构图救了我的命 图都在脑子里,但画出来太费劲。 以前做技术汇报,ProcessOn/Excalidraw 拖拉拽半小时,画得还歪歪扭扭。 现在,如果你有文字草稿,直接扔给AtomStorm。 **Boom!** 一张专业级的架构图直接生成。你只需要微调一下颜色,导出。30分钟的工作被压缩到了3分钟。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) * * * ### 04 ### 最后的碎碎念:设计是隐形的 做这个产品时,我一直在反复琢磨一句话: **"Good design is invisible." (好的设计是隐形的)** 最好的AI,不应该让你觉得你在和一个机器人费劲地对话。它应该像从水管里流出来的水一样自然。用户不应该感受到“我在编写Prompt”,而应该感受到“我想到了,它就出现了”。 ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 所以,我们在Prompt里写下了这样一段“设计灵魂”: > "克制是最高级的表达,少即是多。细节是魔鬼,也是天使。打破规则之前,必须精通规则。" 这就是我们的 **Vibe Design**。 **当然,我得泼盆冷水(再次):它现在还不完美。** 现在的联网深度搜索还不如Perplexity,支付功能在这个月底才上线,文档多模态解析也还需要优化成本。 但相比于那些融资千万却还在画饼的团队,我选择了把产品先端上来。因为我相信:**"Done is better than perfect."** Sam Altman 说,2026年会出现单人创造10亿美金公司的神话。 我不指望成为那个神话,但我希望能成为那个**最早把最先进的铲子递给你们的人**。 **如果你厌倦了千篇一律的AI工具,如果你也想体验一下Agent Native的交互,欢迎来试用,来吐槽。** #### 🌈 如何上车? AtomStorm Beta 正在进行限量内测,地址studio.atomstorm.ai。 计划月底海外上线,国内内测阶段可访问。 为了保证服务器不被挤爆,目前采用邀请制。 长按下方二维码进群,我们聊聊真的技术,不扯淡。如果你是技术大牛或者设计师,更是欢迎。 (vibe一张海报,插入二维码截个图) **【AtomStorm 产品体验群】 | 【AI Coding 硬核交流群】 | 【AI Agent 技术前沿群】** ![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) **One More Thing:** 如果你对技术感兴趣,后续我也计划把项目的**HTML Slide生成部分开源,AI Coding的脚手架也在规划中**。毕竟,我们是AntV和Diagram等开源项目的受益者,也该回馈社区。 **我是栗子KK。山远路险,鞋里有沙,但我们路上见。** * * * PS:有认识Google Cloud的朋友吗?求捞一下,这Token烧得我肉疼,想看看有没有Credits或者商务合作的机会(备注来意)。