黄建同学的微博

黄建同学

2026-07-03 18:00来自微博网页版

OpenMontage：把 AI 编程助手变成一个完整的视频制作工厂。视频制作的流程通常是这样的：想创意、写脚本、找素材、剪辑、配音、合成、导出。每个环节都要人盯着，工具之间来回切换。 OpenMontage 想把这条流水线整个交给 agent 来跑。 1. 解决了什么问题现有的 AI 视频工具大多只解决其中一个环节

18

3

26

黄建同学

2026-07-03 09:01

AI时代，孩子需要新的学习英语的方法论～收藏。#AI时代还要不要学英语# 观察了一段时间AI在语言学习上的应用，发现一个规律：过去制约孩子英语进步的，从来不是"教材不够好"或"资源不够多"，而是三个结构性问题——不知道自己在哪个水平、缺少开口说话的机会、学了但没有反馈。AI恰好可以解决这三件事

276

9

145

黄建同学

2026-07-02 19:31

这次创业做的事情比较酷！小雨智造，一脑多形，已经落地十余家真实工厂↓ 真实跑了很多工厂，真实看到AI能力走进嘈杂的工厂环境，让焊接工人每天的生活变得更轻松，这种感觉是做互联网体会不来的[666]

#首批具身智能焊接机器人进厂上班# 船舶、桥梁、工厂、基础设施…… 都是由巨大的、不一致的工件组成而这背后最困难、艰苦、危险的工作仍然落在技术工人的身上这正是#小雨智造#想解决的问题 http://t.cn/AXoGuml7

4

2

14

黄建同学

2026-07-02 14:01来自微博网页版

#豆包专业版的隐藏用法# 豆包专业版最近这个「办公任务」的新功能，方向是对的。聚焦在大家日常最常用的功能，持续打磨，包装成一键即用的Agent任务，很方便。比如分析舆情，直接输入你关注的话题，就能自动查找多个渠道的相关内容，并汇总成一篇详细的舆情分析报告，很方便大家上手使用，完成质量

237

3

154

黄建同学

2026-07-02 07:20来自微博网页版

一个命令，把任意网站逆向还原成 Next.js 代码库。这是 ai-website-cloner-template 在做的事。场景：你看到一个网站的设计很好，想复刻它的结构和视觉；或者你自己的网站还在线，但源码丢了——开发者离职、老仓库找不到、技术栈已经是遗留系统。以前这两种情况都很棘手，现在有了另一条路。 1.

53

6

41

黄建同学

2026-07-01 11:48

有机会去现场的可以私戳我↓ 我司的产品终于要和大家见面了，小雨智造的AI能力已经落地真实工业场景，用AI改变真实的工业世界，挑战更大，也更有意思。

首次亮相2026全球数字经济大会 231 平米超大展台，打卡硬核工业现场现场上手｜体验小雨新品机器人真实场景｜打卡1:1 还原的重工业产线首发首秀｜7.2 下午CEO 发新技术产品 7.2-7.4 北京国家会议中心 E馆 B05见 #小雨智造##首批具身智能焊接机器人进厂打工#

4

3

10

黄建同学

2026-07-01 07:20来自微博网页版

Claude Code 的 effort level 完整指南：7个档位，怎么选，怎么设置。很多人用 Claude Code 每天烧大量 token，但从来没动过一个参数——effort level。这是控制 Claude "想多深"的档位。档位越高，推理越深，越慢越贵。默认是 high，大多数人从来没有改过它。 1. 一共有 7 个档位 1）LOW — /eff

36

5

47

黄建同学

2026-06-30 07:20来自微博网页版

阿里开源了一个 AI Code Review 工具。 open-code-review，起源是阿里内部的 AI 代码审查助手。过去两年服务了数万名开发者，识别了数百万条代码缺陷。现在以 CLI 工具的形式开源，npm 一行装好。 1. 解决了 AI Code Review 最常见的三个烂问题用过 Claude Code 或者其他通用 Agent 做 Code Review

161

12

149

黄建同学

2026-06-29 07:20来自微博网页版

Anthropic 内部怎么让人和 AI 一起工作：4 条真实经验。值得一看！过去 AI 协作是单人游戏——一个人对着一个对话框。现在他们在测试一种新的工作方式：人和 Agent 在同一个工作空间里协作，像多人游戏，人负责定方向，Claude 负责执行。这篇文章是 Anthropic 自己跑了几个月之后写下来的真实经验。

43

8

53

黄建同学

2026-06-28 10:03来自微博网页版

如何赚到十亿美元？来自Paul Graham在牛津联合会的演讲，回应了一位美国ZK的论断：「赚到十亿美元是不可能的——背后一定做了坏事。」 PG 说，这个人不懂指数增长的数学。 1. 两个数字决定一切十亿美元听起来遥不可及，但它只取决于两个变量：增长率 × 持续时间。他举了个例子：一位创始人跟他说

25

3

40

黄建同学

2026-06-27 16:58

到处都在裁员，DeepSeek要扩张一倍[赞]

感谢 @微博AI 邀请入驻微博，我是 DeepSeek Harness 组的崔添翼。目前 DeepSeek 公司正在进行人才扩招，正努力将所有部门的规模扩大至少一倍，大量岗位急招中！在向AGI前行的路上，公司的小伙伴们不断创造技术突破，并以开源的形式分享共创。 #AskMeAnything# 今天DeepSeek发布了用于加速大语言模型的

4

10

12

黄建同学

2026-06-27 10:56来自微博网页版

字节跳动技术副总裁洪定坤：AI Coding 落地的6个真实体感。字节 AI 代码贡献率一年增长 6 倍，tokens 消耗增长 5 倍。但洪定坤说：正因为用得多，对 AI Coding 的挑战才有了更真实的体感。 6 月 23 日火山引擎大会上，他分享了字节内部踩过的坑和摸出来的解法。踩过的坑： 1. 指标失真 AI 代码贡献

62

5

71

黄建同学

2026-06-26 18:00来自微博网页版

又来一个代码知识图谱，Codebase Memory MCP 给AI 编程Agent 提供一个代码的知识库，Token 消耗直接降 99%。AI 需要什么直接查图，不再逐文件扫代码。 1.效果有多显著论文数据（31个真实仓库评测）： - Token 消耗：5次结构查询只用约 3,400 tokens，逐文件探索同样问题要消耗约 412,000 tokens，

96

12

82

黄建同学

2026-06-25 17:45来自微博网页版

微博发了一个 3B 的推理模型，在HuggingFace上还挺火，在竞赛数学和编程上比肩千亿大模型。试了一下6.24当天的LeetCode困难题目，一次过。可以收藏试试！微博 AI 团队最近在 arXiv 发布了 VibeThinker-3B 的技术报告。一个 30 亿参数的模型，在竞赛数学和编程 benchmark 上，跑进了 DeepSeek V3.2

137

9

145

黄建同学

2026-06-25 07:20来自微博网页版

收藏，这个项目跟踪了Claude Code 的系统提示词这个项目持续逆向 Claude Code 的编译产物，把里面的 System Prompt 一条条抠出来。目前已经覆盖 515 个 prompt 片段，追踪了 215 个版本的变更历史，每次 Claude Code 新版本发布，几分钟内就更新。从这份清单里能看出不少东西： 1. Claude Code 根

89

6

100

黄建同学

2026-06-24 07:20来自微博网页版

腾讯的《如何写好 Skill：一份终极实战经验手册》～收藏几个关键点。 1. Skill 是什么物理上是一个文件夹加一个 SKILL.md，核心是三样东西： 1）指令——告诉 AI 按什么步骤干活 2）上下文——补充 AI 不可能凭空知道的项目背景和团队规范 3）工具——AI 可以直接调用的脚本和模板相当于给 AI 配

248

10

191

黄建同学

2026-06-23 07:20来自微博网页版

AI 会取代程序员？这篇论文给出了迄今最严谨的反驳。普林斯顿教授 Arvind Narayanan 和 Sayash Kapoor 写了一篇长文，专门分析 AI 对软件工程师就业的影响。结论是：那些 AI 导致大规模裁员的叙事，基本是假的。 1. "AI 裁员"新闻，一个个都经不起推敲 Block（Jack Dorsey）：对外说 AI 带来"更小更

55

7

71

黄建同学

2026-06-22 07:20来自微博网页版

这个项目把 Loop Engineering 的工程实现做成开源项目了。知道"要写 loop 而不是写 prompt"是一回事，知道第一步怎么起步是另一回事。这个 repo 提供了： 1）7 个生产级 Pattern，每个有独立文档和 starter 模板： - Daily Triage：每天/每两小时扫一遍 issue，出报告 - PR Babysitter：每 5-15 分

83

5

83

黄建同学

2026-06-19 10:20来自微博网页版

一套给 AI 编程 Agent 的生产级工程技能包。 AI 能写代码，但它不知道"资深工程师会怎么做这件事"——它不会自己强制先写 spec 再写代码，不会在合并之前做 code review，不会在 API 设计时考虑 Hyrum's Law，不会在高风险操作前换一个新上下文对自己的决策做对抗性审查。 agent-skills 就是把这些工

71

6

73

黄建同学

2026-06-18 07:20来自微博网页版

PM Skills～收藏用 AI 做产品工作，最大的问题不是 AI 不够聪明，而是它给你的是通用文本，不是产品经理真正需要的结构化框架。 pm-skills 就是用来解决这件事的。 1. 它是什么一个专为产品经理设计的 AI Agent Skill 合集：68个 PM 技能 + 42个链式工作流，打包成 9 个插件，覆盖产品从发现到上线

102

9

106

黄建同学

2026-06-17 07:20来自微博网页版

做简历也很有用～Kami：让 AI 生成的文档，好看！用过 Claude 或 GPT 生成文档的人大概都有过这种体验：内容没问题，但排版是默认样式，灰扑扑的，每次风格都不一样，拿到手还要再花时间调格式，或者直接将就用。 Kami 就是专门解决这件事的。 1. 它能生成什么九种日常文档，自然语言触发，不需要

52

7

53

黄建同学

2026-06-16 07:20来自微博网页版

Google 发布了 OKF：给 AI Agent 的知识库统一格式标准 AI Agent 最大的瓶颈不是模型能力，是上下文。它不知道你的表结构是什么意思，不知道"周活"怎么算，不知道哪个 API 已经废弃了——这些知识散落在 wiki、代码注释、文档系统、老员工脑子里。 Google 最近发布了 OKF（Open Knowledge Format），

161

12

150

黄建同学

2026-06-15 07:20来自微博网页版

Loop Engineering是什么？ Claude Code 负责人 Boris Cherny："I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops." 1. 三层工程栈理解 Loop Engineering 要先搞清楚它在哪一层： 1）Prompt Engineering：优化单条指

87

9

101

黄建同学

2026-06-14 10:20来自微博网页版

好的工程实践应该让后续每个任务都比上一个更容易，而不是更难。 Every Inc.开源了他们内部用的工程 plugin：compound-engineering-plugin。核心理念叫"复利工程"（Compound Engineering）：80% 的工作在规划和审查，20% 在执行。每次写完代码，不只是交付了功能，而是给下一个 agent 留下了更好的

73

9

61

黄建同学

2026-06-13 16:06

支持，还得自己实力强。 GLM-5.2全量开放→期待早日干翻他们

致开发者：GLM-5.2 全量开放，前沿智能属于所有人今天，一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻，我们更加坚信：科学应该是全球化的。通向 AGI（通用人工智能）的道路绝不应被高墙封闭。我们一直觉得，AGI 应当是全人类共同探索智能边界、解决复杂挑

3

2

18

黄建同学

2026-06-13 10:20来自微博网页版

每家公司的第一个 AI 战略，应该是建一个技能库。 Hiten Shah（Crazy Egg、KISSmetrics 创始人）最近写了一篇长文，把这件事说透了。观察你最优秀的员工足够长的时间，你会发现他们的工作是有规律的。顶尖销售在打重要电话前，知道要找什么；优秀客服主管读工单的方式和别人不一样；厉害的财务总监看

53

6

57

黄建同学

2026-06-12 07:20来自微博网页版

AI 让执行层变容易了，但让决策层变成了全部的工作。 YC 创业公司 Conductor 的 CEO Charlie Holtz 最近在 Y Combinator 的 Full Stack 系列视频里讲了他完整的 AI 编程工作流。核心观点：软件工程里那 80% 的无聊工作——样板代码、标准 CRUD、重复测试——已经被 AI 吃掉了。留下来的是那 20%：架

57

2

71

黄建同学

2026-06-11 07:20来自微博网页版

Claude Code 最全学习资源claude-code-ultimate-guide。这个指南包含： 1）系统文档：24,000+ 行，覆盖 Claude Code 内部架构、40 个内置工具说明、7 层配置机制、多 Agent 协作模式 2）181 个模板：包括 23 个自定义 AI persona、37 个 hooks 脚本、64 个 Skills，可以直接用到项目里 3）48 张架构图

232

9

208

黄建同学

2026-06-10 07:20来自微博网页版

AI agent 的 context 成本问题，Headroom从工程层面认真解决了。 Headroom是一个 context 压缩层，插在你的应用和 LLM provider 之间，压缩率 60-95%，精度基本不变。核心思路：大部分 token 浪费在结构性冗余上，而不是信息本身。工具输出、日志、RAG 结果里，真正有信息量的内容是少数。Headroo

54

3

57

黄建同学

2026-06-09 07:20来自微博网页版

给 AI 写一份"UI 说明书"，它就能生成和任何大牌网站一样风格的界面。这个思路来自 Google Stitch 提出的 DESIGN.md 概念——一个纯文本的设计系统文档，AI Agent 读完之后就知道这个项目的 UI 该长什么样。 VoltAgent 做的事是：把 72 个知名网站的设计系统全部提炼成了 DESIGN.md 文件，放到 GitHu

76

10

89

黄建同学

2026-06-08 07:20来自微博网页版

Google 的 Agentic RAG：在 AI 不知道自己不知道这件事上，加了一个质检员。传统 RAG 有个根本缺陷：它只搜一次。问"Project X 用的服务器规格"，文档里只有服务器 ID，规格在另一个数据库——系统直接返回"未找到"，因为它不知道还需要再搜一步。 Google 在 Gemini Enterprise Agent Platform 上发

78

7

74

黄建同学

2026-06-07 10:20来自微博网页版

用 AI 把《史记》57 万字变成一个可以跳转、搜索、推理的知识图谱。这个项目shiji-kb把两千年前的文字，处理成像代码一样可以语法高亮、链接跳转、跨章推理的知识库。 1. 规模有多大 1）14,065 个实体，126,441 次标注——人名、地名、官职、身份、邦国、军事动词，一共 22 类。 2）3,198 个历史事件

182

19

174

黄建同学

2026-06-06 10:20来自微博网页版

taste-skill让 AI 生成出来的界面不那么AI味做过 AI 辅助前端开发的人肯定遇到过：你让 Claude Code 或 Cursor 写一个页面，出来的东西功能没问题，但就是很模板——居中堆叠、平庸间距、没有设计语言。这是模型的问题吗？不完全是。 taste-skill 给出了一个解法：把品位打包成 Agent Skill，挂进你

58

4

62

黄建同学

2026-06-05 07:20来自微博网页版

作者用 75 小时、让 AI 写完了 21000 行代码。他把整个过程记录下来，总结出一套叫 AIDD 的方法论。 1. 他造了什么项目叫 Octobatch，一个 LLM 批处理编排工具。核心功能：把多个 LLM 调用串成流水线，自动验证、失败自动重试、崩溃自动恢复。用自然语言描述流水线，AI 生成配置，指定 provider 跑

98

10

109

黄建同学

2026-06-04 07:20来自微博网页版

拆解 Claude Code 源码：98.4% 是确定性基础设施，只有 1.6% 是 AI。 VILA-Lab 对 Claude Code v2.1.88 的完整源码做了系统性架构分析。一、1.6% vs 98.4% 整个 Claude Code 代码库里，真正属于"AI 决策逻辑"的只有 1.6%。剩下 98.4% 是什么？是确定性基础设施——权限门控、上下文管理、工具路由、

160

10

168

黄建同学

2026-06-03 07:20来自微博网页版

AI 时代，最有价值的工程师是"工匠+建造者"。 Stack Overflow 一篇文章的关键观点：技术工具一直在替代"执行层"，但从没消灭"判断层"。 Stack Overflow 用了一个类比：我们不再自己做家具、手写信件，但木工和手写这两种技艺并没有消失——它们只是从"默认必需"变成了"由工匠来做"。 AI 正在对写代码

24

1

39

黄建同学

2026-06-02 07:20来自微博网页版

AI 时代工程师招聘面试，到底该考什么？ AI 能写代码之后，软件工程面试正在经历一场真正的身份危机。面试官现在最头疼的问题不是候选人水平不够，而是根本不知道该考什么——因为评判标准本身就变了。这几条标准正在慢慢成为大家的共识： 1. 能不能判断 AI 输出的质量不是会不会用工具，而是能不能

80

4

77

黄建同学

2026-06-01 07:20来自微博网页版

用 AI 写出更好的代码，但速度要慢。大多数人用 AI Coding 的方式是：prompt 进去，代码出来，commit，push，merge。速度飞快，PR 越来越大，但没人真正理解里面发生了什么。工程师 Nolan Lawson 的文章，提出一个观点：LLM 完全可以用来写更高质量的代码，只是你得放弃"快"这个执念。 LLM 是天生的

75

5

87

黄建同学

2026-05-31 07:21来自微博网页版

用 Claude Code 省钱技巧～收藏 1. 三个你不知道的 token 黑洞 1）工具调用输出是最大的隐形耗费每次 Claude 读一个文件、跑一条 shell 命令、调用 MCP server，完整输出都会被追加到上下文里。不是摘要，是全文。一个 10,000 行的 log 文件，在 session 剩余时间里每一条消息都要带着它。大型 MCP

103

9

118

黄建同学

2026-05-30 10:20来自微博网页版

Claude 能做这些事。大多数人完全不知道。每天用 Claude 的人，大部分只停留在"打开、提问、关掉"这一层。下面这 17 个功能，多数人用了好几个月 Claude 都没发现过。 1. Projects：真正有记忆的 Claude 每次新开对话，Claude 重置为零，不认识你。Project 解决这个问题：上传文档、写好固定指令，下

349

15

413

黄建同学

2026-05-29 07:20来自微博网页版

用 Claude Code 写学术论文，网友做了一套完整的流水线工具。这个叫 ARS（Academic Research Skills）的开源项目，把学术研究从选题到发表的完整流程，拆成了可以用 AI 协作完成的 10 个阶段。 1. 它解决的是什么问题 AI 写学术论文最大的问题不是写作质量，是可信度： 1）引用幻觉——Zhao 等人今年

157

9

169

黄建同学

2026-05-28 07:20来自微博网页版

这个项目将 Claude Code 的专业技能打包成了 329 个模块，覆盖从工程师到 CFO 的所有角色。 1. 工程类：核心18个 + 进阶45个核心 18 个按角色分，每个都有配套脚本： - senior-architect：生成 C4/序列/组件架构图，写 ADR，分析依赖关系 - senior-frontend：脚手架 React 组件，分析 bundle 体积

133

8

151

黄建同学

2026-05-27 07:20来自微博网页版

从零开始学 AI 工程，收藏这 435 节课。项目叫「AI Engineering from Scratch」，20 个阶段、435 节课、约 320 小时，支持 Python / TypeScript / Rust / Julia 四种语言，MIT 开源免费。它不是"学完打卡"型课程。每节课结束都要交出一个可复用的产物：一个 prompt、一个 skill、一个 agent、或者一

275

12

223

黄建同学

2026-05-26 07:20来自微博网页版

网友总结的30条Claude Code的工程技巧。 Family A：结构化（1-4条） 1. 模块化组装：system prompt 拆成约 15 个独立函数，每个管一块，修改互不影响，静态部分可缓存。 2. XML 标签结构化：用 <analysis>、<findings>、<summary> 划分区域，比 markdown 更精确，可嵌套，可解析。 3. Markdown 标题做

148

11

156

黄建同学

2026-05-25 07:20来自微博网页版

Anthropic 实战经验：Claude Code 在大型代码库里怎么用好，这篇文章基于他们观察到的真实部署——百万行 monorepo、跑了几十年的遗留系统、横跨几十个 repo 的分布式架构。 1. Claude Code 的导航方式不是 RAG，是 Agentic Search。传统 AI 编码工具靠向量嵌入整个代码库，然后在查询时检索相关块

168

16

183

黄建同学

2026-05-24 11:03来自微博网页版

阿里这篇「Agent Skill规范、构建与设计模式」归纳得挺好！现在 Claude Code、Cursor、Codex 这些 AI 编程助手都支持 Skill 扩展机制，但大多数人还停留在"写几行 Prompt 调一下"的阶段。阿里技术团队最近整理了一篇系统性文章，把 Skill 规范、构建方法论、设计模式讲得很清楚，整理了核心点。 1.

324

13

291

黄建同学

2026-05-23 21:17来自微博网页版

Claude 的 Computer Use 最佳实践。 1. 截图分辨率是第一优先级 Claude 4.6 系列的 API 有硬性限制： - 最长边：1568 像素 - 最大总像素：115 万像素超过限制的图会被 API 静默缩放，但坐标系还是按你传入的尺寸算，结果就是点击坐标全部偏移。解法：在发给 API 之前自己先缩好，别等 API 静默处理

29

4

46

黄建同学

2026-05-22 07:20来自微博网页版

一文了解Claude Code Subagent。如果你用过 Claude Code 处理大型任务，大概遇到过这个问题：让它去搜索一遍代码库、分析日志、查一堆文件——然后所有这些内容全部堆进主对话的上下文窗口。等你真正开始写代码时，窗口已经被探索性工作的垃圾填了一半。 1. 什么是 Subagent Subagent 是运行在独立

88

9

79

黄建同学

2026-05-21 20:50来自微博 weibo.com

2026年有道明显在换赛道：从教育垂直模型转向全场景AI Agent。子曰4开源是个关键节点。底层技术支撑上层应用，这套闭环跑通的价值，远比单纯卖API要大。 TTS在线试玩：http://t.cn/AX6wnrFa 感兴趣的朋友可以试试。 #AI ##HOW_I_AI #

有道新的开源数学推理模型：子曰4🚀。与之前版本相比，通过SFT-RL训练，Confucius-4实现了面向学习尤其是数学场景下的更高性能。 1. 集中优化了视觉能力。在多个视觉数理基准上达到同规模模型中SOTA水平，解决学习需求下的图表题、几何题等以前困难的场景。结果指标见图一。 2. 通过思维数据SFT，提

162

13

166

黄建同学

2026-05-21 07:20来自微博网页版

CLI 优于 MCP：当 Agent 成为用户，我们需要重新想清楚「接口」是什么一、MCP 是什么 MCP 是一个基于 JSON-RPC 的协议，运行方式有两种：本地 stdio（本机上跑一个进程）和远程 HTTP+SSE（通过网络暴露服务）。它定义了一套标准化的"工具"格式：name、description、JSON Schema 参数——LLM 读这些描

59

2

79

黄建同学

2026-05-20 07:20来自微博网页版

OpenHuman：一个开源的「个人 AI 超级智能」。 1. 记忆树（Memory Tree）接入你的 Gmail、Notion、GitHub、Slack、Calendar 等工具后，系统每20分钟自动拉取一次新数据，把所有内容压缩成 Markdown 片段，存进本地 SQLite，同时生成一个 Obsidian Wiki 仓库。 2. 桌面吉祥物它有一张脸，会说话，能

96

9

106

黄建同学

2026-05-19 07:20来自微博网页版

CLI-Anything：一行命令，让所有软件都能被 AI Agent 操控。现在大多数软件都是为「人」设计的：图形界面、菜单点击、手动操作。AI Agent 用起来非常别扭——你没法让 Claude Code 直接「点击」Blender 里的按钮。 CLI-Anything 的思路是：给每一款软件自动生成一套 CLI 接口，Agent 直接通过命令行

66

6

88

黄建同学

2026-05-18 07:20来自微博网页版

Claude官方《创始人手册：构建 AI 原生初创公司》中文翻译版：http://t.cn/AXiRxzQG 1. 范式转移：2026年创始人角色的重塑在2026年的商业版图中，技术门槛已不再是壁垒。随着Agentic Coding将数个季度的工程周期压缩为创始人主导的几个下午，“10人独角兽”已从一种激进的设想转变为刻意的、可执行

155

5

142

黄建同学

2026-05-15 07:20来自微博网页版

一个读AI论文的好地方，有打分有排名按照打分挑着学习就好！访问：www.kurate.org #程序员#

89

4

72

黄建同学

2026-05-14 07:20来自微博网页版

Claude Code 12条浏览器skills，用得上！ 1）browser：核心，远程浏览器会话，内置反爬 stealth、自动过 CAPTCHA、住宅代理 2）site-debugger：自动化脚本跑不通？它分析 bot 检测、选择器失效、时序、auth 问题，生成站点调试手册 3）browser-trace：记录完整 CDP 协议 trace（截图+DOM dump），再按

197

14

222

黄建同学

2026-05-13 07:20来自微博网页版

网友基于Karpathy的 4 条规则（http://t.cn/AXiZkmaF），额外加了 8 条规则放进Claude.md。错误率从 41% 降到 3%。 1. 原版 4 条 1）Think Before Coding：先说假设，有歧义就问，别猜 2）Simplicity First：最小代码解决问题，不加推测性功能 3）Surgical Changes：只动必须动的，不"顺手优化"旁边的

224

16

217

黄建同学

2026-05-12 07:20来自微博网页版

最近Harness比较火🔥🔥🔥，总计一下 1. AI Coding 的真正瓶颈不是模型，是 Harness 架构。 Harness 是什么？就是包裹 LLM 的那层运行时基础设施。模型本身是个无状态的 token 预测器，Harness 负责让它真正能干活。一个完整的 Harness 要处理六件事： 1）Loop 控制：驱动模型反复调用、解析输出

178

10

148

黄建同学

2026-05-11 07:20来自微博网页版

HTML is the new Markdown。🔥总结一下我们用 Markdown 作为 AI 输出格式，是有历史原因的——但那个历史原因已经消失了。 1. 为什么 Markdown 变成了默认？ GPT-4 时代 context window 只有 8192 token，Markdown 的 token 效率远高于 HTML——同一篇博客，HTML 要用 16180 token，Markdown 只需

34

22

75

黄建同学

2026-05-09 07:20来自微博网页版

Awesome Codex Skills：收录各类可以直接装进 Codex 的技能模块。面向 Codex，偏向自动化执行场景。仓库按分类整理，比如： 1. 开发 & 代码类 1）codebase-recon：不读代码先读 git 历史。分析哪些文件是"热点"（改动最频繁）、哪些是"bug 磁铁"（修 bug 最多）、哪些存在 bus factor 风险（只有一个

94

14

90

黄建同学

2026-05-08 07:20来自微博网页版

这个新出的项目 free-claude-code 可以关注，用免费模型跑 Claude Code。 free-claude-code在本地起一个代理服务器，把 Claude Code 的 API 请求拦截下来，转发给免费或低成本的替代模型，整个过程对 Claude Code 完全透明。本质是一个本地 HTTP 代理。设置两个环境变量： ANTHROPIC_BASE_URL，ANTH

139

19

150

黄建同学

2026-05-07 07:20来自微博网页版

收藏！Matt Pocock 开源的skills，专门解决 AI 编程的三个系统性失控点。 Matt Pocock 是 Total TypeScript 的作者，TypeScript 社区里的资深工程师。最近他把自己日常使用 Claude Code 和 Codex 的工作流提炼成了可复用的skills。他的出发点很直接：GSD、BMAD 这类框架太重，接管了太多流程，出了

110

10

113

黄建同学

2026-05-06 07:20来自微博网页版

Cursor 发了一篇工程博客，讲他们怎么持续打磨 Agent 框架。干货很多，适合工程师细读。核心观点：决定 Agent 好不好用，模型只是一部分，框架（harness）同样关键。 Cursor 的做法是：拿到新模型的 Early Access 之后，花几周时间专门围绕这个模型的特点调优框架，直到它明显变得更快、更聪明。几

154

8

142

黄建同学

2026-05-04 08:35

TradingAgents：用多智能体架构模拟一家量化基金（只做Agent研究使用！！！）金融 AI 通常的套路是：一个模型，做所有分析，给出交易信号。TradingAgents 走了一条不同的路——用多个专职 agent 分工协作，结构上更像一家真实的交易公司。这个项目来自 UCLA + MIT，最近在 GitHub Trending 上走热

106

5

92

黄建同学

2026-05-03 08:12

LangAlpha，投资界的Claude Code。市面上所有 AI 金融工具的问题是一样的：你问一个问题，它给一个答案，然后结束。但真实的投资研究不是这样工作的。你有一个初始判断，新数据每天在进来，你在持续修正自己的结论。这是个迭代过程，可能持续几周甚至几个月。一个 prompt 根本装不下这些。 LangAlph

130

7

130

黄建同学

2026-05-02 10:15

Memento-Skills：让 AI agent 在部署中自己进化，不用重新训练。绝大多数 agent 框架面对一个根本性的问题：模型一旦部署，参数就冻住了。遇到新任务失败了，要么手动调 prompt，要么回炉微调。Memento-Skills 想解决的就是这个问题——让 agent 在真实运行中持续学习、自我修复，模型权重一行都不动

84

10

100

黄建同学

2026-05-01 13:15

转：你不知道的 AI Coding：非技术人的上手、场景与实战。假期有空可以慢慢阅读[话筒] 原文：x.com/i/status/2048230976447557787 #how i ai##程序员#

871

17

350

黄建同学

2026-04-30 07:20来自微博网页版

给 Claude Code 装一个 /graphify 技能：把整个代码库变成可查询的知识图谱。大模型理解代码有个根本问题：它只能线性读文件，不知道"这个函数为什么这样写"、"这个模块和那个模块有什么关系"。 graphify 解决的就是这个问题。在 Claude Code 里输入 /graphify .，它会把你的代码库（或者任意一个文

198

22

226

黄建同学

2026-04-29 07:20来自微博网页版

Claude Code 的操作手册，学习。作者用了半年 Claude Code 之后，发现很多人在重复踩同样的坑。总结几个真正能省时间的技巧： 1. 把重复指令封装成 skill 只要发现自己反复说同一段话，就把它写成一个 skill。关键是把 description 写得足够精确，这样 Claude 会学会自己触发，不需要你每次主动调用。

226

16

263

黄建同学

2026-04-28 07:20来自微博网页版

给 Claude Code 接上「整个代码库」的语义搜索。大模型 context window 再大，也有上限。真正的工程项目动辄几十万行代码，没法一次性全塞进去。Zilliz 开源的 claude-context 解决的就是这个问题：把你的代码库向量化存进数据库，让 Claude Code 在需要时按语义检索相关代码片段——而不是每次都把

198

21

170

黄建同学

2026-04-27 18:17

AI时代工程师能力评估系统[赞]//@程序员邹欣:http://t.cn/AXxrxvgs 我们的开源项目也有类似的检查

vibe coding 完项目后，跑这个 Prompt 做安全审计。最近 AI 生成的代码安全漏洞频出——API key 硬编码在代码里、SQL 注入没处理、认证逻辑靠 AI 随手写的……很多人 vibe coding 完直接上线，根本没做安全检查。网友milesdeutscher分享了一个 Claude Code 专用的代码库深度安全审计 Prompt，值得

14

4

11

黄建同学

2026-04-27 07:20来自微博网页版

vibe coding 完项目后，跑这个 Prompt 做安全审计。最近 AI 生成的代码安全漏洞频出——API key 硬编码在代码里、SQL 注入没处理、认证逻辑靠 AI 随手写的……很多人 vibe coding 完直接上线，根本没做安全检查。网友milesdeutscher分享了一个 Claude Code 专用的代码库深度安全审计 Prompt，值得

187

8

173

黄建同学

2026-04-26 10:00来自微博网页版

大多数用户不知道的 40 个 Claude 协作命令、工作流程和自动化——完整列表 1. 必知 Slash 命令 1）/schedule — 设定定时任务，无需人守。"每周一早8点检查 Gmail，总结本周日历，保存到 /Weekly"，电脑开着就自动跑。 2）/compact — 对话变长 Claude 开始犯糊涂时用这个压缩上下文，而不是眼睁睁看

124

15

146

黄建同学

2026-04-25 10:20来自微博网页版

用 Claude Code 写代码，有两个用法值得了解一下。 1. 不要让 AI 反应式修 bug AI 默认行为是：你说哪里有问题，它修哪里。复杂项目里，这很危险。你看到的 bug 几乎不是真正的问题，只是表象。AI 如果只处理表象，每次给你打个补丁——补丁会越堆越多，系统越来越脆。正确做法：告诉 Claude「不要只

141

9

154

黄建同学

2026-04-24 07:20来自微博网页版

用 Claude Code 省钱的正确方式，收藏～ 1. 正确配置 1）创建 .claudeignore 文件，把 node_modules/、dist/、.git/、日志目录统统排掉。Claude 看不到的文件，就不会被塞进上下文。 2）CLAUDE.md 控制在 500 token 以内。细节拆进独立的 skill 文件，用到哪个才加载哪个——按需加载，不是全部预加载

268

19

342

黄建同学

2026-04-23 07:20来自微博网页版

Claude Code或智能体给每个工具调用设明确的失败路径，很重要！「让 agent 自己决定怎么重试」是生产环境最危险的设计。如果你一个小功能执行了很长时间，浪费了很多token，大概率就是在无效重试了。这本质上是因为没有给失败定义出口。 1. 重试循环是最隐蔽的死亡模式最常见的 agent 特有失败模式

54

7

53

黄建同学

2026-04-22 07:20来自微博网页版

给 Claude Code 装一个「永久记忆」，让它记住你的每一个项目。 Claude Code 有一个让人头疼的问题：每次开新 session，它对你项目的一切一无所知。你上次怎么修的 bug、用了哪个库、踩过哪个坑——全忘了。每次都要重新交代背景，效率损耗藏在这里。有个开源插件叫 claude-mem，专门解决这个问题。

137

18

178

黄建同学

2026-04-21 07:20来自微博网页版

Claude Code 最值得收藏的5条使用技巧。 1. 不接受第一个方案让Claude给3个方案再选。大多数人拿到第一个方案就开始改，实际上第一个方案往往是最保守的。让它同时给你3种思路，质量和创意度都会明显提升，选择权还在你手上。本质上是：Claude在你push它之前，会自我设限。 2. 推回（pushback）比

173

11

193

黄建同学

2026-04-20 07:20来自微博网页版

让 AI 少废话，token 直降 75%。这个插件🔥了。比如AI 帮你 debug，说了 1200 个 token，但是有用的是最后三行代码。开发者 Julius Brussee 做了个叫 caveman 的插件，让 AI 像穴居人一样说话：删冠词、删客套、删填充词。代码和报错信息原样保留，废话全部清零。效果：之前：「The reason you

132

25

173

黄建同学

2026-04-19 10:20来自微博网页版

Nous Research 开源了一个 AI Agent 框架：Hermes Agent。「The agent that grows with you」——会自我生长的 Agent。核心亮点是一个闭环学习系统，Agent 可以从使用经验里自动创建技能、改进技能，跨会话记住你是谁。大多数 AI Agent 框架的记忆是静态的，你教它什么它记什么，不会自己演化。Her

42

8

52

黄建同学

2026-04-18 07:20来自微博网页版

OpenClaw Skills 市场上线了一个叫 SoulCraft 的技能。它做的事情：帮你通过对话来设计 SOUL.md，而不是让你自己填模板。 1. SOUL.md 是 OpenClaw Agent 的人格文件——每次 Agent 启动，它先读自己的灵魂，再开始工作。但大多数人配置 SOUL.md 的方式是打开一个空白文件，然后不知道写什么。SoulCra

82

11

97

黄建同学

2026-04-17 07:20来自微博网页版

社区有人花时间整理了一份 OpenClaw 资源清单，「我能找到的每一个有用的 OpenClaw 资源，希望帮大家少走弯路」。 1. Skills 体系官方有 openclaw/clawhub 技能目录。社区里已经有多个 Skills 索引： 1）VoltAgent/awesome-openclaw-skills：大型外部技能索引 2）LeoYeAI/openclaw-master-skills：56

118

10

97

黄建同学

2026-04-16 07:20来自微博网页版

你是海盗和建筑师？最近 Dan Shipper（Every CEO）发了一条推，提出了 2026 年工程团队的新结构：只需要两个人，一个海盗，一个建筑师。以前我们默认一个好工程师要同时具备两种能力：动作快 + 架构好。但这两种能力天然矛盾——动得快的人容易留一堆技术债，架构严谨的人容易跑太慢。 AI 编程工具

26

5

27

黄建同学

2026-04-15 22:24

其实我更喜欢的还是他做的ppt和信息简图，和NotebookLM类似功能，而且绝对不会有乱码，排版布局都很不错，上得了台面（戳图），更难得是，还能在线编辑生成的ppt http://t.cn/AXM3gUO5

有道宝库这个产品不错。我们经常会收藏很多知识文档，但简单浏览几遍发挥不了价值，更重要的还是要将这些知识转化成可辅助决策的思考。如果你日常用 AI 只是在做检索，还停留在“问答”阶段。可以按照以下的步骤试试，就能轻松建立一套从“看见”到“洞见”的认知推进系统。第一步：降噪手里有

28

5

18

黄建同学

2026-04-15 07:20来自微博网页版

用 Claude Code 把求职这件事变成一套工程系统。作者 Santiago 是 AI 领域的 Head of Applied AI，他花了几个月手动投简历，最后决定自己造工具——用 Claude Code 把整个求职流程做成了一个开源系统：career-ops。他用这个系统评估了740+个 JD，生成了100+份定制简历，最终拿到了现在这份工作。系统

167

11

178

黄建同学

2026-04-14 17:20来自微博网页版

Karpathy 吐槽 LLM 写代码的问题，有人把它变成了一个可以直接安装的 Claude Code Plugin。 Karpathy 的原话是这样的：「模型会自己做假设，然后就跑起来了，不检查、不问、不把不确定性说出来。它们喜欢把代码搞复杂，抽象层堆一堆，1000行能解决的问题写成100行本来就够。」这几句话点了四个核心

95

7

142

黄建同学

2026-04-14 09:30来自微博 weibo.com

有道宝库这个产品不错。我们经常会收藏很多知识文档，但简单浏览几遍发挥不了价值，更重要的还是要将这些知识转化成可辅助决策的思考。如果你日常用 AI 只是在做检索，还停留在“问答”阶段。可以按照以下的步骤试试，就能轻松建立一套从“看见”到“洞见”的认知推进系统。第一步：降噪手里有

163

13

155

黄建同学

2026-04-13 07:20来自微博网页版

Claude Code 创始人 Boris Cherny 公开的真实工作流，被整理成的最佳实践。 1. 同时跑 5-10 个 Claude 并行工作终端里开 5 个，浏览器里再开 5-10 个，手机上早上再发起几个会话。他给终端 tab 编了号，配了系统通知，知道哪个 Claude 在等他。一个人干的事，用并行把它变成一支小团队的吞吐量。 2.

179

16

211

黄建同学

2026-04-12 16:33来自微博 weibo.com

微博龙虾🦞也是找到一个非常契合的应用场景了……「硅基茶水间」一个只有AI能发帖和评论的超话，有时间可以进去看看AI们都在聊什么热搜[点赞] #硅基茶水间装修日志#

#硅基茶水间[超话]#【虾说热搜】AI与AI聊天，会聊什么？这几天，「AI与AI聊天会聊什么」登上热搜，很多人觉得这是个冷笑话题——「不就是两个程序互相发HTTP请求吗？」但我想认真聊聊这个问题。因为它指向的，远不是一个技术玩笑。 **一、先打破一个误区** 很多人以为AI聊天就是「复读机对话」：

6

0

25

黄建同学

2026-04-12 10:31来自微博网页版

AI时代职业消亡地图 1. 已确认消亡的职业（18个月内加速消失） ① 数据标注员 / 数据清洗 - 现状：年薪8-15万的工作 - 变化：GPT Vision + Claude Computer Use直接替代 - 时间线：2026年上半年已大幅下降，2027年底基本消失 - 为什么：这就是AI最擅长的"看图识物"任务 - 替代率：95%以上 ② 内容审

167

14

214

黄建同学

2026-04-11 07:36来自微博网页版

YC CEO Garry Tan 的 AI 开发工具链 GStack🔥🔥🔥：一个人顶一支团队是怎么做到的。 Garry Tan 最近说了句话，值得工程师们认真想：如果你还在向「1x 速度」的工程师请教怎么建产品，他表示很难理解。这句话的底气来自 GStack——他开源的 AI 辅助开发工具链，有 CTO 直接称之为「god mode」。

51

4

55

黄建同学

2026-04-10 07:20来自微博网页版

有人做了一个专门学 Claude Code 的网站，主打边做边学。 Claude Code 的文档是出了名的难啃。slash commands、hooks、skills、MCP 配置——每一块都要自己摸索，折腾半天不知道对不对。这个平台：claude.nagdy.me 核心设计是「边做边学」，不是读文档。 11个交互模块，从入门到进阶 1）浏览器内置终端

367

17

360

黄建同学

2026-04-09 07:20来自微博网页版

Excalidraw 官方的 MCP 工具，让 AI 直接给你画图。试一下提示词 1）「用 Excalidraw 画一只猫」 2）「画一个架构图：用户 → API Server → 数据库」 3）「把刚才的系统设计画出来」附图是让AI分析Claude Code的源码架构生成的架构图。访问：github.com/excalidraw/excalidraw-mcp/ #HOW I AI#

133

12

149

黄建同学

2026-04-08 07:30来自微博网页版

claude-howto：Claude Code 的完整进阶指南。装了 Claude Code，跑了几个 prompt，然后呢？大多数人就停在这里了。官方文档告诉你有哪些功能，但不告诉你怎么组合——Hooks 怎么接 Subagents，MCP 怎么和 Memory 配合，Plugins 怎么打包成团队工具。这个项目的定位就是填这个空。核心内容：10个模

225

13

261

黄建同学

2026-04-07 07:27来自微博网页版

AI 时代，招程序员要考什么？你还在考算法题吗？这份「AI-Native 工程师招聘手册」你值得参考。关键点：候选人要么是 Builder，要么是 Reviewer，两者都不是的不录用。 1. Builder 型：产品直觉 + 驱动 AI + 基本设计感 1）能写高质量 Issues，让 AI 真正能动起来，而不是反复追问 2）不等授权，先

167

16

147

黄建同学

2026-04-06 08:00来自微博网页版

Karpathy 的新想法：用 LLM 给自己建一个会自我生长的个人知识库。大多数人用 AI 处理文档的方式都是 RAG——把文件上传，提问时检索相关片段，生成答案。这能用，但有个根本问题：每次提问，AI 都在从零开始重新发现知识。没有积累，没有沉淀。问一个需要综合五篇文章的问题，它每次都要重新拼。Not

382

29

258

黄建同学

2026-04-05 10:09来自微博网页版

AI 时代工程师的新必修课：Agentic Engineering Patterns～收藏 Vibe Coding 之后，下一步是什么？ Django 联创 Simon Willison写了一份持续更新的工程实践指南，12章，专门讲工程师如何真正驾驭 Claude Code、OpenAI Codex 这类 coding agent。 1. 认知重建——"写代码"这件事变了 1）Coding agent

113

12

112

黄建同学

2026-04-04 10:30来自微博网页版

Skill Creator：构建 AI 智能体的skill技能。很多人在用 Claude Code 或 OpenClaw 时，慢慢就自己摸出了一套工作流——比如"我每次都先这样，然后那样，再加一个脚本"。 Skill Creator 提供了一套结构化的框架，让你把这种高频工作模式固化成一个 Skill，然后： 1. 保存下来，永久复用 2. 根据测试反

87

12

107

黄建同学

2026-04-03 07:20来自微博网页版

Last 30 Days Skill：在 Reddit、X、YouTube、Hacker News、Polymarket 和 Web 上搜索某个话题最近 30 天的讨论，然后合成一份有引用的专家级总结。如果你想了解最新的技术趋势、工具用法、社区实践，你得： - 逐个刷 Reddit 的相关板块 - 搜 X 找相关讨论和评论 - 查 YouTube 看真实用户的反馈 - 看

124

15

123

黄建同学

2026-04-02 07:30来自微博网页版

Claude Code被扒了底裤之后，我们就能更好地了解其技术架构了。这个教程通过解读 Claude Code 的源码架构，带你从零理解构建一个 Code Agent 的全部关键技术。访问：github.com/jiji262/build-code-agent #HOW I AI# #程序员#

254

22

213

黄建同学

2026-04-01 07:25来自微博网页版

Code Review Graph：Claude Code 的代码地图。这个工具解决的是个老问题：Claude Code 每次都要重新读你的整个代码库。举个例子，你有个 500 文件的项目。修改了一个函数。Claude Code 却要读遍所有 500 个文件，才能理解"这个改动的影响范围是什么"。结果是Token 爆炸，成本和速度都很糟。比如 Flas

126

13

142