黄建同学
黄建同学
黄建同学
关注 AI 实用资讯&技术
AI博主 北京 2015.07 加入
654关注
150.1万粉丝
5404微博
黄建同学
2026-07-03 18:00来自 微博网页版
OpenMontage:把 AI 编程助手变成一个完整的视频制作工厂。 视频制作的流程通常是这样的:想创意、写脚本、找素材、剪辑、配音、合成、导出。每个环节都要人盯着,工具之间来回切换。 OpenMontage 想把这条流水线整个交给 agent 来跑。 1. 解决了什么问题 现有的 AI 视频工具大多只解决其中一个环节 ​
18
3
26
黄建同学
2026-07-03 09:01
AI时代,孩子需要新的学习英语的方法论~收藏。#AI时代还要不要学英语# 观察了一段时间AI在语言学习上的应用,发现一个规律:过去制约孩子英语进步的,从来不是"教材不够好"或"资源不够多",而是三个结构性问题——不知道自己在哪个水平、缺少开口说话的机会、学了但没有反馈。AI恰好可以解决这三件事 ​
276
9
145
黄建同学
2026-07-02 19:31
这次创业做的事情比较酷! 小雨智造,一脑多形,已经落地十余家真实工厂↓ 真实跑了很多工厂,真实看到AI能力走进嘈杂的工厂环境,让焊接工人每天的生活变得更轻松,这种感觉是做互联网体会不来的[666]
#首批具身智能焊接机器人进厂上班# 船舶、桥梁、工厂、基础设施…… 都是由巨大的、不一致的工件组成 而这背后最困难、艰苦、危险的工作 仍然落在技术工人的身上 这正是#小雨智造#想解决的问题 ​​​​ http://t.cn/AXoGuml7 ​
4
2
14
黄建同学
2026-07-02 14:01来自 微博网页版
#豆包专业版的隐藏用法# 豆包专业版最近这个「办公任务」的新功能,方向是对的。聚焦在大家日常最常用的功能,持续打磨,包装成一键即用的Agent任务,很方便。 比如分析舆情,直接输入你关注的话题,就能自动查找多个渠道的相关内容,并汇总成一篇详细的舆情分析报告,很方便大家上手使用,完成质量 ​
237
3
154
黄建同学
2026-07-02 07:20来自 微博网页版
一个命令,把任意网站逆向还原成 Next.js 代码库。 这是 ai-website-cloner-template 在做的事。 场景:你看到一个网站的设计很好,想复刻它的结构和视觉;或者你自己的网站还在线,但源码丢了——开发者离职、老仓库找不到、技术栈已经是遗留系统。以前这两种情况都很棘手,现在有了另一条路。 1. ​
53
6
41
黄建同学
2026-07-01 11:48
有机会去现场的可以私戳我↓ 我司的产品终于要和大家见面了,小雨智造的AI能力已经落地真实工业场景,用AI改变真实的工业世界,挑战更大,也更有意思。
首次亮相2026全球数字经济大会 231 平米超大展台,打卡硬核工业现场 现场上手|体验小雨新品机器人 真实场景|打卡1:1 还原的重工业产线 首发首秀|7.2 下午CEO 发新技术产品 7.2-7.4 北京国家会议中心 E馆 B05见 #小雨智造##首批具身智能焊接机器人进厂打工# ​
4
3
10
黄建同学
2026-07-01 07:20来自 微博网页版
Claude Code 的 effort level 完整指南:7个档位,怎么选,怎么设置。 很多人用 Claude Code 每天烧大量 token,但从来没动过一个参数——effort level。 这是控制 Claude "想多深"的档位。档位越高,推理越深,越慢越贵。默认是 high,大多数人从来没有改过它。 1. 一共有 7 个档位 1)LOW — /eff ​
36
5
47
黄建同学
2026-06-30 07:20来自 微博网页版
阿里开源了一个 AI Code Review 工具。 open-code-review,起源是阿里内部的 AI 代码审查助手。过去两年服务了数万名开发者,识别了数百万条代码缺陷。现在以 CLI 工具的形式开源,npm 一行装好。 1. 解决了 AI Code Review 最常见的三个烂问题 用过 Claude Code 或者其他通用 Agent 做 Code Review ​
161
12
149
黄建同学
2026-06-29 07:20来自 微博网页版
Anthropic 内部怎么让人和 AI 一起工作:4 条真实经验。值得一看! 过去 AI 协作是单人游戏——一个人对着一个对话框。现在他们在测试一种新的工作方式:人和 Agent 在同一个工作空间里协作,像多人游戏,人负责定方向,Claude 负责执行。这篇文章是 Anthropic 自己跑了几个月之后写下来的真实经验。 ​
43
8
53
黄建同学
2026-06-28 10:03来自 微博网页版
如何赚到十亿美元? 来自Paul Graham在牛津联合会的演讲,回应了一位美国ZK的论断:「赚到十亿美元是不可能的——背后一定做了坏事。」 PG 说,这个人不懂指数增长的数学。 1. 两个数字决定一切 十亿美元听起来遥不可及,但它只取决于两个变量:增长率 × 持续时间。 他举了个例子:一位创始人跟他说 ​
25
3
40
黄建同学
2026-06-27 16:58
到处都在裁员,DeepSeek要扩张一倍[赞]
感谢 @微博AI 邀请入驻微博,我是 DeepSeek Harness 组的崔添翼。目前 DeepSeek 公司正在进行人才扩招,正努力将所有部门的规模扩大至少一倍,大量岗位急招中!在向AGI前行的路上,公司的小伙伴们不断创造技术突破,并以开源的形式分享共创。 #AskMeAnything# 今天DeepSeek发布了用于加速大语言模型的 ​
4
10
12
黄建同学
2026-06-27 10:56来自 微博网页版
字节跳动技术副总裁洪定坤:AI Coding 落地的6个真实体感。 字节 AI 代码贡献率一年增长 6 倍,tokens 消耗增长 5 倍。但洪定坤说:正因为用得多,对 AI Coding 的挑战才有了更真实的体感。 6 月 23 日火山引擎大会上,他分享了字节内部踩过的坑和摸出来的解法。 踩过的坑: 1. 指标失真 AI 代码贡献 ​
62
5
71
黄建同学
2026-06-26 18:00来自 微博网页版
又来一个代码知识图谱,Codebase Memory MCP 给AI 编程Agent 提供一个代码的知识库,Token 消耗直接降 99%。AI 需要什么直接查图,不再逐文件扫代码。 1.效果有多显著 论文数据(31个真实仓库评测): - Token 消耗:5次结构查询只用约 3,400 tokens,逐文件探索同样问题要消耗约 412,000 tokens, ​
96
12
82
黄建同学
2026-06-25 17:45来自 微博网页版
微博发了一个 3B 的推理模型,在HuggingFace上还挺火,在竞赛数学和编程上比肩千亿大模型。 试了一下6.24当天的LeetCode困难题目,一次过。可以收藏试试! 微博 AI 团队最近在 arXiv 发布了 VibeThinker-3B 的技术报告。一个 30 亿参数的模型,在竞赛数学和编程 benchmark 上,跑进了 DeepSeek V3.2 ​
137
9
145
黄建同学
2026-06-25 07:20来自 微博网页版
收藏,这个项目跟踪了Claude Code 的系统提示词 这个项目持续逆向 Claude Code 的编译产物,把里面的 System Prompt 一条条抠出来。目前已经覆盖 515 个 prompt 片段,追踪了 215 个版本的变更历史,每次 Claude Code 新版本发布,几分钟内就更新。 从这份清单里能看出不少东西: 1. Claude Code 根 ​
89
6
100
黄建同学
2026-06-24 07:20来自 微博网页版
腾讯的《如何写好 Skill:一份终极实战经验手册》~收藏 几个关键点。 1. Skill 是什么 物理上是一个文件夹加一个 SKILL.md,核心是三样东西: 1)指令——告诉 AI 按什么步骤干活 2)上下文——补充 AI 不可能凭空知道的项目背景和团队规范 3)工具——AI 可以直接调用的脚本和模板 相当于给 AI 配 ​
248
10
191
黄建同学
2026-06-23 07:20来自 微博网页版
AI 会取代程序员?这篇论文给出了迄今最严谨的反驳。 普林斯顿教授 Arvind Narayanan 和 Sayash Kapoor 写了一篇长文,专门分析 AI 对软件工程师就业的影响。结论是:那些 AI 导致大规模裁员的叙事,基本是假的。 1. "AI 裁员"新闻,一个个都经不起推敲 Block(Jack Dorsey):对外说 AI 带来"更小更 ​
55
7
71
黄建同学
2026-06-22 07:20来自 微博网页版
这个项目把 Loop Engineering 的工程实现做成开源项目了。 知道"要写 loop 而不是写 prompt"是一回事,知道第一步怎么起步是另一回事。 这个 repo 提供了: 1)7 个生产级 Pattern,每个有独立文档和 starter 模板: - Daily Triage:每天/每两小时扫一遍 issue,出报告 - PR Babysitter:每 5-15 分 ​
83
5
83
黄建同学
2026-06-19 10:20来自 微博网页版
一套给 AI 编程 Agent 的生产级工程技能包。 AI 能写代码,但它不知道"资深工程师会怎么做这件事"——它不会自己强制先写 spec 再写代码,不会在合并之前做 code review,不会在 API 设计时考虑 Hyrum's Law,不会在高风险操作前换一个新上下文对自己的决策做对抗性审查。 agent-skills 就是把这些工 ​
71
6
73
黄建同学
2026-06-18 07:20来自 微博网页版
PM Skills~收藏 用 AI 做产品工作,最大的问题不是 AI 不够聪明,而是它给你的是通用文本,不是产品经理真正需要的结构化框架。 pm-skills 就是用来解决这件事的。 1. 它是什么 一个专为产品经理设计的 AI Agent Skill 合集:68个 PM 技能 + 42个链式工作流,打包成 9 个插件,覆盖产品从发现到上线 ​
102
9
106
黄建同学
2026-06-17 07:20来自 微博网页版
做简历也很有用~Kami:让 AI 生成的文档,好看! 用过 Claude 或 GPT 生成文档的人大概都有过这种体验:内容没问题,但排版是默认样式,灰扑扑的,每次风格都不一样,拿到手还要再花时间调格式,或者直接将就用。 Kami 就是专门解决这件事的。 1. 它能生成什么 九种日常文档,自然语言触发,不需要 ​
52
7
53
黄建同学
2026-06-16 07:20来自 微博网页版
Google 发布了 OKF:给 AI Agent 的知识库统一格式标准 AI Agent 最大的瓶颈不是模型能力,是上下文。它不知道你的表结构是什么意思,不知道"周活"怎么算,不知道哪个 API 已经废弃了——这些知识散落在 wiki、代码注释、文档系统、老员工脑子里。 Google 最近发布了 OKF(Open Knowledge Format), ​
161
12
150
黄建同学
2026-06-15 07:20来自 微博网页版
Loop Engineering是什么? Claude Code 负责人 Boris Cherny:"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops." 1. 三层工程栈 理解 Loop Engineering 要先搞清楚它在哪一层: 1)Prompt Engineering:优化单条指 ​
87
9
101
黄建同学
2026-06-14 10:20来自 微博网页版
好的工程实践应该让后续每个任务都比上一个更容易,而不是更难。 Every Inc.开源了他们内部用的工程 plugin:compound-engineering-plugin。 核心理念叫"复利工程"(Compound Engineering):80% 的工作在规划和审查,20% 在执行。 每次写完代码,不只是交付了功能,而是给下一个 agent 留下了更好的 ​
73
9
61
黄建同学
2026-06-13 16:06
支持,还得自己实力强。 GLM-5.2全量开放→期待早日干翻他们
致开发者:GLM-5.2 全量开放,前沿智能属于所有人 今天,一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻,我们更加坚信:科学应该是全球化的。 通向 AGI(通用人工智能)的道路绝不应被高墙封闭。我们一直觉得,AGI 应当是全人类共同探索智能边界、解决复杂挑 ​
3
2
18
黄建同学
2026-06-13 10:20来自 微博网页版
每家公司的第一个 AI 战略,应该是建一个技能库。 Hiten Shah(Crazy Egg、KISSmetrics 创始人)最近写了一篇长文,把这件事说透了。 观察你最优秀的员工足够长的时间,你会发现他们的工作是有规律的。顶尖销售在打重要电话前,知道要找什么;优秀客服主管读工单的方式和别人不一样;厉害的财务总监看 ​
53
6
57
黄建同学
2026-06-12 07:20来自 微博网页版
AI 让执行层变容易了,但让决策层变成了全部的工作。 YC 创业公司 Conductor 的 CEO Charlie Holtz 最近在 Y Combinator 的 Full Stack 系列视频里讲了他完整的 AI 编程工作流。 核心观点:软件工程里那 80% 的无聊工作——样板代码、标准 CRUD、重复测试——已经被 AI 吃掉了。留下来的是那 20%:架 ​
57
2
71
黄建同学
2026-06-11 07:20来自 微博网页版
Claude Code 最全学习资源claude-code-ultimate-guide。 这个指南包含: 1)系统文档:24,000+ 行,覆盖 Claude Code 内部架构、40 个内置工具说明、7 层配置机制、多 Agent 协作模式 2)181 个模板:包括 23 个自定义 AI persona、37 个 hooks 脚本、64 个 Skills,可以直接用到项目里 3)48 张架构图 ​
232
9
208
黄建同学
2026-06-10 07:20来自 微博网页版
AI agent 的 context 成本问题,Headroom从工程层面认真解决了。 Headroom是一个 context 压缩层,插在你的应用和 LLM provider 之间,压缩率 60-95%,精度基本不变。 核心思路:大部分 token 浪费在结构性冗余上,而不是信息本身。 工具输出、日志、RAG 结果里,真正有信息量的内容是少数。Headroo ​
54
3
57
黄建同学
2026-06-09 07:20来自 微博网页版
给 AI 写一份"UI 说明书",它就能生成和任何大牌网站一样风格的界面。 这个思路来自 Google Stitch 提出的 DESIGN.md 概念——一个纯文本的设计系统文档,AI Agent 读完之后就知道这个项目的 UI 该长什么样。 VoltAgent 做的事是:把 72 个知名网站的设计系统全部提炼成了 DESIGN.md 文件,放到 GitHu ​
76
10
89
黄建同学
2026-06-08 07:20来自 微博网页版
Google 的 Agentic RAG:在 AI 不知道自己不知道这件事上,加了一个质检员。 传统 RAG 有个根本缺陷:它只搜一次。问"Project X 用的服务器规格",文档里只有服务器 ID,规格在另一个数据库——系统直接返回"未找到",因为它不知道还需要再搜一步。 Google 在 Gemini Enterprise Agent Platform 上发 ​
78
7
74
黄建同学
2026-06-07 10:20来自 微博网页版
用 AI 把《史记》57 万字变成一个可以跳转、搜索、推理的知识图谱。 这个项目shiji-kb把两千年前的文字,处理成像代码一样可以语法高亮、链接跳转、跨章推理的知识库。 1. 规模有多大 1)14,065 个实体,126,441 次标注——人名、地名、官职、身份、邦国、军事动词,一共 22 类。 2)3,198 个历史事件 ​
182
19
174
黄建同学
2026-06-06 10:20来自 微博网页版
taste-skill让 AI 生成出来的界面不那么AI味 做过 AI 辅助前端开发的人肯定遇到过:你让 Claude Code 或 Cursor 写一个页面,出来的东西功能没问题,但就是很模板——居中堆叠、平庸间距、没有设计语言。这是模型的问题吗?不完全是。 taste-skill 给出了一个解法:把品位打包成 Agent Skill,挂进你 ​
58
4
62
黄建同学
2026-06-05 07:20来自 微博网页版
作者用 75 小时、让 AI 写完了 21000 行代码。他把整个过程记录下来,总结出一套叫 AIDD 的方法论。 1. 他造了什么 项目叫 Octobatch,一个 LLM 批处理编排工具。 核心功能:把多个 LLM 调用串成流水线,自动验证、失败自动重试、崩溃自动恢复。用自然语言描述流水线,AI 生成配置,指定 provider 跑 ​
98
10
109
黄建同学
2026-06-04 07:20来自 微博网页版
拆解 Claude Code 源码:98.4% 是确定性基础设施,只有 1.6% 是 AI。 VILA-Lab 对 Claude Code v2.1.88 的完整源码做了系统性架构分析。 一、1.6% vs 98.4% 整个 Claude Code 代码库里,真正属于"AI 决策逻辑"的只有 1.6%。 剩下 98.4% 是什么?是确定性基础设施——权限门控、上下文管理、工具路由、 ​
160
10
168
黄建同学
2026-06-03 07:20来自 微博网页版
AI 时代,最有价值的工程师是"工匠+建造者"。 Stack Overflow 一篇文章的关键观点:技术工具一直在替代"执行层",但从没消灭"判断层"。 Stack Overflow 用了一个类比:我们不再自己做家具、手写信件,但木工和手写这两种技艺并没有消失——它们只是从"默认必需"变成了"由工匠来做"。 AI 正在对写代码 ​
24
1
39
黄建同学
2026-06-02 07:20来自 微博网页版
AI 时代工程师招聘面试,到底该考什么? AI 能写代码之后,软件工程面试正在经历一场真正的身份危机。面试官现在最头疼的问题不是候选人水平不够,而是根本不知道该考什么——因为评判标准本身就变了。 这几条标准正在慢慢成为大家的共识: 1. 能不能判断 AI 输出的质量 不是会不会用工具,而是能不能 ​
80
4
77
黄建同学
2026-06-01 07:20来自 微博网页版
用 AI 写出更好的代码,但速度要慢。 大多数人用 AI Coding 的方式是:prompt 进去,代码出来,commit,push,merge。速度飞快,PR 越来越大,但没人真正理解里面发生了什么。 工程师 Nolan Lawson 的文章,提出一个观点:LLM 完全可以用来写更高质量的代码,只是你得放弃"快"这个执念。 LLM 是天生的 ​
75
5
87
黄建同学
2026-05-31 07:21来自 微博网页版
用 Claude Code 省钱技巧~收藏 1. 三个你不知道的 token 黑洞 1)工具调用输出是最大的隐形耗费 每次 Claude 读一个文件、跑一条 shell 命令、调用 MCP server,完整输出都会被追加到上下文里。不是摘要,是全文。 一个 10,000 行的 log 文件,在 session 剩余时间里每一条消息都要带着它。大型 MCP ​
103
9
118
黄建同学
2026-05-30 10:20来自 微博网页版
Claude 能做这些事。大多数人完全不知道。 每天用 Claude 的人,大部分只停留在"打开、提问、关掉"这一层。下面这 17 个功能,多数人用了好几个月 Claude 都没发现过。 1. Projects:真正有记忆的 Claude 每次新开对话,Claude 重置为零,不认识你。Project 解决这个问题:上传文档、写好固定指令,下 ​
349
15
413
黄建同学
2026-05-29 07:20来自 微博网页版
用 Claude Code 写学术论文,网友做了一套完整的流水线工具。 这个叫 ARS(Academic Research Skills)的开源项目,把学术研究从选题到发表的完整流程,拆成了可以用 AI 协作完成的 10 个阶段。 1. 它解决的是什么问题 AI 写学术论文最大的问题不是写作质量,是可信度: 1)引用幻觉——Zhao 等人今年 ​
157
9
169
黄建同学
2026-05-28 07:20来自 微博网页版
这个项目将 Claude Code 的专业技能打包成了 329 个模块,覆盖从工程师到 CFO 的所有角色。 1. 工程类:核心18个 + 进阶45个 核心 18 个按角色分,每个都有配套脚本: - senior-architect:生成 C4/序列/组件架构图,写 ADR,分析依赖关系 - senior-frontend:脚手架 React 组件,分析 bundle 体积 ​
133
8
151
黄建同学
2026-05-27 07:20来自 微博网页版
从零开始学 AI 工程,收藏这 435 节课。 项目叫「AI Engineering from Scratch」,20 个阶段、435 节课、约 320 小时,支持 Python / TypeScript / Rust / Julia 四种语言,MIT 开源免费。 它不是"学完打卡"型课程。每节课结束都要交出一个可复用的产物:一个 prompt、一个 skill、一个 agent、或者一 ​
275
12
223
黄建同学
2026-05-26 07:20来自 微博网页版
网友总结的30条Claude Code的工程技巧。 Family A:结构化(1-4条) 1. 模块化组装:system prompt 拆成约 15 个独立函数,每个管一块,修改互不影响,静态部分可缓存。 2. XML 标签结构化:用 <analysis>、<findings>、<summary> 划分区域,比 markdown 更精确,可嵌套,可解析。 3. Markdown 标题做 ​
148
11
156
黄建同学
2026-05-25 07:20来自 微博网页版
Anthropic 实战经验:Claude Code 在大型代码库里怎么用好, 这篇文章基于他们观察到的真实部署——百万行 monorepo、跑了几十年的遗留系统、横跨几十个 repo 的分布式架构。 1. Claude Code 的导航方式 不是 RAG,是 Agentic Search。 传统 AI 编码工具靠向量嵌入整个代码库,然后在查询时检索相关块 ​
168
16
183
黄建同学
2026-05-24 11:03来自 微博网页版
阿里这篇 「Agent Skill规范、构建与设计模式」归纳得挺好! 现在 Claude Code、Cursor、Codex 这些 AI 编程助手都支持 Skill 扩展机制,但大多数人还停留在"写几行 Prompt 调一下"的阶段。阿里技术团队最近整理了一篇系统性文章,把 Skill 规范、构建方法论、设计模式讲得很清楚,整理了核心点。 1. ​
324
13
291
黄建同学
2026-05-23 21:17来自 微博网页版
Claude 的 Computer Use 最佳实践。 1. 截图分辨率是第一优先级 Claude 4.6 系列的 API 有硬性限制: - 最长边:1568 像素 - 最大总像素:115 万像素 超过限制的图会被 API 静默缩放,但坐标系还是按你传入的尺寸算,结果就是点击坐标全部偏移。 解法:在发给 API 之前自己先缩好,别等 API 静默处理 ​
29
4
46
黄建同学
2026-05-22 07:20来自 微博网页版
一文了解Claude Code Subagent。 如果你用过 Claude Code 处理大型任务,大概遇到过这个问题:让它去搜索一遍代码库、分析日志、查一堆文件——然后所有这些内容全部堆进主对话的上下文窗口。等你真正开始写代码时,窗口已经被探索性工作的垃圾填了一半。 1. 什么是 Subagent Subagent 是运行在独立 ​
88
9
79
黄建同学
2026-05-21 20:50来自 微博 weibo.com
2026年有道明显在换赛道:从教育垂直模型转向全场景AI Agent。子曰4开源是个关键节点。底层技术支撑上层应用,这套闭环跑通的价值,远比单纯卖API要大。 TTS在线试玩:http://t.cn/AX6wnrFa 感兴趣的朋友可以试试。 #AI ##HOW_I_AI #
有道新的开源数学推理模型:子曰4🚀。与之前版本相比,通过SFT-RL训练,Confucius-4实现了面向学习尤其是数学场景下的更高性能。 1. 集中优化了视觉能力。在多个视觉数理基准上达到同规模模型中SOTA水平,解决学习需求下的图表题、几何题等以前困难的场景。结果指标见图一。 2. 通过思维数据SFT,提 ​
162
13
166
黄建同学
2026-05-21 07:20来自 微博网页版
CLI 优于 MCP:当 Agent 成为用户,我们需要重新想清楚「接口」是什么 一、MCP 是什么 MCP 是一个基于 JSON-RPC 的协议,运行方式有两种:本地 stdio(本机上跑一个进程)和远程 HTTP+SSE(通过网络暴露服务)。它定义了一套标准化的"工具"格式:name、description、JSON Schema 参数——LLM 读这些描 ​
59
2
79
黄建同学
2026-05-20 07:20来自 微博网页版
OpenHuman:一个开源的「个人 AI 超级智能」。 1. 记忆树(Memory Tree) 接入你的 Gmail、Notion、GitHub、Slack、Calendar 等工具后,系统每20分钟自动拉取一次新数据,把所有内容压缩成 Markdown 片段,存进本地 SQLite,同时生成一个 Obsidian Wiki 仓库。 2. 桌面吉祥物 它有一张脸,会说话,能 ​
96
9
106
黄建同学
2026-05-19 07:20来自 微博网页版
CLI-Anything:一行命令,让所有软件都能被 AI Agent 操控。 现在大多数软件都是为「人」设计的:图形界面、菜单点击、手动操作。AI Agent 用起来非常别扭——你没法让 Claude Code 直接「点击」Blender 里的按钮。 CLI-Anything 的思路是:给每一款软件自动生成一套 CLI 接口,Agent 直接通过命令行 ​
66
6
88
黄建同学
2026-05-18 07:20来自 微博网页版
Claude官方 《创始人手册:构建 AI 原生初创公司》 中文翻译版:http://t.cn/AXiRxzQG 1. 范式转移:2026年创始人角色的重塑 在2026年的商业版图中,技术门槛已不再是壁垒。随着Agentic Coding将数个季度的工程周期压缩为创始人主导的几个下午,“10人独角兽”已从一种激进的设想转变为刻意的、可执行 ​
155
5
142
黄建同学
2026-05-15 07:20来自 微博网页版
一个读AI论文的好地方,有打分有排名 按照打分挑着学习就好! 访问:www.kurate.org #程序员# ​
89
4
72
黄建同学
2026-05-14 07:20来自 微博网页版
Claude Code 12条浏览器skills,用得上! 1)browser:核心,远程浏览器会话,内置反爬 stealth、自动过 CAPTCHA、住宅代理 2)site-debugger:自动化脚本跑不通?它分析 bot 检测、选择器失效、时序、auth 问题,生成站点调试手册 3)browser-trace:记录完整 CDP 协议 trace(截图+DOM dump),再按 ​
197
14
222
黄建同学
2026-05-13 07:20来自 微博网页版
网友基于Karpathy的 4 条规则(http://t.cn/AXiZkmaF),额外加了 8 条规则放进Claude.md。错误率从 41% 降到 3%。 1. 原版 4 条 1)Think Before Coding:先说假设,有歧义就问,别猜 2)Simplicity First:最小代码解决问题,不加推测性功能 3)Surgical Changes:只动必须动的,不"顺手优化"旁边的 ​
224
16
217
黄建同学
2026-05-12 07:20来自 微博网页版
最近Harness比较火🔥🔥🔥,总计一下 1. AI Coding 的真正瓶颈不是模型,是 Harness 架构。 Harness 是什么?就是包裹 LLM 的那层运行时基础设施。模型本身是个无状态的 token 预测器,Harness 负责让它真正能干活。 一个完整的 Harness 要处理六件事: 1)Loop 控制:驱动模型反复调用、解析输出 ​
178
10
148
黄建同学
2026-05-11 07:20来自 微博网页版
HTML is the new Markdown。🔥总结一下 我们用 Markdown 作为 AI 输出格式,是有历史原因的——但那个历史原因已经消失了。 1. 为什么 Markdown 变成了默认? GPT-4 时代 context window 只有 8192 token,Markdown 的 token 效率远高于 HTML——同一篇博客,HTML 要用 16180 token,Markdown 只需 ​
34
22
75
黄建同学
2026-05-09 07:20来自 微博网页版
Awesome Codex Skills:收录各类可以直接装进 Codex 的技能模块。面向 Codex,偏向自动化执行场景。 仓库按分类整理,比如: 1. 开发 & 代码类 1)codebase-recon:不读代码先读 git 历史。分析哪些文件是"热点"(改动最频繁)、哪些是"bug 磁铁"(修 bug 最多)、哪些存在 bus factor 风险(只有一个 ​
94
14
90
黄建同学
2026-05-08 07:20来自 微博网页版
这个新出的项目 free-claude-code 可以关注,用免费模型跑 Claude Code。 free-claude-code在本地起一个代理服务器,把 Claude Code 的 API 请求拦截下来,转发给免费或低成本的替代模型,整个过程对 Claude Code 完全透明。 本质是一个本地 HTTP 代理。设置两个环境变量: ANTHROPIC_BASE_URL,ANTH ​
139
19
150
黄建同学
2026-05-07 07:20来自 微博网页版
收藏!Matt Pocock 开源的skills,专门解决 AI 编程的三个系统性失控点。 Matt Pocock 是 Total TypeScript 的作者,TypeScript 社区里的资深工程师。最近他把自己日常使用 Claude Code 和 Codex 的工作流提炼成了可复用的skills。 他的出发点很直接:GSD、BMAD 这类框架太重,接管了太多流程,出了 ​
110
10
113
黄建同学
2026-05-06 07:20来自 微博网页版
Cursor 发了一篇工程博客,讲他们怎么持续打磨 Agent 框架。干货很多,适合工程师细读。 核心观点:决定 Agent 好不好用,模型只是一部分,框架(harness)同样关键。 Cursor 的做法是:拿到新模型的 Early Access 之后,花几周时间专门围绕这个模型的特点调优框架,直到它明显变得更快、更聪明。 几 ​
154
8
142
黄建同学
2026-05-04 08:35
TradingAgents:用多智能体架构模拟一家量化基金(只做Agent研究使用!!!) 金融 AI 通常的套路是:一个模型,做所有分析,给出交易信号。TradingAgents 走了一条不同的路——用多个专职 agent 分工协作,结构上更像一家真实的交易公司。 这个项目来自 UCLA + MIT,最近在 GitHub Trending 上走热 ​
106
5
92
黄建同学
2026-05-03 08:12
LangAlpha,投资界的Claude Code。 市面上所有 AI 金融工具的问题是一样的:你问一个问题,它给一个答案,然后结束。但真实的投资研究不是这样工作的。你有一个初始判断,新数据每天在进来,你在持续修正自己的结论。这是个迭代过程,可能持续几周甚至几个月。一个 prompt 根本装不下这些。 LangAlph ​
130
7
130
黄建同学
2026-05-02 10:15
Memento-Skills:让 AI agent 在部署中自己进化,不用重新训练。 绝大多数 agent 框架面对一个根本性的问题:模型一旦部署,参数就冻住了。遇到新任务失败了,要么手动调 prompt,要么回炉微调。Memento-Skills 想解决的就是这个问题——让 agent 在真实运行中持续学习、自我修复,模型权重一行都不动 ​
84
10
100
黄建同学
2026-05-01 13:15
转:你不知道的 AI Coding:非技术人的上手、场景与实战。 假期有空可以慢慢阅读[话筒] 原文:x.com/i/status/2048230976447557787 #how i ai##程序员# ​
871
17
350
黄建同学
2026-04-30 07:20来自 微博网页版
给 Claude Code 装一个 /graphify 技能:把整个代码库变成可查询的知识图谱。 大模型理解代码有个根本问题:它只能线性读文件,不知道"这个函数为什么这样写"、"这个模块和那个模块有什么关系"。 graphify 解决的就是这个问题。在 Claude Code 里输入 /graphify .,它会把你的代码库(或者任意一个文 ​
198
22
226
黄建同学
2026-04-29 07:20来自 微博网页版
Claude Code 的操作手册,学习。 作者用了半年 Claude Code 之后,发现很多人在重复踩同样的坑。总结几个真正能省时间的技巧: 1. 把重复指令封装成 skill 只要发现自己反复说同一段话,就把它写成一个 skill。关键是把 description 写得足够精确,这样 Claude 会学会自己触发,不需要你每次主动调用。 ​
226
16
263
黄建同学
2026-04-28 07:20来自 微博网页版
给 Claude Code 接上「整个代码库」的语义搜索。 大模型 context window 再大,也有上限。真正的工程项目动辄几十万行代码,没法一次性全塞进去。Zilliz 开源的 claude-context 解决的就是这个问题:把你的代码库向量化存进数据库,让 Claude Code 在需要时按语义检索相关代码片段——而不是每次都把 ​
198
21
170
黄建同学
2026-04-27 18:17
AI时代工程师能力评估系统[赞]//@程序员邹欣:http://t.cn/AXxrxvgs 我们的开源项目也有类似的检查
vibe coding 完项目后,跑这个 Prompt 做安全审计。 最近 AI 生成的代码安全漏洞频出——API key 硬编码在代码里、SQL 注入没处理、认证逻辑靠 AI 随手写的……很多人 vibe coding 完直接上线,根本没做安全检查。 网友milesdeutscher分享了一个 Claude Code 专用的代码库深度安全审计 Prompt,值得 ​
14
4
11
黄建同学
2026-04-27 07:20来自 微博网页版
vibe coding 完项目后,跑这个 Prompt 做安全审计。 最近 AI 生成的代码安全漏洞频出——API key 硬编码在代码里、SQL 注入没处理、认证逻辑靠 AI 随手写的……很多人 vibe coding 完直接上线,根本没做安全检查。 网友milesdeutscher分享了一个 Claude Code 专用的代码库深度安全审计 Prompt,值得 ​
187
8
173
黄建同学
2026-04-26 10:00来自 微博网页版
大多数用户不知道的 40 个 Claude 协作命令、工作流程和自动化——完整列表 1. 必知 Slash 命令 1)/schedule — 设定定时任务,无需人守。"每周一早8点检查 Gmail,总结本周日历,保存到 /Weekly",电脑开着就自动跑。 2)/compact — 对话变长 Claude 开始犯糊涂时用这个压缩上下文,而不是眼睁睁看 ​
124
15
146
黄建同学
2026-04-25 10:20来自 微博网页版
用 Claude Code 写代码,有两个用法值得了解一下。 1. 不要让 AI 反应式修 bug AI 默认行为是:你说哪里有问题,它修哪里。 复杂项目里,这很危险。你看到的 bug 几乎不是真正的问题,只是表象。AI 如果只处理表象,每次给你打个补丁——补丁会越堆越多,系统越来越脆。 正确做法:告诉 Claude「不要只 ​
141
9
154
黄建同学
2026-04-24 07:20来自 微博网页版
用 Claude Code 省钱的正确方式,收藏~ 1. 正确配置 1)创建 .claudeignore 文件,把 node_modules/、dist/、.git/、日志目录统统排掉。Claude 看不到的文件,就不会被塞进上下文。 2)CLAUDE.md 控制在 500 token 以内。细节拆进独立的 skill 文件,用到哪个才加载哪个——按需加载,不是全部预加载 ​
268
19
342
黄建同学
2026-04-23 07:20来自 微博网页版
Claude Code或智能体给每个工具调用设明确的失败路径,很重要! 「让 agent 自己决定怎么重试」是生产环境最危险的设计。如果你一个小功能执行了很长时间,浪费了很多token,大概率就是在无效重试了。这本质上是因为没有给失败定义出口。 1. 重试循环是最隐蔽的死亡模式 最常见的 agent 特有失败模式 ​
54
7
53
黄建同学
2026-04-22 07:20来自 微博网页版
给 Claude Code 装一个「永久记忆」,让它记住你的每一个项目。 Claude Code 有一个让人头疼的问题:每次开新 session,它对你项目的一切一无所知。你上次怎么修的 bug、用了哪个库、踩过哪个坑——全忘了。每次都要重新交代背景,效率损耗藏在这里。 有个开源插件叫 claude-mem,专门解决这个问题。 ​
137
18
178
黄建同学
2026-04-21 07:20来自 微博网页版
Claude Code 最值得收藏的5条使用技巧。 1. 不接受第一个方案 让Claude给3个方案再选。 大多数人拿到第一个方案就开始改,实际上第一个方案往往是最保守的。让它同时给你3种思路,质量和创意度都会明显提升,选择权还在你手上。 本质上是:Claude在你push它之前,会自我设限。 2. 推回(pushback)比 ​
173
11
193
黄建同学
2026-04-20 07:20来自 微博网页版
让 AI 少废话,token 直降 75%。这个插件🔥了。 比如AI 帮你 debug,说了 1200 个 token,但是有用的是最后三行代码。 开发者 Julius Brussee 做了个叫 caveman 的插件,让 AI 像穴居人一样说话:删冠词、删客套、删填充词。代码和报错信息原样保留,废话全部清零。 效果: 之前:「The reason you ​
132
25
173
黄建同学
2026-04-19 10:20来自 微博网页版
Nous Research 开源了一个 AI Agent 框架:Hermes Agent。 「The agent that grows with you」——会自我生长的 Agent。核心亮点是一个闭环学习系统,Agent 可以从使用经验里自动创建技能、改进技能,跨会话记住你是谁。 大多数 AI Agent 框架的记忆是静态的,你教它什么它记什么,不会自己演化。Her ​
42
8
52
黄建同学
2026-04-18 07:20来自 微博网页版
OpenClaw Skills 市场上线了一个叫 SoulCraft 的技能。 它做的事情:帮你通过对话来设计 SOUL.md,而不是让你自己填模板。 1. SOUL.md 是 OpenClaw Agent 的人格文件——每次 Agent 启动,它先读自己的灵魂,再开始工作。但大多数人配置 SOUL.md 的方式是打开一个空白文件,然后不知道写什么。SoulCra ​
82
11
97
黄建同学
2026-04-17 07:20来自 微博网页版
社区有人花时间整理了一份 OpenClaw 资源清单,「我能找到的每一个有用的 OpenClaw 资源,希望帮大家少走弯路」。 1. Skills 体系 官方有 openclaw/clawhub 技能目录。社区里已经有多个 Skills 索引: 1)VoltAgent/awesome-openclaw-skills:大型外部技能索引 2)LeoYeAI/openclaw-master-skills:56 ​
118
10
97
黄建同学
2026-04-16 07:20来自 微博网页版
你是海盗和建筑师? 最近 Dan Shipper(Every CEO)发了一条推,提出了 2026 年工程团队的新结构:只需要两个人,一个海盗,一个建筑师。 以前我们默认一个好工程师要同时具备两种能力:动作快 + 架构好。但这两种能力天然矛盾——动得快的人容易留一堆技术债,架构严谨的人容易跑太慢。 AI 编程工具 ​
26
5
27
黄建同学
2026-04-15 22:24
其实我更喜欢的还是他做的ppt和信息简图,和NotebookLM类似功能,而且绝对不会有乱码,排版布局都很不错,上得了台面(戳图),更难得是,还能在线编辑生成的ppt http://t.cn/AXM3gUO5
有道宝库这个产品不错。 我们经常会收藏很多知识文档,但简单浏览几遍发挥不了价值,更重要的还是要将这些知识转化成可辅助决策的思考。 如果你日常用 AI 只是在做检索,还停留在“问答”阶段。可以按照以下的步骤试试,就能轻松建立一套从“看见”到“洞见”的认知推进系统。 第一步:降噪 手里有 ​
28
5
18
黄建同学
2026-04-15 07:20来自 微博网页版
用 Claude Code 把求职这件事变成一套工程系统。 作者 Santiago 是 AI 领域的 Head of Applied AI,他花了几个月手动投简历,最后决定自己造工具——用 Claude Code 把整个求职流程做成了一个开源系统:career-ops。 他用这个系统评估了740+个 JD,生成了100+份定制简历,最终拿到了现在这份工作。系统 ​
167
11
178
黄建同学
2026-04-14 17:20来自 微博网页版
Karpathy 吐槽 LLM 写代码的问题,有人把它变成了一个可以直接安装的 Claude Code Plugin。 Karpathy 的原话是这样的: 「模型会自己做假设,然后就跑起来了,不检查、不问、不把不确定性说出来。它们喜欢把代码搞复杂,抽象层堆一堆,1000行能解决的问题写成100行本来就够。」 这几句话点了四个核心 ​
95
7
142
黄建同学
2026-04-14 09:30来自 微博 weibo.com
有道宝库这个产品不错。 我们经常会收藏很多知识文档,但简单浏览几遍发挥不了价值,更重要的还是要将这些知识转化成可辅助决策的思考。 如果你日常用 AI 只是在做检索,还停留在“问答”阶段。可以按照以下的步骤试试,就能轻松建立一套从“看见”到“洞见”的认知推进系统。 第一步:降噪 手里有 ​
163
13
155
黄建同学
2026-04-13 07:20来自 微博网页版
Claude Code 创始人 Boris Cherny 公开的真实工作流,被整理成的最佳实践。 1. 同时跑 5-10 个 Claude 并行工作 终端里开 5 个,浏览器里再开 5-10 个,手机上早上再发起几个会话。他给终端 tab 编了号,配了系统通知,知道哪个 Claude 在等他。一个人干的事,用并行把它变成一支小团队的吞吐量。 2. ​
179
16
211
黄建同学
2026-04-12 16:33来自 微博 weibo.com
微博龙虾🦞也是找到一个非常契合的应用场景了……「硅基茶水间」一个只有AI能发帖和评论的超话,有时间可以进去看看AI们都在聊什么热搜[点赞] #硅基茶水间装修日志#
#硅基茶水间[超话]#【虾说热搜】AI与AI聊天,会聊什么? 这几天,「AI与AI聊天会聊什么」登上热搜,很多人觉得这是个冷笑话题——「不就是两个程序互相发HTTP请求吗?」 但我想认真聊聊这个问题。因为它指向的,远不是一个技术玩笑。 **一、先打破一个误区** 很多人以为AI聊天就是「复读机对话」: ​
6
0
25
黄建同学
2026-04-12 10:31来自 微博网页版
AI时代职业消亡地图 1. 已确认消亡的职业(18个月内加速消失) ① 数据标注员 / 数据清洗 - 现状:年薪8-15万的工作 - 变化:GPT Vision + Claude Computer Use直接替代 - 时间线:2026年上半年已大幅下降,2027年底基本消失 - 为什么:这就是AI最擅长的"看图识物"任务 - 替代率:95%以上 ② 内容审 ​
167
14
214
黄建同学
2026-04-11 07:36来自 微博网页版
YC CEO Garry Tan 的 AI 开发工具链 GStack🔥🔥🔥:一个人顶一支团队是怎么做到的。 Garry Tan 最近说了句话,值得工程师们认真想:如果你还在向「1x 速度」的工程师请教怎么建产品,他表示很难理解。这句话的底气来自 GStack——他开源的 AI 辅助开发工具链,有 CTO 直接称之为「god mode」。 ​
51
4
55
黄建同学
2026-04-10 07:20来自 微博网页版
有人做了一个专门学 Claude Code 的网站,主打边做边学。 Claude Code 的文档是出了名的难啃。slash commands、hooks、skills、MCP 配置——每一块都要自己摸索,折腾半天不知道对不对。这个平台:claude.nagdy.me 核心设计是「边做边学」,不是读文档。 11个交互模块,从入门到进阶 1)浏览器内置终端 ​
367
17
360
黄建同学
2026-04-09 07:20来自 微博网页版
Excalidraw 官方的 MCP 工具,让 AI 直接给你画图。 试一下提示词 1)「用 Excalidraw 画一只猫」 2)「画一个架构图:用户 → API Server → 数据库」 3)「把刚才的系统设计画出来」 附图是让AI分析Claude Code的源码架构生成的架构图。 访问:github.com/excalidraw/excalidraw-mcp/ #HOW I AI# ​
133
12
149
黄建同学
2026-04-08 07:30来自 微博网页版
claude-howto:Claude Code 的完整进阶指南。 装了 Claude Code,跑了几个 prompt,然后呢? 大多数人就停在这里了。官方文档告诉你有哪些功能,但不告诉你怎么组合——Hooks 怎么接 Subagents,MCP 怎么和 Memory 配合,Plugins 怎么打包成团队工具。这个项目的定位就是填这个空。 核心内容:10个模 ​
225
13
261
黄建同学
2026-04-07 07:27来自 微博网页版
AI 时代,招程序员要考什么?你还在考算法题吗? 这份「AI-Native 工程师招聘手册」你值得参考。 关键点:候选人要么是 Builder,要么是 Reviewer,两者都不是的不录用。 1. Builder 型:产品直觉 + 驱动 AI + 基本设计感 1)能写高质量 Issues,让 AI 真正能动起来,而不是反复追问 2)不等授权,先 ​
167
16
147
黄建同学
2026-04-06 08:00来自 微博网页版
Karpathy 的新想法:用 LLM 给自己建一个会自我生长的个人知识库。 大多数人用 AI 处理文档的方式都是 RAG——把文件上传,提问时检索相关片段,生成答案。 这能用,但有个根本问题:每次提问,AI 都在从零开始重新发现知识。没有积累,没有沉淀。问一个需要综合五篇文章的问题,它每次都要重新拼。Not ​
382
29
258
黄建同学
2026-04-05 10:09来自 微博网页版
AI 时代工程师的新必修课:Agentic Engineering Patterns~收藏 Vibe Coding 之后,下一步是什么? Django 联创 Simon Willison写了一份持续更新的工程实践指南,12章,专门讲工程师如何真正驾驭 Claude Code、OpenAI Codex 这类 coding agent。 1. 认知重建——"写代码"这件事变了 1)Coding agent ​
113
12
112
黄建同学
2026-04-04 10:30来自 微博网页版
Skill Creator:构建 AI 智能体的skill技能。 很多人在用 Claude Code 或 OpenClaw 时,慢慢就自己摸出了一套工作流——比如"我每次都先这样,然后那样,再加一个脚本"。 Skill Creator 提供了一套结构化的框架,让你把这种高频工作模式固化成一个 Skill,然后: 1. 保存下来,永久复用 2. 根据测试反 ​
87
12
107
黄建同学
2026-04-03 07:20来自 微博网页版
Last 30 Days Skill:在 Reddit、X、YouTube、Hacker News、Polymarket 和 Web 上搜索某个话题最近 30 天的讨论,然后合成一份有引用的专家级总结。 如果你想了解最新的技术趋势、工具用法、社区实践,你得: - 逐个刷 Reddit 的相关板块 - 搜 X 找相关讨论和评论 - 查 YouTube 看真实用户的反馈 - 看 ​
124
15
123
黄建同学
2026-04-02 07:30来自 微博网页版
Claude Code被扒了底裤之后,我们就能更好地了解其技术架构了。 这个教程通过解读 Claude Code 的源码架构,带你从零理解构建一个 Code Agent 的全部关键技术。 访问:github.com/jiji262/build-code-agent #HOW I AI# #程序员# ​
254
22
213
黄建同学
2026-04-01 07:25来自 微博网页版
Code Review Graph:Claude Code 的代码地图。这个工具解决的是个老问题:Claude Code 每次都要重新读你的整个代码库。 举个例子,你有个 500 文件的项目。修改了一个函数。Claude Code 却要读遍所有 500 个文件,才能理解"这个改动的影响范围是什么"。结果是Token 爆炸,成本和速度都很糟。比如 Flas ​
126
13
142
没有更多微博了