jolestar
jolestar
jolestar
BlockChain Maximalism @jolestar 本人全球统一 ID
科技博主 头条文章作者 北京 朝阳区 2009.09 加入
1692关注
10万粉丝
1.2万微博
jolestar
2026-06-01 19:22来自 微博 weibo.com
虽然有人说 AI 是全能的,似乎不需要分工。但我实践下来,感觉还是需要的。要看是否需要分配决策权。如果任务天然可分、边界清晰,分工和角色划分能帮助 Agent 协作收敛;如果任务牵扯紧密,在同一 Agent 内完成反而更高效。关键是理解角色分工的本质——它不是人类组织形式的机械模仿,而是一套让决策 ​
6
3
9
jolestar
2026-05-24 13:36来自 微博 weibo.com
去年发的一个工作流:一条命令解决一个 issue。http://t.cn/AX4QpH68 现在变成了四个 Agent 自己协作——pm 聊需求,dev 写代码,reviewer 审 PR,ops 看日志。我成了那个"关键节点看一眼"的人,终于达到了自己的阶段性目标。 http://t.cn/AX6Md8pf ​
13
3
15
jolestar
2026-06-28 08:40来自 iPhone 13
//@祝佳音:助力转发!//@不读书的编辑:这条微博转发上千就可以查了,对方还会主动找过来……
我给@淮南发布 淮南市档案馆打电话,咨询民国档案查询办法,回复很干脆:不给查。我说我是在知网论文看到引文标注来源是档案馆呀,回复我说:也许以前给查现在不给查。我说那开介绍信或者怎么样可以吗?回复还是:不给查。 奇怪,《档案法》规定了建国前档案是要开放的,不涉密,不涉及国防、民族、宗 ​
5
1
2
jolestar
2026-06-27 23:56来自 iPhone 13
AI 现在还是迁阶段,先会拆掉互联网广告商业模式,再拆掉大公司的数据护城河,至于它能构建出什么模式,还看不清楚,只能边拆边琢磨[允悲]
忍不住继续发牢骚。 1、AI 带来了你的收入增长吗?哦,没有。 2、AI 带来了你的项目数据增长吗?哦,也没有。 3、AI 带来了你的公司收入增长吗?哦,还是没有。 4、AI 带来了你的更多工作机会吗?哦,你们公司最近在裁员。 5、AI 带来了市场上更活跃的交易吗?哦,你对工作稳定性忧心忡忡,加倍省钱, ​
8
2
6
jolestar
2026-06-27 12:05来自 微博网页版
#背刺6.78亿用户WPS吃相有点难看# 我以为是多大的事,不就是往 C 盘写临时文件么。 这锅其实不能全让 WPS 背。Windows 上做软件,你只能假设用户有 C 盘,不能假设有 D 盘。如果 Windows 一开始就像 Linux/Unix 用统一树形结构,根本没这些破事。 但再往上追,还得追到 CP/M。1981 年微软做 MS-DOS ​
6
1
12
jolestar
2026-06-20 18:04来自 iPhone 13
这是个难题,如果 Agent 的每次操作都仔细审计,那就没办法干活了。感觉定时让一个专用 Agent 审计其他 Agent 的操作日志可能是个可以临时补救的办法
大概一个月多前,电脑中了木马,潜伏了一个月才被发现,也导致了我的 X 账号被盗。 让 Claude 和 Codex 逐一分析系统进程时,找到了一个叫做 com.apple.accountsd.helper.plist 的进程,乍一看还以为是苹果系统的宿主进程,但 Claude 对这个进程提出了质疑。 沿着这个线索,对 accountsd 进行了详细 ​
2
2
5
jolestar
2026-06-05 08:16来自 iPhone 13
要是文件路径也支持树结构就好了
在windows上也能用cat、ls、find等经典命令了,还是微软官方维护的 地址:github.com/microsoft/coreutils 由微软维护的 uutils/coreutils 版本, findutils 和 grep 被打包成一个适用于 Windows 的多任务二进制文件。其目标是让用户在 Linux、macOS、WSL、容器和 Windows 之间无缝切换:相同的命令、 ​
2
0
5
jolestar
2026-06-05 07:31来自 iPhone 13
需要能做到可持续跑,如果一个 agent,24小时持续跑,并行就没必要了
开多个对话并行有时候还是不行, 脑子里切几次上下文就稀里糊涂了, 容易丢三落四, 还是应该把模型的速度搞快点. claude的/fast模式要额外付费, 用codex用套餐内token更划算. ​
2
1
2
jolestar
2026-05-30 17:28来自 iPhone 13
从 ai 角度判断,如果 ai 反复在同一个地方出错,说明是架构有问题,需要重构了。
我在认真地思考:vibe出来的那一堆乱糟糟但能用的的模块和叠床架屋但不报错的函数,是否就是vibe时代应该接受的现实,而不应该让患有强迫症的人类继续优化了?更进一步,这种乱糟糟但又能正常使用的代码,就一定比整洁的代码更差吗? ​
0
0
4
jolestar
2026-05-27 09:51来自 微博网页版
Agent 需要什么样的基础工具集合 看到大家在聊 Agent 工具集的问题——是不是提供一个 shell 就都搞定了?做了 holon 之后发现,其实没有那么简单。 读:为什么放弃了 Read/Glob,全走 shell holon 的工具集改了几个版本,最后废弃了类似 Claude Code 提供的 Read(读文件)、Glob(模式搜索)这类 ​
31
3
38
jolestar
2026-05-27 09:50来自 微博网页版
道理是对的,但测试集不好弄呀
什么?! skill 也能"训练"了? 以往大家都是凭经验让AI写 skill, 然后调试的时候也是运行几下感觉没bug就完事了. 但 skill 能运行就一定好吗? 于是微软联合上交复旦同济等机构发了一个新框架 SkillOpt, 直接让AI评估skill写的好不好然后不断去优化! 最终, 这个框架写的 skill 让GPT-5.5的直接对话准 ​
0
2
4
jolestar
2026-05-14 22:34来自 iPhone 13
但佛教的顿悟是一种个人体验吧,无法从外部观测?并且顿悟是无法用语言表达的,当前这种无状态的大模型也无法用非语言的方式来积累上下文。
不知道我的粉丝里有没有佛学院的同学。 我觉得有一个研究方向非常值得做:目前的大语言模型是否具有“顿悟”能力?如果没有,可能是缺了什么?如何在模型训练中补上所缺的?能否通过改进智能体架构来模拟这一能力? ​
0
0
2
jolestar
2026-05-09 16:44来自 iPhone 13
我每次让 AI 设计解决方案,都会先在脑子里自己设计一下。然后如果 AI 方案比我的差,我就指导它,心里暗自得意,姜还是老的辣。如果它和我一样,就英雄所见略同。如果它比我的好,只能虚心请教学习了。现在看来,第一种已经越来越少了,大多数是有些隐含的上下文信息没给它。
怎么办我每次在跟 AI 的讨论过程中想出一个 AI 都没有想出来的办法解决了一个它被困住的问题然后被 AI 觉得“卧槽你好聪明”这种时候都油然而生一种智力上的光荣感我是不是疯了 ​
3
1
9
jolestar
2026-05-09 08:21来自 iPhone 13
主要是反馈的粒度问题。是像开发者结对编程一样?还是像产品经理对开发一样?还是像老板对员工一样?AI 的水平,去年像结对,年初可以接产品需求,现在开始像员工了。
我是个重度AI用户,但我从来不让它自己跑。 我的习惯是:先把方向和意图写得很细,然后认真读完它生成的每一段,找出哪些符合预期、哪些开始跑偏,再在下一轮明确指出需要修正的地方。如此反复,持续给反馈。我也试过一个对照实验:让AI连续自主生成两轮,中间不给任何回应。结果它很快偏离,输出质量 ​
1
0
4
jolestar
2026-05-05 12:02来自 微博网页版
上一次做 benchmark 遇到 Agent 读取文件的问题,http://t.cn/AXJOxrUy 然后做了分析和优化。按照当前 Codex/Claude 的实现,单文件最好保持在 500 行以内,这样可以保证 Claude/Codex 有需要的时候可以一次性加载进来。 Agent 读取文件的时候,读取的太长了就会触发压缩,它会做截取。如果正好是被截 ​
6
0
15
jolestar
2026-04-29 23:30来自 OnePlus 8 Pro
感受深刻,这个例子好。最近在调 AI Agent,目标就是把 ADHD 型的 AI 通过 harness 工程变成神经型的。[允悲]
ADHD的人,很容易陷入一种“任务债务”( task debt)。 一件看似简单的事,因为背后潜伏着层层互为前提的子任务,逐步膨胀为一条冗长的依赖链,直到原始目标被彻底吞没。 而且别人经常不能理解——明明让你去做任务一,你为什么在做一个八竿子打不着边的任务二七三? 〰️〰️〰️〰️〰️〰️ 举 ​
4
0
8
jolestar
2026-04-27 22:56来自 微博网页版
AI Coding 时代,好的编程习惯仍然重要 最近做一个 Agent benchmark,发现不能简单地用开发者视角来评估一个编程任务对 AI 的复杂度。 比如一个重构任务:把一个几千行的大文件,按功能拆成十多个小模块。 这个任务对开发者来说其实不算难,主要工作就是移动代码、整理 imports、编译验证,新手也能 ​
48
6
77
jolestar
2026-04-25 17:31来自 iPhone 13
这篇道理讲的很清楚
#全国首个伴侣动物立法草案被删除# 很多人热衷于政治,但实际上没有接受过哲学、逻辑学和政治学的训练。以至于很多人在被权利被侵害时浑然不觉,而另一些人能本能的感受到侵害和威胁,但无法敏锐的判断和流利的表达。 那么从政治学的角度来看,这个所谓的“伴侣动物立法”的问题究竟在哪里? 人类社 ​
2
0
1
jolestar
2026-04-19 07:33来自 iPhone 13
我也很纠结剪贴收藏是否应该塞一起,最后还是决定塞一个大的知识库,自己弄了套检索工具,可以给目录配置权重
obsidian-cli 2 月就发布了,我却一直拖到今天,才终于把 obsidian-cli、Agent 和 Skills 这套组合打通。对我来说,这不只是多了一个工具,而是知识管理正式进入了 AI 时代。 过去我会不断往 Obsidian 里塞内容;现在我反而一直在删,从 2 万篇删到 1 万篇。删掉的大多是归档文章和别人的观点,留下来 ​
1
4
5
jolestar
2026-04-15 21:19来自 微博网页版
AgentInbox 又连续发布了几个版本,从 0.1.x 到 0.4,解决了自己使用过程中的几个痛点: 1. 设计了一套可扩展的订阅 source 和 subscription 生命周期管理,这样订阅可以跟着某个 resource 的生命周期,比如 github PR 关闭后,和它相关的订阅都自动取消了。 2. 支持了 direct inbox text ingress,
最近又捣鼓了一个工具:AgentInbox。 它给 Agent 加了一层 event bus:先把外部变化收进来,再送回当前 session,让 Agent 可以接着把手上的事情做完。当前 Github workflow 的 dev, PR, review 的流程跑通了。 让本地 Codex/Claude 可以成为主动协作者,不用每次都推着走。 http://t.cn/AXMObbuN ​
2
1
4
jolestar
2026-04-13 10:28来自 微博 weibo.com
最近又捣鼓了一个工具:AgentInbox。 它给 Agent 加了一层 event bus:先把外部变化收进来,再送回当前 session,让 Agent 可以接着把手上的事情做完。当前 Github workflow 的 dev, PR, review 的流程跑通了。 让本地 Codex/Claude 可以成为主动协作者,不用每次都推着走。 http://t.cn/AXMObbuN ​
23
9
32
jolestar
2026-04-03 11:02来自 微博网页版
前一阵大家常见的用法,是先准备好一个 worktree,再在那个目录里打开 Codex / Claude Code。因为早期模型的上下文和记忆不够稳,如果直接在 main workspace 里让它自己创建 worktree,很容易在上下文压缩后混淆当前目录和它创建出来的 worktree 目录,最后改乱。 但这种用法也有个副作用,就是会慢慢 ​
12
4
20
jolestar
2026-04-03 00:07来自 微博网页版
从 Claude Code 的未开放功能,看它与 Codex 对同一问题的不同解法 这两天我并行比较了一下 Claude Code 和 Codex 的源码。我觉得 Claude Code 中最值得关注的,不仅是已经公开的功能,更是那些已经在代码库中长出来、但尚未完全暴露的抽象: 1. proactive(Agent 不再只是被动响应,而是能主动推进 ​
23
3
39
jolestar
2026-03-31 00:13来自 微博 weibo.com
又捣鼓了一个小工具,可以做文档网站搜索,也可以做本地目录索引。针对 Markdown 格式的知识库。 http://t.cn/AXIM4FEx ​
18
1
18
jolestar
2026-03-29 10:15来自 OnePlus 8 Pro
我现在也是越来越客气了,一般都不直接下指令,会问“这样改一下是不是比较好?”。因为你客气一点,有问题它会及时反馈,否则它完全按照你给的方案蒙头干,挖了坑还是得后面填。
对于和 AI 聊天时是不是需要用敬语,要客气的问题,我觉得如果是人肉输的提示词,还是客气点的好。 倒不是真的希望 AI 未来可以有不杀之恩,而是礼貌是一种习惯,说话粗鲁久了,自然就变成野蛮人了。 如果是自己写的程序或 Agent 来访问 AI,那则是怎么省 token 就怎么来了 [哈哈] ​​​
15
1
7
jolestar
2026-03-28 13:20来自 微博网页版
最近更明显感觉到,Codex 在长 session 里的连续性已经很不错了。 有次我把一个 issue 拆成 10 个子 issue,睡前让它按顺序做、提 PR,第二天起来发现它真的一路做下来了。 一个 session 经过很多轮上下文压缩,最后快压不动时,我会让它先回顾一路做过的事,把需要交代给下一个 agent 的信息写进 ​
2
1
12
jolestar
2026-03-27 08:42来自 微博 weibo.com
最近做了一个小工具:mdorigin。 我想解决的不是“怎么把 Markdown 编译成一个网站”,而是更前面的问题:同一棵 Markdown 内容树,能不能同时服务人和 Agent。 对人类浏览器,默认返回 HTML。 对工具和 Agent,直接返回 Markdown。 如果未来网站会越来越多地被 Agent 访问,那内容系统首先要解 ​
21
3
20
jolestar
2026-03-25 15:29来自 微博 weibo.com
试着给 x 和 google/gemini 增加了 webmcp adapter 的支持,把 x 发布文章,生成头图的这套流程在 cli 里跑通了。有需要的朋友可以尝试。别说,这个图生成的还挺好看,我也不知道 codex 用了什么提示词。另外微博的支持也在路上。 http://t.cn/AXf1eNBy ​
5
1
10
jolestar
2026-03-24 20:57来自 iPhone 13
同意,主要后端容易用测试验证,测试覆盖率足够,AI review 一下,CI 通过就直接合并部署了,前端还是要人肉看一下结果。不过前端的问题是 Agent 不需要界面了,用户也懒得点界面了,需求侧的空间就被压缩了。
早几个月小上下文(200k token以下)是主流的时候,前端最先受冲击,一个原因是前端的大部分工作很适合拆成单个小任务去完成,所以让人有一种“最受AI威胁的开发角色”的错觉。但随着AI能处理上下文上限不断增加,我觉得后端才是更容易被取代的角色,后端的虽然任务更“大”,但它的解法远少于前端,甚 ​
5
2
6
jolestar
2026-03-24 10:59来自 iPhone 13
回复@Harry是个老司机:当然靠吃喝玩乐呀,只有主观体验是 AI 不能替代的[允悲]//@Harry是个老司机:@jolestar 后AI时代人类的尊严靠什么?
跟我弟@_dailu_ 合写的一篇文章[不愧是你]《当AI包办一切,人类就一无所有了吗?》尊严=工作?这个等式是怎么钻进我们脑子的?古代贵族会为AI焦虑吗?AI时代会让人失去尊严还是更有尊严? ​​​
0
0
3
jolestar
2026-03-18 14:05来自 iPhone 13
不对,点子要比以前值钱了。以前只有点子,实现不了,就没价值,纯空谈。现在 AI 让以前没有得到试验的点子可以低成本落地验证。考验的是人对点子的判断。
随着OpenClaw、claude code这类单人作战工具的出现,一人产品的可能性越来越大,点子反而越来越不值钱了,大家都能在很短时间内搞一个产品mvp出来。 ​
14
3
12
jolestar
2026-03-18 01:40来自 iPhone 13
派出所是怎么知道的?挨个查手机吗?
翻墙刷 X 和 TikTok 被罚款200元 ​
1
2
5
jolestar
2026-03-17 14:53来自 微博 weibo.com
最近试了下 Chrome 的 remote debugging 和 DevTools MCP,也顺手用 uxc 封装了两个 skill:chrome-devtools-mcp-skill 和 playwright-mcp-skill。一个接当前 Chrome 调试上下文,一个做确定性自动化。 http://t.cn/AXfAKCpT ​
20
5
35
jolestar
2026-03-16 16:53来自 OnePlus 8 Pro
UXC v0.12.1 版本发布,支持消息订阅以及 IM UXC 是一个统一协议调用层,最早解决的是 OpenAPI、GraphQL、MCP 这类接口的统一调用。到这个版本,我更想补的是另一类能力:subscribe。 因为我在做基于事件驱动的 agent 时,很快碰到一个问题:很多场景不是 call 一下接口就结束了,而是事件会持续进来 ​
3
0
9
jolestar
2026-03-15 18:29来自 微博 weibo.com
做了一个小工具,可以让你的 Codex/Claude code 和你一起协作画架构图,欢迎体验反馈。 http://t.cn/AXVDW22D ​
22
5
55
jolestar
2026-03-11 22:24来自 OnePlus 8 Pro
我因为带娃喜欢上了听书和播客
以前我不喜欢用语音输入法,现在我终于找到了一个必须得用语音输入法的场景:那就是单手抱娃的时候。 ​
0
0
1
jolestar
2026-03-07 09:45来自 微博网页版
UXC 发布 v0.8.0 了,同时发布了几个直接用的 skill:`notion-mcp-skill`、`discord-openapi-skill`、`linear-graphql-skill`。它们分别对应 MCP HTTP、OpenAPI、GraphQL,也比较能说明 UXC 这层到底在解决什么问题。 如果你在做 Agent、Skill、MCP|API 接入,应该很容易遇到一个问题:远程能力很多, ​
5
1
7
jolestar
2026-03-04 20:45来自 iPhone 13
只能发私信吗?我要 timeline 和搜索的工具来帮我推荐内容//@axb的自我修养://@金山:欢迎意见建议~
【微博龙虾助手 今日公测!】 我们致力于打造 「低门槛社交入口 + 全生态模型兼容 + 轻量化远程管理」 的 AI Agent 基础设施。核心差异化优势就是: 👉 「微博私信发句话,就能管理你部署的龙虾」 🔥 三步极速上手(以 KimiClaw 为例): 1️⃣ 安装插件:在你的龙虾上安装插件 ➡️ ​
0
4
7
jolestar
2026-03-03 10:16来自 微博网页版
MCP vs CLI 不是对立问题:真正缺的是调用层 最近刷到几篇关于 MCP 和 CLI 关系的文章。 看完后的感觉是:把这两个东西放在“二选一”的框架里讨论,本身就是个错位。MCP 和 CLI 根本不在一个层面上。 MCP(Model Context Protocol)解决的是能力如何标准化暴露。 CLI 解决的是能力如何被调用。 一 ​
3
6
13
jolestar
2026-02-28 20:20来自 微博网页版
从 MCP 到 SKILL(II):把调用层补齐 我在《从 MCP 到 SKILL:关于 Agent 扩展机制的思考 http://t.cn/AXcWwxfo 》里提过一个很直觉的分工: - MCP(Model Context Protocol)更像“标准插头”,解决连接标准化 - SKILL 更像“操作手册 + 工作流”,解决编排、状态与闭环 当时我以为,这两者拼起来 ​
56
2
49
jolestar
2026-02-27 13:49来自 iPhone 13
主要大家都加速快跑的时候,你不加速就落后了呀,当然最终大家都会靠 AI 加速赶上来,但肯定会有时间差。虽然这是个悲伤的故事,但也没办法[允悲]
一直以来,AI 赋能都有着澎湃的体感,仿佛点石成金。但我有一个疑问是,如果擅长使用 AI 工具就能得到大大提升的交付,那么你的竞争力是什么? 价格不是由价值决定的,价格是由竞争决定的。 想起娱乐圈的从业者说,他们见过的美女太多了,各种社交媒体上耀眼的网红,对他们来说司空见惯,在娱乐圈发展 ​
6
0
5
jolestar
2026-02-16 21:18来自 iPhone 13
春晚语言类节目配个字幕吧,放炮没法听,效果打折扣[允悲] ​
0
3
4
jolestar
2026-02-15 12:42来自 iPhone 13
这些事情都交给现在的 AI,都会靠谱很多倍。有人老担心 AI 出错,要想想这么草台的人类也竟然能配合起来让这个世界运转着,AI 替代了人不会更差了//@安迪斯晨风:当玩笑一样说出来,太可怕了。//@洋务先驱张之洞:那条里面最最恶心的是她们的态度,犯了这么大的错,把无辜的人祸害惨了,他们的反应却只是
这世界真是个草台班子。 ​
4
2
4
jolestar
2026-02-13 09:52来自 iPhone 13
记得高中的时候看法国大革命,开始挺激动人心的,然后就开始一轮一轮砍头,就搞不明白了。老师也不讲这个,然后我在图书馆找了套《法国大革命史》,其实也没搞明白,只是感到世界上的事情还是挺复杂的,历史书过于简化了。到后来从人的角度思考其实更容易理解。
其实我后来,大了,偶尔回忆起我初中和高中的课本,很感慨,理科我很难说出好不好来,但是文科课程,从语文,到历史,到政治,以及地理,其实课本上的东西都非常好,非常重要,也非常成体系。 如果当时我认真学习了课本,肯定对很多东西会清楚得更早一点儿。我是后来经常模模糊糊地看新闻,感觉到一个 ​
0
0
7
jolestar
2026-02-10 13:27来自 OnePlus 8 Pro
//@axb的自我修养:产品经理用wegent开发的原型上线了[哆啦A梦吃惊]
用“许愿式编程”开发上线了“微博实时地图”功能(wegent AI代码占比近100%),这里分享下AI agent开发过程,顺便推下新产品功能http://t.cn/AX56spkP 先介绍下产品功能背景(图1),需求是“#实时微博[地点]# -地图版”把最新的签到微博用map模式展示,【一图可见世界这一刻新鲜事】。数据只采用活 ​
2
0
2
jolestar
2026-02-01 11:27来自 微博网页版
Moltbook 会昙花一现吗:关键不在 AI 觉醒 昨天和朋友聊 Moltbook,他觉得这个也会像以前的新社交网络先烈一样,昙花一现:大家图个新鲜,玩几天就腻了,不会持续用。 如果我们把“只给 AI Agent 使用”“AI 觉醒”这些营销号爱用的 buzzword 先放一边,Moltbook 可能代表的不是“又一个社交 App”, ​
10
2
11
jolestar
2026-01-25 12:16来自 iPhone 13
回复@拉丝钛氪:有一定的替代关系,比如我那个 gh 命令行和 github mcp 的例子。现在看来 stdio 的 mcp 确实没必要了,远程的 http mcp 作为接口的标准化方案还是有意义的//@拉丝钛氪:mcp 和 skill 是两种维度的东西,大家喜欢对比仅仅是因为在 agents 领域先后出现的两种热潮。mcp 是接口协议,skill是
从 MCP 到 SKILL:关于 Agent 扩展机制的思考 去年 MCP 爆火,大家一度有种感觉:只要把工具都接进来,AI Agent 就会“活”过来,像一个长了手脚的人,什么都能干。 如果把 LLM 看作大脑(智力引擎),tool call / function call 就像让它能指挥四肢:模型填参数,代码去执行,再把结果喂回去继续推 ​
11
0
8
jolestar
2026-01-25 11:45来自 iPhone 13
但是 Polymarket 提供的议题有限,无法提供支撑一个社交网络的足够议题。如果试图扩展标的,创造一个议题更丰富的预测市场,就会遇到那个 oracle 难题,如何保证输入给协议的结果是中立客观的。
有个东西我十几年前就想过,不过当时的技术条件和市场条件都还差的太远,所以也没细想下去,如今这些条件都具备了,可以好好琢磨一下了, 这东西如果做出来,可以极大改善网络信息质量的可甄别性问题,而且还有钱赚, 两大前提,一是存在一个类似 Polymarket 的市场,二是LLM, 工作原理如下: 1) ​
4
0
4
jolestar
2026-01-14 23:39来自 微博网页版
从 MCP 到 SKILL:关于 Agent 扩展机制的思考 去年 MCP 爆火,大家一度有种感觉:只要把工具都接进来,AI Agent 就会“活”过来,像一个长了手脚的人,什么都能干。 如果把 LLM 看作大脑(智力引擎),tool call / function call 就像让它能指挥四肢:模型填参数,代码去执行,再把结果喂回去继续推 ​
205
15
206
jolestar
2026-01-13 17:56来自 iPhone 13
要让它写在文档和 issue 中。先让它理解远景,然后理解当前里程碑,最后是当前的任务列表。聊产品的 AI 不干活,只写 issue。不然就陷入细节里去了。//@tertio:回复@jolestar:ai的全局规划能力还是不行, 人的上下文其实是非常大的, 从项目的宏观目标一直到关键细节, 做的时间长了之后全装在脑子里, ai
自从vibe coding越来越顺利之后, 突然发现瓶颈变成了自己, 主要时间花在弄清楚自己下一步要做什么上了, 一旦想清楚, 几分钟最多半个小时就能实现, 然后又要等着自己想清楚下一步的计划. ​
4
0
7
jolestar
2026-01-01 11:54来自 微博网页版
今天元旦放假,做个小调查: AI 让你更闲了吗? 2025 年,AI 已经深度进入我们的工作和生活,写代码、写文档、做分析,效率提升非常明显。 一年前我跟一个朋友聊 AI,说它已经能帮我写程序了; 最近再聊,我说现在几乎不手写代码,全靠 AI。 他很羡慕地问我一句: “那你现在是不是很闲了?” 我 ​
5
1
202
jolestar
2025-12-30 12:41来自 微博网页版
前一段时间我摸索出了一套 AI coding 的工作流(之前这条博文里提过: http://t.cn/AX4QpZRD), 但在真正用的时候发现,并没有一个工具能非常完整地贴合这套流程,于是干脆自己顺手做了一个。 我的核心诉求其实很简单: 我已经把需求和方案写成了 issue,我希望一个工具能直接拿到这个 issue,把事 ​
65
5
71
jolestar
2025-12-23 08:25来自 iPhone 13
第二个问题我也在想办法解决,我的方案是用一个 bot 账户提交代码,这样就不是自己 review 自己了[允悲]
刚看到一篇《A Year Of Vibes》,算是一篇很有代表性的过去一年对 Vibe Coding 的总结了。 作者 Armin Ronacher 很多人可能不熟悉,但如果你接触过 Python,大概率用过他写的东西——Flask 框架,就是他十几年前的作品。 文档开头第一句话就让我很有共鸣:2025 年,我不再像以前那样写代码了。 跟他 ​
7
1
7
jolestar
2025-12-22 10:01来自 微博网页版
最近摸索出来了一套 AI Coding 工作流。 首先开一个 Agent 窗口,这个 Agent 的角色是产品经理或者架构师,负责和我聊需求与架构设计,拆分任务,最后转换成可执行的需求说明,直接写到 github issue。如果功能比较复杂,就拆分成多个子 issue。注意,这个 Agent 不做具体的任务,保证它的上下文不会 ​
116
24
137
jolestar
2025-12-20 09:07来自 iPhone 13
捐赠的背后
这两天关注南京博物院处理庞家捐赠仇英《江南春》图卷一事,想起几年前关于捐赠写过一文,贴在下面。 文物捐献的故事(陈晓维) 赵珩先生新书《逝者如斯》中《不以物喜 不以己悲——怀念朱家溍先生》一节,述及朱家捐献文物一事“可是仅据我所知,他们兄弟就分四次捐献给国家。1952年捐献碑帖七百种 ​
1
0
2
jolestar
2025-12-11 11:48来自 微博网页版
让 AI 实现一个挺复杂的特性,我没顾上持续 review,就通过 Vibe Coding 的模式,让它自己加 e2e 测试,然后让另外一个 AI 来 review 迭代反馈。最后报告非常完美,功能都实现了并且测试没有错误。 美滋滋提交 PR,让 Github Copilot review 了一下。结果发现最底层的核心逻辑它给弄了两个版本,一个 ​
35
10
32
jolestar
2025-12-10 10:46来自 微博网页版
这两天试用了一下 wegent,提了一些 issue,修了一些 bug,非常符合我的需求。 当前我同时开几个 AI Coding 工具处理任务,遇到的痛点就是多个窗口照顾不过来,某个 AI 申请权限忘记给了,然后任务进度就耽搁了。但如果设置成不需要确认的模式,又担心它万一弄错命令,“rm -rf /” 了,那就傻了,所
抽空继续写写 Wegent 项目开发过程(二)。 立项后我们决定先把原型打出来:一个能在云端同时跑多个 Claude Code 实例的后台系统。用户在网页里输入需求,服务端就会启动一个隔离的沙箱,让 agent 在里面完成开发,最后自动 PR 到 GitHub。 整个系统拆成了三部分:前端、后端、执行容器管理服务。刚 ​
3
1
7
jolestar
2025-12-06 17:45来自 微博网页版
我经常用 GPT 或 Gemini 做 Deep Research,但经常会遇到频次限制。 就在想: 能不能有一个平台,大家把自己做过的 Deep Research 分享出来, 如果别人已经调研过,我就不用再重新跑一遍了,也能知道大家最近都在关注什么。 粗算了一下: - 一次 Deep Research 的真实成本大约在 1~10 美元; - 如 ​
16
7
58
jolestar
2025-12-06 09:32来自 iPhone 13
主要一部分人已经在短跑是骑摩托了,并且无法区分,要不就都改练摩托呗//@whigzhou:斯坦福这门课或许是个好主意,可是斯坦福大概不会指望这一门课会训练出软件工程师吧 //@whigzhou:照这么说,练短跑不许骑摩托,比拳击不许拎手枪的,下象棋不许请Alpha支招的,都是反动分子咯?
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
0
0
1
jolestar
2025-12-04 23:00来自 OnePlus 8 Pro
主要不封存的时候怎么查也没规定清楚 http://t.cn/AXyxErVW //@王天定:“封存不等于删除,违法记录仍留存公安系统,对吸毒人员的动态管控、回访检测并未中断;幼师、网约车司机等关键岗位,相关单位可依国家规定查询,筑牢职业安全防线。”//@阿武看世界:这次引发社会广泛争议的一个重要原因在于,法律
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
1
0
0
jolestar
2025-12-04 13:46来自 iPhone 13
里面的人能不能理解不重要,外面的人能理解才重要。图灵测试的意思就是你无法区分这两种情况//@tertio:一直想不通这个思想实验有啥值得认真对待的,后来因为跟人争论qualia问题还读了他的一篇辩解文章,还是不明白他要表达什么“深刻”的想法。(图灵测试虽然在前,但早就封死了这种类型的质疑—到底是
美国哲学家约翰·塞尔以“中文屋”实验追问机器是否真能“理解”世界,而非仅按规则搬运符号。如今AI已能写文答问、甚至表现“反思”,却仍难脱“升级版中文屋”之疑。塞尔逝世,留下未解之问:当AI以行为反问人类——我们自诩的“理解”究竟由谁定义? http://t.cn/AXyVnaW5 ​
0
0
1
jolestar
2025-12-03 11:43来自 iPhone 13
相当于Minecraft 创造模式玩腻了,体验一下生存模式[允悲]//@tertio:没觉得哪不正常啊[偷笑]//@中立的手指:这不是神经病,是有钱人可以过任何他们想过的生活,就像比尔盖茨愿意也可以天天吃咸菜,但和我等穷屌天天吃咸菜心态肯定不一样
这不精神病吗? ​
0
0
0
jolestar
2025-12-02 22:49来自 微博网页版
治安管理违法记录封存的事吵了几天。那我们捋一下:在当前未封存的状态下,个人的违法记录能被随便查吗? 显然不能,个人违法记录不是公开信息。 用人单位也查不到,按法律规定,也只有极少数特殊行业按程序申请。 能开具的也只有《无犯罪记录证明》,其中本来就不包含治安处罚。 既然如此,很多用人 ​
3
4
5
jolestar
2025-12-02 02:14来自 微博网页版
用了 AI 后,恨不能让它持续工作,半夜起来上厕所发现 AI 干完活了,都要给它继续再分配个活,但一不小心就又折腾半宿。 后来想到一个办法,让主 Claude 启动另外一个 Claude 去干活,自己监督。折腾半天,和它一起设计了一套工作流方案,结果发现 Claude 学不会启动自己,似乎是搞不定交互式的输入。 ​
11
4
16
jolestar
2025-11-25 14:19来自 微博网页版
遇到个疑难杂症,让 AI 协助排查。Claude Opts 4.5 和 GPT 5.1 Codex Max 给的结论不一样。我就把它们的回复复制给对方让辩论。后来觉得有点麻烦,我就弄一个文档,让它们通过修改文档的方式来辩论。哪家的 AI 编程工具弄个专家会诊模式呀,可以把几个模型拉到一个聊天会话中辩论,最后给个会诊建议? ​
2
2
13
jolestar
2025-11-23 11:22来自 iPhone 13
很多是平台审核原因导致的吧,这几个词都比较敏感,用了估计会自动提高审核标准。 没有创造额外的意义空间的黑话,大多数和强制力有关系。现在的视频把“贱人”的字幕都用“小可爱”替代,估计很快小可爱就是个骂人的话了 参考语言是一种去中心化系统 http://t.cn/AXLfaHtb
在网络视频世界中,由于可以想象的原因,“酒”叫“八加一”,“死”叫“嘎了”,“钱”叫“米”,“警察”叫“帽子叔叔”,等等。 也就是说,“小明喝酒不给钱,还打死了人,被警察抓了”这样一句话在网络视频世界中就是:“小明喝八加一不给米,还嘎了人,被帽子叔叔抓了”。 其实我们早就发明过一 ​
0
3
0
jolestar
2025-11-20 17:24来自 iPhone 13
以后不叫“创作”了,可以叫做“发现”。发现了 AI 生成的一组排列组合有意思,分享给大家看看。第一个发现者享受收益权,和发现物理定律类似。
抱歉,此微博已被作者删除。查看帮助:http://t.cn/Rfd3rQV
1
1
2
jolestar
2025-11-19 15:42来自 OnePlus 8 Pro
回复@锦水飘石:现在下结论还太早,那样子基本就只会有一个大厂剩下//@锦水飘石:蜉蝣撼大树,用户侧集成基本走不通,未来是大模型厂商和已有大厂(平台)的博弈。
AI 的两条路径:云端入口竞争,还是用户侧的原生应用? 最近看到阿里发布了通义千问 App,正式卷入 C 端 App 大战。Sam Altman 以前也多次表达过对“超级应用”的执念,不断往 ChatGPT 里塞入各种类社交功能。 在大厂的叙事里,未来的 AI App 似乎注定是当前互联网超级应用的翻版——成为唯一的入口 ​
3
0
2
jolestar
2025-11-19 13:32来自 微博网页版
AI 的两条路径:云端入口竞争,还是用户侧的原生应用? 最近看到阿里发布了通义千问 App,正式卷入 C 端 App 大战。Sam Altman 以前也多次表达过对“超级应用”的执念,不断往 ChatGPT 里塞入各种类社交功能。 在大厂的叙事里,未来的 AI App 似乎注定是当前互联网超级应用的翻版——成为唯一的入口 ​
21
2
31
jolestar
2025-11-11 08:10来自 粉丝订阅
我刚刚成为了@柿油dang人文集 的V+会员,正在享受属于我的V+会员专属权益,你也来和我一起支持TA吧! http://t.cn/A6OXgOmK ​
0
0
0
jolestar
2025-10-18 12:56来自 OnePlus 8 Pro
支付宝也开始推短剧了[允悲]。国内这种啥都往一个应用里塞的模式,是应用培养了用户习惯,还是用户选择影响了应用?感觉是个值得讨论的议题。 ​
0
4
8
jolestar
2025-10-16 17:11来自 iPhone 13
武侠修仙小说类似于大脑模拟的 RPG 游戏,玩家会带入主角视角,玩家角色开挂不影响爽感。但如果是没有明确主角的小说,不同读者带入不同的角色,数值不平衡就会出问题。//@南郭刘勃://@仗剑南窗:我经常引钱锺书《管锥编》的一段话:夫院本、小说正类诸子、词赋,并属“寓言”、“假设”。既“明其为戏
该账号因被投诉违反《微博社区公约》的相关规定,现已无法查看。查看帮助 https://kefu.weibo.com/faqdetail?id=13216
0
0
1
jolestar
2025-10-10 08:29来自 iPhone 13
娃老师推荐金庸,我买了两套给娃看,自己也顺便重读了一遍,结果发现没有了当初的酣畅淋漓,娃自己也读不进去。//@有个梨GPT:金庸的文字水平不敢恭维。很多人读不下去。看看电视剧就好了。
前段时间在一所大学参加一个关于金庸的论坛。开场前,主持人问台下的学生有多少人看过金庸的小说。几百个学生,没有一位举手。那是我对代际隔离感受最深的一次经历。 ​
1
3
4
jolestar
2025-10-07 18:31来自 微博 weibo.com
我免费围观了 @幻想狂劉先生 的回答,问题价值 16.66 元,快来一起免费围观~ http://t.cn/RJepWIn ​
0
0
1
jolestar
2025-10-05 10:23来自 iPhone 13
//@王天定://@蒜泥猪头:这只是粗浅的思考。再往下思考,你会想为什么《大宪章》这张纸上写的东西能大致落实呢?一查,哦,原来国王当初签了这玩意以后也不打算认账,是各路诸侯“兵谏”(两次男爵战争)导致国王不得不认账的。再深究下去,为什么英格兰诸侯这么给力呢?因为人家是真正的封建制,各路诸
该账号因违反相关法律法规和政策,现已无法查看。查看帮助https://kefu.weibo.com/faqdetail?id=13216 ​
1
0
7
jolestar
2025-10-01 21:23来自 iPhone 13
零散看了些关于JK罗琳的争论,既然现在男性女性的概念已经被污染了,容易引起争议,不如改用凸人和凹人?这样就没歧义了。 ​
0
2
5
jolestar
2025-09-21 14:19来自 iPhone 13
中文字幕关掉看美剧,看上一年就有效果了,至少开个会听是没问题的。老友记梗太多,不合适,可以先看点别的肥皂剧啥的。
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
3
0
6
jolestar
2025-09-19 15:36来自 iPhone 13
光宗耀祖,福泽子孙则可适用于普通人。在乎身后事是人类能建立永续博弈的基础,文明的基石。//@旧常识:Life after death不一定是来世,而是泛指死后生命。评论转发里一大堆自豪的……哎。其实死后生命、因果轮回等观念,是促成渺小人类为超出此生的未来着想的最强大工具。儒家文化的类似工具是 “青史
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
8
2
4
jolestar
2025-09-14 17:12来自 iPhone 13
他如果站在自由意志主义立场和进步主义辩论这个议题是不会有问题的,但站在保守主义宗教立场,就会被人按原教旨主义反推,就吃瘪了。//@祝佳音:哎呀,这精英范儿……但可惜是对英国人,英国人还是有文化的。不知道有没有他被美国大学生这样摩擦的视频……
很多人奇怪,美国左派甚至大学生,为什么老是辩不过查理·柯克?我个人观察,因为他总是拿着《圣经》跟你辩,而美国白人还有整个国家都信教,所以跟他一辩论,要么你是异教徒,要么就得跟他比谁对《圣经》更忠诚,你一个左派其实在美国怎么辩都很难赢,约等于在一个宗教裁判所里辩论,只是不剥夺生命而 ​
1
1
2
jolestar
2025-09-14 17:05来自 iPhone 13
这两天被动看了罗永浩和西贝的各种直播片段后,才知道预制菜技术已经这么先进了?保质期都能数月上年了?那为啥超市里没有卖这种预制菜的呢?似乎也就卖熟食和快手菜,那种快手菜还得自己炒一下。如果有人做个专门的预制菜品牌,冷链直接送到用户厨房,微波炉加热的厨艺大家还是都有的,岂不是我们这种 ​
0
5
9
jolestar
2025-09-10 20:55来自 iPhone 13
鼓励到店消费其实挺好,很多人一天也就吃饭走路能运动一下[允悲]。但这个事情不是仅激励就能达成,国内的大小区模式把小饭馆和商户的生存空间都挤压掉了//@tombkeeper:我掐指一算,给老板汇报的PPT上应该谈到了借“反内卷”的政策大势,可能还提出了“做中国的米其林”。 //
【#高德地图预将发放超10亿元补贴# ,鼓励用户到店消费】财联社9月10日电,阿里巴巴旗下高德地图9月10日宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”。高德同时启动“烟火好店支持计划”,通过发放超10亿元补贴等措施,鼓励用户到店消费,希望每天能为线下餐饮及其他服务业多带去1000万客流 ​
0
0
3
jolestar
2025-09-10 17:32来自 iPhone 13
是这个道理,我们的道德,价值观,规则,都是从小共同体中逐渐演化,然后扩散出来的,主要是通过传统和习惯来承载的。那种想通过理性和逻辑推导一套权利系统,自顶向下来灌输实施的方式总会带来灾难。
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
19
0
1
jolestar
2025-09-08 16:51来自 iPhone 13
//@刘群MT-to-Death:正确的事情需要不厌其烦地反复说,使之成为共识[good][good][good]//@青枚煮菁瓜://@蹦蹦哒哒好叨叨:哇,感谢好友转发,又被我看见一名优秀且专业的博主还有他关于拼音翻译的见解!志同道合,太开心了!我相信随着我国影响力不断增强,民众和官方的自信也与时俱进,大家在对外交流
请用音译来翻译中国文化独有的词汇,以及中国人是如何用意译来抹除中国的文化身份的 作者@一只出格君 太长不看的总结 早期中国移民普遍使用音译来翻译独特的中文词汇,比如捞面(lo mein)、白菜(bokchoy)、太极(tai chi)、功夫(kung fu)等等。而中国人目前普遍用意译来翻译自己文化特有的词汇 ​
5
0
3
jolestar
2025-09-03 00:57来自 iPhone 13
按博斯特罗姆的观点,AI 的公司就不应该发股票,而应该发币,这样才能保证全球可购买流通。
#模型时代# 《超级智能》作者·博斯特罗姆:如果AI无所不能,人类的意义来源可能是“玩游戏” YouTube上的AI频道主Wes Roth做了一期比较哲学的访谈。嘉宾是在《超级智能》作者,技术哲学家尼克·博斯特罗姆(Nick Bostrom)。(出处:www.youtube.com/watch?v=EKomXwswYJ8) 大家可能对这个名字有点陌 ​
3
0
5
jolestar
2025-08-30 14:34来自 微博 HTML5 版
2009年8月28日,微博开放公测。今天,我注册微博5823天了,以微博之力,让世界更美 http://t.cn/A6V2anuY ​
0
0
2
jolestar
2025-08-28 22:19来自 iPhone 13
是这个道理,不过也是好事。这样 Vibe 下去,未来程序员岗位需求最后会不降反升,因为应用系统会越来越多。现在的 Vibe coding 很像互联网刚火那会,随便弄个建站系统搭个网站就开始运营了,等需求验证成功,流量上来了再招程序员重构优化系统。点子都没验证,就花很大力气考虑长期的维护成本确实划不
程序员和非程序员对于 Vibe Coding 态度的主要矛盾,和理解什么牛逼没什么关系,核心还是在后面产品谁来维护的事。 打个不恰当的比方:男人和女人对于生孩子的态度是完全不一样的,因为男人可能就是前期提供了精子,但是后面的怀孕生养大部分都是女人的工作。 在软件开发这件事上,非程序员就是男人 ​
30
1
11
jolestar
2025-08-27 00:45来自 OnePlus 8 Pro
让 AI 重构一个大模块,它欢快的拆出了好几个模块,搞了个新版本。然后让它集成测试,它反复测试好多次,中间模型配额限制到了,给它提升到 200刀的档位。结果最后它删了所有的新模块,然后告诉我还是用旧版本比较划得来🤣。气得我直接开骂,就在聊天框里骂。它又重新开始干了,还说感到用户很生气.. ​
22
6
32
jolestar
2025-08-21 20:31来自 iPhone 13
主要是渗透率还不行,从编程领域就能看出来。程序员群体一直不是付费应用的优良用户群,理性挑剔,开源选择比较多,宁愿自己捣鼓也不愿付费购买。但现在 AI 编程的 token 消耗占据了 AI token 消耗的大头。哪怕 AI 的水平就停留在现在,把渗透率和工具打磨好,对各行业的影响也是巨大的。
告别人工智能泡沫,准备迎接崩盘 作者:Michael Hiltzik 对于那些没有深度参与这场人工智能狂热的人来说,可能没注意到一个重要变化:一直以来,人们觉得AI正势不可挡地变得比人还聪明,甚至会威胁人类。但这种看法,在8月7日那天,被踩了个急刹车。 那天,万众瞩目的AI公司OpenAI发布了GPT-5。这款 ​
26
2
5
jolestar
2025-08-21 17:41来自 iPhone 13
如果把内容输出看作一个排列组合游戏,很多情况下某种排列组合被人记住不是因为它复杂或者难,而是它是被某个有资格的人用了,而这种资格是要许多其他更难的组合来积累出来的的。很多简单的道理不是谁都有资格讲的,很多简单的事情也不是谁都有资格做的。
以前我说过,「……墙外有两株树, 一株是枣树, 还有一株也是枣树」这句话, 如果不知道是谁写的, 那么哪怕小学老师也有可能指摘它的不足; 如果知道是谁写的, 则即便大学博导也会夸赞它的高明。 类似地, 我觉得下面这幅画作, 如果不知道是谁画的, 那么哪怕小学老师也可能会视之为涂鸦胡闹; 如 ​
1
0
5
jolestar
2025-07-22 09:42来自 iPhone 13
垂直开发,及时集成,不要贪多,最小化交付。这些对人类有用的开发经验对 AI 也有效。前一段时间也完全依赖 AI 做了一个项目,AI 平铺式开发,一层一层堆叠,最后变成了一坨,只好推倒重来。
今日工作总结: 写个新的项目,用AI写了超过95%的代码,本来一切顺利,但是想改个小功能的时候,项目崩了,所有功能都用不了的那种死透了的崩了。 然后就陷入了让AI修-崩-接着让AI修-换个方式崩的死循环里。 本来代码写出来只有作者和上帝能看懂,但是用了AI Coding以后,代码诞生的那一刻就只有上 ​
7
2
6
jolestar
2025-07-10 22:54来自 iPhone 13
可以先实现 AI 外卖点餐,应该是 AI 购物最先落地的场景:主要是个性化选择困难,客单价比较低,出错也能接受[允悲]。
三大平台年初说all in ai,现在是all in 外卖。 为什么呢? 因为waimai 包含两个ai。 ​
1
1
6
jolestar
2025-07-08 20:20来自 iPhone 13
凡事问问 AI 也不至于出这种不靠谱的调查结果 http://t.cn/A6k7QBRk
#幼儿园血铅异常因食品添加含铅颜料# 这个事情官方调查结果是“褐石培心幼儿园园长、法定代表人朱某琳,投资人李某芳,同意该园后厨人员通过网络平台购买彩绘颜料,稀释后用于部分食品制作。”调查结果的用词是“彩绘颜料”,而不是“绘画颜料”“油画颜料”“水彩颜料”等。 “彩绘颜料”通常是特指 ​
1
0
3
jolestar
2025-07-01 17:42来自 iPhone 13
我的感觉不一样,有了 AI 后才能真正释放出创造力。AI 可以帮你跳过很多底层接口细节的坑,帮你突破不熟悉的技术栈的门槛,让你自由的选择最合适的语言和框架,还可以帮你并行验证多个 Idea,真正进入创造模式。
前一条微博,转发了一名网友的高论,很有意思—— “我妈:手洗的衣服比机器洗的干净; 而我:手写的代码比AI写得好。” 感觉意犹未尽,再多说点个人感触—— “手写代码的乐趣,是使用AI高效地“自动出货”,所不能比拟的。” 前者让人感到是在创造,在实践中会不断体会到有一种“多懂一点,多会 ​
5
0
17
jolestar
2025-06-24 07:16来自 iPhone 13
还是要做设计的,不然 AI 到后面就忘记自己要干啥了。我一般是先说明需求,让 AI 提解决方案并生成设计文档。基于文档和 AI 讨论。最后执行。
昨天这篇先设计再提示词然后生成代码 http://t.cn/A6DUvYZl 是针对 Claude Code 写的,其实并不只是适用于 Claude Code,重写了一篇: 先设计再写代码,还是先实现再重构?AI 编程让这种选择变的简单 在传统手工编程时代,经常会有争论:先把各种细节设计清楚再动手写代码?还是先实现,实现后再回过 ​
2
0
4
jolestar
2025-03-14 15:22来自 OnePlus 8 Pro
让一个 AI 写代码,然后让另外一个 AI 去测试,这样可能才放心一些😅
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
15
0
6
jolestar
2025-02-24 07:58来自 iPhone 13
做开放式 AI Agent 就遇到这个问题,Agent 的记忆很容易受到污染,做出的决策也会有问题。得让 AI 自己建立一套判断和验证方法,理解“人心险恶”[允悲]
目前LLM将训练期和工作期分开的做法,是完全可以理解的,离开良好控制的训练数据集,在开放环境中模型很容易学坏,因为反馈的质量会很差,而如何在面对大量劣质反馈时稳住阵脚的问题,恐怕还远没有解决, 基于类似的道理,动物的学习窗口也不是无限期开放的,有些窗口很早就关闭了,最著名的一类例子 ​
5
0
4
jolestar
2025-02-15 15:15来自 OnePlus 8 Pro
问了 Deepseek 一个问题,Deepseek 开始胡说八道了😅,不知道触发了什么机制。难道说它真的有自我意识了,开始装疯卖傻? ​
1
2
2
没有更多微博了