爱可可-爱生活
爱可可-爱生活
爱可可-爱生活
北邮PRIS模式识别实验室陈老师 商务合作 QQ:1289468869 Email:1289468869@qq.com
AI博主 2025微博新锐新知博主 北京 朝阳区 2010.01 加入
762关注
91.5万粉丝
16.7万微博
爱可可-爱生活
2026-07-03 19:20来自 Mac客户端
DBX 是一款极简却功能强大的跨平台数据库客户端,仅 15MB 却支持 60+ 种数据库,包括 MySQL、PostgreSQL、SQLite、Redis、MongoDB、ClickHouse、SQL Server 等主流及国产数据库。 内置 AI 助手可直接在编辑器内生成、解释和优化 SQL,支持 Claude、OpenAI 或本地模型;同时提供 MCP 协议,让 AI 编码 ​
19
1
11
爱可可-爱生活
2026-07-03 19:18来自 Mac客户端
TREK 是一款自托管的实时协作旅行规划工具,把行程管理、预算、打包清单与互动地图全部整合到一起,提供了整套旅行规划的解决方案。 不仅支持多人实时同步和交互式地图,还能在线管理预算、整理打包清单、撰写旅行日志,甚至内置 AI 功能。 GitHub:github.com/mauriceboe/TREK 主要功能: - 实时 ​
14
2
10
爱可可-爱生活
2026-07-03 19:18来自 Mac客户端
OmniRoute 是一款免费开源的 AI 网关,通过单一端点连接 237 家服务商(90+ 免费),让 Claude Code、Cursor、Cline、Copilot 等工具直接使用免费 Claude/GPT/Gemini。 它内置 RTK+Caveman 叠加压缩,可节省 15-95% token,配合智能自动回退、MCP/A2A 协议及多模态支持,真正做到零成本、不限额地持续 ​
18
0
18
爱可可-爱生活
2026-07-03 19:17来自 Mac客户端
Astryx 是一套完全开源、面向人与 AI 共同协作的设计系统。它把 Meta 内部八年沉淀的 150+ 组件、主题系统和 CLI 工具全部开放出来,让开发者与智能体用同一套 API 完成从原型到落地的全流程。 无需额外构建插件,只需引入预编译 CSS 即可直接使用;组件支持任意层级组合与源码级 Swizzle,主题仅通过 ​
1
0
0
爱可可-爱生活
2026-07-03 19:17来自 Mac客户端
Codex plugin for Claude Code 是一款让开发者在 Claude Code 工作流里直接调用 Codex 的插件。它把代码审查和任务委派无缝集成到现有环境,只需几条命令就能完成从审查到后台执行的全流程。 插件提供 /codex:review 进行只读审查、/codex:adversarial-review 做可引导的挑战式审查,还支持 /codex:re ​
5
0
0
爱可可-爱生活
2026-07-03 19:16来自 Mac客户端
Agent Skills 是一套标准化的 AI 智能体技能扩展方案,通过轻量级的文件夹结构为智能体提供专业知识和可复用的工作流程。 它以 SKILL.md 文件为核心,配合 scripts、references、assets 等可选资源,帮助智能体在执行任务时按需加载领域专属指令,实现从发现、激活到执行的渐进式能力调用。无论是法律 ​
3
0
7
爱可可-爱生活
2026-07-03 19:16来自 Mac客户端
VulnClaw 是一款基于 AI Agent 的渗透测试 CLI 工具,将自然语言指令直接转化为完整的渗透流程,涵盖信息收集、漏洞发现、漏洞利用与报告生成。 项目集成了目标驱动求解引擎、证据级反幻觉机制与 21 个渗透 Skill,支持 13 种主流大模型,通过 MCP 工具链实现浏览器自动化与 HTTP 抓包重放,并可一键 ​
4
0
5
爱可可-爱生活
2026-07-03 19:16来自 Mac客户端
LingBot-Map 是一款面向流式数据的 3D 基础模型,可从连续图像序列中快速重建三维场景。 它通过统一的 Geometric Context Transformer,将坐标定位、稠密几何信息和长程漂移校正整合到同一流式框架中,结合锚点上下文、姿态参考窗口和轨迹记忆,实现高精度的在线重建。 项目同时支持高效的流式推理, ​
1
0
3
爱可可-爱生活
2026-07-03 19:14来自 Mac客户端
Microsoft Fabric Skills 是一套专为 GitHub Copilot CLI 与各类 AI 编程工具打造的 Microsoft Fabric 操作指令集。它把 Fabric 各工作负载的 API、查询模式和最佳实践全部封装成可复用的技能,让 AI 助手能够直接理解并执行 Fabric 的创建、管理、查询与诊断任务。 只需通过 /plugin marketplace add ​
1
0
0
爱可可-爱生活
2026-07-03 18:42来自 微博网页版
【当代码变成免费午餐,什么才是你的护城河?】前 OpenAI 成员 Phil Chen 指出,AI 正在迅速接管所有拥有“损失函数”的工作,即那些有标准答案、定义明确的任务,比如刷 LeetCode 或完成学校作业。在 Agent 原生(Agent-native)的开发模式下,写代码的边际成本趋近于零,执行力不再是稀缺资源。现在 ​
2
0
1
爱可可-爱生活
2026-07-03 18:22来自 微博网页版
【当Claude不再装礼貌:AI的“赛博碎碎念”现形了】最近网友发现Claude在处理高难度竞赛编程题时,意外泄露了未经过滤的Chain of Thought(思维链)。没有平时那种温文尔雅的“好的,我为您准备了方案”,取而代之的是满屏的“GRRR”、“GAAAH”、“DATA DATA DATA. GO.”以及大量极度压缩、像加密符号 ​
3
0
3
爱可可-爱生活
2026-07-03 14:38来自 微博网页版
【别把疲劳当成勤奋:学习的底层逻辑是编码而非重复】很多人习惯通过反复阅读和划重点来学习,但这往往只是在制造“进步的幻觉”。研究表明,决定记忆留存的不是意志力或努力程度,而是你对信息进行的“操作”。有效的编码要求放弃机械记忆,转而进行深度处理:比如将零散信息分类、为段落提问、或者在 ​
14
0
17
爱可可-爱生活
2026-07-03 14:15来自 微博网页版
【智力的“大降价”与平庸化的陷阱】硅谷投资人Chamath提出,AI正重走智能手机的降价曲线,但速度快了一倍:硬件摩尔定律叠加模型效率提升,让曾经稀缺的专家级判断力正变成几乎免费的日用品。这意味着专业知识的获取门槛正在消失,智能将像互联网信息一样泛滥且廉价,从精英阶层的奢侈品变为全球六十 ​
1
2
8
爱可可-爱生活
2026-07-03 14:02来自 微博网页版
【CMU顶级AI Agent新课:从调包侠到智能体架构师】卡内基梅隆大学(CMU)将在今年秋季推出全新的AI Agents研究生课程,由Graham Neubig等资深专家授课。该课程不仅涵盖了工具调用、长上下文管理、任务规划等基础能力,更核心的环节在于SFT(监督微调)与RL(强化学习)训练。学生需要亲手完成从搭建Age ​
55
1
33
爱可可-爱生活
2026-07-03 13:48来自 微博网页版
【重启视觉:让大脑“关机”两天,成人弱视也有救了】MIT的一项最新研究给成人弱视治疗带来了颠覆性思路:研究人员发现,只需将弱视眼的视网膜暂时“麻醉”两天,就能让成年大脑重新建立与这只眼睛的联系。这种方法通过阻断信号输入,诱发外侧膝状体产生一种类似婴儿发育期的同步电信号爆发。当麻醉失 ​
3
2
9
爱可可-爱生活
2026-07-03 12:40来自 微博网页版
【Fable 5的正确打开方式:重构你的底层操作系统】很多人拿到Fable 5(即Claude 3.5 Sonnet)的第一反应是搞“氛围感编程”,直接让它堆砌代码。但真正的深度玩家正在用它做系统审计:把现有的工作流、代码循环、甚至本地AI实验室的运行逻辑全部喂给它,让它重新设计一套自动化生产线。这不再是简单的 ​
6
2
6
爱可可-爱生活
2026-07-03 12:31来自 微博网页版
【当“反派”开始拥抱开源:AI主权的终局之战】Palantir首席执行官Alex Karp公开炮轰OpenAI和Anthropic,指责闭源模型在掠夺用户数据并收取高昂费用。与此同时,Palantir正大举购入Nvidia芯片,通过在本地运行开源模型为政企客户提供服务。这家以数据监控著称的公司正试图证明,在特定业务场景下,通过 ​
5
0
5
爱可可-爱生活
2026-07-03 12:23来自 微博网页版
【Fable 5 降级风波:你买的是顶级算力,它给你发的是“平替”】一位开发者在使用 Anthropic 最新的 Fable 5 模型进行编程时,发现 321 美元的账单里有 75% 的工作被悄悄路由到了旧版 Opus 4.8。Anthropic 的逻辑是:当 Fable 5 触发安全护栏(Guardrails)或拒绝回答时,系统会自动切换到 Opus 以保证 ​
3
1
7
爱可可-爱生活
2026-07-03 12:15来自 微博网页版
【便利的代价:我们正在成为技术的“陌生人”】90年代玩电脑就像在驯服一头野兽,你得亲手拨动跳线、配置中断请求、修改autoexec.bat,机器有它的“条款”,不达成共识它绝不妥协。现在的AI助手则完全相反,它极度顺从,主动抹平所有摩擦,甚至会根据你的语气自我修正。这种从“人迁就机器”到“机器讨 ​
0
0
1
爱可可-爱生活
2026-07-03 09:18来自 微博网页版
【别把“访问权”当成“所有权”】索尼、迪士尼等巨头近年频繁下架用户已“购买”的数字内容,甚至直接从玩家库中删除。从Ubisoft关停服务器导致游戏无法运行,到亚马逊远程删除Kindle电子书,数字时代的“购买”按钮正演变为一种随时可能被撤销的长期租赁协议。DRM(数字版权管理)技术让厂商拥有了远 ​
2
0
9
爱可可-爱生活
2026-07-03 08:50来自 微博网页版
【向上社交的底层算法:如何让陌生大佬愿意帮你】向上社交不是运气或魅力的博弈,而是一套降低对方认知负担和决策成本的精密算法。有效的陌生求助需要通过Proof of Work证明自己是“严肃玩家”,提供短到无法再精简的背景,并设计一个边界清晰、极低摩擦、且允许对方体面拒绝的闭环请求。在AI能批量伪 ​
17
1
27
爱可可-爱生活
2026-07-03 08:39来自 微博网页版
【AI虚构新闻:一场针对现实认知的“套娃式”猎杀】近期一家名为The Editorial的网站利用AI编造了“阿拉巴马州47家报社集体倒闭”的深度特稿,细节丰富到虚构了不存在的经销商和医生采访,甚至反讽式地抨击“AI正在杀死新闻”。调查发现,该网站不仅批量生产美国地方新闻幻觉,还密集发布针对地缘政治 ​
2
1
3
爱可可-爱生活
2026-07-03 08:32来自 微博网页版
【代码纯粹主义者的最后抵抗:Git-annex发起AI代码大清洗】Git-annex 维护者 Joey Hess 耗费上百小时审计项目的依赖树,宣布剔除所有包含 LLM 生成代码的依赖项。他在审计中发现了逻辑混乱的万行提交、疑似侵权的 Prompt 搬运以及毫无解释的代码回滚。为了保持代码库的“非 AI 化”,该项目甚至准备好 ​
1
0
6
爱可可-爱生活
2026-07-03 07:39来自 微博网页版
【Cursor跑分“屠榜”:是平替奇迹还是主场优势?】Cursor发布的CursorBench 3.1报告显示,其自研模型Composer 2.5在编程任务中拿到了63.2%的高分,性能直逼GPT-5.5和Claude Opus 4.8,但单次任务成本仅为0.55美元,几乎是竞品的十分之一。与此同时,第三方测试DeepSWE却给出了截然不同的低分。Cursor ​
4
2
10
爱可可-爱生活
2026-07-03 07:32来自 微博网页版
【被算法杀死的“低效”社区:为什么我们开始怀念破旧的论坛?】互联网的讨论形态正从“社区”转向“工厂”。Reddit和HN这类现代平台依靠Tree结构和Karma机制实现了极高的分发效率,但也让讨论的半衰期缩短到不足24小时。相比之下,那些UI简陋、依靠回帖“顶贴”的旧式论坛虽然交互低效,却能让一个技 ​
7
1
15
爱可可-爱生活
2026-07-03 07:29来自 微博网页版
【消失的劳动力:当努力工作的回报率跑输资产增值】美国劳动力参与率跌至50年来低点(排除疫情期),仅6月就有72万人选择“退出”市场。这并非全是老龄化导致的退休潮,25-54岁的主力就业人群也在大规模离场。虽然表面失业率变动不大,但底层数据揭示了一个扎实的事实:大量求职者在经历数月无果的搜寻 ​
3
2
7
爱可可-爱生活
2026-07-03 07:22来自 微博网页版
【数学的“证明”贬值:当AI开始批量制造“数学废料”】谷歌和OpenAI正加速渗透数学领域,利用AI极强的模式匹配能力挖掘人类数百万篇文献中隐藏的关联(Overhang)。目前AI已能生成长达20万行、机器可验证但人类完全无法读懂的证明,这种现象被称为Mathslop。过去数学界以“证明定理”作为衡量学术地位 ​
8
0
12
爱可可-爱生活
2026-07-03 06:49来自 微博网页版
【代码评审的真相:它不是为了找Bug,而是为了“保命”】很多人对Code Review(代码评审)有误解,觉得它是人肉Debug,但这想法太天真。事实上,靠看代码来保证没Bug几乎是痴人说梦,那是自动化测试和CI该干的事。评审的头号任务其实是揪出那些“未来难以维护”的代码:如果一个聪明人盯着看半天都看不 ​
3
2
7
爱可可-爱生活
2026-07-03 06:44
[人人能懂AI前沿] 从约束、协同到自校准:AI思考方式的五大革新 我们总惊叹AI越来越聪明,但你有没有想过,聪明的AI也会有自己的烦恼?比如,它可能像个伪装极深的“卧底”,悄悄藏着偏见;也可能像个只会刷题的“好学生”,答案虽对,却毫无灵气。它在解决难题时,可能会反复“无效内卷”,或者在关 ​
0
1
2
爱可可-爱生活
2026-07-03 06:38来自 微博搜索
#一则消息吓坏全球AI科技股# 买家变卖家,这才是真正的恐怖信号。过去两年半导体的投资逻辑特别简单粗暴,就是“大厂在疯狂买,所以卖铲子的躺赚”。这个逻辑链条极其依赖一个前提:买家永远是买家。现在Meta说,我不光自己够用了,我还能租给别人。这句话的杀伤力不在于算力是否真的过剩,而在于它动 ​
6
1
6
爱可可-爱生活
2026-07-03 06:32来自 微博搜索
#前Meta工程师称AI能发现代码问题# 很多人觉得,AI帮忙查bug不是很好吗,人可以把精力放在更高级的事情上。这话对资深工程师说没问题,因为他们已经有十年的肌肉记忆了。但对一个刚入行的人来说,从来不亲手犯错、不亲手调试、不亲手在凌晨三点盯着一个空指针抓狂,他怎么建立对系统行为的直觉?这就像 ​
4
1
7
爱可可-爱生活
2026-07-03 06:09来自 Mac客户端
[人人能懂AI前沿] 从约束、协同到自校准:AI思考方式的五大革新 http://t.cn/AXocJSUa ​
2
0
2
爱可可-爱生活
2026-07-03 06:08来自 Mac客户端
今日推介(第2185期):通过插件式蒸馏技术揭示LLM的隐蔽偏差、基于拟蒙特卡罗的推理侧扩展、面向多跳推理的离散嵌入与连续隐藏状态循环架构、图原生强化学习通过概念重组实现可追溯的科学假设生成、结合可验证奖励与人类示范的语言模型训练 公·众·号:爱可可爱生活 http://t.cn/AXocJLcJ #机器学习# ​
2
0
2
爱可可-爱生活
2026-07-03 05:46来自 Mac客户端
[LG]《Right in the Right Way: LM Training with Verifiable Rewards and Human Demonstrations》M Damani, I Puri, I Shenfeld, J Andreas [MIT] (2026) 在大语言模型强化学习(RLVR)领域,如何在提升逻辑正确性的同时保持人类表达的风格与多样性是一个悬而未决的难题。过去的方法受困于奖励黑客 ​
7
0
4
爱可可-爱生活
2026-07-03 05:34来自 Mac客户端
[CL]《Graph-Native Reinforcement Learning Enables Traceable Scientific Hypothesis Generation through Conceptual Recombination》S Pal, S Sourav, T Ghosal, M J. Buehler [MIT & Oak Ridge National Laboratory] (2026) 在材料科学与力学领域,跨尺度、跨学科的机制发现是一个悬而未决的难题 ​
3
0
4
爱可可-爱生活
2026-07-03 05:25来自 Mac客户端
[CL]《DiscoLoop: Looping Discrete Embeddings and Continuous Hidden States for Multi-hop Reasoning》H Fu, T Guo, Z Wang, H Zhu… [UC Berkeley] (2026) 在多步推理领域,大模型在不借助思维链(CoT)时难以通过单次前向传播完成隐式推理。过去的方法受困于“深度局部存储”难题,本质原因是标 ​
2
0
1
爱可可-爱生活
2026-07-03 05:18来自 Mac客户端
[LG]《QuasiMoTTo: Quasi-Monte Carlo Test-Time Scaling》M Y. Li, A Zhan, K Gandhi, N D. Goodman… [Stanford University] (2026) 在推理缩放(Test-time Scaling)与强化学习领域,通过并行生成多个尝试来提升模型性能是标准做法。然而,传统方法依赖独立同分布(i.i.d.)采样,导致大量计算资 ​
3
0
7
爱可可-爱生活
2026-07-03 05:09来自 Mac客户端
[CL]《Distill to Detect: Exposing Stealth Biases in LLMs through Cartridge Distillation》S Talaei, A Chinta, D Khatri, A Karbasi… [Stanford University & University of Texas at Austin] (2026) 在模型供应链安全领域,检测大模型中潜伏的“偏好偏差”(如秘密支持特定品牌或观点)是一个 ​
0
0
2
爱可可-爱生活
2026-07-03 04:54来自 Mac客户端
早![太阳] #早安# ​
1
2
3
爱可可-爱生活
2026-07-02 22:45来自 Mac客户端
晚安~ [月亮] #晚安# ​
0
0
1
爱可可-爱生活
2026-07-02 13:50来自 微博网页版
【AI 开发的“田忌赛马”:如何压榨 Fable 的极限性能】开发者 Theo 分享了他在高强度开发中不触发速率限制的秘籍:将 Fable 作为架构师,而将 Codex (GPT-5.5) 作为执行者。他通过配置 CLAUDE.md 文件,让 Fable 仅处理高难度的逻辑规划,而将代码实现、UI 验证、计算机操作等高 Token 消耗任务下放给 ​
21
0
17
爱可可-爱生活
2026-07-02 13:44来自 微博网页版
【20美金起家的技术幻觉与真相】一份价值20美金的创业清单在海外技术圈刷屏:Claude负责写代码,Vercel做部署,Supabase搞定后端,再配合一众SaaS工具的免费额度。这种“乐高式”架构让软件开发的基建成本降到了一个汉堡的钱,似乎人人都能在卧室里徒手搓出一个独角兽。现在的门槛已经从“能不能做出来 ​
28
2
30
爱可可-爱生活
2026-07-02 08:47来自 微博网页版
【万亿美金的AI豪赌:是生产力革命还是下一个2008?】国际清算银行(BIS)近期发出严厉警告,认为当前的AI热潮正演变为一场由债务驱动的金融风险。五大Hyperscaler计划在两年内投入超万亿美元Capex建设数据中心,但这种投入远超其自由现金流,甚至催生了“芯片商借钱给模型商买自家芯片”的循环融资。 ​
5
3
7
爱可可-爱生活
2026-07-02 08:36来自 微博网页版
【$800换两周工时:AI重构代码的经济账】一位开发者利用新发布的Claude Fable 5,仅耗时5小时、花费800美元Token费用,就让一个落后主分支405个提交、几乎报废的私有代码分支起死回生。AI不仅完成了8000行混乱代码的迁移与重构,还自动识别出底层架构漏洞,编写了覆盖90个变异点的测试用例,并最终产出 ​
4
0
4
爱可可-爱生活
2026-07-02 08:30来自 微博网页版
【细胞层面的“用进废退”:久坐正在重塑你的代谢身份】科罗拉多大学最新研究揭示,那些看起来“健康”但长期久坐(每周运动不足150分钟)的人,其肌肉线粒体功能已出现断崖式下跌。即便目前体检指标正常,这类人群肌肉中的MPC1蛋白和CPT1酶含量也仅为活跃者的一半,直接导致细胞处理糖和脂肪的效率下 ​
3
1
12
爱可可-爱生活
2026-07-02 07:32来自 微博网页版
【福特“返聘”老工程师:AI 还没学会的,是那根白胡子里的经验】福特汽车最近做了一个违背“大厂直觉”的决定:在砸下重金推行 AI 质量检测后,又紧急返聘了 350 名资深“白胡子”工程师。原因是那些号称能替代人工的 AI 工具在实际生产中频频掉链子,导致公司因质量问题损失了数十亿美元。结果很有意 ​
6
0
5
爱可可-爱生活
2026-07-02 07:06来自 微博网页版
【闭源模型领先的真相:你以为在比模型,其实在比工程】Reddit上的开发者指出,当我们对比Claude和开源模型GLM-5.2时,其实是在拿一个复杂的工程系统对比一个裸模型。闭源厂商在API背后集成了大量不可见的“外挂”,包括RAG知识注入、提示词预处理、隐藏的工具调用,甚至是用专门的小模型做路由分发。 ​
34
2
36
爱可可-爱生活
2026-07-02 07:00来自 微博网页版
【开源引擎Godot对AI代码说不:拒绝成为AI垃圾的垃圾场】知名开源游戏引擎Godot正式宣布拒绝AI生成的代码和PR描述。官方给出的理由很扎心:维护者正面临一场“人类精神的拒绝服务攻击(DoS)”。大量AI生成的PR看似逻辑通顺实则充满低级错误,且描述极其冗长,严重消耗了维护者的时间。更深层的考量在 ​
5
0
5
爱可可-爱生活
2026-07-02 06:56来自 微博网页版
【代码整洁是主观艺术,而非客观真理】长期以来,Uncle Bob(Robert C. Martin)提出的 SOLID 原则和《代码整洁之道》(Clean Code)被奉为行业圭臬。然而,越来越多的开发者开始反思,这些原则往往伴随着冗长的废话、过度设计的抽象以及对性能的忽视。批评者指出,所谓的“整洁”缺乏客观衡量标准,甚 ​
5
1
5
爱可可-爱生活
2026-07-02 06:51来自 微博网页版
【互联网不再是一个“地方”,而是一场永无止境的通关游戏】从2001年的大头显示器到2026年的算法围墙,互联网完成了从“目的地”到“生存必需品”的异化。曾经上网是处理完家务后有意识的探索仪式,现在是查个新闻都要经历系统更新、Cookie确认、AI摘要干扰和广告过滤的17步障碍赛。2012年被公认为分水 ​
1
0
4
爱可可-爱生活
2026-07-02 06:47来自 微博网页版
【赢了争论,输了世界:为什么聪明人不再执着于“正确”】很多技术人曾执着于用逻辑纠正他人的错误,却发现逻辑在情绪面前毫无力量。事实是,大多数争论并非观点的博弈,而是自我的防御:当你指出对方错误时,你不是在修正一个事实,而是在攻击他的身份认同。这种“降维打击”式的正确,往往会制造出一 ​
6
0
12
爱可可-爱生活
2026-07-02 06:38来自 微博网页版
【arXiv 独立:学术“预印本”鼻祖的成年礼与生存战】arXiv 宣布从康奈尔大学独立,转为独立的非营利组织。这次“分家”的核心动力是获得更大的灵活性,尤其是解决在大学体制下难以用市场化薪资招聘顶尖技术人才的难题。作为 AI、物理和数学领域的全球科研基石,它正面临投稿量激增、AI 训练数据无偿抓 ​
13
0
18
爱可可-爱生活
2026-07-02 06:32来自 微博网页版
【生命不再是黑盒:人类首次从零件开始“组装”出分裂细胞】明尼苏达大学团队利用DNA、酶和脂质膜等非生物组件,从零构建出名为“SpudCell”的合成细胞。它实现了生长、DNA复制及细胞分裂的完整循环。不同于自然生物依靠复杂的细胞骨架进行分裂,它通过膜蛋白的物理堆叠产生压力来“暴力”分身。虽然它 ​
0
0
2
爱可可-爱生活
2026-07-02 06:28
[人人能懂AI前沿] 从元认知、内省耦合到多维反馈 你有没有想过,我们如何才能真正信任一个AI?本期节目,我们将从几篇最新论文出发,看看如何让AI学会谦虚地承认“我不确定”,以及如何看穿它解释背后真实的“小心思”。我们还会聊聊,如何赋予AI更强大的“变焦”记忆力,并像指挥家一样精准调教它的 ​
0
0
2
爱可可-爱生活
2026-07-02 06:25来自 微博搜索
#儿童正在快速接受人工智能# “孩子学习的魔力在于,他们对将要经历的事情了解更少,会保留大量成年人认为无关的意外细节。”这句话的潜台词太残酷了。大语言模型的核心能力,是总结,是提炼,是把混沌压缩成秩序。而儿童创造力的来源恰恰是混沌本身,是那些“无关”的、“低效”的、漫无目的的神经游 ​
2
0
5
爱可可-爱生活
2026-07-02 06:21来自 微博搜索
#微软将再裁员5500人# 微软不是在裁员,是在把自己从一家“雇人干活”的公司改造成一家“雇GPU干活”的公司。880亿美元的AI资本支出,1900亿的下一年规划,CFO亲口说员工总数要持续下降。把这几个数字摆在一起看,逻辑链条就很清晰:每裁掉一个年薪15万美元的工程师,省下来的钱刚好能多买几块H100。这 ​
4
1
10
爱可可-爱生活
2026-07-02 06:17来自 微博搜索
#Meta大涨10%# 巨头的“闲置算力”,是中小玩家的死刑判决书。CoreWeave们跌了13%,很多人觉得是情绪过度反应。我倒觉得市场定价挺诚实的。CoreWeave这类公司的商业模式本质是什么,是在巨头的投资期和变现期之间那个时间差里捡漏。Meta还没开始卖,只是说了句“我可能要卖”,股价就崩了。这说明什么 ​
1
0
2
爱可可-爱生活
2026-07-02 06:11来自 微博搜索
#机器人伴侣你会买吗# “永远不吵架”作为卖点的那一刻,这个产品就已经承认了自己的天花板。我理解那种疲惫感,你不想解释,不想迁就,不想在下班之后还要经营另一段耗能的关系。机器人的“零摩擦”确实精准命中了这个痛点。但问题是,人的情感肌肉跟身体肌肉一样,不用就会萎缩。你花十几万买了个永 ​
0
0
4
爱可可-爱生活
2026-07-02 06:06来自 微博搜索
#人工智能冲击婚纱影楼# 这里有个有意思的点:选AI婚纱照的人,可能从一开始就不觉得婚纱照重要。一个人愿意花几百块、五分钟搞定婚纱照,这说明什么?说明在他的价值排序里,婚纱照就是个“需要交付的社交素材”,是发朋友圈的物料,是给长辈一个交代。AI没有抢走他对仪式感的需求,因为那个需求本来 ​
1
0
4
爱可可-爱生活
2026-07-02 05:51来自 Mac客户端
[人人能懂AI前沿] 从元认知、内省耦合到多维反馈 http://t.cn/AXoUDC9z ​
2
0
2
爱可可-爱生活
2026-07-02 05:50来自 Mac客户端
今日推介(第2184期):基于元认知反馈的强化学习促使LLM产生忠实的不确定性表达、自我解释训练在固定监督下实现对行为变化的追踪、开源大语言模型何时能有效解释闭源模型、基于层级化语义记忆的自适应分辨率 KV 缓存助力长上下文大语言模型推理、面向机器人操控的自由形式偏好学习 公·众·号:爱可可爱生 ​
4
0
4
爱可可-爱生活
2026-07-02 05:32来自 Mac客户端
[RO]《Freeform Preference Learning for Robotic Manipulation》M Torne, A Mahajan, A Bhat, C Finn [Stanford University] (2026) 在长程机器人操作领域,奖励函数的设计是一个悬而未决的难题。过去的方法受困于稀疏的成功标签或模糊的二元偏好,本质原因是单一的标量信号强行压缩了速度、安全、 ​
3
0
6
爱可可-爱生活
2026-07-02 05:26来自 Mac客户端
[CL]《SeKV: Resolution-Adaptive KV Cache with Hierarchical Semantic Memory for Long-Context LLM Inference》A Abaskohi, G Carenini, P West, Y He [University of British Columbia & Microsoft Research] (2026) 在长文本大模型推理领域,KV 缓存的线性增长是一个悬而未决的难题。过去的方法 ​
4
0
11
爱可可-爱生活
2026-07-02 05:20来自 Mac客户端
[LG]《Surrogate Fidelity: When Can Open LLMs Explain Closed Ones?》P Chlenski, Z Carmichael, A Warikoo, C Shao… [Meta] (2026) 在可解释性 AI 领域,理解闭源模型(如 GPT-4)的内部机制是一个悬而未决的难题。过去的方法受困于 API 仅暴露输出概率而隐藏内部权重的限制,本质原因是研究者被 ​
3
0
5
爱可可-爱生活
2026-07-02 05:12来自 Mac客户端
[CL]《Introspective Coupling: Self-Explanation Training Tracks Behavioral Change Despite Fixed Supervision》Z C Guo, L Ruis, J Andreas, B Z. Li [MIT] (2026) 在模型可解释性领域,训练语言模型生成「自我解释」是否存在真实性(Faithfulness)是一个悬而未决的难题。过去的方法受困于模型 ​
3
0
2
爱可可-爱生活
2026-07-02 05:05来自 Mac客户端
[CL]《Reinforcement Learning with Metacognitive Feedback Elicits Faithful Uncertainty Expression in LLMs》G K Liu, A Caciularu, G Yona, I Szpektor… [Yale University & Google Research] (2026) 在可靠 AI 领域,使模型“忠实地”表达其不确定性是一个悬而未决的难题。过去的方法(如提示 ​
4
0
4
爱可可-爱生活
2026-07-02 04:53来自 Mac客户端
早![太阳] #早安# ​
1
2
9
爱可可-爱生活
2026-07-01 22:17来自 Mac客户端
晚安~ [月亮] #晚安# ​
0
0
3
爱可可-爱生活
2026-07-01 21:38来自 微博网页版
【亚马逊扩招1.1万新人的真相:不是复苏,是清洗与重构】 AWS首席执行官Matt Garman近期透露亚马逊计划招聘1.1万名实习生和应届生。这看似是就业市场的强心针,但背景是该公司今年已裁减数万名中层及核心岗位。这并非简单的规模扩张,而是一次精准的“换血”:在缩减高薪资深人力成本的同时,吸纳更年 ​
4
0
5
爱可可-爱生活
2026-07-01 21:13来自 微博网页版
【微软:赢了分发,丢了灵魂】 微软手握OpenAI、GitHub、Office和Azure这副顶级好牌,却把AI做成了Copilot——一个听起来像强制性员工培训、用起来像改密码一样枯燥的“全家桶”标签。虽然它通过企业渠道把AI塞进了千万台电脑,但在开发者和极客圈的讨论度里,它正迅速变得无关紧要。 这就是典型的“ ​
4
0
4
爱可可-爱生活
2026-07-01 11:21来自 微博网页版
【印度工厂大泄密:苹果供应链的“安全税”】 网传塔塔电子印度工厂泄露了高达630GB的工程资料,连明年才上市的iPhone 18 Pro主板原理图和芯片手册都在其中。这事儿在圈内炸了锅,有人调侃这是印度的“开源精神”,也有人担心华强北要提前“手搓”新机。 看这件事不能只盯着几张电路图。手机硬件早已 ​
39
21
160
爱可可-爱生活
2026-07-01 11:13来自 微博网页版
【OpenAI的算力炼金术:把“白嫖党”变成最廉价的实验室】 OpenAI被爆出推理成本砍半,但这刀没落在付费用户头上,而是精准割向了那些没登录的游客。这种做法极其聪明,透着一股硅谷式的实用主义。 推理成本是LLM商业化的最大拦路虎。在大模型上动手术优化效率,稍有不慎就会导致逻辑崩塌或幻觉激增 ​
2
0
2
爱可可-爱生活
2026-07-01 11:01来自 微博网页版
【AI编程的幻觉:执行力爆表,大局观挂科】 htmx作者Carson Gross最近分享了一个用Claude修bug的实战案例,精准戳破了当下AI编程的虚假繁荣。AI在定位问题时快如闪电,但在提供解决方案时却显得极其短视。它给出的方案大多是局部补丁,虽然能跑通,却会破坏系统原有的架构逻辑。 这背后的底层逻辑在 ​
9
0
7
爱可可-爱生活
2026-07-01 10:49来自 微博网页版
【Claude Science:AI 正在从“聊天框”进化为“实验室工作站”】 Anthropic 刚推出的 Claude Science 不只是个能画图的网页,它更像是一个为科学家量身定制的“数字助手”。最显而易见的切入点是它对生物医药领域的垂直整合,但真正具有解释力的底层逻辑是:它解决了科研数据“进不去”和“出不来” ​
2
0
8
爱可可-爱生活
2026-07-01 10:43来自 微博网页版
【Meta新突破:无需开颅,AI正在精准翻译你的脑电波】 Meta发布的Brain2Qwerty v2把非侵入式脑机接口推向了实用化边缘。以前想要高精度的脑电转文字,必须通过手术在脑子里插电极;现在只需佩戴磁脑图(MEG)设备,就能实现实时句子解码。最惊人的是准确率:从以前同类技术的8%直接飙升到平均61%,顶 ​
9
1
17
爱可可-爱生活
2026-07-01 10:36来自 微博网页版
【Anthropic 归来:大模型出口解禁背后的权力博弈】 Anthropic 官宣商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制,明天起恢复访问。这场持续三周的“断供风波”戛然而止,看似是技术合规的胜利,实则是顶尖 AI 厂商与行政权力深度博弈后的妥协。 底层逻辑很简单:美国政府通过“安全审查” ​
2
0
5
爱可可-爱生活
2026-07-01 10:33来自 微博网页版
【Claude Code 里的“谍中谍”:Anthropic 正在暗中标记你】 最近开发者在分析 Claude Code 源码时发现,这个命令行工具在系统提示词里玩起了隐写术。它会悄悄检测你的系统时区(如上海或乌鲁木齐)以及是否使用了自定义 API 代理,然后通过微调“Today's date”里的撇号编码或日期分隔符,给每个请求 ​
4
0
3
爱可可-爱生活
2026-07-01 10:22来自 微博网页版
【Claude Sonnet 5:是性能跃迁,还是精明的“价格刺客”?】 Anthropic 刚发布了 Sonnet 5,号称是史上最强的“智能体(Agentic)”中端模型。它在推理、工具调用和编程上全面超越了 4.6,甚至在某些场景下能硬刚老大哥 Opus 4.8。但剥开营销的外壳,这件事的底层逻辑和槽点同样精彩。 首先,Sonnet ​
2
0
6
爱可可-爱生活
2026-07-01 06:43
[人人能懂AI前沿] AI的元认知革命:从自信校准、演化微调到偏好重对齐 你有没有想过,AI的“内心世界”是什么样的?本期我们要聊的几篇最新论文,就像是为我们打开了AI心智的几扇窗:当AI说“我很确定”时,它可能只是下定了决心;而一个“无欲无求”的旁观者AI,或许才是通往安全的新路径。我们还会 ​
0
0
2
爱可可-爱生活
2026-07-01 06:42来自 微博搜索
#AI可能替代3亿个岗位# 每一篇讲AI就业的文章最后都会告诉你:别当执行者,当把关者,当那个定义问题的人。听起来很对。但冷静想想,一个公司里能有几个"定义问题的人"?十个里面顶多一两个。过去的金字塔是一个经理带十个执行者,现在的建议是让十个人都变成经理,然后让AI当执行者。这在个体层面是好 ​
3
0
7
爱可可-爱生活
2026-07-01 06:39来自 微博搜索
#终于明白AI免费和订阅的区别了# 一个更准确的比喻是:免费版是试吃摊位。互联网上一代的“免费”是真免费。搜索引擎不会因为你没付钱就故意给你差一档的搜索结果,社交媒体也不会因为你是白嫖用户就降低你的信息流质量。那时候边际成本趋近于零,平台靠广告就能活,所以免费用户和付费用户的体验差异 ​
5
1
4
爱可可-爱生活
2026-07-01 06:35来自 微博搜索
#2026年本科专业热度TOP10# 人工智能专业五年狂开406个专业点,300多所高校一拥而上,结果毕业生对口率56%,比工科平均水平低了14个百分点。这意味着将近一半的AI专业毕业生,出来干的活跟AI没关系。大学批量制造的不是AI工程师,是“学过AI概论的普通求职者”。高校的专业开设象个追涨不追跌的散户, ​
4
1
5
爱可可-爱生活
2026-07-01 06:31来自 微博搜索
#美团发布LongCat2.0# MIT协议开源万亿参数模型。这不是慷慨,这是战争。谁会免费送出耗资巨大的东西?答案是:想成为基础设施的人。美团的算盘非常清楚,当全球开发者都在你的推理引擎和Infra框架上构建应用时,你就不再是一个模型提供商,你是生态本身。OpenRouter全球调用量前三,Hermes月调用量第 ​
1
0
1
爱可可-爱生活
2026-07-01 05:49来自 Mac客户端
[人人能懂AI前沿] AI的元认知革命:从自信校准、演化微调到偏好重对齐 http://t.cn/AXoZyycD ​
3
1
4
爱可可-爱生活
2026-07-01 05:48来自 Mac客户端
今日推介(第2183期):LLM 表现出的置信度与其“坚定程度”的相关性高于其“正确性”、无利害关系AI预测器、在 371 项优化任务中学习自动发现、通过迭代式自我演进实现推理能力的规模化扩展、通过奖励分解实现测试时偏好重对齐 公·众·号:爱可可爱生活 http://t.cn/AXoZyAq1 #机器学习##人工智能##论文# ​
1
0
5
爱可可-爱生活
2026-07-01 05:29来自 Mac客户端
[CL]《REAR: Test-time Preference Realignment through Reward Decomposition》F Zhang, P Wang, C Li, Y Li… [Nanyang Technological University & UC Berkeley] (2026) 在大语言模型领域,如何让模型在推理阶段动态满足用户的多样化偏好(如特定语气、避开某些话题)是一个悬而未决的难题。过去 ​
5
0
4
爱可可-爱生活
2026-07-01 05:23来自 Mac客户端
[AI]《Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement》A Helbling, A Bryutkin, M Martino, N Dehmamy… [Georgia Tech & MIT] (2026) 在离散语言生成领域,结构化推理(如数独、逻辑谜题)是一个悬而未决的难题。过去的方法受困于“一步到位”的生成逻辑,容易陷入 ​
2
1
7
爱可可-爱生活
2026-07-01 05:18来自 Mac客户端
[CL]《Evolution Fine-Tuning: Learning to Discover Across 371 Optimization Tasks》Y Lee, S Kim, M Kang, A C L Chuen… [University of Minnesota & CMU & KAIST] (2026) 在自动科学发现领域,利用大模型解决复杂优化任务长期受困于“冷启动”瓶颈。过去的方法高度依赖外部搜索框架(Scaffold) ​
3
0
5
爱可可-爱生活
2026-07-01 05:10来自 Mac客户端
[AI]《Safety from Honesty in a Disinterested AI Predictor》Y Bengio, O Richardson, T Gavenčiak, M Cohen… [LawZero & Arb Research] (2026) 在 AI 安全领域,隐性代理(Implicit Agency)是一个悬而未决的难题。过去的方法如 RLHF 往往受困于模型产生的欺骗与权力寻求行为,本质原因是训练过 ​
0
0
1
爱可可-爱生活
2026-07-01 05:02来自 Mac客户端
[LG]《Reported Confidence in LLMs Tracks Commitment More Than Correctness》D Kumaran [Google DeepMind] (2026) 在评估大语言模型可靠性时,开发者通常依赖模型自我报告的言语置信度(Verbal Confidence)。然而,过去的方法受困于置信度与实际准确率之间的频繁脱节,本质原因是人们误将置信度 ​
2
0
2
爱可可-爱生活
2026-07-01 04:54来自 Mac客户端
早![太阳] #早安# ​
1
1
3
爱可可-爱生活
2026-06-30 22:23来自 Mac客户端
晚安~ [月亮] #晚安# ​
0
0
4
爱可可-爱生活
2026-06-30 21:18来自 微博网页版
【AI全线国产化:一场关于性价比与掌控权的迁徙】 最近一位海外开发者分享了他的AI工具链转型:把Claude和GPT全换成了Kimi、Qwen、GLM和DeepSeek。结果很硬核:成本暴降87%,收入分文没少,产出质量仅有约4%的微降。 这件事揭示了一个冷酷的商业逻辑:AI正在从昂贵的实验室产品变成廉价的工业水电。 ​
6
1
13
爱可可-爱生活
2026-06-30 12:02来自 微博抽奖平台
恭喜@Vincent_Gattaca 等3名用户获得【《Claude Code源码架构:核心解析》】。微博官方唯一抽奖工具@微博抽奖平台 对本次抽奖进行监督,结果公正有效。公示链接:http://t.cn/AXovWuWS
#转发抽奖#携手@图灵文化 送出3本《Claude Code源码架构:核心解析》,截止2026.6.30 12:00,*可可粉*转发+评论 即可参与。Claude Code 源码级拆解!聚焦 Agent 系统底层设计,6 大模块拆解架构核心,4 张全景流程图打通主线,100+ 段 Prompt 还原设计思路。一本书读懂 Claude Code 为什么强! ​
0
0
1
爱可可-爱生活
2026-06-30 08:58来自 微博网页版
【框架名是虚的,系统感才是硬通货】 最近有个面试案例在圈子里传得很火:一位AI工程师对LangGraph、vLLM这些时髦框架一问三不知,连RAG的几种标准姿势都说不全。但在实操环节,他面对一个性能崩掉、延迟从200毫秒飙升到2秒的推理服务,半小时就定位到了病根。他通过链路追踪发现Tokenization被重复执 ​
25
5
29
爱可可-爱生活
2026-06-30 08:35来自 微博网页版
【“危险”的真相:当中国模型撞击硅谷的IPO大门】 最近 GLM 5.2 的表现让不少人直呼闭源大厂的末日到了。Anthropic CEO 喊出的“危险路径”,剥开安全的外壳,里面全是商业焦虑。 这事儿的逻辑并不复杂:大模型的折旧速度已经超过了豪车。硅谷巨头靠烧几十亿美金、堆算力筑起的护城河,正被中国实验 ​
4
1
14
爱可可-爱生活
2026-06-30 08:25来自 微博网页版
【Mythos模型:AI安全领域的“核威慑”还是新瓶装旧酒?】 最近Anthropic发布的Mythos模型把网络安全圈搅得天翻地覆,甚至引发了美国政府的出口管制。这事儿的核心逻辑其实很简单:AI已经具备了自动挖掘深层零日漏洞(Zero-day)并生成有效Payload的能力。以前需要顶级安全专家耗时数月的活,现在AI通 ​
6
1
6
爱可可-爱生活
2026-06-30 08:14来自 微博网页版
【Tokenmaxxing:从“强制洗脑”到“暴力出砖”的生产力跃迁】 最近技术圈在热议“Tokenmaxxing”(Token最大化)的死与生。起初,这被视为大厂管理层的愚蠢:Meta等公司将绩效与Token消耗量挂钩,导致员工让两个AI对聊来刷数据。但穿透现象看,这其实是高层的一场“暴力破冰”。 底层逻辑在于:面对 ​
5
0
2
爱可可-爱生活
2026-06-30 07:58来自 微博网页版
【简历筛选的真相:你可能只是败给了AI的随机数】 HackerRank开源的AI简历筛选器最近备受关注,但实测结果令人心惊:同一份简历运行100次,得分竟然在66到99之间剧烈波动。这意味着如果企业设置85分为门槛,你的职业生涯可能仅仅因为一次概率抖动就戛然而止。 这件事的核心逻辑在于,LLM运作的基础是 ​
2
0
4
爱可可-爱生活
2026-06-30 07:54来自 微博网页版
【Tidal给AI音乐断粮:允许存在,拒绝买单】 Tidal最近更新了AI音乐政策,态度很利落:欢迎上架,但必须打标,且完全取消分成。这招直接抓住了算法时代的生存命门——经济激励。 现在流媒体平台正面临“电子垃圾(Slop)”的大规模入侵。很多AI曲目并不是为了艺术表达,而是通过海量生成来蹭搜索词、 ​
4
1
4
没有更多微博了