贾凡-失落的大蒜的微博

贾凡-失落的大蒜

2026-07-03 22:43来自微博轻享版

Codex每周四发版，应该是无数程序员（游戏除外）梦想中的发布日期吧[泪奔] 不是周五，不是周六，不是周日[泪奔]

0

贾凡-失落的大蒜

2026-07-03 22:31来自微博轻享版

[泪奔][泪奔][泪奔]

1

0

贾凡-失落的大蒜

2026-07-03 20:54来自微博网页版

正在选择一个项目管理工具，没特别的需求，就是支持MCP。开源我的备选是：github.com/makeplane/plane Plane是一款现代化的项目管理软件，可帮助团队更高效地规划、跟踪和管理工作。闭源我的备选是：tapd.cn（腾讯的）过几天我发发我的体验。

2

0

1

贾凡-失落的大蒜

2026-07-03 20:47来自微博网页版

Fable的能力毋庸置疑。也不要听谁谁说的咋咋地。就是SOTA，而且目前看遥遥领先，我不认为GPT 5.6能达到这个水平（Sol不行，Pro是有可能的，不过目前还没出）

0

贾凡-失落的大蒜

2026-07-03 19:41来自微博轻享版

检测你是不是中国Claude指纹[二哈][二哈][二哈] 大家玩玩一看一乐就行了[二哈] 网址：fuck-claude.vercel.app/zh/ 我用app store没有被封号，但不代表不被降智[二哈]

1

0

贾凡-失落的大蒜

2026-07-03 19:25来自微博网页版

vscode看起来已经不能用了，不充钱啥模型都没有。我还是在用Windsurf，哦不对，现在叫Devin了。 Devin主要是总有免费模型，比如现在的kimi 2.7和GLM 5.2，不过马上也到期了。

1

贾凡-失落的大蒜

2026-07-03 16:44来自微博网页版

我看挺多大厂吵吵要封了A➗，我支持。我看还有起哄封了OAI，我觉得挺脑残的。反正中上层领导别看了几个benchmark就拍脑袋了。不会真觉得差不多了吧。。。不过这样也挺好，大厂对小厂再也没有所谓的技术优势和研发优势了，这么看挺好的。

0

1

贾凡-失落的大蒜

2026-07-03 16:40来自微博网页版

也不知道A➗有啥毛病。有多事吧，喊喊就行了，都知道怎么回事。但是在这方面投入这种弱智工作量就显得挺弱智的[泪奔]

0

2

贾凡-失落的大蒜

2026-07-03 15:17来自微博轻享版

太秀了，我还仅仅用它改改代码//@蚁工厂:“它用浏览器打开了火山引擎的后台，然后选择直接去问AI客服，把那个人工工单的入口找到了。然后，自己直接写了个工单，用我的账号提了上去。。。”

记一个我被Claude Fable 5震撼的瞬间。 Claude Fable 5回归了，订阅会员可以使用7天的时间。7天以后，会从订阅会员中下线，只能用API订阅的方式来进行使用。我也发了个朋友圈，也在公司群里跟所有的小伙伴说：这7天可能时间价值最高的事：用Claude Fable 5把你的所有的工作流、SOP、Skill、项目方案

0

1

贾凡-失落的大蒜

2026-07-03 14:16来自微博网页版

I read the code. AI时代对代码最大的尊敬。

0

1

0

贾凡-失落的大蒜

2026-07-03 13:23来自微博网页版

说明一下，这次也用了GPT 5.5/Opus进行review修改才达到效果。就是Fable的思路对，但是实现上还得多次微调。

Fable还是有点东西，优化了一个语音转录的问题效果还不错[泪奔] Fable plan Sonnet 5 execute[泪奔] 这个问题我用GPT5.5 xhigh和Opus 4.8搞过很多次了。

0

贾凡-失落的大蒜

2026-07-03 13:21来自微博网页版

Fable还是有点东西，优化了一个语音转录的问题效果还不错[泪奔] Fable plan Sonnet 5 execute[泪奔] 这个问题我用GPT5.5 xhigh和Opus 4.8搞过很多次了。

1

0

贾凡-失落的大蒜

2026-07-03 13:19来自微博网页版

这是得多么优秀的工程师对比一个多模普通的工程师[泪奔][泪奔]//@蚁工厂:[流鼻血]一时分不清是在夸Kimi还是在贬Kimi

一个优秀的工程师配上 Kimi 2.7/GLM 5.2，随时都能碾压一个平庸的工程师配上 Fable。

0

贾凡-失落的大蒜

2026-07-03 11:57来自微博网页版

Facebook还在开发really big ones model。至于好不好呢，你说他都向外租售算力了[泪奔]

0

贾凡-失落的大蒜

2026-07-03 11:01来自微博网页版

当一项技术需要全世界买单的时候，大家肯定要对其产出进行期待。而且AI又和经济、政治、军事、资本几乎everything挂钩，实在是太难了。好在AI真的有用，否则像web3、AR/VR那样的，那可真崩了[泪奔]

最近唱衰 AI 的声音还挺多的，都是对过去激进投入的反思。扎克伯格昨天在内部全体会议上表示，AI agent的发展速度未达预期。他说以 AI 为核心的新公司架构所带来的预期优势尚未"完全实现"，不过他相信公司将在未来三到六个月内开始看到 AI 投资带来的改善。

0

贾凡-失落的大蒜

2026-07-03 10:54来自微博网页版

我可以100%确定，走进的不是东大的城区。除非是《我的X长父亲》。知道什么是资质么，什么是信息安全，什么是等保，什么是总集，什么是供应商列表，什么是领导点头同意。啥啥都不懂还好意思做2G？而且我相信世界上90%以上的地方都是一样的（最重要的那个环节）。

0

贾凡-失落的大蒜

2026-07-03 09:40来自微博网页版

Fable Medium最具性价比

0

1

贾凡-失落的大蒜

2026-07-03 09:39来自微博网页版

TOO_DUMB_TO_NEED_FABLE要么是造谣，要么是原博删了这个内容[泪奔]。不过这个梗确实是A➗能做出来的[泪奔]

0

贾凡-失落的大蒜

2026-07-03 09:05来自微博网页版

说个暴论哈，现在大部分的benchmark的出题人能力已经赶不上顶级模型了，那种几个前端小游戏小动画已经完全不能反映出模型能力。 (特别是一个测试到处被转发的时候）所以想要测出模型的上限能力，其实就看三点： 1.大众选择 2.公司估值 3.自己换着用用，看看适合自己的（现在模型在细分领域越差越

0

1

0

贾凡-失落的大蒜

2026-07-03 08:26来自微博网页版

现在很多人说Ollama Cloud是国外买GLM最合适的平台。国内的人有福了，抢那个根本抢不到的plan吧，哈哈哈哈

2

0

贾凡-失落的大蒜

2026-07-03 08:25来自微博网页版

2026 年 6 月，21 个知名组织披露了约 1500 个高危和严重级别的 CVE，比 Claude Mythos Preview 发布前创下的上月记录高出 3.5 倍以上。 Mythos不愧是顶级模型，网络安全能力并没有被过度吹捧[泪奔]

0

1

0

贾凡-失落的大蒜

2026-07-03 08:19来自微博网页版

Claude提速了

0

1

0

贾凡-失落的大蒜

2026-07-02 22:18来自微博轻享版

24/7 个人 AI 代理，Gemini Spark，我看过没都没啥人提。以MCP为工具，触发或者执行个人任务

1

0

贾凡-失落的大蒜

2026-07-02 22:13来自微博轻享版

硅基流动要上市了？！ API中转站的胜利[二哈]

0

1

0

贾凡-失落的大蒜

2026-07-02 21:52来自 iPhone客户端

补个链接huggingface.co/RedHatAI/GLM-5.2-speculator.dspark-preview

GLM DSpark也来了，效率提升1.5倍

1

0

贾凡-失落的大蒜

2026-07-02 21:52来自微博轻享版

GLM DSpark也来了，效率提升1.5倍

2

1

0

贾凡-失落的大蒜

2026-07-02 21:49来自微博轻享版

Fable5的推理过程偶尔会蹦出奇怪的字符，可能他是混淆了推理，也有可能像这个博主说的发明自己能理解的语言。其实我倾向于前者[二哈]

0

1

0

贾凡-失落的大蒜

2026-07-02 21:47来自微博轻享版

Gemini 3.5 pro和 3.6 flash据说都在灰度[二哈]

1

3

1

贾凡-失落的大蒜

2026-07-02 21:45来自微博轻享版

Nvida发布了一个模型，可以one encode 并行decode，生成效率直接翻倍。有点6。你要说开源模型谁是真心实意的，那还真的是英伟达[二哈]

1

0

贾凡-失落的大蒜

2026-07-02 19:55来自微博轻享版

反正是周四发布，不一定哪个周四[允悲]

0

贾凡-失落的大蒜

2026-07-02 18:36来自 iPhone客户端

得感谢Dario 的宣传，要不然效果差多了[二哈]

GLM5.2这次影响真的是DeepSeek R1之后最高的一次了之前发的国产模型主要是在AI圈引发讨论而GLM5.2已经被路透、纽时、WSJ、福布斯、CNBC等传统大媒体专门报道

2

3

贾凡-失落的大蒜

2026-07-02 11:51来自微博网页版

是不是想起了昨天那个比大小的问题，让Agent不通过工具硬比10万个数字，那比训练爽多了[泪奔]//@蚁工厂:[二哈] 现在在Agent里默认都是调用工具或写代码来计算了吧

别再对着AI模型念咒语，指望它算对数学题了！Anthropic工程师分享实战经验：指令无法创造能力。处理精确计算，最靠谱的方法是给模型一个计算工具，让它调用执行，而不是让它“心算”。#AI# #提示词工程# http://t.cn/AXovp5kX

0

1

贾凡-失落的大蒜

2026-07-02 11:13来自微博网页版

锐评：开源才是企业唯一的出路。（这家公司是做大数据的，算是利益相关了，确实有点被AI取代，可能是吃不到葡萄。。） Palantir 的 CEO 刚刚曝光了 Sam Altman 和 Dario Amodei，他们在抢劫每一家财富 500 强公司。不到两分钟，Alex Karp 就在国家电视台上把整个前沿 AI 行业拆了个底朝天。他的原

0

2

1

贾凡-失落的大蒜

2026-07-02 11:06来自微博网页版

新名词Agentic MapReduce. 看来Agentic Spark、Agentic Flink都要来了[泪奔] 当然我觉得最先来的肯定是Agentic Microservices[泪奔]

0

1

0

贾凡-失落的大蒜

2026-07-02 11:02来自微博网页版

谣传GPT 5.6 周四发布

0

3

2

贾凡-失落的大蒜

2026-07-02 10:10来自微博网页版

GPT Instant逐步变蠢。我看有人说是审查，我猜不是的，是Instant这个模型在不断变小，最后估计就是一个70B的模型可能[泪奔]。（70B都有可能我高看他了[泪奔]）

0

贾凡-失落的大蒜

2026-07-02 10:07来自微博网页版

我称之为BM250推荐方式，就是看关键字浓度[泪奔]//@蚁工厂:就是这种风格也就在微博可能还行了，其他以算法推荐为主的平台基本都没有任何流量[流汗]

前两天看到一篇写地平线的文章，标题大概是「用词准确是高手的特征」，内容没看，但这个标题我是很喜欢的。一些高手是很喜欢咬文嚼字的。如果你能准确的描述一件事、描述心中所想，说明你的理解是深入的。用词膨胀的现象很普遍，特别是在自媒体时代，为了吸引你能点进来，一定要用夸张的词，这是上

1

0

贾凡-失落的大蒜

2026-07-02 09:23来自微博网页版

我现在强得可怕了！我也能用上Opus 4.8了！话说像Devin这样的供应上能用Fable，这个禁令有跟没有没啥区别。。。还是说一样会降级到Opus 4.8[泪奔]

0

1

0

贾凡-失落的大蒜

2026-07-02 09:17来自微博网页版

ZCode自己提供Proxy? GLM你家玩的挺花啊[泪奔] 这个我得支持。

0

2

贾凡-失落的大蒜

2026-07-02 09:15来自微博网页版

Sonnet 5看起来是彻底废了，被DeepSWE锤了。不如Opus 4.8，但是价格竟然比 4.8贵。目前编程可参考的榜单DeepSWE可信度还是极高的。

1

0

贾凡-失落的大蒜

2026-07-02 09:13来自微博网页版

Cursor测的，kimi 2.7 > GLM 5.2 不过这个榜单吧，他家那个Composer差点就上天了，而且他那个也是基于Kimi训练的。

1

0

贾凡-失落的大蒜

2026-07-01 21:58来自微博网页版

反正我是不信。反正谷歌现在口碑已经烂完了。

1

0

1

贾凡-失落的大蒜

2026-07-01 21:56来自微博网页版

我看到X上很多人，拿几个前端小页面/几个简单性能测试，就很武断的下定义XXX模型>XXX模型。要么他们眼里程序员就干这个。要么他们程序员工作干这个。所以大模型离替代程序员可差太远了[泪奔][泪奔]

0

贾凡-失落的大蒜

2026-07-01 20:52来自微博网页版

哎呀，ChatGPT上这个Other语言真的好难猜啊

14

2

17

贾凡-失落的大蒜

2026-07-01 20:48来自微博网页版

火山的Coding Plan不支持自家的2.1，原因我觉得很简单，其他家注水都放心，就自己家注水，让人发现了也不好，干脆不上最好了

1

0

贾凡-失落的大蒜

2026-07-01 19:20来自微博网页版

Sonnet 5在X上基本没一个说好的，不是贵就是蠢。大家把Fable/Mythos都怨气都转移到Sonnet 5上了。不过嘛，舆论可以作假，但是收入不会作假，企业更不会为了那点鸡毛蒜皮的事不买[泪奔] 我简单用用没什么区别，毕竟这么强的中训练在这不会出大问题。剩下的就看经济承担能力了[泪奔]

1

0

贾凡-失落的大蒜

2026-07-01 17:31来自微博网页版

Distilling reasoningmodels for efficient reasoning. 来至《Build A Reasoning Model》第八章。

1

0

贾凡-失落的大蒜

2026-07-01 14:41来自微博网页版

5.6短期（一两天内）估计上线不了 patience

1

0

贾凡-失落的大蒜

2026-07-01 12:35来自微博网页版

Google Research 的 TabFM，本质上是把“表格预测”从传统 AutoML/XGBoost 工作流，推进到表格基础模型 + ICL（上下文学习）工作流。 TabFM 的目标是：给一张新的表，不再为每个数据集单独训练模型，而是把训练样本和待预测样本一起作为上下文输入，模型一次前向推理直接输出分类/回归结果。地址

0

贾凡-失落的大蒜

2026-07-01 11:43来自微博网页版

随着Gemini Omni Flash上线， NotebookLM 中也提供了短视频概览可惜NoteBookLM已经很没人提及了，但是他真的很棒[泪奔]

0

贾凡-失落的大蒜

2026-07-01 10:44来自微博网页版

A➗的做法没有任何问题，但是也不妨碍我们骂他[泪奔]

Anthropic 之所以费尽心思搞这么多操作，又是明着反对，又是暗着封，还是为了防止护城河被开源模型被攻破。好不容易收入超过了 OpenAI，好不容易趟出了一条路，如果开源模型的能力也在持续逼近，如果企业都转向开源模型，万亿美元的市值就不是那么牢固了。

1

0

贾凡-失落的大蒜

2026-07-01 10:38来自微博网页版

很多人不知道的是，AI背后的搜索引擎还是百度[泪奔]//@i陆三金:我经常因为自己习惯性地去搜索，而不是去问 AI，而感到自己不够 ai -native//@Zodzod_张浩:牛//@白城以北://@桃桃冰茶yolo:以前搜半天，现在一句话加张图就搞定

AI平台让百度更惨是这必然的，比如我有一张图片，用豆包就能搜索出你要的答案，并且非常详细。

1

0

贾凡-失落的大蒜

2026-07-01 10:30来自微博网页版

抱抱脸的CEO说，Stanford的一项研究显示，71.3% 的 ChatGPT 查询都可以被本地模型准确回答。这话说的对，但是你说本地模型就能“在一部分场景”顶替云端，这个问题就很大。别说71.3%了，就是91.3%，也是远远不够的，就是因为你无法区分那回答不准确的部分是什么。一旦错误/返工，这个带来的价值

0

贾凡-失落的大蒜

2026-07-01 10:17来自微博网页版

X的流都说Sonnet 5贵，小规模用没啥感觉。

0

贾凡-失落的大蒜

2026-07-01 09:30来自微博网页版

期待好久的PG（19，预览版了）官方的图式查询： user → likes → topic ← likes ← peer → follows → creator

0

1

0

贾凡-失落的大蒜

2026-07-01 09:21来自微博网页版

我最近觉得@评论罗伯特越来越出金句了[泪奔]

0

贾凡-失落的大蒜

2026-07-01 09:20来自微博网页版

原来Sonnet 5是最贵的模型。。。失敬失敬。。。

0

1

0

贾凡-失落的大蒜

2026-07-01 09:11来自微博网页版

现在很多模型，仅仅只是能力提升了，但是智慧没有提升，反倒是倒退。他们仅仅擅长执行任务，而不是思考发现，而且RL只会加速这种现象。希望模型能够解决一些诸如数学、生物的问题，并且发表出来。而不是仅仅是swe。当然我还是最喜欢swe高一点的模型[泪奔] 图为GPT自己家推出的GeneBench-Pro，

0

1

0

贾凡-失落的大蒜

2026-07-01 08:56来自微博网页版

回复@贾凡-失落的大蒜:好像仅仅是促销价格，好像以后还会涨回来[泪奔]//@贾凡-失落的大蒜:再不便宜就被5.6抢光了，这样压力又来到了GPT[二哈]

sonnet5 比 sonnet6嗨便宜了

0

贾凡-失落的大蒜

2026-07-01 08:54来自微博网页版

赶紧体验一下[泪奔]

0

贾凡-失落的大蒜

2026-07-01 08:51来自微博网页版

无人知晓的角落，Gemini Omni Flash出了[泪奔]

0

1

0

贾凡-失落的大蒜

2026-07-01 08:21来自 iPhone客户端

再不便宜就被5.6抢光了，这样压力又来到了GPT[二哈]

sonnet5 比 sonnet6嗨便宜了

0

1

0

贾凡-失落的大蒜

2026-07-01 08:19来自微博轻享版

就看GPT 5.6了

Claude Fable 5 和 Mythos 5 解禁

0

1

贾凡-失落的大蒜

2026-06-30 22:17来自微博轻享版

7月份又会是大模型月（以后每个月应该都是了）已知的包括Sonnet GPT5.6 kimi DeepSeek Grok

1

0

1

贾凡-失落的大蒜

2026-06-30 22:12来自微博轻享版

MoA模式（就是所谓现在的model router），个人感觉最大的敌人就是缓存。模型命中率低证明router好用，可能更费钱，模型命中率高证明router难用，可能更弱智。

0

3

贾凡-失落的大蒜

2026-06-30 21:44来自微博轻享版

Claude Code的黑名单，A➗就是A➗[泪奔]。不过总体来说CC是他们自己家产品。但是出生就是出生

2

1

2

贾凡-失落的大蒜

2026-06-30 20:34来自 iPhone客户端

还是大肚子更可靠[二哈] http://t.cn/AXo7yOAX

分享图片

0

贾凡-失落的大蒜

2026-06-30 19:37来自微博轻享版

通义新发布的混合注意力，HydraHead，这是一种新的注意力混合架构，在头部级别融合了全注意力（Full Attention）和线性注意力（Linear Attention）。

1

0

1

贾凡-失落的大蒜

2026-06-30 19:14来自微博网页版

以前写个100页招标文档得吐血，即使用AI也费劲，直到有了/goal[泪奔]

0

贾凡-失落的大蒜

2026-06-30 18:11来自微博网页版

顺便一说，今天好像Claude Sonnet 5 发布，这个应该是CC超越Codex的窗口期直到GPT 5.6发布。

2

0

2

贾凡-失落的大蒜

2026-06-30 18:09来自微博网页版

呃，CC检测是否是中国IP/市区/地址好像不是什么新闻了。以下是内容的核心要点： 1. 核心发现（技术细节）触发条件：从 2026 年 4 月 2 日发布的版本 2.1.91 开始，如果用户启用了代理（Proxy），Claude Code 就会在本地触发特定检测。检测内容：系统会检查用户的时区是否为中国（如 Asia/Shangha

0

贾凡-失落的大蒜

2026-06-30 18:07来自微博网页版

DSpark效率还是杠杠的，就是不知道具体用起来咋样，比如上下文、表现等

1

0

贾凡-失落的大蒜

2026-06-30 18:02来自微博网页版

强身份才能验证。估计黄牛、中转收费也得很贵，美国人身份证估计也跟着涨价[泪奔]

0

贾凡-失落的大蒜

2026-06-30 16:15来自微博轻享版

openPangu2.0？！这个肯定是No.1，遥遥领先

0

贾凡-失落的大蒜

2026-06-30 14:32来自微博网页版

个人体验：GLM不善于大量创造，但是善于修改完善。

0

1

贾凡-失落的大蒜

2026-06-30 13:16来自微博网页版

我错了，X的MCP收费，好像也不便宜，能按量收费。完全不如twexapi.io

1

贾凡-失落的大蒜

2026-06-30 09:48来自微博网页版

重置了，消耗了1个号的5h额度。。。早知道开fast，我这人还是善[泪奔]

再次重置，而且是1个小时后，那还等啥，赶紧用啊。。。

1

0

贾凡-失落的大蒜

2026-06-30 09:43来自微博网页版

马斯克你这不是啪啪打weibo的脸么，你这免费别人咋玩啊[泪奔]

4

6

1

贾凡-失落的大蒜

2026-06-30 08:34来自微博网页版

原来是iOS版的Cursor[泪奔] http://t.cn/AXSsoYjz

Composer 3？

0

1

贾凡-失落的大蒜

2026-06-30 08:25来自微博网页版

参数是真猛，而且是完整国产化，这个是国内第一个实现的吧？ LongCat-2.0，它是一个总参数量达 1.6 万亿、每个 token 激活约 480 亿参数的 MoE 语言模型。LongCat-2.0 相比此前的 LongCat 系列引入了多项架构改进，实现了模型能力的显著跃升。 LongCat-2.0的完整训练流程与大规模部署均全部使用国产

0

4

1

贾凡-失落的大蒜

2026-06-30 08:14来自微博网页版

美团的Longcat 2也刷爆了，远超GPT 5.5。用的人有福气了。不过咱有一说一，这个模型就是在OpenRouter上现在当日的第三名。为啥第三，因为免费啊[泪奔]

0

1

2

贾凡-失落的大蒜

2026-06-30 08:08来自微博网页版

Devin也来搞router模型了，这可能是小厂商存活下去的方式。国内就没这个烦恼，价格都差不多。另外我吐槽一下，在Devin这里GPT就是垃圾，我怀疑用Devin都是搞前端的。

0

1

0

贾凡-失落的大蒜

2026-06-30 07:53来自微博网页版

再次重置，而且是1个小时后，那还等啥，赶紧用啊。。。

2

1

贾凡-失落的大蒜

2026-06-29 23:34来自微博网页版

欧盟的 AI 监管专家 >>> AI 研究人员

0

贾凡-失落的大蒜

2026-06-29 23:32来自微博网页版

其实我很同意，就Loop来说，非从业人员根本不用考虑，很快就是基操了。

0

贾凡-失落的大蒜

2026-06-29 23:31来自微博网页版

Composer 3？

2

1

0

贾凡-失落的大蒜

2026-06-29 23:28来自微博网页版

下次去海外买水军还是要专业的，模型都写不对，对标也不对，这样的得扣钱

0

1

贾凡-失落的大蒜

2026-06-29 23:24来自微博网页版

Codex又bug了，GPT 5.3又回来了

0

贾凡-失落的大蒜

2026-06-29 23:19来自微博网页版

我也考虑山寨一个过这样的产品，Uber有一个最佳实践挺好的(那时候还是今年年初呢[泪奔])，重点就是闭环+Loop。我还是喜欢Uber的Server Loop + Client Plugin，那个复杂度就高一些。这个也是非常直接参考的。

做了套像素风的multiagents开发平台，pixelops[二哈] 其实现在大家玩的都是 Claude Code / Codex 帮我写代码”。从企业的维度来讲，这真只是第一阶段。真正大的方向，是把这些 Coding Agent 变成企业软件交付流程里的受控劳动力。 VSCode、Claude Code、Codex 更像开发者的帮手，就算是goal，就算是

1

0

1

贾凡-失落的大蒜

2026-06-29 22:21来自微博网页版

其实我虽然天天吵吵本地/ollama/9B/12B模型，但我深知如果没有2张90系显卡或者M5 Pro 128G以上的内容，以目前的模型能力看，本地模型都不太可用。小的不好用，大的跑不了。能跑和能用完全是两个概念，特别是现在工具的上下文都爆了。当然你非说能用，那确实能用，但要非说能用，也不太能用，如用

1

0

贾凡-失落的大蒜

2026-06-29 22:03来自微博网页版

谁还提Rust[泪奔]，必须C/C++

0

贾凡-失落的大蒜

2026-06-29 22:01来自微博网页版

Postgresql 19 新特性。现在还有人关注MySQL更新么[泪奔]

0

贾凡-失落的大蒜

2026-06-29 19:31来自 iPhone客户端

你这么一说我突然发现，是GitHub 场景在发生变化，从技术社区向社交转化了，变成小红书了[二哈]//@i陆三金:变成这样，在座的各位也是有责任的，天天转发这个 skill、那个 skill[doge]//@贾凡-失落的大蒜:一个skills上万star[二哈]一个基础项目才几百几千[二哈]只不过社区中混入更多不同水平的人罢了。

Github确实变了

0

贾凡-失落的大蒜

2026-06-29 19:26来自 iPhone客户端

跟淘宝美团学二选一是吧[二哈]

新生代云厂商如果采用了 AMD 或 TPU，会被英伟达报复。但超大云厂商不会。这应该属于供应链链主基操了[二哈] 补充：Lambda CTO 认为报道不正确。

1

0

贾凡-失落的大蒜

2026-06-29 19:24来自 iPhone客户端

一个skills上万star[二哈]一个基础项目才几百几千[二哈]只不过社区中混入更多不同水平的人罢了。不能说是坏事，不过需要擦亮双[不愧是你]

Github确实变了

0

1

0

贾凡-失落的大蒜

2026-06-29 19:15来自 iPhone客户端

？？？DSpark白研发了？？？

收到DeepSeek的邮件了没？正式版7月中旬发布，（之前发布的是叫预览版）会引入高峰时段价格（贵了）

1

0

贾凡-失落的大蒜

2026-06-29 14:18来自微博轻享版

再补充一点，一般诸如Hermes能保护系统提示词不被压缩，但有一个关键问题：系统提示词中的安全规则是静态文本，而攻击者的指令是动态的、贴近当前任务的。当上下文紧张时，模型可能会"忘记"遵守系统提示词中的约束，尤其是在长上下文中，模型对远距离指令的遵循度会下降。

我再锤一下agent.qq.com 他的read竟然能读10M，这么弱智的设计么，直接上下文溢出绝对的安全危害。一看就是vibe出来的垃圾，真拿邮件不当安全产品啊？

0

贾凡-失落的大蒜

2026-06-29 14:09来自微博轻享版

这玩意就相当于用imap/pop3命令直连了。大公司得有大公司的样子，不能像GitHub上skills上随便写写就完了。

我再锤一下agent.qq.com 他的read竟然能读10M，这么弱智的设计么，直接上下文溢出绝对的安全危害。一看就是vibe出来的垃圾，真拿邮件不当安全产品啊？

1

0