贾凡-失落的大蒜
贾凡-失落的大蒜
贾凡-失落的大蒜
不争论
其他 2025.12 加入
29关注
315粉丝
2494微博
贾凡-失落的大蒜
2026-07-03 22:43来自 微博轻享版
Codex每周四发版,应该是无数程序员(游戏除外)梦想中的发布日期吧[泪奔] 不是周五,不是周六,不是周日[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-03 22:31来自 微博轻享版
[泪奔][泪奔][泪奔] ​
1
0
0
贾凡-失落的大蒜
2026-07-03 20:54来自 微博网页版
正在选择一个项目管理工具,没特别的需求,就是支持MCP。 开源我的备选是:github.com/makeplane/plane Plane是一款现代化的项目管理软件,可帮助团队更高效地规划、跟踪和管理工作。 闭源我的备选是:tapd.cn(腾讯的) 过几天我发发我的体验。 ​
2
0
1
贾凡-失落的大蒜
2026-07-03 20:47来自 微博网页版
Fable的能力毋庸置疑。 也不要听谁谁说的咋咋地。 就是SOTA,而且目前看遥遥领先, 我不认为GPT 5.6能达到这个水平(Sol不行,Pro是有可能的,不过目前还没出) ​
0
0
0
贾凡-失落的大蒜
2026-07-03 19:41来自 微博轻享版
检测你是不是中国Claude指纹[二哈][二哈][二哈] 大家玩玩一看一乐就行了[二哈] 网址:fuck-claude.vercel.app/zh/ 我用app store没有被封号,但不代表不被降智[二哈] ​
1
0
0
贾凡-失落的大蒜
2026-07-03 19:25来自 微博网页版
vscode看起来已经不能用了,不充钱啥模型都没有。 我还是在用Windsurf,哦不对,现在叫Devin了。 Devin主要是总有免费模型,比如现在的kimi 2.7和GLM 5.2,不过马上也到期了。 ​
1
1
1
贾凡-失落的大蒜
2026-07-03 16:44来自 微博网页版
我看挺多大厂吵吵要封了A➗,我支持。 我看还有起哄封了OAI,我觉得挺脑残的。 反正中上层领导别看了几个benchmark就拍脑袋了。 不会真觉得差不多了吧。。。 不过这样也挺好,大厂对小厂再也没有所谓的技术优势和研发优势了,这么看挺好的。 ​
0
0
1
贾凡-失落的大蒜
2026-07-03 16:40来自 微博网页版
也不知道A➗有啥毛病。 有多事吧,喊喊就行了,都知道怎么回事。 但是在这方面投入这种弱智工作量就显得挺弱智的[泪奔] ​
0
0
2
贾凡-失落的大蒜
2026-07-03 15:17来自 微博轻享版
太秀了,我还仅仅用它改改代码//@蚁工厂:“它用浏览器打开了火山引擎的后台,然后选择直接去问AI客服,把那个人工工单的入口找到了。然后,自己直接写了个工单,用我的账号提了上去。。。”
记一个我被Claude Fable 5震撼的瞬间。 Claude Fable 5回归了,订阅会员可以使用7天的时间。7天以后,会从订阅会员中下线,只能用API订阅的方式来进行使用。 我也发了个朋友圈,也在公司群里跟所有的小伙伴说:这7天可能时间价值最高的事:用Claude Fable 5把你的所有的工作流、SOP、Skill、项目方案 ​
0
0
1
贾凡-失落的大蒜
2026-07-03 14:16来自 微博网页版
I read the code. AI时代对代码最大的尊敬。 ​
0
1
0
贾凡-失落的大蒜
2026-07-03 13:23来自 微博网页版
说明一下,这次也用了GPT 5.5/Opus进行review修改才达到效果。就是Fable的思路对,但是实现上还得多次微调。
Fable还是有点东西,优化了一个语音转录的问题效果还不错[泪奔] Fable plan Sonnet 5 execute[泪奔] 这个问题我用GPT5.5 xhigh和Opus 4.8搞过很多次了。 ​
0
0
0
贾凡-失落的大蒜
2026-07-03 13:21来自 微博网页版
Fable还是有点东西,优化了一个语音转录的问题效果还不错[泪奔] Fable plan Sonnet 5 execute[泪奔] 这个问题我用GPT5.5 xhigh和Opus 4.8搞过很多次了。 ​
1
0
0
贾凡-失落的大蒜
2026-07-03 13:19来自 微博网页版
这是得多么优秀的工程师对比一个多模普通的工程师[泪奔][泪奔]//@蚁工厂:[流鼻血]一时分不清是在夸Kimi还是在贬Kimi
一个优秀的工程师配上 Kimi 2.7/GLM 5.2,随时都能碾压一个平庸的工程师配上 Fable。 ​
0
0
0
贾凡-失落的大蒜
2026-07-03 11:57来自 微博网页版
Facebook还在开发really big ones model。 至于好不好呢,你说他都向外租售算力了[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-03 11:01来自 微博网页版
当一项技术需要全世界买单的时候,大家肯定要对其产出进行期待。而且AI又和经济、政治、军事、资本几乎everything挂钩,实在是太难了。好在AI真的有用,否则像web3、AR/VR那样的,那可真崩了[泪奔]
最近唱衰 AI 的声音还挺多的,都是对过去激进投入的反思。 扎克伯格昨天在内部全体会议上表示,AI agent的发展速度未达预期。 他说以 AI 为核心的新公司架构所带来的预期优势尚未"完全实现",不过他相信公司将在未来三到六个月内开始看到 AI 投资带来的改善。 ​
0
0
0
贾凡-失落的大蒜
2026-07-03 10:54来自 微博网页版
我可以100%确定,走进的不是东大的城区。 除非是《我的X长父亲》。 知道什么是资质么,什么是信息安全,什么是等保,什么是总集,什么是供应商列表,什么是领导点头同意。 啥啥都不懂还好意思做2G? 而且我相信世界上90%以上的地方都是一样的(最重要的那个环节)。 ​​​
0
0
0
贾凡-失落的大蒜
2026-07-03 09:40来自 微博网页版
Fable Medium最具性价比 ​
0
1
1
贾凡-失落的大蒜
2026-07-03 09:39来自 微博网页版
TOO_DUMB_TO_NEED_FABLE要么是造谣,要么是原博删了这个内容[泪奔]。 不过这个梗确实是A➗能做出来的[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-03 09:05来自 微博网页版
说个暴论哈, 现在大部分的benchmark的出题人能力已经赶不上顶级模型了, 那种几个前端小游戏小动画已经完全不能反映出模型能力。 (特别是一个测试到处被转发的时候) 所以想要测出模型的上限能力,其实就看三点: 1.大众选择 2.公司估值 3.自己换着用用,看看适合自己的(现在模型在细分领域越差越 ​
0
1
0
贾凡-失落的大蒜
2026-07-03 08:26来自 微博网页版
现在很多人说Ollama Cloud是国外买GLM最合适的平台。 国内的人有福了,抢那个根本抢不到的plan吧,哈哈哈哈 ​
2
0
0
贾凡-失落的大蒜
2026-07-03 08:25来自 微博网页版
2026 年 6 月,21 个知名组织披露了约 1500 个高危和严重级别的 CVE,比 Claude Mythos Preview 发布前创下的上月记录高出 3.5 倍以上。 Mythos不愧是顶级模型, 网络安全能力并没有被过度吹捧[泪奔] ​
0
1
0
贾凡-失落的大蒜
2026-07-03 08:19来自 微博网页版
Claude提速了 ​
0
1
0
贾凡-失落的大蒜
2026-07-02 22:18来自 微博轻享版
24/7 个人 AI 代理,Gemini Spark,我看过没都没啥人提。 以MCP为工具,触发或者执行个人任务 ​
1
1
0
贾凡-失落的大蒜
2026-07-02 22:13来自 微博轻享版
硅基流动要上市了?! API中转站的胜利[二哈] ​
0
1
0
贾凡-失落的大蒜
2026-07-02 21:52来自 iPhone客户端
补个链接huggingface.co/RedHatAI/GLM-5.2-speculator.dspark-preview
GLM DSpark也来了,效率提升1.5倍 ​
1
0
0
贾凡-失落的大蒜
2026-07-02 21:52来自 微博轻享版
GLM DSpark也来了,效率提升1.5倍 ​
2
1
0
贾凡-失落的大蒜
2026-07-02 21:49来自 微博轻享版
Fable5的推理过程偶尔会蹦出奇怪的字符,可能他是混淆了推理,也有可能像这个博主说的发明自己能理解的语言。 其实我倾向于前者[二哈] ​
0
1
0
贾凡-失落的大蒜
2026-07-02 21:47来自 微博轻享版
Gemini 3.5 pro和 3.6 flash据说都在灰度[二哈] ​
1
3
1
贾凡-失落的大蒜
2026-07-02 21:45来自 微博轻享版
Nvida发布了一个模型,可以one encode 并行decode,生成效率直接翻倍。 有点6。 你要说开源模型谁是真心实意的,那还真的是英伟达[二哈] ​
1
0
0
贾凡-失落的大蒜
2026-07-02 19:55来自 微博轻享版
反正是周四发布,不一定哪个周四[允悲] ​
0
0
0
贾凡-失落的大蒜
2026-07-02 18:36来自 iPhone客户端
得感谢Dario 的宣传,要不然效果差多了[二哈]
GLM5.2这次影响真的是DeepSeek R1之后最高的一次了 之前发的国产模型主要是在AI圈引发讨论 而GLM5.2已经被路透、纽时、WSJ、福布斯、CNBC等传统大媒体专门报道 ​
2
2
3
贾凡-失落的大蒜
2026-07-02 11:51来自 微博网页版
是不是想起了昨天那个比大小的问题,让Agent不通过工具硬比10万个数字,那比训练爽多了[泪奔]//@蚁工厂:[二哈] 现在在Agent里默认都是调用工具或写代码来计算了吧
别再对着AI模型念咒语,指望它算对数学题了!Anthropic工程师分享实战经验:指令无法创造能力。处理精确计算,最靠谱的方法是给模型一个计算工具,让它调用执行,而不是让它“心算”。#AI# #提示词工程# http://t.cn/AXovp5kX ​
0
0
1
贾凡-失落的大蒜
2026-07-02 11:13来自 微博网页版
锐评:开源才是企业唯一的出路。(这家公司是做大数据的,算是利益相关了,确实有点被AI取代,可能是吃不到葡萄。。) Palantir 的 CEO 刚刚曝光了 Sam Altman 和 Dario Amodei,他们在抢劫每一家财富 500 强公司。 不到两分钟,Alex Karp 就在国家电视台上把整个前沿 AI 行业拆了个底朝天。 他的原 ​
0
2
1
贾凡-失落的大蒜
2026-07-02 11:06来自 微博网页版
新名词Agentic MapReduce. 看来Agentic Spark、Agentic Flink都要来了[泪奔] 当然我觉得最先来的肯定是Agentic Microservices[泪奔] ​
0
1
0
贾凡-失落的大蒜
2026-07-02 11:02来自 微博网页版
谣传GPT 5.6 周四发布 ​
0
3
2
贾凡-失落的大蒜
2026-07-02 10:10来自 微博网页版
GPT Instant逐步变蠢。 我看有人说是审查,我猜不是的,是Instant这个模型在不断变小,最后估计就是一个70B的模型可能[泪奔]。(70B都有可能我高看他了[泪奔]) ​
0
0
0
贾凡-失落的大蒜
2026-07-02 10:07来自 微博网页版
我称之为BM250推荐方式,就是看关键字浓度[泪奔]//@蚁工厂:就是这种风格也就在微博可能还行了 ,其他以算法推荐为主的平台 基本都没有任何流量[流汗]
前两天看到一篇写地平线的文章,标题大概是「用词准确是高手的特征」,内容没看,但这个标题我是很喜欢的。 一些高手是很喜欢咬文嚼字的。如果你能准确的描述一件事、描述心中所想,说明你的理解是深入的。 用词膨胀的现象很普遍,特别是在自媒体时代,为了吸引你能点进来,一定要用夸张的词,这是上 ​
1
0
0
贾凡-失落的大蒜
2026-07-02 09:23来自 微博网页版
我现在强得可怕了!我也能用上Opus 4.8了! 话说像Devin这样的供应上能用Fable,这个禁令有跟没有没啥区别。。。 还是说一样会降级到Opus 4.8[泪奔] ​
0
1
0
贾凡-失落的大蒜
2026-07-02 09:17来自 微博网页版
ZCode自己提供Proxy? GLM你家玩的挺花啊[泪奔] 这个我得支持。 ​
0
0
2
贾凡-失落的大蒜
2026-07-02 09:15来自 微博网页版
Sonnet 5看起来是彻底废了,被DeepSWE锤了。 不如Opus 4.8,但是价格竟然比 4.8贵。 目前编程可参考的榜单DeepSWE可信度还是极高的。 ​
1
0
0
贾凡-失落的大蒜
2026-07-02 09:13来自 微博网页版
Cursor测的,kimi 2.7 > GLM 5.2 ​​​ 不过这个榜单吧,他家那个Composer差点就上天了,而且他那个也是基于Kimi训练的。 ​
1
0
0
贾凡-失落的大蒜
2026-07-01 21:58来自 微博网页版
反正我是不信。 反正谷歌现在口碑已经烂完了。 ​
1
0
1
贾凡-失落的大蒜
2026-07-01 21:56来自 微博网页版
我看到X上很多人,拿几个前端小页面/几个简单性能测试,就很武断的下定义XXX模型>XXX模型。 要么他们眼里程序员就干这个。 要么他们程序员工作干这个。 所以大模型离替代程序员可差太远了[泪奔][泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-01 20:52来自 微博网页版
哎呀,ChatGPT上这个Other语言真的好难猜啊 ​
14
2
17
贾凡-失落的大蒜
2026-07-01 20:48来自 微博网页版
火山的Coding Plan不支持自家的2.1, 原因我觉得很简单,其他家注水都放心,就自己家注水,让人发现了也不好,干脆不上最好了 ​
1
0
0
贾凡-失落的大蒜
2026-07-01 19:20来自 微博网页版
Sonnet 5在X上基本没一个说好的,不是贵就是蠢。 大家把Fable/Mythos都怨气都转移到Sonnet 5上了。 不过嘛,舆论可以作假,但是收入不会作假,企业更不会为了那点鸡毛蒜皮的事不买[泪奔] 我简单用用没什么区别,毕竟这么强的中训练在这不会出大问题。 剩下的就看经济承担能力了[泪奔] ​
1
0
0
贾凡-失落的大蒜
2026-07-01 17:31来自 微博网页版
Distilling reasoningmodels for efficient reasoning. 来至《Build A Reasoning Model》第八章。 ​
1
0
0
贾凡-失落的大蒜
2026-07-01 14:41来自 微博网页版
5.6短期(一两天内)估计上线不了 patience ​
1
1
0
贾凡-失落的大蒜
2026-07-01 12:35来自 微博网页版
Google Research 的 TabFM,本质上是把“表格预测”从传统 AutoML/XGBoost 工作流,推进到 表格基础模型 + ICL(上下文学习) 工作流。 TabFM 的目标是:给一张新的表,不再为每个数据集单独训练模型,而是把训练样本和待预测样本一起作为上下文输入,模型一次前向推理直接输出分类/回归结果。 地址 ​
0
0
0
贾凡-失落的大蒜
2026-07-01 11:43来自 微博网页版
随着Gemini Omni Flash上线, NotebookLM 中也提供了短视频概览 可惜NoteBookLM已经很没人提及了,但是他真的很棒[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-01 10:44来自 微博网页版
A➗的做法没有任何问题,但是也不妨碍我们骂他[泪奔]
Anthropic 之所以费尽心思搞这么多操作,又是明着反对,又是暗着封,还是为了防止护城河被开源模型被攻破。 好不容易收入超过了 OpenAI,好不容易趟出了一条路,如果开源模型的能力也在持续逼近,如果企业都转向开源模型,万亿美元的市值就不是那么牢固了。 ​
1
1
0
贾凡-失落的大蒜
2026-07-01 10:38来自 微博网页版
很多人不知道的是,AI背后的搜索引擎还是百度[泪奔]//@i陆三金:我经常因为自己习惯性地去搜索,而不是去问 AI,而感到自己不够 ai -native//@Zodzod_张浩:牛//@白城以北://@桃桃冰茶yolo:以前搜半天,现在一句话加张图就搞定
AI平台让百度更惨是这必然的,比如我有一张图片,用豆包就能搜索出你要的答案,并且非常详细。 ​​​​
1
0
0
贾凡-失落的大蒜
2026-07-01 10:30来自 微博网页版
抱抱脸的CEO说,Stanford的一项研究显示,71.3% 的 ChatGPT 查询都可以被本地模型准确回答。 这话说的对,但是你说本地模型就能“在一部分场景”顶替云端,这个问题就很大。 别说71.3%了,就是91.3%,也是远远不够的,就是因为你无法区分那回答不准确的部分是什么。 一旦错误/返工,这个带来的价值 ​
0
0
0
贾凡-失落的大蒜
2026-07-01 10:17来自 微博网页版
X的流都说Sonnet 5贵,小规模用没啥感觉。 ​
0
0
0
贾凡-失落的大蒜
2026-07-01 09:30来自 微博网页版
期待好久的PG(19,预览版了)官方的图式查询: user → likes → topic ← likes ← peer → follows → creator ​
0
1
0
贾凡-失落的大蒜
2026-07-01 09:21来自 微博网页版
我最近觉得@评论罗伯特 越来越出金句了[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-01 09:20来自 微博网页版
原来Sonnet 5是最贵的模型。。。失敬失敬。。。 ​
0
1
0
贾凡-失落的大蒜
2026-07-01 09:11来自 微博网页版
现在很多模型,仅仅只是能力提升了,但是智慧没有提升,反倒是倒退。 他们仅仅擅长执行任务,而不是思考发现,而且RL只会加速这种现象。 希望模型能够解决一些诸如数学、生物的问题,并且发表出来。 而不是仅仅是swe。 当然我还是最喜欢swe高一点的模型[泪奔] 图为GPT自己家推出的GeneBench-Pro, ​
0
1
0
贾凡-失落的大蒜
2026-07-01 08:56来自 微博网页版
回复@贾凡-失落的大蒜:好像仅仅是促销价格,好像以后还会涨回来[泪奔]//@贾凡-失落的大蒜:再不便宜就被5.6抢光了,这样压力又来到了GPT[二哈]
sonnet5 比 sonnet6嗨便宜了 ​
0
0
0
贾凡-失落的大蒜
2026-07-01 08:54来自 微博网页版
赶紧体验一下[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-07-01 08:51来自 微博网页版
无人知晓的角落,Gemini Omni Flash出了[泪奔] ​
0
1
0
贾凡-失落的大蒜
2026-07-01 08:21来自 iPhone客户端
再不便宜就被5.6抢光了,这样压力又来到了GPT[二哈]
sonnet5 比 sonnet6嗨便宜了 ​
0
1
0
贾凡-失落的大蒜
2026-07-01 08:19来自 微博轻享版
就看GPT 5.6了
Claude Fable 5 和 Mythos 5 解禁 ​
0
1
1
贾凡-失落的大蒜
2026-06-30 22:17来自 微博轻享版
7月份又会是大模型月(以后每个月应该都是了) 已知的包括Sonnet GPT5.6 kimi DeepSeek Grok ​
1
0
1
贾凡-失落的大蒜
2026-06-30 22:12来自 微博轻享版
MoA模式(就是所谓现在的model router),个人感觉最大的敌人就是缓存。 模型命中率低证明router好用,可能更费钱, 模型命中率高证明router难用,可能更弱智。 ​
0
0
3
贾凡-失落的大蒜
2026-06-30 21:44来自 微博轻享版
Claude Code的黑名单,A➗就是A➗[泪奔]。 不过总体来说CC是他们自己家产品。 但是出生就是出生 ​
2
1
2
贾凡-失落的大蒜
2026-06-30 20:34来自 iPhone客户端
还是大肚子更可靠[二哈] http://t.cn/AXo7yOAX
分享图片 ​
0
0
0
贾凡-失落的大蒜
2026-06-30 19:37来自 微博轻享版
通义新发布的混合注意力,HydraHead,这是一种新的注意力混合架构,在头部级别融合了全注意力(Full Attention)和线性注意力(Linear Attention)。 ​
1
0
1
贾凡-失落的大蒜
2026-06-30 19:14来自 微博网页版
以前写个100页招标文档得吐血,即使用AI也费劲,直到有了/goal[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-06-30 18:11来自 微博网页版
顺便一说,今天好像Claude Sonnet 5 发布,这个应该是CC超越Codex的窗口期直到GPT 5.6发布。 ​
2
0
2
贾凡-失落的大蒜
2026-06-30 18:09来自 微博网页版
呃,CC检测是否是中国IP/市区/地址好像不是什么新闻了。 以下是内容的核心要点: 1. 核心发现(技术细节) 触发条件:从 2026 年 4 月 2 日发布的版本 2.1.91 开始,如果用户启用了代理(Proxy),Claude Code 就会在本地触发特定检测。 检测内容:系统会检查用户的时区是否为中国(如 Asia/Shangha ​
0
0
0
贾凡-失落的大蒜
2026-06-30 18:07来自 微博网页版
DSpark效率还是杠杠的,就是不知道具体用起来咋样,比如上下文、表现等 ​
1
0
0
贾凡-失落的大蒜
2026-06-30 18:02来自 微博网页版
强身份才能验证。 估计黄牛、中转收费也得很贵,美国人身份证估计也跟着涨价[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-06-30 16:15来自 微博轻享版
openPangu2.0?! 这个肯定是No.1,遥遥领先 ​
0
0
0
贾凡-失落的大蒜
2026-06-30 14:32来自 微博网页版
个人体验:GLM不善于大量创造,但是善于修改完善。 ​
0
1
1
贾凡-失落的大蒜
2026-06-30 13:16来自 微博网页版
我错了,X的MCP收费,好像也不便宜,能按量收费。 完全不如twexapi.io ​
1
1
1
贾凡-失落的大蒜
2026-06-30 09:48来自 微博网页版
重置了,消耗了1个号的5h额度。。。早知道开fast,我这人还是善[泪奔]
再次重置,而且是1个小时后,那还等啥,赶紧用啊。。。 ​
1
1
0
贾凡-失落的大蒜
2026-06-30 09:43来自 微博网页版
马斯克你这不是啪啪打weibo的脸么, 你这免费别人咋玩啊[泪奔] ​
4
6
1
贾凡-失落的大蒜
2026-06-30 08:34来自 微博网页版
原来是iOS版的Cursor[泪奔] http://t.cn/AXSsoYjz
Composer 3? ​
0
0
1
贾凡-失落的大蒜
2026-06-30 08:25来自 微博网页版
参数是真猛,而且是完整国产化,这个是国内第一个实现的吧? LongCat-2.0,它是一个总参数量达 1.6 万亿、每个 token 激活约 480 亿参数的 MoE 语言模型。LongCat-2.0 相比此前的 LongCat 系列引入了多项架构改进,实现了模型能力的显著跃升。 LongCat-2.0的完整训练流程与大规模部署均全部使用国产 ​
0
4
1
贾凡-失落的大蒜
2026-06-30 08:14来自 微博网页版
美团的Longcat 2也刷爆了,远超GPT 5.5。 用的人有福气了。 不过咱有一说一,这个模型就是在OpenRouter上现在当日的第三名。 为啥第三,因为免费啊[泪奔] ​
0
1
2
贾凡-失落的大蒜
2026-06-30 08:08来自 微博网页版
Devin也来搞router模型了,这可能是小厂商存活下去的方式。 国内就没这个烦恼,价格都差不多。 另外我吐槽一下,在Devin这里GPT就是垃圾,我怀疑用Devin都是搞前端的。 ​
0
1
0
贾凡-失落的大蒜
2026-06-30 07:53来自 微博网页版
再次重置,而且是1个小时后,那还等啥,赶紧用啊。。。 ​
2
2
1
贾凡-失落的大蒜
2026-06-29 23:34来自 微博网页版
欧盟的 AI 监管专家 >>> AI 研究人员 ​
0
0
0
贾凡-失落的大蒜
2026-06-29 23:32来自 微博网页版
其实我很同意,就Loop来说,非从业人员根本不用考虑,很快就是基操了。 ​
0
0
0
贾凡-失落的大蒜
2026-06-29 23:31来自 微博网页版
Composer 3? ​
2
1
0
贾凡-失落的大蒜
2026-06-29 23:28来自 微博网页版
下次去海外买水军还是要专业的,模型都写不对,对标也不对,这样的得扣钱 ​
0
0
1
贾凡-失落的大蒜
2026-06-29 23:24来自 微博网页版
Codex又bug了,GPT 5.3又回来了 ​
0
0
0
贾凡-失落的大蒜
2026-06-29 23:19来自 微博网页版
我也考虑山寨一个过这样的产品,Uber有一个最佳实践挺好的(那时候还是今年年初呢[泪奔]),重点就是闭环+Loop。我还是喜欢Uber的Server Loop + Client Plugin,那个复杂度就高一些。这个也是非常直接参考的。
做了套像素风的multiagents开发平台,pixelops[二哈] 其实现在大家玩的都是 Claude Code / Codex 帮我写代码”。 从企业的维度来讲,这真只是第一阶段。 真正大的方向,是把这些 Coding Agent 变成企业软件交付流程里的受控劳动力。 VSCode、Claude Code、Codex 更像开发者的帮手,就算是goal,就算是 ​
1
0
1
贾凡-失落的大蒜
2026-06-29 22:21来自 微博网页版
其实我虽然天天吵吵本地/ollama/9B/12B模型, 但我深知如果没有2张90系显卡或者M5 Pro 128G以上的内容,以目前的模型能力看,本地模型都不太可用。小的不好用,大的跑不了。 能跑和能用完全是两个概念,特别是现在工具的上下文都爆了。 当然你非说能用,那确实能用,但要非说能用,也不太能用,如用 ​
1
0
0
贾凡-失落的大蒜
2026-06-29 22:03来自 微博网页版
谁还提Rust[泪奔],必须C/C++ ​
0
0
0
贾凡-失落的大蒜
2026-06-29 22:01来自 微博网页版
Postgresql 19 新特性。 现在还有人关注MySQL更新么[泪奔] ​
0
0
0
贾凡-失落的大蒜
2026-06-29 19:31来自 iPhone客户端
你这么一说我突然发现,是GitHub 场景在发生变化,从技术社区向社交转化了,变成小红书了[二哈]//@i陆三金:变成这样,在座的各位也是有责任的,天天转发这个 skill、那个 skill[doge]//@贾凡-失落的大蒜:一个skills上万star[二哈]一个基础项目才几百几千[二哈]只不过社区中混入更多不同水平的人罢了。
Github确实变了 ​
0
0
0
贾凡-失落的大蒜
2026-06-29 19:26来自 iPhone客户端
跟淘宝美团学二选一是吧[二哈]
新生代云厂商如果采用了 AMD 或 TPU,会被英伟达报复。但超大云厂商不会。 这应该属于供应链链主基操了[二哈] ​​​​ 补充:Lambda CTO 认为报道不正确。 ​
1
0
0
贾凡-失落的大蒜
2026-06-29 19:24来自 iPhone客户端
一个skills上万star[二哈]一个基础项目才几百几千[二哈]只不过社区中混入更多不同水平的人罢了。不能说是坏事,不过需要擦亮双[不愧是你]
Github确实变了 ​
0
1
0
贾凡-失落的大蒜
2026-06-29 19:15来自 iPhone客户端
???DSpark白研发了???
收到DeepSeek的邮件了没? 正式版7月中旬发布,(之前发布的是叫预览版) 会引入高峰时段价格(贵了) ​
1
1
0
贾凡-失落的大蒜
2026-06-29 14:18来自 微博轻享版
再补充一点,一般诸如Hermes能保护系统提示词不被压缩,但有一个关键问题:系统提示词中的安全规则是静态文本,而攻击者的指令是动态的、贴近当前任务的。当上下文紧张时,模型可能会"忘记"遵守系统提示词中的约束,尤其是在长上下文中,模型对远距离指令的遵循度会下降。
我再锤一下agent.qq.com 他的read竟然能读10M,这么弱智的设计么,直接上下文溢出绝对的安全危害。 一看就是vibe出来的垃圾,真拿邮件不当安全产品啊? ​
0
0
0
贾凡-失落的大蒜
2026-06-29 14:09来自 微博轻享版
这玩意就相当于用imap/pop3命令直连了。 大公司得有大公司的样子,不能像GitHub上skills上随便写写就完了。
我再锤一下agent.qq.com 他的read竟然能读10M,这么弱智的设计么,直接上下文溢出绝对的安全危害。 一看就是vibe出来的垃圾,真拿邮件不当安全产品啊? ​
1
0
0
没有更多微博了