刘聪NLP的微博_新浪新闻

刘聪NLP

2026-04-30 11:00来自微博网页版

又到月底了，我们持续进行国内开源模型总结。这一个月，各种Skills纵横，hermes热度取代openclaw成为Agent新贵，GPT-Image2炸裂效果，让有图有真相成为笑话, 而在模型部分，国内持续在卷，智谱GLM5.1、Kimi K2.6、Qwen3.6、混元HY-3.0-preview, 还有模型期待已久的DeepSeek-V4都开源了。当然国内

39

6

34

刘聪NLP

2026-06-20 16:35来自微博网页版

前段时间有群友问我，有什么比较好的TTS吗？恰好端午节在家闲着无聊，翻到了一个TTS模型-Confucius4-TTS，1.3B大小，无需参考文本可以无约束声音克隆，很适合本地部署，测试了一下之后，效果很不错，尤其是音色、情绪克隆这一块。比如，把之前给小孩做的唐诗300首的网站，增加其他语言。

1

0

2

刘聪NLP

2026-06-20 16:33来自微博音频

分享音频 http://t.cn/AXasWYph

0

刘聪NLP

2026-06-18 19:58来自微博网页版

6月初的时候，参加了赛豆科技的AIVA的发布会，有点AI原生的味道了，过去大家说AI上车，更多是车已经造好了，再把大模型、智能座舱、辅助驾驶这些能力加进去。 AIVA表达了另一种思路：先想清楚 AI 需要什么样的感知、交互、计算和决策能力，再去反推整车架构。也就是说，不是车里装了AI，是车从一开始

0

1

刘聪NLP

2026-06-18 17:57来自微博网页版

DeepSeek睁眼看世界了？闭上也行。今天DeepSeek的识图模式全量开放了，灰度的时候我有测过，论文解读我也写了，详细见： http://t.cn/AXam7d4d http://t.cn/AXam7d4r 经过一个多月之后，我以为会有所提高，复测了一下之前的结果，基本上没啥太大差别。实话实说，在我这，就是不太理想的，起

1

0

1

刘聪NLP

2026-06-13 16:40来自 HUAWEI Mate 50

glm更新的也太频繁了[笑而不语]爱了爱了

致开发者：GLM-5.2 全量开放，前沿智能属于所有人今天，一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻，我们更加坚信：科学应该是全球化的。通向 AGI（通用人工智能）的道路绝不应被高墙封闭。我们一直觉得，AGI 应当是全人类共同探索智能边界、解决复杂挑

0

刘聪NLP

2026-06-13 09:32来自 HUAWEI Mate 50

糟老头子坏的很，禁了fable5。#how i ai#

0

刘聪NLP

2026-06-12 23:24来自 HUAWEI Mate 50

回复@刘聪NLP:再补充， GLM 第一个版本是2021年3月18日，但是论文强调general language model，生成&理解统一模型，没强调large language model 错失国产第一//@刘聪NLP:补充一下，确实悟道1.0模型，提LLM的这个概念更早，但是我只看到了新闻稿，没找到模型或者相关paper

啥？盘古是国内第一个大模型？晚上刷手机，信息流全是老余在华为发布会的视频，说是国内第一个大模型，乃至于全世界都没有大模型概念的时候，盘古大模型就出了？我去翻了一下，该说不说，还是挺严的， PanGu-α 模型论文是2021年4月26号发的，同期，百度的Ernie3.0是2021年7月5日发的，盘古大

0

刘聪NLP

2026-06-12 23:24来自 HUAWEI Mate 50

补充一下，确实悟道1.0模型，提LLM的这个概念更早，但是我只看到了新闻稿，没找到模型或者相关paper

啥？盘古是国内第一个大模型？晚上刷手机，信息流全是老余在华为发布会的视频，说是国内第一个大模型，乃至于全世界都没有大模型概念的时候，盘古大模型就出了？我去翻了一下，该说不说，还是挺严的， PanGu-α 模型论文是2021年4月26号发的，同期，百度的Ernie3.0是2021年7月5日发的，盘古大

0

1

刘聪NLP

2026-06-12 21:30来自微博网页版

啥？盘古是国内第一个大模型？晚上刷手机，信息流全是老余在华为发布会的视频，说是国内第一个大模型，乃至于全世界都没有大模型概念的时候，盘古大模型就出了？我去翻了一下，该说不说，还是挺严的， PanGu-α 模型论文是2021年4月26号发的，同期，百度的Ernie3.0是2021年7月5日发的，盘古大

11

20

42

刘聪NLP

2026-06-09 09:03来自微博网页版

高考数学基本上被抹平了，测了一个30B级别的模型，数学全国卷一都145分。单选、多选全对，填空错了一道，不过roll三遍，会对一遍，算扣5分因为是纯文本大模型， 15题带图，不好测对不对，纯文本给到，然后，真的证明出来了，并且证明&解答都没问题，这就是海量训练的作用，无需图片，一样推理

2

1

4

刘聪NLP

2026-06-07 17:50来自微博网页版

数学考完了，我好奇2026年高考，各家大模型都能得多少分， PK起来了呀~#高考##how i ai#

0

1

0

刘聪NLP

2026-06-05 16:49来自微博网页版

5月开源模型汇总又来了，联合@微博AI ，推出汇总内容。这次增加了一些国外的开源模型，感觉现在国内开源模型的数量也在慢慢的减少，我感觉核心还是开源的神Qwen，更新的太慢了。。。。 5月的开源模型集中在面壁、千问、OpenMOSS、混元、小米、快手、美团、蚂蚁、阶跃等。除了下面的开源模型，国内

3

0

3

刘聪NLP

2026-05-29 01:41来自会员特权专用

http://t.cn/AX6mVFCa

0

1

刘聪NLP

2026-05-29 01:21来自微博网页版

来自群友，但是坤坤赢麻了 http://t.cn/AX6mtokI

opus4.8已经能用了[doge]，榜单上全面领先GPT5.5，指标很强了#how i ai# #ClaudeOpus4.8发布#

1

刘聪NLP

2026-05-29 00:53来自 HUAWEI Mate 50

opus4.8已经能用了[doge]，榜单上全面领先GPT5.5，指标很强了#how i ai# #ClaudeOpus4.8发布#

3

2

3

刘聪NLP

2026-05-28 18:25来自微博网页版

666[流鼻血]

1

2

刘聪NLP

2026-05-27 12:09来自微博网页版

M3模型要出了，改成了稀疏注意力 http://t.cn/AX6j7m2v

笑死了，确实，2个月没发模型已经很久了@歸藏的AI工具箱，卷死#how i ai#

0

刘聪NLP

2026-05-27 12:05来自微博网页版

笑死了，确实，2个月没发模型已经很久了@歸藏的AI工具箱，卷死#how i ai#

1

0

刘聪NLP

2026-05-21 14:15来自微博网页版

昨天是520，给最近沉迷于剑来的老婆，用Qwen3.7-max搓了个剑来的卡牌游戏，仿照三国杀做的玩法来做，人物、技能、问拳、避让、装备、弃牌这些机制都放进去了。目前素材还比较粗糙，后面我准备再用 GPT-Image2生成一些角色图和卡面图，把整体视觉替换一下，现在还在继续打磨中。得到了我媳妇的高

0

2

6

刘聪NLP

2026-05-21 14:12来自微博网页版

昨天是520，给最近沉迷于剑来的老婆，用Qwen3.7搓了个剑来的卡牌游戏，仿照三国杀做的玩法来做，人物、技能、问拳、避让、装备、弃牌这些机制都放进去了。目前素材还比较粗糙，后面我准备再用 GPT-Image2生成一些角色图和卡面图，把整体视觉替换一下，现在还在继续打磨中。得到了肯定的评价。

0

1

0

刘聪NLP

2026-05-21 12:11来自微博网页版

分享一个Agent开源项目，把KV Cache玩出了花，任务成本可降到Hermes的1/6 现在各种Agent框架泛滥，很多时候我们Token的消耗，大部分都花在了输入侧。系统提示词、工具定义、skill 描述、历史消息、文件内容、网页快照、压缩摘要，这些东西只要进入上下文，每一轮都可能参与计费。今天就给大家分享

1

3

5

刘聪NLP

2026-05-19 23:20来自微博网页版

震惊

我去 Karpathy 居然加入了 Anthropic，这下估计没有教程看了，啥也不会说了，希望还能多分享#how i ai#

1

0

2

刘聪NLP

2026-05-15 13:06来自微博网页版

冲了[不愧是你] http://t.cn/AXiKBlo3

藏师傅的 PPT Skills，感觉 GitHub star 马上就要破万了呀！没点 star 的朋友点点 star 吧，谢谢了。顺便让 Codex 分析了一下安装的数据，还挺有意思的。#how i ai# 这里尝试：github.com/op7418/guizang-ppt-skill

1

0

刘聪NLP

2026-05-15 13:02来自微博网页版

前几天刷到一个x，我醉了，说DeepSeek泄露用户的聊天数据，输入\<think\>会吐一些内容，这不就是幻觉吗？跟泄露用户的隐私数据有啥关系，就是special token injection没做好。不过，隐私泄露的问题，确实是大家在用LLM时比较注意的，担心被别人拿去当训练数据。其实各家训练都会做一些敏感信

1

2

6

刘聪NLP

2026-05-15 10:26来自微博网页版

Codex 终于上手机了，iOS和Android都能用。最近已经从Claude Code转向Codex，量大又好用，关键还不封号， OpenAI官方数据里，Codex周活有400万，以后手机端就能远程派任务，直接爽玩，心疼TRAE的三端协同5秒钟。。。。 #how i ai#

2

3

4

刘聪NLP

2026-05-14 19:45来自 HUAWEI Mate 50

笑死了，有人在偷吃[doge]

4

7

30

刘聪NLP

2026-05-14 17:59来自 HUAWEI Mate 50

对，他在发微博

怎么能说老马在玩手机呢？这场面当然要拍照留念了。

0

2

刘聪NLP

2026-05-14 17:57来自 HUAWEI Mate 50

赶紧去研究一下[笑而不语]

腾讯刚开源的Agent记忆项目TencentDB-Agent-Memory 地址：github.com/Tencent/TencentDB-Agent-Memory “TencentDB Agent Memory 帮助 Agent 学会你的流程、保留任务上下文、复用历史经验。但我们拒绝暴力的历史堆砌，也抛弃不可逆的暴力摘要。我们将记忆设计为一套极具层次感的系统，以符号化记忆解

0

1

刘聪NLP

2026-05-14 09:00来自微博网页版

闷声搞了一年OPC，离职了，不装了我最近刚离职，一直认真想一件事，怎么全职做一人公司。对，就是全职，了解我的朋友都知道，我其实很早就在运营的自媒体账号，业余时间也会做一些tob企业的落地工作，现在大火的OPC变现方向，主要就是3个路径， - 做自媒体，利用IP进行变现 - 做tob企业服务，

3

2

6

刘聪NLP

2026-05-13 09:25来自 HUAWEI Mate 50

马上开始啦，昨天晚上跟一帮自媒体朋友学的，随手拍，先拍起来[doge] #how i ai##百度ai开发者大会# http://t.cn/AXiVMAyo

0

4

22

刘聪NLP

2026-05-13 09:21来自 HUAWEI Mate 50

来了，百度AI开发者大会 #ai创造营# http://t.cn/AXiVIVve

0

2

刘聪NLP

2026-05-12 13:09来自微博网页版

对，我只会cursor、claude code、codex这些，不会vibe coding，今日笑点 #ai创造营##how i ai#

0

1

2

刘聪NLP

2026-05-11 22:05来自 HUAWEI Mate 50

酷

【🎉限量开放！微博V创作中心抢先体验】创作找选题难？没灵感？来微博V创作中心一键开启AI创作！全站热点线索实时聚合，创作版权素材一键调取，热门IP玩法持续更新。 💥多类型AI创作工具全程加持，满足多场景覆盖，更有现金和流量双重激励等你来拿。 👉 PC端入口：发布框下方-V创作中心

0

刘聪NLP

2026-05-09 20:38来自 HUAWEI Mate 50

反直觉诶，我觉得人对html的高密度信息是通过视觉解决的。对于llm来说，html难道不会额外增加解析负担嘛[doge]

Claude Code 团队内部，正在发生一场有趣的范式转移。据 Claude Code 开发者 Thariq 说，他们正在逐渐放弃 Markdown，全面采用 HTML 作为 AI 的默认输出与沟通媒介。 100 行是人类阅读 AI 生成 Markdown 文件的耐心临界点，超过此长度，阅读意愿呈断崖式下跌。 HTML 拥有降维打击般的信息密度：它

0

1

刘聪NLP

2026-05-09 20:30来自 HUAWEI Mate 50

me too//@欧巴聊AI:很看好阶跃[并不简单]//@刘聪NLP:几家欢喜几家愁，哈哈哈[doge]//@蚁工厂:智谱和minimax已上市，百川智能、零一万物已经基本退出大模型竞争了， Kimi还在融资，感觉不急着上市. //@刘聪NLP:六小龙，还剩下谁[笑而不语]

阶跃星辰也快上市了

0

刘聪NLP

2026-05-09 14:50来自微博网页版

今天刷x刷到，文心5.1在Search Arena上冲到全球第4，见图1-3。仔细一看，是style-control off情况，不过style-control on整体排名下降，但国内仍然是第一。 PS： style-control off是原始投票分数，会因为格式、长度、排版拿到高分红利，on会进行校准，剔除这些因素。这次算找准角度了，search深耕

0

刘聪NLP

2026-05-09 09:42来自 HUAWEI Mate 50

所以，不先开vlm模型吗[doge]

【#曝DeepSeekV4.1下月发布#】北京时间昨日（8 日）晚间，The Information 援引两名直接了解讨论情况的人士消息称，DeepSeek 正寻求完成首轮融资，目标高达 500 亿元人民币。知情人士还透露，DeepSeek 计划在 6 月发布 V4 模型的更新版本 V4.1。

0

刘聪NLP

2026-05-08 13:36来自 HUAWEI Mate 50

几家欢喜几家愁，哈哈哈[doge]//@蚁工厂:智谱和minimax已上市，百川智能、零一万物已经基本退出大模型竞争了， Kimi还在融资，感觉不急着上市. //@刘聪NLP:六小龙，还剩下谁[笑而不语]

阶跃星辰也快上市了

2

0

刘聪NLP

2026-05-08 13:18来自 HUAWEI Mate 50

六小龙，还剩下谁[笑而不语]

阶跃星辰也快上市了

10

0

刘聪NLP

2026-05-08 10:51来自 HUAWEI Mate 50

要从cc转到codex了[doge]

Codex 越来越猛了，昨天更新增加了内置的谷歌浏览器插件，可以直接控制你的谷歌浏览器执行任务。而且它可以在后台跨浏览器页面并行工作，不耽误你正常使用浏览器。所谓“并行工作”，指的是你可以启动多个子 SubAgent 帮你操作多个网页。我试了一下，发现最厉害的一点是：它不仅可以控制 Chrome，

1

0

刘聪NLP

2026-05-07 20:30来自 HUAWEI Mate 50

上有政策，下有对策，需要社区发力了[笑而不语]

Claude Desktop 今天的更新会校验模型名字，此前社区利用 Gateway 接口接入DeepSeek等其他模型的方法失效了。

0

2

刘聪NLP

2026-05-07 20:30来自 HUAWEI Mate 50

//@蚁工厂:转发微博

关于 AI Coding 和 Harness 最近写的一些内容：让ai学会并发干活儿 http://t.cn/AXIAvc4I 让AI能够复用过去的经验，把代码写的更好 http://t.cn/AXIAvc4X 如何让AI进入疯狂工作模式 http://t.cn/AXIAvc4i 让AI输出效果提升五倍 http://t.cn/AXIAvc4M AI解放双手，如何把工作托管给浏览器

0

刘聪NLP

2026-05-07 20:24来自 HUAWEI Mate 50

回复@karminski-牙医:合理，scaling因素很大，并且之前ds都没超过T级别，这次也是对资源的很大挑战，要不然也不能晚了这么久//@karminski-牙医:我猜scaling是主要问题, 毕竟上线性注意力的超过1T的模型现在也没几个（应该只有Ring-2.5-1T，Ling-2.6-1T 和 MiMo-V2.5-Pro ？）

DeepSeek V4为什么没有采用自家的Engram技术？ V4的技术报告里有一句很容易被滑过去的话，未来方向，包含条件记忆模块。而这个sparse embedding modules对应的论文，就是《Conditional memory via scalable lookup: A new axis of sparsity for large language models.》条件记忆就是。 1月发的

0

刘聪NLP

2026-05-07 20:22来自微博网页版

今天千问PC端上线AI语音输入，聊一下。口喷已经成为了新时代与ai交互的方式。谁赞成，谁反对。。。传统语音输入解决的是输入效率问题，核心目标是，把你说的话尽可能准确地转成文字。识别率高一点，速度快一点，标点自然一点，本质上还是键盘的替代品。 AI语音输入则是在解决表达效率的问题，

1

6

35

刘聪NLP

2026-05-07 15:58来自 HUAWEI Mate 50

笑死了，很棒，我看了，功能很全，很有创意[doge] #ai创造营#

0

1

2

刘聪NLP

2026-05-07 12:10来自 HUAWEI Mate 50

敌人的敌人就是朋友[doge]

#xAI更名SpaceXAI# 马斯克真狠啊～我xai怎么样没事，但你OpenAI必须死…… 🤷

0

刘聪NLP

2026-05-07 11:31来自微博网页版

DeepSeek V4为什么没有采用自家的Engram技术？ V4的技术报告里有一句很容易被滑过去的话，未来方向，包含条件记忆模块。而这个sparse embedding modules对应的论文，就是《Conditional memory via scalable lookup: A new axis of sparsity for large language models.》条件记忆就是。 1月发的

35

3

42

刘聪NLP

2026-05-06 19:32来自微博网页版

Dflash可以提高6倍，但不知道效果是否会有下降 http://t.cn/AXJQEYLY http://t.cn/AXJQEYLT

Google开源了Gemma4的系列草稿模型，借助这些草稿模型，可以将推理速度提升3倍。核心是利用推测解码（Speculative Decoding）的思路，让草稿模型（轻量）一次性预测出多个Token（MTP，Multi-Token Prediction），作为草稿，再利用主模型进行验证，若主模型完全认可草稿：所有草稿 token 一次性接

1

0

刘聪NLP

2026-05-06 17:26来自 HUAWEI Mate 50

[doge][doge][doge]

？特朗普他儿去开AI中转站了。还提供deepseek qwen等国产模型[awsl] 看评论感觉这家服务有猫腻，不建议用[并不简单] #AI创造营#

0

1

0

刘聪NLP

2026-05-06 15:55来自 HUAWEI Mate 50

虽然speculative decoding不是新东西，但是对草稿模型的魔改还蛮有意思的[笑而不语]

Google开源了Gemma4的系列草稿模型，借助这些草稿模型，可以将推理速度提升3倍。核心是利用推测解码（Speculative Decoding）的思路，让草稿模型（轻量）一次性预测出多个Token（MTP，Multi-Token Prediction），作为草稿，再利用主模型进行验证，若主模型完全认可草稿：所有草稿 token 一次性接

0

刘聪NLP

2026-05-06 15:51来自微博网页版

Google开源了Gemma4的系列草稿模型，借助这些草稿模型，可以将推理速度提升3倍。核心是利用推测解码（Speculative Decoding）的思路，让草稿模型（轻量）一次性预测出多个Token（MTP，Multi-Token Prediction），作为草稿，再利用主模型进行验证，若主模型完全认可草稿：所有草稿 token 一次性接

8

4

9

刘聪NLP

2026-05-06 12:55来自微博网页版

看到reddit上有人，将台灯改成Claude Code的代码状态指示灯。利用开源项目，http://t.cn/AXJHycXe #how i ai# http://t.cn/AXJHySnN

0

1

刘聪NLP

2026-05-03 19:27来自 HUAWEI Mate 50

DeepSeek已进行兼容性调整，400错误改善之前说的，因为reason result导致的第三方agent或者chatbot报错400的问题， deepseek官方做了兼容性调整，之前有问题的，可以重试。 #how i ai##deepseek#

0

2

刘聪NLP

2026-05-01 19:58来自微博网页版

DeepSeek官方发布Agent接入手册 http://t.cn/AXJ5Y3Vp 我前两天分享过一篇内容，就是也许大家用的都还不是满血的DeepSee..., 核心是其实你在用DeepSeek-Pro的时候，可能没有触发max思考，然后现在官方给了一份agent接入文档，编程IDE和主流Agent都有，涉及， Claude Code、GitHub Copilot、GitH

2

0

2

刘聪NLP

2026-05-01 11:36来自 HUAWEI Mate 50

转发微博

给大家说下目前使用 DeepSeek-V4 (pro/flash) 的最需要注意的问题. 本身其实并不算 bug, 但是却很致命. 问题大概是这样的, 在请求 DeepSeek API 或者 terminal coding agent (claude code, kimi cli 等) / AI IDE (cursor 等) 用 DeepSeek 的时候偶尔会遇到报错: HTTP 400 {"error":{"message":"The

0

1

刘聪NLP

2026-05-01 00:24来自微博网页版

DeepSeek多模态技术报告，详细解读! 果然是放假之前必作妖，说好的中国人不卷中国人呢？《Thinking with Visual Primitives》，提出了一个全新的推理框架，把空间标记（bounding box 与 point）内嵌进思维链，作为语言与图像之间的精确指针，让模型做到一边指点一边推理。思路很正，就像人在走迷

11

21

36

刘聪NLP

2026-04-30 12:24来自 HUAWEI Mate 50

回复@美食家御逍遥:ds真是把价格卷死了[笑而不语]//@美食家御逍遥:卷起来是好事。越来越便宜了。

又到月底了，我们持续进行国内开源模型总结。这一个月，各种Skills纵横，hermes热度取代openclaw成为Agent新贵，GPT-Image2炸裂效果，让有图有真相成为笑话, 而在模型部分，国内持续在卷，智谱GLM5.1、Kimi K2.6、Qwen3.6、混元HY-3.0-preview, 还有模型期待已久的DeepSeek-V4都开源了。当然国内

1

0

1

刘聪NLP

2026-04-30 12:23来自 HUAWEI Mate 50

太酷了

我操，Codex 太牛逼了！自己给我做了一个类似于《杀戮尖塔》的爬塔游戏，从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏，要中国风格的这是能玩的！#how i ai#

0

刘聪NLP

2026-04-29 22:30来自微博网页版

因为，模型还没开源，其他信息模型相关信息还不知道，只能在网页端，测试一些这个VLM模型的视觉能力。现在还在是灰度状态，所以不确定现在模型是什么版本，也许灰度之后，模型会进行微调，效果会更好。 DeepSeek 识图模式实测。当前测试结果，只针对现在灰度模型。我的这个测试纯对比Qwen3.5-

5

1

0

刘聪NLP

2026-04-29 15:36来自 HUAWEI Mate 50

弃书从博[doge]

小红书确实烂透。经常有在上面做生意的朋友跟我吐槽，这个平台烂得很。我没当真，因为我毕竟在小红书赚钱。可是这波小红书直接给我关掉了蒲公英，说我刷量，关键这都是投薯条的量，四月在上面花了小五千了，没有刷量。我问如何自证？小红书那边没有任何办法，申诉也是失败，还是说烂透

1

0

刘聪NLP

2026-04-29 15:31来自 HUAWEI Mate 50

回复@千问:到时候横测一波[笑而不语]//@千问:这波灰度确实快，看来DeepSeek的多模态布局早就准备好了。等开源之后，不管是做项目还是写代码，又能多一个得力的工具了，期待正式上线！

我就说vlm这么火，原始多模态已经很多家都验证了， deepseek怎么可能没有呢？原来，马上就来了呀，已经开始灰度了，离开源不远了。。。抓包可以看到图像识别模式。 #deepseek# #DeepSeek多模态开启灰测##DeepSeek多模态值得期待吗#

0

2

刘聪NLP

2026-04-29 15:11来自 HUAWEI Mate 50

我就说vlm这么火，原始多模态已经很多家都验证了， deepseek怎么可能没有呢？原来，马上就来了呀，已经开始灰度了，离开源不远了。。。抓包可以看到图像识别模式。 #deepseek# #DeepSeek多模态开启灰测##DeepSeek多模态值得期待吗#

2

3

刘聪NLP

2026-04-27 15:23来自微博网页版

也许大家用的都还不是满血的DeepSeek-V4，昨天发完DeepSeek的解读和测试内容，群里细心的小伙伴问了一个问题，就是测得是high模式还是max模式，很明显是high。我相信很多人在一手测试的时候，都不会注意，或者说用的都是默认参数。我今天又测试了3千万 Tokens，使用max之后，在coding和agentic

10

4

17

刘聪NLP

2026-04-27 15:22来自微博网页版

DeepSeek-V4实测感觉， Pro水平相较于国内三家差不多，但对于一句话实现的效果没那么好 flash的水平，相较于前两天测试的ling-2.6-flash和hy3-preview要好一些复杂理解Pro没有问题，但flash会不稳定，比如老鹰问题可以理解“但丁真”，但不能理解“坦克有后视镜” 对于小鱼的SVG，flash模型跟hy

1

0

1

刘聪NLP

2026-04-27 15:16来自微博网页版

DeepSeek-V4开源， DeepSeek-V4-Pro（1.6T，激活49B）、DeepSeek-V4-Flash（284B，激活13B）。其实还是，有一点点小失望的，就是这个V4还是一个纯文本的模型，并不是多模态模型。不过说回来，DeepSeek也真是国内一股清流，一句“不诱于誉，不恐于诽，率道而行，端然正己。” 道破本心。看完Deep

0

6

刘聪NLP

2026-03-17 17:34来自 HUAWEI Mate 50

回复@AI金三啊:刷到了，哈哈哈，很久没更了[doge]//@AI金三啊:回复@刘聪NLP:笑死，聪哥也来微博了

Token消耗量，正在成为你的新简历我最近有一个很直观的观察。一个人消耗的 Token 数量，直接代表了他驾驭 AI 的水平。这个其实不是我说的，只是我观察到一些厂商的招人需求，来得到的判断。现在有些公司招人开始看一个全新的指标了。他们会要求候选人提供一些后台截图。甚至要求看主流代码编辑

0

刘聪NLP

2026-03-17 17:01来自微博网页版

确实，上来就说用了1T Tokens消耗了，专注ai[吃瓜]

Token消耗量，正在成为你的新简历我最近有一个很直观的观察。一个人消耗的 Token 数量，直接代表了他驾驭 AI 的水平。这个其实不是我说的，只是我观察到一些厂商的招人需求，来得到的判断。现在有些公司招人开始看一个全新的指标了。他们会要求候选人提供一些后台截图。甚至要求看主流代码编辑

0

刘聪NLP

2026-02-11 22:48来自微博 weibo.com

发布了头条文章：《阶跃星辰为何将大模型命名为Step 3.5 Flash？》 http://t.cn/AX5sFeQt

0

3

刘聪NLP

2026-01-20 02:47来自生日动态

http://t.cn/AXGHIaEK

0

刘聪NLP

2025-12-31 15:16来自微博 weibo.com

发布了头条文章：《最近玩GUI模型到上头，手搓打卡神器，附教程》 http://t.cn/AX43EMzm

0

1

刘聪NLP

2025-11-17 12:55来自微博网页版

千问APP到底行不行呀？前两天，国外出现了一个新词汇，叫Qwen Panic，就是千问恐慌，涉及敏感话题的我就不说了，感兴趣的朋友可以去搜搜。背景呢主要是Qwen发展的太快了，已经占据开源的大头，现在基本上学术研究，大部分在Qwen系列模型基础上进行实验，同时Qwen衍生出来的模型，也是占比最多的。

0

3

刘聪NLP

2025-10-22 15:35来自微博 weibo.com

发布了头条文章：《再谈DeepSeek-OCR的信息压缩论！附DeepSeek-OCR与PaddleOCR实测对比》 http://t.cn/AXwKO1jb

0

1

2

刘聪NLP

2025-10-21 18:57来自微博网页版

Qwen3的VL模型测试感悟， - 表格识别，Qwen3-VL依旧牛逼，本来Qwen2.5-VL就很强 - 对色彩的把握程度变高，之前色盲测试一堆问题，现在多次实验，结果均正确 - 图片排序任务，雪糕对了，菌子错了，但也解释比较合理，相较于Qwen2.5提高很多，并且比主流开源VL模型效果要好 - 网页复刻任务效果比较差，这

1

5

刘聪NLP

2025-09-16 09:38来自微博 weibo.com

发布了头条文章：《可灵AI数字人 Kling-Avatar上线，从对口型到会表演！附实测案例！》 #可灵ai# #ai数字人# http://t.cn/AXhVc6cW

0

4

刘聪NLP

2025-09-05 09:24来自微博 weibo.com

发布了头条文章：《快手开源Keye-VL1.5：8B多模态模型细节揭秘，短视频理解很强！》 http://t.cn/AXPi8eKX

0

9

刘聪NLP

2025-08-27 20:07来自微博 weibo.com

发布了头条文章：《最强开源8B级VLM模型！高刷视频理解的有救了～》 http://t.cn/AXvHdYJj

0

9

刘聪NLP

2025-07-18 18:23来自 HUAWEI Mate 50

被AI硬件感动的瞬间朋友推荐，买了个AI硬件，前段在朋友圈被刷屏，号称随身AI搭子的TicNote。前天还爆出，断货了，辛亏搞得早~见图2. 我到手第一次用，是跟老婆晚视频聊天，也是那一次让我对TicNote的好感值直线上升。由于现在异地（之前从上学就基本上没怎么分开过），现在很不适应，虽然周末回

0

6

刘聪NLP

2025-07-14 17:21来自 HUAWEI Mate 50

转发微博

【世界奇特美妙，AI#源来如此# 】 ⚖️ 开源，加快了AI发展的速度。代码共享、技术复用，让AI不再是少数巨头的专利。 [疑问]但同时，自研与共享的界限，也变得越来越模糊。模型之间的结构相似，究竟是合理借鉴，还是过度沿用? 当争议难以通过主观判断，我们有一种技术方案可以提供依据——LLM指纹分

0

刘聪NLP

2025-07-03 17:22来自微博 weibo.com

发布了头条文章：《混元A13B实测出炉，腾讯补上开源MoE模型的“尺寸断档”》 http://t.cn/A6DRw0HZ

0

4

刘聪NLP

2025-06-17 14:28来自微博 HTML5 版

MiniMax开源周Day1，开源 MiniMax-M1模型卷起来了呀，MiniMax也玩起了开源周，哈哈哈哈，这是对标DeepSeek开源周的节奏呀！先狠狠地期待一手，不知道后面四天都会有什么内容，不过，现在大模型厂真的卷到飞起了！ Day1，MiniMax 是先开源了混合注意力推理模型-M1，这个模型是在今年1月份开源的Min

0

1

刘聪NLP

2025-05-22 12:17来自微博网页版

实测天工超级智能体Skywork Super Agents，周一晚上，一朋友跟我说，有个爆炸好用的Agent，生成的PPT他直接给老板交作业了，见图1。他们主打基于deep research的office三件套。 Link：http://t.cn/A6g0syVW ，需要魔法！整体体验下来，交互体验非常好，并且生成内容均基于自研的Deep Research模

1

0

4

刘聪NLP

2025-04-07 08:09来自 HUAWEI Mate 50

llama4让我失望极了[doge]//@karminski-牙医:这个比llama-4良心多了[开学季]

QWEN3的一些谍报： - 30T training tokens,这最起码是个多模态了，和llama4持平 - a 0.6B draft model 做speculation decoding用的，这么小的draft,推理可得多快 3款要发的MOE - 16B/2A , - 46B/7A , - ≈330B/28A 据说训的时候也玩了ds的全局loadbalance, 训挺好就一句总结：16和46这个老

0

刘聪NLP

2025-04-01 08:46来自 HUAWEI Mate 50

今天是愚人节，openai开源的保真量-10086[doge]

0

1

刘聪NLP

2025-03-27 07:44来自 HUAWEI Mate 50

Qwen再开源，多模态Qwen2.5-Omni-7B模型 #ai创造营# Qwen2.5-Omni-7B是一个端到端的多模态模型，可以接收文本、图像、音频和视频的输入，以文本或语音作为输出，参数模型结构见图2-3。 HF link: http://t.cn/A6BgC0d7 Paper： http://t.cn/A6BgnAe4 Qwen2.5-Omni提出了Thinker-Talker架构，同时提出

0

1

2

刘聪NLP

2025-03-24 10:10来自 HUAWEI Mate 50

转发微博

一款基于多模态大模型的 SVG 代码生成器。它将矢量化任务转换为代码生成任务，直接在 SVG 代码空间进行解析和生成。这种方式的最大优势在于，它不单单是对图像轮廓的拟合，而是结合了视觉和语言模型的能力，理解图像的语义结构，从而生成更紧凑、精确且富有层次感的 SVG 代码。在架构上，StarVector

0

刘聪NLP

2025-03-19 10:31来自 HUAWEI Mate 50

腾讯HunYuan-T1，是要开源吗？#ai创造营#

0

刘聪NLP

2025-03-18 10:40来自 HUAWEI Mate 50

早上刷到，Mistral也开源了，最近真是开源不断，大模型好起来了。#ai创造营# 本次Mistral开源的是一个24B的多模态，专打Google前几天发布的Gemma3-27B模型。 HF: Mistral-Small-3.1-24B-Instruct-2503 本次开源的3.1-small模型特点如下： - Apache 2.0 许可证，可以随便用； - 多语言：英语、法语

0

1

刘聪NLP

2025-03-17 14:45来自 HUAWEI Mate 50

讨论API Agent和GUI Agent之间的差异#ai创造营# API Agent和GUI Agent在完成相同任务时，有很大的区别，见图1。从多个维度（如模态、可靠性、效率、可用性、灵活性、安全性、可维护性、透明度和类人交互）对API代理和GUI代理进行了全面评估，见图2。同时讨论在不同场景下选择API代理、GUI代理或

0

1

刘聪NLP

2025-03-16 13:23来自 HUAWEI Mate 50

实测一手文心4.5和x1，#ai创造营# http://t.cn/A6B6FMxn

0

刘聪NLP

2025-03-13 16:24来自 HUAWEI Mate 50

该说不说，gemini2.0这个图像生成有点东西的，图来自网友。

0

刘聪NLP

2025-03-13 11:32来自 HUAWEI Mate 50

Gemini2.0-Flash更新，支持图文同时生成，有点意思！#ai创造营# Gemini2.0-Flash更新，支持图文同时生成，测试了一下蛮有意思的，在Google AI Studio上可以直接使用，见图2。 link: http://t.cn/A6BcCyoq 模型选择Gemini2.0-Flash Experimental，输出格式选择Images and Text。测试了几个，蛮有意

0

刘聪NLP

2025-03-13 08:39来自 HUAWEI Mate 50

火速更新[笑而不语]

抱歉，根据作者设置的微博可见时间范围，此微博已不可见。

0

刘聪NLP

2025-03-13 08:36来自 HUAWEI Mate 50

已经习惯md方式写作[苦涩]

#模型时代# Andrej Kaparthy新推文，我们的内容将不再是为人类而写，而是为模型而写。最近我也正在思考这件事情，实际上很多时候我们已经不直接阅读内容，而是间接阅读AI的二创内容，那么就要考虑让AI一手阅读更友好。唉，这个时代的车轮滚滚向前啊。 *** 虽然已经到了2025年，但我们今天绝大部分

0

2

1

刘聪NLP

2025-03-12 16:54来自 HUAWEI Mate 50

Google最新开源多模态模型-Gemma3！话不多说，线上链接： http://t.cn/A6B5Vjtq 此次开源了4个版本模型，包括1B、4B、12B和27B等4个尺寸，详细概述如图2所示，来自x@danielhanchen。 27B模型使用14T Tokens训练，12B模型使用12T Tokens训练，4B模型使用4T Tokens训练，1B模型使用2T Tokens训练。

0

3

刘聪NLP

2025-03-12 12:15来自 HUAWEI Mate 50

一字学[阴险]

Unsloth 发布了一篇语言模型微调的指南（当然是使用 Unsloth 做微调啦）。 http://t.cn/A6BUH1HY 它详细介绍了微调的基本概念，包括如何选择合适的模型和方法（如 LoRA 和 QLoRA），如何准备和使用数据集，以及如何调整模型参数以避免过拟合或欠拟合等。阅读本文后，读者可以了解微调的基本流程和最佳

0

1

刘聪NLP

2025-03-12 12:13来自 HUAWEI Mate 50

笑死了

抱歉，根据作者设置的微博可见时间范围，此微博已不可见。

0

刘聪NLP

2025-03-12 11:00来自 HUAWEI Mate 50

昨天发了一篇篇帖子，越狱Manus的提示词和29个工具，也是引起了一片讨论，Manus的Peak也是发帖回应，并说明还用了多个Qwen微调过的模型，并且很早之前开源的模型是基于Qwen模型训练的推理类模型。见图2。跟通义的人闲聊，他们说确实Manus和通义千问在进行开源模型方面的合作，感觉不久的将来会有一些有

0

刘聪NLP

2025-03-10 11:38来自 HUAWEI Mate 50

Manus被越狱了！套出Prompt和29个工具！！ #ai创造营# 今天刷x，发现一个有意思的帖子，获取Manus中"/opt/.manus/"里的文件， link: http://t.cn/A6BL9NZq 套出来Manus的Prompt，以及所需的Tool，见图3-5。过程： http://t.cn/A6BL9NZG Github： http://t.cn/A6BL9NZ5

0

刘聪NLP

2025-03-06 07:37来自 HUAWEI Mate 50

开源啦！千问推理模型QwQ-32B开源啦！ #ai创造营# 话不多说，线上链接： http://t.cn/A61FcAqP QwQ-32B模型为Dense模型，总参数32.5B，非嵌入参数31B，64层，采用GQA，Q为40，KV为8，上下文长度为131K。同时，指标很强，在LiveBench、IFEval、BFCL上都超过了DeepSeek-R1-671B模型。如图。值得注

4

1

2