刘聪NLP
刘聪NLP
刘聪NLP
这里是NLP刘聪,可能一点也不流通。 一位大模型从业者,现全职奶爸, 书籍《ChatGPT原理与实战》、《大型语言模型实战指南》作者
AI博主 其他 2025.01 加入
52关注
1980粉丝
223微博
刘聪NLP
2026-04-30 11:00来自 微博网页版
又到月底了,我们持续进行国内开源模型总结。 这一个月,各种Skills纵横,hermes热度取代openclaw成为Agent新贵,GPT-Image2炸裂效果,让有图有真相成为笑话, 而在模型部分,国内持续在卷, 智谱GLM5.1、Kimi K2.6、Qwen3.6、混元HY-3.0-preview, 还有模型期待已久的DeepSeek-V4都开源了。 当然国内 ​
39
6
34
刘聪NLP
2026-06-20 16:35来自 微博网页版
前段时间有群友问我,有什么比较好的TTS吗? 恰好端午节在家闲着无聊, 翻到了一个TTS模型-Confucius4-TTS,1.3B大小, 无需参考文本可以无约束声音克隆,很适合本地部署, 测试了一下之后,效果很不错,尤其是音色、情绪克隆这一块。 比如,把之前给小孩做的唐诗300首的网站,增加其他语言。 ​
1
0
2
刘聪NLP
2026-06-20 16:33来自 微博音频
分享音频 http://t.cn/AXasWYph ​
0
0
0
刘聪NLP
2026-06-18 19:58来自 微博网页版
6月初的时候,参加了赛豆科技的AIVA的发布会,有点AI原生的味道了, 过去大家说AI上车,更多是车已经造好了,再把大模型、智能座舱、辅助驾驶这些能力加进去。 AIVA表达了另一种思路:先想清楚 AI 需要什么样的感知、交互、计算和决策能力,再去反推整车架构。 也就是说,不是车里装了AI,是车从一开始 ​
0
0
1
刘聪NLP
2026-06-18 17:57来自 微博网页版
DeepSeek睁眼看世界了?闭上也行。 今天DeepSeek的识图模式全量开放了, 灰度的时候我有测过,论文解读我也写了, 详细见: http://t.cn/AXam7d4d http://t.cn/AXam7d4r 经过一个多月之后, 我以为会有所提高, 复测了一下之前的结果,基本上没啥太大差别。 实话实说, 在我这,就是不太理想的, 起 ​
1
0
1
刘聪NLP
2026-06-13 16:40来自 HUAWEI Mate 50
glm更新的也太频繁了[笑而不语]爱了爱了
致开发者:GLM-5.2 全量开放,前沿智能属于所有人 今天,一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻,我们更加坚信:科学应该是全球化的。 通向 AGI(通用人工智能)的道路绝不应被高墙封闭。我们一直觉得,AGI 应当是全人类共同探索智能边界、解决复杂挑 ​
0
0
0
刘聪NLP
2026-06-13 09:32来自 HUAWEI Mate 50
糟老头子坏的很,禁了fable5。#how i ai# ​
0
0
0
刘聪NLP
2026-06-12 23:24来自 HUAWEI Mate 50
回复@刘聪NLP:再补充, GLM 第一个版本是2021年3月18日,但是论文强调general language model,生成&理解统一模型,没强调large language model 错失国产第一//@刘聪NLP:补充一下,确实 悟道1.0模型 ,提LLM的这个概念更早,但是我只看到了新闻稿,没找到模型或者相关paper
啥?盘古是国内第一个大模型? 晚上刷手机,信息流全是老余在华为发布会的视频, 说是国内第一个大模型,乃至于全世界都没有大模型概念的时候,盘古大模型就出了? 我去翻了一下,该说不说,还是挺严的, PanGu-α 模型论文是2021年4月26号发的, 同期,百度的Ernie3.0是2021年7月5日发的, 盘古大 ​
0
0
0
刘聪NLP
2026-06-12 23:24来自 HUAWEI Mate 50
补充一下,确实 悟道1.0模型 ,提LLM的这个概念更早,但是我只看到了新闻稿,没找到模型或者相关paper
啥?盘古是国内第一个大模型? 晚上刷手机,信息流全是老余在华为发布会的视频, 说是国内第一个大模型,乃至于全世界都没有大模型概念的时候,盘古大模型就出了? 我去翻了一下,该说不说,还是挺严的, PanGu-α 模型论文是2021年4月26号发的, 同期,百度的Ernie3.0是2021年7月5日发的, 盘古大 ​
0
0
1
刘聪NLP
2026-06-12 21:30来自 微博网页版
啥?盘古是国内第一个大模型? 晚上刷手机,信息流全是老余在华为发布会的视频, 说是国内第一个大模型,乃至于全世界都没有大模型概念的时候,盘古大模型就出了? 我去翻了一下,该说不说,还是挺严的, PanGu-α 模型论文是2021年4月26号发的, 同期,百度的Ernie3.0是2021年7月5日发的, 盘古大 ​
11
20
42
刘聪NLP
2026-06-09 09:03来自 微博网页版
高考数学基本上被抹平了, 测了一个30B级别的模型,数学全国卷一都145分。 单选、多选全对, 填空错了一道,不过roll三遍,会对一遍,算扣5分 因为是纯文本大模型, 15题带图,不好测对不对,纯文本给到, 然后,真的证明出来了,并且证明&解答都没问题, 这就是海量训练的作用,无需图片,一样推理 ​
2
1
4
刘聪NLP
2026-06-07 17:50来自 微博网页版
数学考完了,我好奇2026年高考,各家大模型都能得多少分, PK起来了呀~#高考##how i ai# ​
0
1
0
刘聪NLP
2026-06-05 16:49来自 微博网页版
5月开源模型汇总又来了,联合@微博AI ,推出汇总内容。 这次增加了一些国外的开源模型,感觉现在国内开源模型的数量也在慢慢的减少, 我感觉核心还是开源的神Qwen,更新的太慢了。。。。 5月的开源模型集中在面壁、千问、OpenMOSS、混元、小米、快手、美团、蚂蚁、阶跃等。 除了下面的开源模型,国内 ​
3
0
3
刘聪NLP
2026-05-29 01:41来自 会员特权专用
http://t.cn/AX6mVFCa ​
0
0
1
刘聪NLP
2026-05-29 01:21来自 微博网页版
来自群友,但是坤坤赢麻了 http://t.cn/AX6mtokI
opus4.8已经能用了[doge],榜单上全面领先GPT5.5,指标很强了#how i ai# ​​​​#ClaudeOpus4.8发布# ​
1
1
1
刘聪NLP
2026-05-29 00:53来自 HUAWEI Mate 50
opus4.8已经能用了[doge],榜单上全面领先GPT5.5,指标很强了#how i ai# ​​​​#ClaudeOpus4.8发布# ​
3
2
3
刘聪NLP
2026-05-28 18:25来自 微博网页版
666[流鼻血] ​
1
1
2
刘聪NLP
2026-05-27 12:09来自 微博网页版
M3模型要出了,改成了稀疏注意力 http://t.cn/AX6j7m2v
笑死了,确实,2个月没发模型已经很久了@歸藏的AI工具箱 ,卷死#how i ai# ​
0
0
0
刘聪NLP
2026-05-27 12:05来自 微博网页版
笑死了,确实,2个月没发模型已经很久了@歸藏的AI工具箱 ,卷死#how i ai# ​
1
1
0
刘聪NLP
2026-05-21 14:15来自 微博网页版
昨天是520,给最近沉迷于剑来的老婆,用Qwen3.7-max搓了个剑来的卡牌游戏, 仿照三国杀做的玩法来做,人物、技能、问拳、避让、装备、弃牌这些机制都放进去了。 目前素材还比较粗糙,后面我准备再用 GPT-Image2生成一些角色图和卡面图,把整体视觉替换一下,现在还在继续打磨中。 得到了我媳妇的高 ​
0
2
6
刘聪NLP
2026-05-21 14:12来自 微博网页版
昨天是520,给最近沉迷于剑来的老婆,用Qwen3.7搓了个剑来的卡牌游戏, 仿照三国杀做的玩法来做,人物、技能、问拳、避让、装备、弃牌这些机制都放进去了。 目前素材还比较粗糙,后面我准备再用 GPT-Image2生成一些角色图和卡面图,把整体视觉替换一下,现在还在继续打磨中。 得到了肯定的评价。 ​
0
1
0
刘聪NLP
2026-05-21 12:11来自 微博网页版
分享一个Agent开源项目,把KV Cache玩出了花,任务成本可降到Hermes的1/6 现在各种Agent框架泛滥,很多时候我们Token的消耗,大部分都花在了输入侧。 系统提示词、工具定义、skill 描述、历史消息、文件内容、网页快照、压缩摘要,这些东西只要进入上下文,每一轮都可能参与计费。 今天就给大家分享 ​
1
3
5
刘聪NLP
2026-05-19 23:20来自 微博网页版
震惊
我去 Karpathy 居然加入了 Anthropic,这下估计没有教程看了,啥也不会说了,希望还能多分享#how i ai# ​
1
0
2
刘聪NLP
2026-05-15 13:06来自 微博网页版
冲了[不愧是你] http://t.cn/AXiKBlo3
藏师傅的 PPT Skills,感觉 GitHub star 马上就要破万了呀! 没点 star 的朋友点点 star 吧,谢谢了。 顺便让 Codex 分析了一下安装的数据,还挺有意思的。#how i ai# 这里尝试:github.com/op7418/guizang-ppt-skill ​
1
0
0
刘聪NLP
2026-05-15 13:02来自 微博网页版
前几天刷到一个x,我醉了, 说DeepSeek泄露用户的聊天数据,输入\<think\>会吐一些内容, 这不就是幻觉吗?跟泄露用户的隐私数据有啥关系, 就是special token injection没做好。 不过,隐私泄露的问题,确实是大家在用LLM时比较注意的,担心被别人拿去当训练数据。 其实各家训练都会做一些敏感信 ​
1
2
6
刘聪NLP
2026-05-15 10:26来自 微博网页版
Codex 终于上手机了,iOS和Android都能用。 最近已经从Claude Code转向Codex,量大又好用,关键还不封号, OpenAI官方数据里,Codex周活有400万, 以后手机端就能远程派任务,直接爽玩, 心疼TRAE的三端协同5秒钟。。。。 #how i ai# ​
2
3
4
刘聪NLP
2026-05-14 19:45来自 HUAWEI Mate 50
笑死了,有人在偷吃[doge] ​
4
7
30
刘聪NLP
2026-05-14 17:59来自 HUAWEI Mate 50
对,他在发微博
怎么能说老马在玩手机呢?这场面当然要拍照留念了。 ​
0
0
2
刘聪NLP
2026-05-14 17:57来自 HUAWEI Mate 50
赶紧去研究一下[笑而不语]
腾讯刚开源的Agent记忆项目TencentDB-Agent-Memory 地址:github.com/Tencent/TencentDB-Agent-Memory “TencentDB Agent Memory 帮助 Agent 学会你的流程、保留任务上下文、复用历史经验。但我们拒绝暴力的历史堆砌,也抛弃不可逆的暴力摘要。我们将记忆设计为一套极具层次感的系统,以符号化记忆解 ​
0
0
1
刘聪NLP
2026-05-14 09:00来自 微博网页版
闷声搞了一年OPC,离职了,不装了 我最近刚离职,一直认真想一件事,怎么全职做一人公司。 对,就是全职, 了解我的朋友都知道,我其实很早就在运营的自媒体账号,业余时间也会做一些tob企业的落地工作, 现在大火的OPC变现方向,主要就是3个路径, - 做自媒体,利用IP进行变现 - 做tob企业服务, ​
3
2
6
刘聪NLP
2026-05-13 09:25来自 HUAWEI Mate 50
马上开始啦, 昨天晚上跟一帮自媒体朋友学的,随手拍,先拍起来[doge] #how i ai##百度ai开发者大会# http://t.cn/AXiVMAyo ​
0
4
22
刘聪NLP
2026-05-13 09:21来自 HUAWEI Mate 50
来了,百度AI开发者大会 #ai创造营# http://t.cn/AXiVIVve ​
0
0
2
刘聪NLP
2026-05-12 13:09来自 微博网页版
对,我只会cursor、claude code、codex这些,不会vibe coding,今日笑点 #ai创造营##how i ai# ​
0
1
2
刘聪NLP
2026-05-11 22:05来自 HUAWEI Mate 50
【🎉限量开放!微博V创作中心抢先体验】 创作找选题难?没灵感?来微博V创作中心一键开启AI创作! 全站热点线索实时聚合,创作版权素材一键调取,热门IP玩法持续更新。 💥多类型AI创作工具全程加持,满足多场景覆盖,更有现金和流量双重激励等你来拿。 👉 PC端入口:发布框下方-V创作中心 ​
0
0
0
刘聪NLP
2026-05-09 20:38来自 HUAWEI Mate 50
反直觉诶,我觉得人对html的高密度信息是通过视觉解决的。对于llm来说,html难道不会额外增加解析负担嘛[doge]
Claude Code 团队内部,正在发生一场有趣的范式转移。 据 Claude Code 开发者 Thariq 说,他们正在逐渐放弃 Markdown,全面采用 HTML 作为 AI 的默认输出与沟通媒介。 100 行是人类阅读 AI 生成 Markdown 文件的耐心临界点,超过此长度,阅读意愿呈断崖式下跌。 HTML 拥有降维打击般的信息密度:它 ​
0
1
1
刘聪NLP
2026-05-09 20:30来自 HUAWEI Mate 50
me too//@欧巴聊AI:很看好阶跃[并不简单]//@刘聪NLP:几家欢喜几家愁,哈哈哈[doge]//@蚁工厂:智谱和minimax已上市,百川智能、零一万物已经基本退出大模型竞争了, Kimi还在融资,感觉不急着上市. //@刘聪NLP:六小龙,还剩下谁[笑而不语]
阶跃星辰也快上市了 ​
0
0
0
刘聪NLP
2026-05-09 14:50来自 微博网页版
今天刷x刷到,文心5.1在Search Arena上冲到全球第4,见图1-3。 仔细一看,是style-control off情况, 不过style-control on整体排名下降,但国内仍然是第一。 PS: style-control off是原始投票分数,会因为格式、长度、排版拿到高分红利,on会进行校准,剔除这些因素。 这次算找准角度了,search深耕 ​
0
0
0
刘聪NLP
2026-05-09 09:42来自 HUAWEI Mate 50
所以,不先开vlm模型吗[doge]
【#曝DeepSeekV4.1下月发布#】 北京时间昨日(8 日)晚间,The Information 援引两名直接了解讨论情况的人士消息称,DeepSeek 正寻求完成首轮融资,目标高达 500 亿元人民币。知情人士还透露,DeepSeek 计划在 6 月发布 V4 模型的更新版本 V4.1。 ​
0
0
0
刘聪NLP
2026-05-08 13:36来自 HUAWEI Mate 50
几家欢喜几家愁,哈哈哈[doge]//@蚁工厂:智谱和minimax已上市,百川智能、零一万物已经基本退出大模型竞争了, Kimi还在融资,感觉不急着上市. //@刘聪NLP:六小龙,还剩下谁[笑而不语]
阶跃星辰也快上市了 ​
2
0
0
刘聪NLP
2026-05-08 13:18来自 HUAWEI Mate 50
六小龙,还剩下谁[笑而不语]
阶跃星辰也快上市了 ​
10
0
0
刘聪NLP
2026-05-08 10:51来自 HUAWEI Mate 50
要从cc转到codex了[doge]
Codex 越来越猛了,昨天更新增加了内置的谷歌浏览器插件,可以直接控制你的谷歌浏览器执行任务。 而且它可以在后台跨浏览器页面并行工作,不耽误你正常使用浏览器。所谓“并行工作”,指的是你可以启动多个子 SubAgent 帮你操作多个网页。 我试了一下,发现最厉害的一点是:它不仅可以控制 Chrome, ​
1
1
0
刘聪NLP
2026-05-07 20:30来自 HUAWEI Mate 50
上有政策,下有对策,需要社区发力了[笑而不语]
Claude Desktop 今天的更新会校验模型名字,此前社区利用 Gateway 接口接入DeepSeek等其他模型的方法失效了。 ​
0
0
2
刘聪NLP
2026-05-07 20:30来自 HUAWEI Mate 50
//@蚁工厂:转发微博
关于 AI Coding 和 Harness 最近写的一些内容: 让ai学会并发干活儿 http://t.cn/AXIAvc4I 让AI能够复用过去的经验,把代码写的更好 http://t.cn/AXIAvc4X 如何让AI进入疯狂工作模式 http://t.cn/AXIAvc4i 让AI输出效果提升五倍 http://t.cn/AXIAvc4M AI解放双手,如何把工作托管给浏览器 ​
0
0
0
刘聪NLP
2026-05-07 20:24来自 HUAWEI Mate 50
回复@karminski-牙医:合理,scaling因素很大,并且之前ds都没超过T级别,这次也是对资源的很大挑战,要不然也不能晚了这么久//@karminski-牙医:我猜scaling是主要问题, 毕竟上线性注意力的超过1T的模型现在也没几个 (应该只有Ring-2.5-1T,Ling-2.6-1T 和 MiMo-V2.5-Pro ?)
DeepSeek V4为什么没有采用自家的Engram技术? V4的技术报告里有一句很容易被滑过去的话,未来方向,包含条件记忆模块。 而这个sparse embedding modules对应的论文,就是《Conditional memory via scalable lookup: A new axis of sparsity for large language models.》 条件记忆就是。 1月发的 ​
0
0
0
刘聪NLP
2026-05-07 20:22来自 微博网页版
今天千问PC端上线AI语音输入,聊一下。 口喷已经成为了新时代与ai交互的方式。 谁赞成,谁反对。。。 传统语音输入解决的是输入效率问题,核心目标是,把你说的话尽可能准确地转成文字。识别率高一点,速度快一点,标点自然一点,本质上还是键盘的替代品。 AI语音输入则是在解决表达效率的问题, ​
1
6
35
刘聪NLP
2026-05-07 15:58来自 HUAWEI Mate 50
笑死了, 很棒,我看了,功能很全,很有创意[doge] #ai创造营# ​
0
1
2
刘聪NLP
2026-05-07 12:10来自 HUAWEI Mate 50
敌人的敌人就是朋友[doge]
#xAI更名SpaceXAI# 马斯克真狠啊~ 我xai怎么样没事,但你OpenAI必须死…… 🤷 ​
0
0
0
刘聪NLP
2026-05-07 11:31来自 微博网页版
DeepSeek V4为什么没有采用自家的Engram技术? V4的技术报告里有一句很容易被滑过去的话,未来方向,包含条件记忆模块。 而这个sparse embedding modules对应的论文,就是《Conditional memory via scalable lookup: A new axis of sparsity for large language models.》 条件记忆就是。 1月发的 ​
35
3
42
刘聪NLP
2026-05-06 19:32来自 微博网页版
Dflash可以提高6倍,但不知道效果是否会有下降 http://t.cn/AXJQEYLY http://t.cn/AXJQEYLT
Google开源了Gemma4的系列草稿模型,借助这些草稿模型,可以将推理速度提升3倍。 核心是利用推测解码(Speculative Decoding)的思路, 让草稿模型(轻量)一次性预测出多个Token(MTP,Multi-Token Prediction),作为草稿,再利用主模型进行验证, 若主模型完全认可草稿:所有草稿 token 一次性接 ​
1
0
0
刘聪NLP
2026-05-06 17:26来自 HUAWEI Mate 50
[doge][doge][doge]
?特朗普他儿去开AI中转站了。 还提供deepseek qwen等国产模型[awsl] 看评论感觉这家服务有猫腻,不建议用[并不简单] #AI创造营# ​
0
1
0
刘聪NLP
2026-05-06 15:55来自 HUAWEI Mate 50
虽然speculative decoding不是新东西,但是对草稿模型的魔改还蛮有意思的[笑而不语]
Google开源了Gemma4的系列草稿模型,借助这些草稿模型,可以将推理速度提升3倍。 核心是利用推测解码(Speculative Decoding)的思路, 让草稿模型(轻量)一次性预测出多个Token(MTP,Multi-Token Prediction),作为草稿,再利用主模型进行验证, 若主模型完全认可草稿:所有草稿 token 一次性接 ​
0
0
0
刘聪NLP
2026-05-06 15:51来自 微博网页版
Google开源了Gemma4的系列草稿模型,借助这些草稿模型,可以将推理速度提升3倍。 核心是利用推测解码(Speculative Decoding)的思路, 让草稿模型(轻量)一次性预测出多个Token(MTP,Multi-Token Prediction),作为草稿,再利用主模型进行验证, 若主模型完全认可草稿:所有草稿 token 一次性接 ​
8
4
9
刘聪NLP
2026-05-06 12:55来自 微博网页版
看到reddit上有人,将台灯改成Claude Code的代码状态指示灯。 利用开源项目,http://t.cn/AXJHycXe #how i ai# http://t.cn/AXJHySnN ​
0
0
1
刘聪NLP
2026-05-03 19:27来自 HUAWEI Mate 50
DeepSeek已进行兼容性调整,400错误改善 之前说的,因为reason result导致的第三方agent或者chatbot报错400的问题, deepseek官方做了兼容性调整, 之前有问题的,可以重试。 #how i ai##deepseek# ​
0
0
2
刘聪NLP
2026-05-01 19:58来自 微博网页版
DeepSeek官方发布Agent接入手册 http://t.cn/AXJ5Y3Vp 我前两天分享过一篇内容,就是也许大家用的都还不是满血的DeepSee..., 核心是其实你在用DeepSeek-Pro的时候,可能没有触发max思考, 然后现在官方给了一份agent接入文档, 编程IDE和主流Agent都有,涉及, Claude Code、GitHub Copilot、GitH ​
2
0
2
刘聪NLP
2026-05-01 11:36来自 HUAWEI Mate 50
转发微博
给大家说下目前使用 DeepSeek-V4 (pro/flash) 的最需要注意的问题. 本身其实并不算 bug, 但是却很致命. 问题大概是这样的, 在请求 DeepSeek API 或者 terminal coding agent (claude code, kimi cli 等) / AI IDE (cursor 等) 用 DeepSeek 的时候偶尔会遇到报错: HTTP 400 {"error":{"message":"The ​
0
0
1
刘聪NLP
2026-05-01 00:24来自 微博网页版
DeepSeek多模态技术报告,详细解读! 果然是放假之前必作妖,说好的中国人不卷中国人呢? 《Thinking with Visual Primitives》,提出了一个全新的推理框架,把空间标记(bounding box 与 point)内嵌进思维链,作为语言与图像之间的精确指针,让模型做到一边指点一边推理。 思路很正,就像人在走迷 ​
11
21
36
刘聪NLP
2026-04-30 12:24来自 HUAWEI Mate 50
回复@美食家御逍遥:ds真是把价格卷死了[笑而不语]//@美食家御逍遥:卷起来是好事。越来越便宜了。
又到月底了,我们持续进行国内开源模型总结。 这一个月,各种Skills纵横,hermes热度取代openclaw成为Agent新贵,GPT-Image2炸裂效果,让有图有真相成为笑话, 而在模型部分,国内持续在卷, 智谱GLM5.1、Kimi K2.6、Qwen3.6、混元HY-3.0-preview, 还有模型期待已久的DeepSeek-V4都开源了。 当然国内 ​
1
0
1
刘聪NLP
2026-04-30 12:23来自 HUAWEI Mate 50
太酷了
我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的!#how i ai# ​
0
0
0
刘聪NLP
2026-04-29 22:30来自 微博网页版
因为,模型还没开源,其他信息模型相关信息还不知道, 只能在网页端,测试一些这个VLM模型的视觉能力。 现在还在是灰度状态,所以不确定现在模型是什么版本,也许灰度之后,模型会进行微调,效果会更好。 DeepSeek 识图模式实测。 当前测试结果,只针对现在灰度模型。 我的这个测试纯对比Qwen3.5- ​
5
1
0
刘聪NLP
2026-04-29 15:36来自 HUAWEI Mate 50
弃书从博[doge]
小红书确实烂透。 经常有在上面做生意的朋友跟我吐槽, 这个平台烂得很。 我没当真, 因为我毕竟在小红书赚钱。 可是这波小红书直接给我关掉了蒲公英, 说我刷量, 关键这都是投薯条的量, 四月在上面花了小五千了, 没有刷量。 我问如何自证? 小红书那边没有任何办法, 申诉也是失败, 还是说烂透 ​
1
0
0
刘聪NLP
2026-04-29 15:31来自 HUAWEI Mate 50
回复@千问:到时候横测一波[笑而不语]//@千问:这波灰度确实快,看来DeepSeek的多模态布局早就准备好了。等开源之后,不管是做项目还是写代码,又能多一个得力的工具了,期待正式上线!
我就说vlm这么火,原始多模态已经很多家都验证了, deepseek怎么可能没有呢? 原来,马上就来了呀, 已经开始灰度了,离开源不远了。。。 抓包可以看到图像识别模式。 #deepseek# #DeepSeek多模态开启灰测##DeepSeek多模态值得期待吗# ​
0
0
2
刘聪NLP
2026-04-29 15:11来自 HUAWEI Mate 50
我就说vlm这么火,原始多模态已经很多家都验证了, deepseek怎么可能没有呢? 原来,马上就来了呀, 已经开始灰度了,离开源不远了。。。 抓包可以看到图像识别模式。 #deepseek# #DeepSeek多模态开启灰测##DeepSeek多模态值得期待吗# ​
2
2
3
刘聪NLP
2026-04-27 15:23来自 微博网页版
也许大家用的都还不是满血的DeepSeek-V4, 昨天发完DeepSeek的解读和测试内容, 群里细心的小伙伴问了一个问题,就是测得是high模式还是max模式, 很明显是high。 我相信很多人在一手测试的时候,都不会注意,或者说用的都是默认参数。 我今天又测试了3千万 Tokens,使用max之后,在coding和agentic ​
10
4
17
刘聪NLP
2026-04-27 15:22来自 微博网页版
DeepSeek-V4实测感觉, Pro水平相较于国内三家差不多,但对于一句话实现的效果没那么好 flash的水平,相较于前两天测试的ling-2.6-flash和hy3-preview要好一些 复杂理解Pro没有问题,但flash会不稳定,比如老鹰问题 可以理解“但丁真”,但不能理解“坦克有后视镜” 对于小鱼的SVG,flash模型跟hy ​
1
0
1
刘聪NLP
2026-04-27 15:16来自 微博网页版
DeepSeek-V4开源, DeepSeek-V4-Pro(1.6T,激活49B)、DeepSeek-V4-Flash(284B,激活13B)。 其实还是,有一点点小失望的,就是这个V4还是一个纯文本的模型,并不是多模态模型。 不过说回来,DeepSeek也真是国内一股清流,一句“不诱于誉,不恐于诽,率道而行,端然正己。” 道破本心。 看完Deep ​
0
0
6
刘聪NLP
2026-03-17 17:34来自 HUAWEI Mate 50
回复@AI金三啊:刷到了,哈哈哈,很久没更了[doge]//@AI金三啊:回复@刘聪NLP:笑死,聪哥也来微博了
Token消耗量,正在成为你的新简历 我最近有一个很直观的观察。 一个人消耗的 Token 数量,直接代表了他驾驭 AI 的水平。 这个其实不是我说的,只是我观察到一些厂商的招人需求,来得到的判断。 现在有些公司招人开始看一个全新的指标了。他们会要求候选人提供一些后台截图。甚至要求看主流代码编辑 ​
0
0
0
刘聪NLP
2026-03-17 17:01来自 微博网页版
确实,上来就说用了1T Tokens消耗了,专注ai[吃瓜]
Token消耗量,正在成为你的新简历 我最近有一个很直观的观察。 一个人消耗的 Token 数量,直接代表了他驾驭 AI 的水平。 这个其实不是我说的,只是我观察到一些厂商的招人需求,来得到的判断。 现在有些公司招人开始看一个全新的指标了。他们会要求候选人提供一些后台截图。甚至要求看主流代码编辑 ​
0
0
0
刘聪NLP
2026-02-11 22:48来自 微博 weibo.com
发布了头条文章:《阶跃星辰为何将大模型命名为Step 3.5 Flash?》 http://t.cn/AX5sFeQt ​
0
0
3
刘聪NLP
2026-01-20 02:47来自 生日动态
http://t.cn/AXGHIaEK ​
0
0
0
刘聪NLP
2025-12-31 15:16来自 微博 weibo.com
发布了头条文章:《最近玩GUI模型到上头,手搓打卡神器,附教程》 http://t.cn/AX43EMzm ​
0
0
1
刘聪NLP
2025-11-17 12:55来自 微博网页版
千问APP到底行不行呀? 前两天,国外出现了一个新词汇,叫Qwen Panic,就是千问恐慌, 涉及敏感话题的我就不说了,感兴趣的朋友可以去搜搜。 背景呢主要是Qwen发展的太快了,已经占据开源的大头,现在基本上学术研究,大部分在Qwen系列模型基础上进行实验,同时Qwen衍生出来的模型,也是占比最多的。 ​
0
0
3
刘聪NLP
2025-10-22 15:35来自 微博 weibo.com
发布了头条文章:《再谈DeepSeek-OCR的信息压缩论!附DeepSeek-OCR与PaddleOCR实测对比》 http://t.cn/AXwKO1jb ​
0
1
2
刘聪NLP
2025-10-21 18:57来自 微博网页版
Qwen3的VL模型测试感悟, - 表格识别,Qwen3-VL依旧牛逼,本来Qwen2.5-VL就很强 - 对色彩的把握程度变高,之前色盲测试一堆问题,现在多次实验,结果均正确 - 图片排序任务,雪糕对了,菌子错了,但也解释比较合理,相较于Qwen2.5提高很多,并且比主流开源VL模型效果要好 - 网页复刻任务效果比较差,这 ​
1
1
5
刘聪NLP
2025-09-16 09:38来自 微博 weibo.com
发布了头条文章:《可灵AI数字人 Kling-Avatar上线,从对口型到会表演!附实测案例!》 #可灵ai# #ai数字人# http://t.cn/AXhVc6cW ​
0
0
4
刘聪NLP
2025-09-05 09:24来自 微博 weibo.com
发布了头条文章:《快手开源Keye-VL1.5:8B多模态模型细节揭秘,短视频理解很强!》 http://t.cn/AXPi8eKX ​
0
0
9
刘聪NLP
2025-08-27 20:07来自 微博 weibo.com
发布了头条文章:《最强开源8B级VLM模型!高刷视频理解的有救了~》 http://t.cn/AXvHdYJj ​
0
0
9
刘聪NLP
2025-07-18 18:23来自 HUAWEI Mate 50
被AI硬件感动的瞬间 朋友推荐,买了个AI硬件,前段在朋友圈被刷屏,号称随身AI搭子的TicNote。 前天还爆出,断货了,辛亏搞得早~见图2. 我到手第一次用,是跟老婆晚视频聊天,也是那一次让我对TicNote的好感值直线上升。 由于现在异地(之前从上学就基本上没怎么分开过),现在很不适应,虽然周末回 ​
0
0
6
刘聪NLP
2025-07-14 17:21来自 HUAWEI Mate 50
转发微博
【世界奇特美妙,AI#源来如此# 】 ⚖️ 开源,加快了AI发展的速度。代码共享、技术复用,让AI不再是少数巨头的专利。 [疑问]但同时,自研与共享的界限,也变得越来越模糊。模型之间的结构相似,究竟是合理借鉴,还是过度沿用? 当争议难以通过主观判断,我们有一种技术方案可以提供依据——LLM指纹分 ​
0
0
0
刘聪NLP
2025-07-03 17:22来自 微博 weibo.com
发布了头条文章:《混元A13B实测出炉,腾讯补上开源MoE模型的“尺寸断档”》 http://t.cn/A6DRw0HZ ​
0
0
4
刘聪NLP
2025-06-17 14:28来自 微博 HTML5 版
MiniMax开源周Day1,开源 MiniMax-M1模型 卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先狠狠地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的Min ​
0
1
1
刘聪NLP
2025-05-22 12:17来自 微博网页版
实测天工超级智能体Skywork Super Agents, 周一晚上,一朋友跟我说,有个爆炸好用的Agent,生成的PPT他直接给老板交作业了,见图1。 他们主打基于deep research的office三件套。 Link:http://t.cn/A6g0syVW ,需要魔法! 整体体验下来,交互体验非常好,并且生成内容均基于自研的Deep Research模 ​
1
0
4
刘聪NLP
2025-04-07 08:09来自 HUAWEI Mate 50
llama4让我失望极了[doge]//@karminski-牙医:这个比llama-4良心多了[开学季]
QWEN3的一些谍报: ​ - 30T training tokens,这最起码是个多模态了,和llama4持平 - a 0.6B draft model 做speculation decoding用的,这么小的draft,推理可得多快 3款要发的MOE - 16B/2A , - 46B/7A , - ≈330B/28A 据说训的时候也玩了ds的全局loadbalance, 训挺好 就一句总结:​​16和46这个老 ​
0
0
0
刘聪NLP
2025-04-01 08:46来自 HUAWEI Mate 50
今天是愚人节,openai开源的保真量-10086[doge] ​
0
0
1
刘聪NLP
2025-03-27 07:44来自 HUAWEI Mate 50
Qwen再开源,多模态Qwen2.5-Omni-7B模型 #ai创造营# Qwen2.5-Omni-7B是一个端到端的多模态模型,可以接收文本、图像、音频和视频的输入,以文本或语音作为输出,参数模型结构见图2-3。 HF link: http://t.cn/A6BgC0d7 Paper: http://t.cn/A6BgnAe4 Qwen2.5-Omni提出了Thinker-Talker架构,同时提出 ​
0
1
2
刘聪NLP
2025-03-24 10:10来自 HUAWEI Mate 50
转发微博
一款基于多模态大模型的 SVG 代码生成器。它将矢量化任务转换为代码生成任务,直接在 SVG 代码空间进行解析和生成。这种方式的最大优势在于,它不单单是对图像轮廓的拟合,而是结合了视觉和语言模型的能力,理解图像的语义结构,从而生成更紧凑、精确且富有层次感的 SVG 代码。 在架构上,StarVector ​
0
0
0
刘聪NLP
2025-03-19 10:31来自 HUAWEI Mate 50
腾讯HunYuan-T1,是要开源吗?#ai创造营# ​
0
0
0
刘聪NLP
2025-03-18 10:40来自 HUAWEI Mate 50
早上刷到,Mistral也开源了,最近真是开源不断,大模型好起来了。#ai创造营# 本次Mistral开源的是一个24B的多模态,专打Google前几天发布的Gemma3-27B模型。 HF: Mistral-Small-3.1-24B-Instruct-2503 本次开源的3.1-small模型特点如下: - Apache 2.0 许可证,可以随便用; - 多语言:英语、法语 ​
0
0
1
刘聪NLP
2025-03-17 14:45来自 HUAWEI Mate 50
讨论API Agent和GUI Agent之间的差异#ai创造营# API Agent和GUI Agent在完成相同任务时,有很大的区别,见图1。 从多个维度(如模态、可靠性、效率、可用性、灵活性、安全性、可维护性、透明度和类人交互)对API代理和GUI代理进行了全面评估,见图2。 同时讨论在不同场景下选择API代理、GUI代理或 ​
0
0
1
刘聪NLP
2025-03-16 13:23来自 HUAWEI Mate 50
实测一手文心4.5和x1,#ai创造营# http://t.cn/A6B6FMxn ​
0
0
0
刘聪NLP
2025-03-13 16:24来自 HUAWEI Mate 50
该说不说,gemini2.0这个图像生成有点东西的,图来自网友。 ​
0
0
0
刘聪NLP
2025-03-13 11:32来自 HUAWEI Mate 50
Gemini2.0-Flash更新,支持图文同时生成,有点意思!#ai创造营# Gemini2.0-Flash更新,支持图文同时生成,测试了一下蛮有意思的,在Google AI Studio上可以直接使用,见图2。 link: http://t.cn/A6BcCyoq 模型选择Gemini2.0-Flash Experimental,输出格式选择Images and Text。 测试了几个,蛮有意 ​
0
0
0
刘聪NLP
2025-03-13 08:39来自 HUAWEI Mate 50
火速更新[笑而不语]
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
0
0
0
刘聪NLP
2025-03-13 08:36来自 HUAWEI Mate 50
已经习惯md方式写作[苦涩]
#模型时代# Andrej Kaparthy新推文,我们的内容将不再是为人类而写,而是为模型而写。 最近我也正在思考这件事情,实际上很多时候我们已经不直接阅读内容,而是间接阅读AI的二创内容,那么就要考虑让AI一手阅读更友好。 唉,这个时代的车轮滚滚向前啊。 *** 虽然已经到了2025年,但我们今天绝大部分 ​
0
2
1
刘聪NLP
2025-03-12 16:54来自 HUAWEI Mate 50
Google最新开源多模态模型-Gemma3! 话不多说,线上链接: http://t.cn/A6B5Vjtq 此次开源了4个版本模型,包括1B、4B、12B和27B等4个尺寸,详细概述如图2所示,来自x@danielhanchen。 27B模型使用14T Tokens训练,12B模型使用12T Tokens训练,4B模型使用4T Tokens训练,1B模型使用2T Tokens训练。 ​
0
0
3
刘聪NLP
2025-03-12 12:15来自 HUAWEI Mate 50
一字学[阴险]
Unsloth 发布了一篇语言模型微调的指南(当然是使用 Unsloth 做微调啦)。 http://t.cn/A6BUH1HY 它详细介绍了微调的基本概念,包括如何选择合适的模型和方法(如 LoRA 和 QLoRA),如何准备和使用数据集,以及如何调整模型参数以避免过拟合或欠拟合等。 阅读本文后,读者可以了解微调的基本流程和最佳 ​
0
0
1
刘聪NLP
2025-03-12 12:13来自 HUAWEI Mate 50
笑死了
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
0
0
0
刘聪NLP
2025-03-12 11:00来自 HUAWEI Mate 50
昨天发了一篇篇帖子,越狱Manus的提示词和29个工具,也是引起了一片讨论,Manus的Peak也是发帖回应,并说明还用了多个Qwen微调过的模型,并且很早之前开源的模型是基于Qwen模型训练的推理类模型。见图2。跟通义的人闲聊,他们说确实Manus和通义千问在进行开源模型方面的合作,感觉不久的将来会有一些有 ​
0
0
0
刘聪NLP
2025-03-10 11:38来自 HUAWEI Mate 50
Manus被越狱了!套出Prompt和29个工具!! #ai创造营# 今天刷x,发现一个有意思的帖子,获取Manus中"/opt/.manus/"里的文件, link: http://t.cn/A6BL9NZq 套出来Manus的Prompt,以及所需的Tool,见图3-5。 过程: http://t.cn/A6BL9NZG Github: http://t.cn/A6BL9NZ5 ​
0
0
0
刘聪NLP
2025-03-06 07:37来自 HUAWEI Mate 50
开源啦!千问推理模型QwQ-32B开源啦! #ai创造营# 话不多说,线上链接: http://t.cn/A61FcAqP QwQ-32B模型为Dense模型,总参数32.5B,非嵌入参数31B,64层,采用GQA,Q为40,KV为8,上下文长度为131K。 同时,指标很强,在LiveBench、IFEval、BFCL上都超过了DeepSeek-R1-671B模型。如图。 值得注 ​
4
1
2
没有更多微博了