老师木
老师木
老师木
AI博主 北京 2011.02 加入
2303关注
16.5万粉丝
1.8万微博
老师木
2026-06-27 08:47来自 iPhone客户端
[微风]//@马少平THU:张老师各方面都是榜样,九十多岁了,身体也是少有的好。
清华GIFT课堂尾声的提问环节,令人尤为动容。有学员好奇请教91岁高龄的张钹院士,为何至今依旧思维敏捷、精神矍铄,保持极佳的授课与思考状态。 院士的回答朴素却直击本质。他坦言,大多数人步入六十岁后,心态便趋于固化,停止主动学习、安于现状,慢慢丧失探索新事物的热情。而自己数十年如一日,始 ​
12
0
3
老师木
2026-05-23 09:41来自 iPhone客户端
Siliconflow 在全球知名AI开发平台 Dify 上开发者安装量超过50万,在100多家token供应商中,和阿里Tongyi,DeepSeek, OpenAI和火山方舟一起名列第一梯队,在最知名的token转发平台 OpenRouter 上日均产量也名列前茅,这说明 Siliconflow的产品品质获得了世界上最广大用户的认可,摆在眼前的问题是去哪 ​
36
5
49
老师木
2026-05-08 21:55来自 iPhone客户端
转发微博
《硅基流动跻身中国 MaaS 市场第一梯队,唯一创业公司》 今天,国际数据公司(IDC)公布《中国 AI 软件市场半年度追踪,2025H2》报告:2025 年,中国企业级 MaaS(Model as a Service) 市场按调用量统计,规模为 1944 万亿 Tokens,同比 2024 年增长约 16 倍。在公有云 MaaS 市场,硅基流动作为唯一 ​
2
2
13
老师木
2025-06-27 20:40来自 iPhone 15 Pro Max
新的Logo 是俩连在一起的GPU,构成一个台阶,寓意是成为AI应用发展的石阶。确实也发了新产品,同步发布国际站点,方便出海应用和海外开发者使用硅基流动的服务 ​
5
2
29
老师木
2025-06-27 20:39来自 iPhone 15 Pro Max
前几天发了几个小彩蛋,友人以为我们要发大招,其实是Logo 升级,新的Logo 是俩连在一起的GPU,构成一个台阶,寓意是成为AI应用发展的石阶。确实也发了新产品,同步发布国际站点,方便出海应用和海外开发者使用硅基流动的服务,请多多批评指正[抱拳]
【#硅基流动品牌焕新#:启用新品牌视觉标识,国际站正式上线】6 月 27 日消息,国内 AI 基础设施平台企业硅基流动 SiliconFlow 今日宣布进行品牌焕新,启用新的品牌视觉标识,同时国际站 ( http://t.cn/A6DMNfub ) 也正式上线。硅基流动表示:新 Logo 让扁平化的硅基芯片如水般流动,也恰似撑起 AI 生 ​
3
2
9
老师木
2025-06-17 22:05来自 iPhone 15 Pro Max
很荣幸能参与这个工作
硅基流动和华为团队一起研究如何在CloudMatrix 384超节点上部署 DeepSeek 的报告已经放在arxiv上了http://t.cn/A6erPREH ,应该算业界首次披露非英伟达体系下是怎么搞定那些难题的,值得深读。 ​
48
8
114
老师木
2025-05-16 21:06来自 iPhone 15 Pro Max
转发微博
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
7
0
5
老师木
2025-04-28 18:25来自 iPhone 15 Pro Max
转发微博
《#飞书#接入#硅基流动#,用 #DeepSeek#-R1 一键批量接管千行表格》 日常办公中,我们、经常要处理大批量、结构类似的数据,表格成了清晰管理这些信息不可或缺的工具。现在有了 #AI大模型#的加持,效率直接起飞。 不过,#大模型#工具选得不好,你会遇到指令遗忘、上下文长度限制、输出格式杂乱等问 ​
4
0
13
老师木
2025-04-24 18:32来自 iPhone 15 Pro Max
谢谢肖老师,祝贺丽晨[good]
热烈祝贺我们组博士生潘丽晨的论文发表在CCF-A类会议EuroSys 2025上。该论文针对GPU集合通信的死锁问题,提出了一个无死锁集合通信库DFCCL,通过实现对GPU集合通信的抢占从根本上打破了GPU集合通信固有的死锁风险,确保进程不会陷入无休止的轮询状态,其性能可以比肩业界领先水平。这是我们组与OneFlow ​
4
1
26
老师木
2025-04-18 10:31来自 iPhone 15 Pro Max
看评论,很多人不信,现在硅基流动平台上DeepSeek R1 就是用超节点部署的,都可以直接体验的。(DeepSeek V3 目前还没用上超节点、还是910b)
老师木说的。虽然华为芯片单颗比起用英伟达还是有落差,但是组成系统后,效率明显就高了。算力这一块中国是不缺的,真的没必要为算力焦虑。要记住,以工业化实力而论,中国甚至能让算力过剩。。。 ​
254
19
82
老师木
2025-03-01 14:23来自 iPhone客户端
DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert 组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高, ​
114
17
203
老师木
2025-03-01 14:13来自 iPhone客户端
DeepSeek 每台机器输出吞吐15000,利润率500%, 看来做MaaS 亏本还是赚钱取决于自身能力
DeepSeek 5天开源周(实际今天第6天也放出来一个"DeepSeek-V3/R1 推理系统概述")总结:覆盖硬件加速、模型训练、数据处理等,均围绕*降低算力成本*与*提升硬件效率*展开,通过开源代码实现技术普惠。 Day 1:FlashMLA—GPU算力压榨新标杆 - 专为Hopper GPU优化的高效解码内核,动态分配算力资源,解 ​
111
10
46
老师木
2025-02-26 21:04来自 iPhone客户端
DeepSeek 说的50%毛利可能是假的,真实情况是,比50%高 ​
47
13
60
老师木
2025-02-24 22:00来自 iPhone客户端
[心]
#昆仑技术携手硅基流动重磅推出DeepSeek一体机,性能相比业界提升35%+# 为了满足企业对私有化、国产化部署的需求,#昆仑技术#与#硅基流动#紧密合作,凭借双方在AI领域的深厚技术积累和丰富行业经验,正式推出#DeepSeek一体机#。 实测数据显示,此次推出的一体机在性能表现上相较于业界同类产品实现了 ​
12
1
19
老师木
2025-02-09 17:35来自 iPhone客户端
谢谢推荐
最近deepseek的官网和app确实卡的不行,我自己在用两个替代方案,都很简单。 如果不需要“联网搜索”功能的话,那可以通过siliconflow来使用deepseek r1,还可以搭配chatbox等AI客户端使用(手机端也行)。教程在这里,设置很简单,5分钟的事儿:http://t.cn/A63FGDOd 注册siliconflow的时候也可以帮 ​
21
6
31
老师木
2025-02-07 21:54来自 iPhone 15 Pro Max
实实在在的满血版 //@三思逍遥:别买我就上当受骗了,它的收费版deepseek肯定不是满血版,效果比免费的通义千问还差,编个顺口溜都要流口水那种水平,气死我了。//@楠山Bc:想用收费的可以用硅基流动的,我也是被折腾了半天没办法找的硅基流动的,缺点就是付费的pro版生成内容没有普通版详细,唯一优点就
这样:要不幻方还是收费吧, 这么折腾deepseek谁都用不了啊。 ​
6
16
25
老师木
2025-02-07 19:19来自 iPhone 15 Pro Max
转发微博
硅基流动和华为小艺的动作够快,仍然是基于昇腾云端算力的部署。 ​
2
0
12
老师木
2025-02-04 21:53来自 iPhone 15 Pro Max
产业链条上,数据这一环,梁总为中国大模型发展做出了不可替代的贡献
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
28
4
46
老师木
2025-02-04 16:09来自 iPhone 15 Pro Max
之前只上线了满血版R1/V3, 用户太多了,体验下降了,今天把DeepSeek所有蒸馏版模型都上线了,10B以下模型完全免费,速度飞快,蒸馏模型也很强大,鼓励大家非不得已都用蒸馏版模型[呲牙] 全家桶来了!硅基流动上线加速版 DeepSeek-R1 蒸馏模型 http://t.cn/A63u35kK ​
245
25
222
老师木
2025-02-03 14:27来自 iPhone 15 Pro Max
注册送14元,邀请成功送14元,照这个传播速度,现金流撑不住 ​
20
7
43
老师木
2025-02-03 13:56来自 iPhone 15 Pro Max
产品之前有个流量包,购买后可以享受更高并发,非常抱歉现在无法兑现并发指标,可以退款。 ​
1
8
20
老师木
2025-02-02 20:34来自 iPhone 15 Pro Max
[doge]//@文光围脖1:@老师木 也顶不住[哈哈]//@Apache9:@老师木 你们这宣传的不够啊http://t.cn/A638ZfSB //@stage1st宅社区:说实话,这时候我宁愿他收费开VIP了……
似乎deepseek得一大早用,现在完全不能用 开个付费会员吧?总不能为了跑开源模型自己去买个几千刀的cpu和内存或者几万刀的显卡吧..... ​
11
5
15
老师木
2025-02-01 23:40来自 iPhone 15 Pro Max
//@高飞:我刚看到硅基流动袁进辉老师发圈,提供了在线体验(基于华为晟腾): DeepSeek-R1地址:r1.siliconflow.//@花火515:所以有没有稳定能用 R1 的方式,我的官网已经寄了//@高飞:继续更新这个支持名单:英特尔宣布加入支持行业,AMD之前也官宣了 http://t.cn/A638HfcI //
#模型时代# #英伟达上线DeepSeek# 其实除英伟达在内,已经有但不局限于Hugging Face、戴尔、Perlexity、微软、亚马逊aws、Cursor、Windsurf、Grok Inc、AMD、SAP、英特尔都在支持和表态支持DeepSeek。 虽然围绕DeepSeek的讨论,已经从技术走向了地缘。但是能看到很多美国科技公司,已经从商业、用户体 ​
26
3
15
老师木
2025-01-30 18:12来自 iPhone 15 Pro Max
转发微博
#模型时代# 英特尔前CEO帕特·基辛格(Pat Gelsinger)谈DeepSeek带给他的三个启示。 我确实没想到基辛格会出来发文,他这篇博文可以说客观深刻。从一个芯片/ 计算行业老兵的角度,更从一个工程师的角度,给出了三个意见。分别是(括弧内是我的评语):降低AI成本只会带来更多计算需求(利好英伟达以及 ​
10
0
10
老师木
2025-01-30 18:07来自 iPhone 15 Pro Max
转发微博
#模型时代# 英特尔前CEO帕特·基辛格(Pat Gelsinger)谈DeepSeek带给他的三个启示。 我确实没想到基辛格会出来发文,他这篇博文可以说客观深刻。从一个芯片/ 计算行业老兵的角度,更从一个工程师的角度,给出了三个意见。分别是(括弧内是我的评语):降低AI成本只会带来更多计算需求(利好英伟达以及 ​
33
0
5
老师木
2025-01-21 10:34来自 iPhone 15 Pro Max
现在论文太多了,没时间都看,通常社交媒体上很多人讨论某一篇论文时才会引发好奇心去读一读,昨晚看到一些对DeepSeek R1的讨论,早晨趁注意力好就阅读了一下,又一次被震惊了。如果说DeepSeek V3的思路还都在想象范围内,更多是惊艳的工程交付能力,DeepSeek R1就是纯粹的无人区探索和发现了(可能Ope ​
258
28
408
老师木
2025-01-17 06:46来自 iPhone 15 Pro Max
AGI实现之后,AI 超过人类,是福是祸?本文推演了一种对人类不太友好的结局。
《资本、AGI 与人类雄心》 通用人工智能(AGI)正在不可阻挡地走向人类社会,有人期待它带来的巨大生产力突破,有人也在警告它可能成为洪水猛兽,也有人对它的发展只是持观望态度。不管怎样,基于你所了解的信息,你可以尝试描绘一幅 AGI 图景,并畅想它在人类政治、经济、社会发展会产生的影响。 ​
9
0
10
老师木
2025-01-09 16:58来自 iPhone 15 Pro Max
转发微博
#Easy同学正在独立开发# 温馨提示:文尾有抽奖[喵喵] 麦悠电台( my.ft07.com )终于上架苹果商店啦。这是一个聚合RSS然后用AI生成PodCast的APP。非常适合用来重用健身、家务、通勤和上班的时间。 🎈搭配RSSHub,可以收听上千个网站的内容(建议挑选带全文的RSS源) 🎈搭配Wewe-rss,可以收听 ​
1
0
4
老师木
2024-12-30 21:55来自 iPhone客户端
转发微博
《#Siliconcloud#上线加速版CosyVoice2:150ms实时#语音合成#》 近日,阿里通义实验室语音团队正式发布语音合成模型CosyVoice2。该模型支持文本和语音的双向流式传输,支持多语种、混合语种和方言,提供更准确、更稳定、更快、更好的语音生成能力。 现在,硅基流动SiliconCloud正式上线推理加速版Co ​
7
2
11
老师木
2024-12-27 12:19来自 iPhone客户端
一则小故事,数学家伯努利看到一篇匿名数学论文,马上认出是牛顿的手笔:从爪子判断这是一头雄狮。阅读完DeepSeek V3技术报告有一种类似的感觉,在DeepSeek论文里看到了早期Google和OpenAI的影子:追求实效、狂野的想象力、扎实的工程交付能力(想象力都能验证和兑现)三方面的统一。从MLA,MoE 稳定训 ​
118
9
195
老师木
2024-12-25 17:39来自 iPhone客户端
在微博发微信公众号文章链接的最佳实践是什么? 怎么才能在微博显示公众号文章标题 ​
1
3
9
老师木
2024-12-25 17:27来自 iPhone客户端
几万字的2024 全球AI盘点,想了解AI当前处在什么状态,看这一份资料就够了 http://t.cn/A6uUfOOQ ​
253
11
96
老师木
2024-12-25 17:24来自 iPhone客户端
明晚8点直播,看了一下话题列表,都很烧脑,大部分问题自己也看不透,大家一起不负责任地侃侃吧[破涕为笑] ​
2
1
9
老师木
2024-11-19 16:54来自 iPhone客户端
转发微博
@老师木 :我对微调有个认知迭代,以前觉得不仅不靠谱,而且还像调算法一样更像艺术而非科学,现在的认知完全反转了:微调不仅很强大,而且很简单,和提示工程比还是有很多好处的,微调后提示词不用原来那么长了,节省了token;而且微调是科学,提示工程是艺术,切换模型后提示词可能还需要人工调整, ​
11
2
11
老师木
2024-11-07 22:27来自 iPhone客户端
转发微博
《获奖名单公布!| #BizyAir# 工作流创作征集活动圆满完结》 本期 BizyAir 工作流创作征集活动现已圆满收官!在这场 BizyAir 创作大秀中,我们收到了超多用心的作品。感谢大家的热情参与和才华展示!❤️ 经过认真的评选,我们根据作品的质量、创意、生成成果的美学表现以及平台下载量,评选出了 8 ​
2
0
2
老师木
2024-10-28 20:06来自 iPhone客户端
里面竟然有我20年前和张老师合影
该账号因被投诉违反《微博社区公约》的相关规定,现已无法查看。查看帮助 https://kefu.weibo.com/faqdetail?id=13216
9
3
23
老师木
2024-10-14 14:30来自 iPhone 15 Pro Max
[good]
咱们悄悄地升级了一下,带来了 CogVideoX 系列的新成员——CogVideoX-5B 模型(见github,搜索cogvideo)。我们对推理性能做了一些小优化,现在运行起来更加顺畅。可能的惊喜是,像 GTX 1080TI 这样的老显卡也能玩转 CogVideoX-2B,而 RTX 3060 这样的甜品卡,也能轻松尝试 CogVideoX-5B。不妨试试看, ​
4
0
5
老师木
2024-10-12 07:52来自 iPhone 15 Pro Max
前些天还和另一所知名大学的老师谈到为啥清华做AI方向的这么多,张老师的经历就是答案。
#中国人工智能泰斗张钹作为天才的决心##89岁院士和他的大模型清华代表队#张钹用自己的职业生涯,培养了整整一代人工智能人才,而留在这些人身上的坚持,构成了我们今天所面对的技术现实。 这是一位老人和他所改变的一代人的故事。张钹讲起他的学生们总是最高兴的,他还给这个学生群体取了一个名字— ​
9
0
10
老师木
2024-09-29 19:57来自 iPhone 15 Pro Max
转发微博
【#OpenAIo1如何延续ScalingLaw#,#与硅基流动袁进辉聊o1新范式#】OpenAI 发布新模型 o1 后的第二天,我们邀请了硅基流动创始人袁进辉与我们分享了 o1 的技术意义,也讨论了今年 1 月至今,袁进辉观察到的 AI 开发者社区变化。 o1 的一个重要变化就是增加了分配给推理(inference,即大模型的使用)阶 ​
8
0
7
老师木
2024-09-14 08:32来自 iPhone 15 Pro Max
前几天李继刚 基于Claude设计了一个有趣的毒舌prompt- 汉语新解,深得网友喜欢,实现这种效果需要大模型能洞察一个词的深层含义,还得用辛辣幽默精炼的语言把本质揭示出来,最终生成html代码实现视觉布局。那国产大模型能不能做到呢,可以,结构化Prompt高手云中江树 设计了一个能用国产模型的汉语新解 ​
26
4
38
老师木
2024-09-06 20:09来自 iPhone 15 Pro Max
转发微博
#《你与AI应用开发之间,只隔着一个API密钥》 # 以往,非技术人员想要开发一个AI应用,至少需要一些编程知识、调SDK工具包等基础能力,这让不少人望而却步,哪怕有一部分人出于热情学习了基础知识与开发流程,但在实操中也会由于出现的各类操作问题很快失去兴趣。 随着大模型的出现,现在很多传统AI ​
2
0
4
老师木
2024-09-02 22:55来自 iPhone 15 Pro Max
//@pinganpingan平安:转发微博
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
24
0
11
老师木
2024-08-31 09:37来自 iPhone 15 Pro Max
转发微博
#提示工程师# 吴恩达:模型成本每年降80%,AI员工时薪1.44美金(相当于人民币时薪10块,月薪2400)。 吴恩达刚刚撰文分析了模型成本下降的原因,和对产业的影响。下降是两部分,一个是开源模型,特别是Llama系列的推动,另一个是更多芯片类型加入竞争(比如Groq);对产业的影响则是app无需担心成本, ​
5
0
5
老师木
2024-08-29 08:28来自 iPhone 15 Pro Max
转发微博
《SiliconCloud API实战攻略:教你配置OneAPI、LobeChat、MindSearch》 #SiliconCloud API实战攻略:教你配置OneAPI、LobeChat、MindSearch# ​为方便用户在各主流应用平台上接入SiliconCloud API,我们将手把手教您在OneAPI、LobeChat、MindSearch中配置SiliconCloud的API,快操作起来吧! ​
1
0
1
老师木
2024-08-26 21:28来自 iPhone 15 Pro Max
转发微博
《硅基流动荣登“2024年AIGC创新企业及产品创新”榜单》 #硅基流动荣登“2024年AIGC创新企业及产品创新”榜单# 8月22日,国际创新生态服务平台创业邦发布了《2024 AIGC年度榜单》(创新企业榜单、产品创新榜单),硅基流动荣登“2024年AIGC创新企业100强”榜单,SiliconCloud大模型云服务平台作为 ​
0
0
3
老师木
2024-08-22 18:20来自 iPhone 15 Pro Max
感谢捏Ta团队的信任,选择将硅基流动的大模型API服务平台SiliconCloud和图片/视频推理引擎OneDiff引入其核心技术栈。服务捏Ta这样真实的生产需求对我们帮助也很大,暴露意料不到的问题,特别是稳定性的问题,中间遇到过机房断电、网线松动、共享资源的其它用户瞬时请求爆发等等问题,在服务过程中一一
《SiliconCloud x 捏Ta:10倍提效C端大规模内容生成》 #SiliconCloud x 捏Ta:10倍提效C端大规模内容生成# 捏Ta是一个以生成式AI为核心,为用户提供AI漫画和虚拟角色内容生成的平台,被视为以角色幻想故事智能创作为主的早期“小红书”。 基于捏Ta平台庞大的图片生成与角色故事创作需求,他们亟需 ​
0
0
7
老师木
2024-08-21 23:31来自 iPhone 15 Pro Max
张老师从教六十余年,言传身教、润物无声,桃李满天下。我有幸能跟随张老师学习和做研究,是从2002年秋天清华西操电话亭的一个电话开始,我问张老师招不招直博生,张老师叫我第二天去他办公室见一下,我就真去了。22年过去了,我的专业和人生因张老师而不同,也对张老师很了解,但仍然有很多谜:几十年
《张钹传》隆重出版,我有幸写序。过几天我写些感想。 http://t.cn/A6RLIWCL ​
7
1
20
老师木
2024-08-19 12:40来自 iPhone 15 Pro Max
转发微博
《沉浸式翻译、Dify、NextChat“三连击”,SiliconCloud API 视频教程》 #沉浸式翻译、Dify、NextChat“三连击”,SiliconCloud API 视频教程# 手把手教你配置SiliconCloud API的视频教程来了! 在最近举办的“SiliconCloud产品体验官招募”活动中,B站Up主“沧海九粟”在他的视频教程中分享了如 ​
8
0
4
老师木
2024-08-17 13:27来自 iPhone 15 Pro Max
BizyAir 只是一个试水的小项目,把文生图workflow 工具ComfyUI搬到云上,看来真的被开发者和设计师喜欢,那我们就在这个方向上继续做些投入 http://t.cn/A6Rhwynq ​
13
3
22
老师木
2024-08-15 12:46来自 iPhone 15 Pro Max
转发微博
《SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题》 #SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题# 今天,SIliconCloud正式上线阿里通义近期开源的新一代数学模型Qwen2-Math-72B-Instruct,根据相关评测表现,它成为目前最先进的数学专项模型,SiliconCl ​
2
0
4
老师木
2024-08-14 13:02来自 iPhone 15 Pro Max
转发微博
《SiliconCloud上线InternLM2.5-20B-Chat,复杂场景推理能力全面增强》 #SiliconCloud上线InternLM2.5-20B-Chat,复杂场景推理能力全面增强# 今天,SIliconCloud正式上线推理加速后的新版本InternLM2.5-20B-Chat,其综合性能更为强劲,可以有效支持更加复杂的实用场景,接入MindSearch多智能体框架 ​
1
0
1
老师木
2024-08-13 12:25来自 iPhone 15 Pro Max
转发微博
《集齐RAG三要素,SiliconCloud上线Reranker、Embedding模型BCE与BGE》 #集齐RAG三要素,SiliconCloud上线Reranker、Embedding模型BCE与BGE# 今天,SIliconCloud正式上线由网易有道开源的Embedding模型bce-embedding-base_v1和Reanker模型bce-reranker-base_v1,以及由智源研究院开源的Embedding模 ​
12
0
4
老师木
2024-08-06 15:54来自 iPhone 15 Pro Max
转发微博
#SiliconCloud上线Llama-3.1-405B:让开发者走进GPT4时代# 近日,Meta发布了备受瞩目的Llama-3.1系列模型,包括405B “超大杯”模型傲视群雄,成为首个比肩最强大模型的开源模型。 一如既往,SiliconCloud平台快速支持了Llama-3.1-8B(可免费使用)、Llama-3.1-70B模型。今天,Llama-3.1-405B大模型 ​
5
0
1
老师木
2024-08-06 15:52来自 iPhone 15 Pro Max
转发微博
#超越SD3,比肩MJ v6,SiliconCloud上线FLUX.1# 近日,图片生成模型FLUX.1引爆了AIGC社区,其在视觉质量、图像细节和输出多样性等方面性能优越,输出极佳的图片生成效果。一如既往,为了让用户快速体验到推理加速版的最新开源图片生成模型,硅基流动团队旋即在SiliconCloud上线了FLUX.1 [dev]与FLUX. ​
3
0
0
老师木
2024-08-04 16:30来自 iPhone 15 Pro Max
谢谢信任,我们全力以赴提供更好的服务
消息翻译功能全面替换为siliconflow 服务,速度很快,效果相对于之前调的某传统在线翻译服务要自然太多了(=゚Д゚=),英日韩语毫无压力,下一步准备把对话AI 也全部接入到siliconflow[打call][打call][打call][打call] @OneFlow #英语口语##人工智能##二次元# ​
3
1
7
老师木
2024-08-02 19:39来自 iPhone 15 Pro Max
//@OneFlow:[心][鲜花]//@开源中国:在插件选择「翻译服务」即可: http://t.cn/A68pRRxc
抱歉,由于作者设置,你暂时没有这条微博的查看权限哦。查看帮助:http://t.cn/RfdBWwP ​
2
0
7
老师木
2024-08-02 13:25来自 iPhone 15 Pro Max
转发微博
#BizyAir 上新!无需显卡也可玩转最新版 Kolors# 昨天,BizyAir 推出全新版本,已完整支持最新版 Kolors,让一切变得更加简单! 无论您是否拥有高性能显卡,利用云节点,都可以轻松畅享 Kolors 强大的局部重绘、ControlNet 和 IPAdapter 等功能。同时,BizyAir 最新版还实现了 KSampler 节点适配、新 ​
0
0
0
老师木
2024-08-02 11:11来自 iPhone 15 Pro Max
每成功邀请一位 SiliconCloud 新用户,邀请者和被邀请者均可获得 2000 万 Tokens。邀请奖励上不封顶。 http://t.cn/A68phrvE ​
9
8
9
老师木
2024-08-01 19:53来自 iPhone 15 Pro Max
//@OneFlow:[心][鲜花]
沉浸式翻译突然发现多了 SiliconCloud 翻译,感觉效果比之前的腾讯和谷歌翻译好。 ​
2
1
5
老师木
2024-08-01 19:52来自 iPhone 15 Pro Max
//@OneFlow:[心][鲜花]
沉浸式翻译可以免费用大模型了!SiliconCloud 太棒了[有票了] 感觉翻译质量还是很不错 ​
223
0
5
老师木
2024-08-01 19:51来自 iPhone 15 Pro Max
BizyAir 更强大了。没有GPU或不会安装GPU软件,都没关系,使用BizyAir云节点,一样可以用ComfyUI玩转文生图,不仅基础模型有云节点,各种插件也有云上版本。这种产品能给开发者很多便利,idea 很容易想到,但行业一直没有漂亮的解决方案,直到BizyAir出现。http://t.cn/A68CQWUs ​
13
2
10
老师木
2024-07-31 00:22来自 iPhone 15 Pro Max
转发微博
澳大利亚国立大学的天文学家测试了各种闭源大模型和开源大模型在天文学领域的表现,Claude表现最好,开源模型中LlaMa-3 70B 和GPT-4o 效果差不多,但价格低一个数量级,部分实验通过SiliconCloud API 完成。SiliconCloud第一次为学术研究做贡献。SiliconCloud:http://t.cn/A68UO0Lf:论文: ​
3
0
2
老师木
2024-07-24 11:57来自 iPhone 15 Pro Max
转发微博
#免费模型最高速率提升10倍!SiliconCloud分层限速开启公测# 今天,硅基流动团队推出SiliconCloud分层限速方案,并开启公测(7月24日至7月31日),以此为用户提供更优质服务与使用体验。 公测三大亮点: 1. 六种用量级别:用得越多,可用最大速率越高 2. 免费模型速率提升10倍 3.收费模型最高速率提 ​
10
2
5
老师木
2024-07-23 18:56来自 iPhone 15 Pro Max
转发微博
开放获取模型和商业模型的差距越来越小了 ​​​。制图:Maxime Labonne ​
4
1
5
老师木
2024-07-18 19:24来自 iPhone 15 Pro Max
转发微博
发布了头条文章:《生成式AI推理企业的市场机遇、竞争与未来》 #生成式AI推理企业的市场机遇、竞争与未来# 在生成式人工智能时代的投资选择中,风投公司对“铲子型”初创企业的浓厚兴趣,这些企业的业务涵盖了模型微调、可观测性分析、以及人工智能的“抽象化”服务(例如,将AI Inference作为服务) ​
4
0
4
老师木
2024-07-16 18:11来自 iPhone 15 Pro Max
[心]
别看现在开源免费可商用大模型这么多,但你想快速用起来了也还是得折腾一番的,自己部署也需要算力效率等的优化。之前体验了阿里云,稍微贵点,重点支持qwen自己的业务。硅基流动这块做的倒是挺好,基于开源模型,基于自研优化策略,速度快,成本低,赞一个。国外好像也有个类似的,Fireworks AI, 刚 ​
2
0
5
老师木
2024-07-13 18:33来自 iPhone 15 Pro Max
转发微博
刚刚发现 SiliconFlow 上向量模型了,还是免费的,这个配合 DeepSeek 做文档检索成本可以很便宜了。 http://t.cn/A6QeIsaN ​​​
5
1
8
老师木
2024-07-12 09:46来自 iPhone 15 Pro Max
最近感到非常exciting 的一个产品创新:没有GPU也能玩ComfyUI,还能在ComfyUI 里使用强大的大模型自动优化prompt ,先来体验下火爆的Kolors 吧。(我感到exciting的原因是,这帮AI Infra 工程师也有产品经理的sense,终于不再只讲我做的系统有多快了,而是从解决用户一个大痛点来思考了)
【比肩Midjourney-v6!#没有GPU也能跑可图Kolors# 】比肩#Midjourney-v6# ,快手的文生图开源模型可图Kolors一发布,开源社区就炸开了锅。短短几天,可图在Github上收获2k Star,Huggingface模型下载热榜第一。 国产文生图模型可图的强势崛起让人振奋,不过,大多数跃跃欲试的用户却很难在本地部署并 ​
39
0
25
老师木
2024-07-10 21:34来自 iPhone 15 Pro Max
转发微博
【#如何快速上手SiliconCloud# ?】SiliconCloud是集合主流开源大模型的一站式云服务平台,为开发者提供更快、更便宜、更全面、体验更丝滑的大模型API。 不同于多数大模型云服务平台只提供自家大模型API,#SiliconCloud# 已上架包括DeepSeek-V2-Chat、DeepSeek-Coder-V2、Stable Diffusion 3 Medium、 ​
3
0
1
老师木
2024-07-10 12:56来自 iPhone 15 Pro Max
正在开发,会尽快上线新的限速方案
今天又测试了下 siliconflow 的接口,DeepSeek V2 模型的速度大概能比官方快一倍。但是能把付费模型的RPS调高一些吗?[允悲] @OneFlow @老师木 我们跑工作流一个请求1分钟以上,RPS 3 也就是说整个产品同时只能3个人用,根本不够商用啊 [苦涩] 个人这块,比如沉浸式翻译的场景,一个页面就是一堆请 ​
2
0
6
老师木
2024-07-09 18:47来自 iPhone 15 Pro Max
沉浸式翻译 + SiliconFlow + ChatGLM-4 9B【💰 免费接入!沉浸式翻译 x SiliconFlow(硅基流动)-哔哩哔哩】 http://t.cn/A6Qu1moq ​
18
9
32
老师木
2024-07-07 15:47来自 iPhone 15 Pro Max
转发微博
一篇比较大模型代码生成能力的文章,DeepSeek-v2-Coder相当强悍呀,甚至超过gpt4-o 。 内容主要基于DevQualityEval的评测结果。DevQualityEval是一个比较和改进大模型代码生成质量的评估基准和框架。 http://t.cn/A6Q8t5B3 ​
23
1
4
老师木
2024-07-07 15:45来自 iPhone 15 Pro Max
转发微博
Google 又开源了新的大模型——Gemma 2,提供 9B 和 27B 两种参数规模的版本。 按照 Google 自己的宣传图里,是敢于跟 Llama 3 硬刚了,但实际体验还要测一测才知道。 在 LMSys Chatbot Arena 基准测试中,27B 版本的测试与 GPT-4 和 Claude-3 Sonnet 性能相当。 ​
1
0
1
老师木
2024-07-02 23:04来自 iPhone 15 Pro Max
转发微博
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
1
0
3
老师木
2024-07-01 18:42来自 iPhone 15 Pro Max
官方maas 推理能力提升很多,siliconflow 很快慧上线最新版本的deepseek 模型。128K 上下文,正在解决。
#Easy同学正在独立开发# 目前我们主要使用的开源LLM是 DeepseekV2,能力没有吹得那么好,大概智能在3.8。但这个是真便宜,而且开源,有很多第三方供货商。 目前测试下来,兼容性最好的是官方;最快的是 siliconflow;但这两个都不支持128k,只有 OpenRouter 支持,但国内访问太慢了… --- 便宜的 ​
5
1
11
老师木
2024-06-25 17:28来自 iPhone 15 Pro Max
OpenAI对中国区停服,大家还是用国产模型吧,今天SiliconCloud 把一大批模型都免费了,大家轻薅,别给整破产了[流泪]
刚刚,硅基流动为国内开发者献上一份前所未有的大礼:Qwen2 (7B)、GLM4 (9B)、Yi1.5(9B)等顶尖开源大模型永久免费。从此,开发者 “Token 自由” 不再是梦,可以甩开膀子开发超级应用了。 http://t.cn/A6QielRw ​
28
3
23
老师木
2024-06-25 15:12来自 iPhone 15 Pro Max
开源模型和国产模型能力足够强了,有够好的产品创意足够打造出Super App了。不过产品创意的发生具有偶然性,在大厂和大模型厂商的“张小龙候选人”太少了,必须扩大基数,实现Token自由,广大开发者和产品经理只要有好想法就可以打造和推广应用,当有100万这样的开发者时,“张小龙”就出现了。
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
14
3
21
老师木
2024-06-19 16:36来自 iPhone 15 Pro Max
官方定价输入1元,输出2元,我们没有区分输入和输出,定价1.33,和官方差不多吧。 公测阶段先放了32K ,后续会上线128K。//@Easy:测试了下,话说DeepSeek v2明明有128k你们搞个32k,定价还比官方API贵是怎么想的?maxtoken不填默认512也比较坑,线上业务切换不过来。//@老师木:转发微博
【SiliconCloud公测两周,用户这样评价】 5月31日,#硅基流动# 公测上线了集合主流开源大模型的一站式云服务平台#SiliconCloud# ,为开发者提供更快、更便宜、更全面的模型API服务。 目前,SiliconCloud已上架包括Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID在 ​
0
0
3
老师木
2024-06-19 06:35来自 iPhone 15 Pro Max
转发微博
【SiliconCloud公测两周,用户这样评价】 5月31日,#硅基流动# 公测上线了集合主流开源大模型的一站式云服务平台#SiliconCloud# ,为开发者提供更快、更便宜、更全面的模型API服务。 目前,SiliconCloud已上架包括Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID在 ​
9
0
4
老师木
2024-06-14 22:48来自 iPhone 15 Pro Max
转发微博
【文生图王者登场:Stable Diffusion 3 Medium开源|SiliconCloud上新】 今年2月,#Stability.AI#发布了#Stable Diffusion 3#预览版,在多主题提示、图像质量和拼写能力方面具有显著的性能提升。Stable Diffusion 3是一个系列模型,参数量从800M到8B不等。 6月12日,Stability AI正式开源了 ​
6
0
3
老师木
2024-06-12 18:56来自 iPhone 15 Pro Max
感谢亚马逊云科技的认可,亚马逊云是公有云领导者,非常荣幸能加入亚马逊云科技生成式AI合作伙伴计划,相信我们的产品能给双方客户创造更多价值。
【硅基流动 x 亚马逊云科技,加速生成式AI触达全球客户】 近日,亚马逊云科技中国合作伙伴峰会在上海召开。峰会上宣布了“#亚马逊云科技生成式 AI 合作伙伴计划#”,旨在为企业提供全方位的模型、工具、应用和集成服务,助力企业更快地应用生成式AI,打造“人工智能+”时代的竞争优势。#硅基流动#成为 ​
2
0
8
老师木
2024-03-12 23:24来自 iPhone 11 Pro Max
转发微博
【一流科技入选“北京市数字经济标杆企业”】 2月29日,《2023北京市数字经济标杆企业评价报告》正式发布,一流科技#OneFlow#入选2023北京市数字经济标杆100家名单,并荣膺“数字基础技术标杆企业”。 据悉,《2023北京市数字经济标杆企业评价报告》是在北京市经济和信息化局指导下,北京软件和信息 ​
1
1
7
老师木
2024-03-12 23:24来自 iPhone 11 Pro Max
转发微博
发布了头条文章:《好久不见!#OneFlow 1.0#全新版本上线》 好久不见。今天是 OneFlow 开源的第 1320 天。 与 #OneFlow# 框架的创作者们一样,过去一年,它也经历了过山车般的命运。好在,即使在下坡潜伏期依然被社区用户关注和使用,作为它的创作者,我们为此感到欣慰——这也是它还在更迭的价值 ​
5
0
6
老师木
2024-01-11 12:02来自 iPhone 11 Pro Max
光年除了并购oneflow 40人,还有新加入光年的30多位人才,这30人大部分并进美团。老王花了3亿多向oneflow投资人买了47%的股权。交易公告交代清楚了,美团一元购买了光年(含47% oneflow股权),光年投资人不赔不赚。老王真花钱了,光年和团队共同作为oneflow股东,同时很nice 地对oneflow没有竞业
让我捋捋啊。王慧文光年之外收购oneflow的时候看中的是团队,后来王慧文身体不好不干了,美团接盘整个光年之外,让投资人都退了。 现在oneflow的人出来创业,袁进辉说一开始有40个人,现在出来创业的有35个人。 那美团是买了个寂寞? ​
19
3
35
老师木
2024-01-10 20:48来自 iPhone 11 Pro Max
谢谢晚点。蛮需要人才的,一起抓住新时代的机遇。
#硅基流动完成五千万元天使轮融资##创新工场王慧文等投资袁进辉新公司#【晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资】OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow)。 《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使 ​
16
9
30
老师木
2024-01-10 20:47来自 iPhone 11 Pro Max
会做,已做//@罗克2011:如果硅基流动的推理框架相比竞品,推理成本更低,那为什么不做开源模型的云服务呢,同样的调用,更低的成本更低的报价,对于企业来说换个API多简单
#硅基流动完成五千万元天使轮融资##创新工场王慧文等投资袁进辉新公司#【晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资】OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow)。 《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使 ​
13
4
8
老师木
2024-01-03 18:36来自 iPhone 11 Pro Max
//@丕子:[good]//@马少平THU:赞!我们实验室现任主任,张钹老师的高徒,来自安徽一个贫困地区。上大学时学校除了给予一定的补贴外,安排他在图书馆勤工俭学,顺利完成学业。
朱军教授加入了人工智能「名人堂」。 http://t.cn/A6lrfgsV ​
5
1
5
老师木
2024-01-01 15:53来自 iPhone 11 Pro Max
转发微博
发布了头条文章:《OneFlow技术年货:800+页免费“大模型”电子书》 #OneFlow技术年货:800+页免费“大模型”电子书# 年关将至,我们制作了一份超800页的“年货”赠予每一位用户,希望能帮助你系统了解大模型的来龙去脉。这份合集分为七大板块。祝你新年快乐[给你小心心][春游家族][打call] ​
7
0
8
老师木
2024-01-01 15:52来自 iPhone 11 Pro Max
Enjoy[微风]
http://t.cn/A6lumwkk OF这个关于大模型的年度文集挺好的,有科普的也有深专的,值得收藏学习。@老师木 ​
15
0
7
老师木
2023-04-27 11:05来自 iPhone 11 Pro Max
[赞]
发布了头条文章:《周枫:当我们谈论大模型时,应该关注哪些新能力?》 。讨论下大模型哪些能力最重要。任何新技术,只有将技术的关键能力,和重要需求结合起来,才能实现突破,所以要找到技术的关键能力。和大家探讨[Salute] @老师木 @李志飞AI http://t.cn/A6N6lyUR ​
13
1
6
老师木
2023-03-28 14:37来自 iPhone 11 Pro Max
转发微博
【GPT-4,#大增长时代的序幕# 】虽然我们早在 2017 年就预测了超大模型的到来,因此才搞了分布式深度学习框架# OneFlow# (github.com/Oneflow-Inc/oneflow/),且 2020 年的 GPT-3 也掀起了大模型热潮(OneFlow——让每一位算法工程师都有能力训练 GPT) ,但当时各项测试屠榜的 GPT-3 的超高训练成本 ​
14
4
17
老师木
2023-03-23 02:27来自 iPhone 11 Pro Max
转发微博
【OpenAI创始人:#GPT-4的研究起源和构建心法# 】三十年前,互联网(Web 1.0)时代开启。人们只能在笨重的电脑上用鼠标点击由HTML编写的网页文本,随后开始支持插入图片,可以上传视频,于是有了网络新闻、搜索、电子邮件、短信、网游......互联网带来了全新的商业模式,深刻改变了人们的生产生活。 ​
24
4
21
老师木
2023-03-12 13:08来自 iPhone 11 Pro Max
转发微博
【适配PyTorch FX,#OneFlow让量化感知训练更简单# 】近年来,#量化感知训练# 是一个较为热点的问题,可以大大优化量化后训练造成精度损失的问题,使得训练过程更加高效。 Torch.fx在这一问题上走在了前列,使用纯Python语言实现了对于Torch.nn.Module的解析和向IR的转换,也可以提供变换后的IR对应的 ​
0
0
4
老师木
2023-03-10 07:23来自 iPhone 11 Pro Max
转发微博
【ChatGPT作者John Schulman:我们成功的秘密武器】除了OpenAI,外界可能很少有人知道ChatGPT模型成功的真正原因,实际上,#OpenAI# 也会对ChatGPT拥有的巨大影响力感到不可思议。这种困惑和惊喜就像工程师们解bug时获得的意外成功:We don't know why, but it works. 一种普遍的看法是,#ChatGPT# ​
9
0
4
老师木
2023-03-05 17:07来自 iPhone 11 Pro Max
转发微博
'llama-dl - High-speed download of LLaMA, Facebook's 65B parameter GPT model' Shawn Presser GitHub: github.com/shawwn/llama-dl #开源##机器学习# ​
4
0
5
老师木
2023-03-03 20:50来自 iPhone 11 Pro Max
转发微博
【ChatGPT背后:从0到1,#OpenAI的创立之路# 】​ChatGPT一出,OpenAI名声大震,CEO Sam Altman也成为聚光灯下的C位主角,有些报道甚至开始了对他的“造神”运动。年少成名,他不到30岁就成为YC总裁,从2019年GPT-3开始,他开始主导OpenAI的运营事务,并取得了如今的非凡成就。 他擅长将企业发展从1放 ​
6
0
7
老师木
2023-03-03 20:49来自 iPhone 11 Pro Max
转发微博
【#GPT-3/ChatGPT复现的经验教训# 】为什么所有公开的对 GPT-3 的复现都失败了?我们应该在哪些任务上使用 GPT-3.5 或 #ChatGPT# ? 对于那些想要复现一个属于自己的 GPT-3 或 ChatGPT 的人而言,第一个问题是关键的。第二个问题则对那些想要使用它们的人是重要的(下文提到 GPT-3,主要是指 GPT-3.5 ​
2
0
3
老师木
2023-03-03 20:49来自 iPhone 11 Pro Max
转发微博
【超越ChatGPT:#大模型的智能极限# 】在此前《大型语言模型的涌现能力》、《#ChatGPT进化的秘密# 》两篇文章中,符尧剖析了大型语言模型的突现能力和潜在优势,大模型所带来的“潜在的”范式转变,并拆解了#ChatGPT# 演进的技术路线图。 在本文中,作者以终为始分析了大模型的智能极限及其演进维度。 ​
3
0
3
老师木
2023-03-03 15:49来自 iPhone 11 Pro Max
转发微博
去年底以来,一系列加速作图效率的技术改进。 比如,能让Stable Diffusion实现“1秒出图”的OneFlow深度学习框架,现在已经成为了Hugging Face开源平台的热门。清华大学推出的,压缩AI绘图采样步骤的方法,也备受关注。 这一系列的改进,都让Stable Diffusion绘图的速度,从以前几天洗一张照片,变成 ​
2
0
13
老师木
2023-03-01 06:41来自 iPhone 11 Pro Max
转发微博
很多讨论ChatGPT的文章在讨论RLHF都喜欢说“跟人的价值观对齐”或者“跟人类偏好对齐”,这种说法挺让人困惑的。GPT-3本身就是完全用自然语言文本训练的,训练文本本来就是人写的,已经反映了所谓的“人类价值观”或者“人类偏好”了,为什么还要跟这些东西对齐?其实OpenAI在介绍他们采用的RLHF技术的 ​
8
0
4
没有更多微博了