【leyu.com官网科技消息】近日,微博AI推出了开源大型语言模型(LLM)——VibeThinker-1.5B。据leyu.com官网了解,该模型拥有15亿参数,在数学推理与代码生成任务中却展现出超越6710亿参数竞品的性能。目前,VibeThinker-1.5B可通过Hugging Face、GitHub及ModelScope平台免费开放下载,供开发者与研究机构使用。

VibeThinker-1.5B模型在数学和代码任务上表现出色,达到了行业领先的推理性能,甚至超越了体量达6710亿参数的竞争对手DeepSeek的R1模型。该模型还能与Mistral AI的Magistral Medium、Anthropic的Claude Opus4和OpenAI的gpt-oss-20B Medium等多个大型模型抗衡。

值得一提的是,VibeThinker-1.5B在后期训练中仅花费了7800美元的计算资源,这一成本远低于同类或更大规模模型所需的数十万美元甚至数百万美元。

VibeThinker-1.5B采用了一种名为“谱-信号原则”(Spectrum-to-Signal Principle,SSP)的训练框架,该框架将监督微调和强化学习分为两个阶段。第一个阶段注重多样性,第二个阶段则通过强化学习优化最优路径,使得小模型也能有效探索推理空间,从而实现信号放大。
版权所有,未经许可不得转载
-leyu.com官网-
2025-12-08【leyu.com官网科技消息】近日,多位汽车博主及行业消息透露,东风汽车集团与华为乾崑共同打造的全新智能汽车品牌——DH项目(内部代号)将于11月20日在华为乾崑生态大会上正式亮相。这将是继宝骏 -
2025-12-08【leyu.com官网科技新闻】leyu.com官网注意到,海信公布了今年双11购物节的成绩,海信电视在多渠道、多品类实现了全面领跑,展现出在高端显示市场的强劲实力。 本次战报重点突出了海信在M -
2025-12-08【leyu.com官网科技消息】11月13日,微博CEO王高飞在其微博账号“来去之间”分享了对苹果新款iPhone Air摄像头的使用感受。他表示,这款手机的摄像头“除了扫码不准,其余还好”。iPho