常州 AI Club

精选

精选 · 模型发布/更新

05/10 00:40X：阿里云 / Alibaba Cloud (@alibaba_cloud)模型

HappyHorse上线阿里云，AI视频无需等待

基准测试排名第一。闪电速度。原生音视频同步。排队等待AI视频的时代结束了。HappyHorse现已在阿里云Model Studio上线。当别人还在渲染时，你已完成。立即构建：https：//int.alibabacloud.com/m/1000412167/

AI HOT原文

05/09 15:09X：百度 Baidu (@Baidu_Inc)模型

ERNIE 5.1发布，预训练成本仅需对标模型6%

ERNIE 5.1 刚刚发布。基于 ERNIE 5.0 的预训练基础，我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力，而预训练成本仅需对标模型的约 6%。更多内容详见主题帖 🧵

AI HOT原文

05/09 12:05X：阶跃星辰 StepFun (@StepFun_ai)模型

StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测排行榜中位列全球第三，Elo 评分为 1187 分，仅次于 Inworld TTS 1.5 Max 与 Google Gemini 3.1 Flash TTS。该模型语音自然度较前代显著提升，并以 8 分优势超越 Eleven v3。其定价为每百万字符 85 美元，生成速度为每秒 37.6 字符，并提供了全局上下文提示和行内情感标签两种语音控制方式。

AI HOT原文

05/09 01:52X：蚂蚁百灵 (@AntLingAGI)模型

Ring-2.6-1T发布：万亿参数思维模型专为复杂任务设计

Ring-2.6-1T是一款万亿参数的旗舰思维模型，专为现实世界复杂任务和生产环境构建。该模型具备可调节思维努力功能，通过动态计算机制灵活平衡认知深度、token成本和执行速度。它针对代理优化，适用于高频工作流，提供快速多步执行和工具编排，并具有SOTA稳定性。深度思维特性解锁了模型的最大能力上限，特别适合严格数学逻辑和科学研究。

AI HOT原文

05/09 00:03Hugging Face：Blog（RSS）模型

EMO：为涌现模块化预训练的专家混合模型

EMO是一种新型专家混合模型，通过端到端预训练使模块化结构直接从数据中涌现，无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集（即8个活跃专家中的部分），同时保持接近全模型的性能；当所有128个专家共同使用时，它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数，训练数据达1万亿令牌。与标准MoE相比，EMO通过文档级路由约束，鼓励专家形成领域专业化组，从而支持选择性使用而不导致严重性能下降，实现了可组合架构，优化了大型稀疏MoE的内存-准确性权衡。

AI HOT原文

05/07 23:06X：蚂蚁百灵 (@AntLingAGI)模型

万亿参数指令模型Ling-2.6-1T发布

inclusionAI宣布Ling-2.6-1T现已在OpenRouter上线。🚀 这款万亿参数旗舰指令模型专为现实世界智能体打造。它采用"快速思考"方法，在保持AIME26和SWE-bench Verified基准测试顶尖性能的同时，将成本降低约75%。适用于： - 高级编程 - 复杂推理 - 大规模智能体工作流

AI HOT原文

05/07 21:00OpenAI：官网动态（RSS · 排除企业/客户案例）模型

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

OpenAI扩展了网络安全领域的可信访问计划，推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究，并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持。

AI HOT原文

05/07 18:00OpenAI：官网动态（RSS · 排除企业/客户案例）模型

通过 API 中的新模型推进语音智能

OpenAI API 推出了新的实时语音模型，能够进行推理、翻译和语音转录。这些模型显著提升了语音交互的自然度与智能水平，支持实时处理与多语言转换。新功能旨在为开发者提供更强大的工具，以构建更流畅、更智能的语音应用体验。

AI HOT原文

05/06 22:31X：商汤 SenseTime (@SenseTime_AI)模型

SenseNova-U1开源8步蒸馏LoRA，推理速度大幅提升

🚀 SenseNova-U1 更新： ⚡ 开源8步蒸馏LoRA：100 NFE降至8 NFE，H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI，提供文生图、图像编辑和交错生成的即用工作流试用链接 👇 https：//github.com/OpenSenseNova/SenseNova-U1/

AI HOT原文

05/06 21:51IT之家（RSS）模型

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

字节跳动火山引擎发布豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 升级版。该模型原生统一支持视频、图像、音频和文本理解，并能进行跨模态联合推理，在物理、医疗等学科推理及细粒度感知上表现超越此前Pro版本。音频方面支持19种语种转写及多语种互译，多项基准测试优于Gemini-3.1-Pro。同时，其Agent、Coding与GUI能力升级，能更稳定处理长任务、胜任深度开发，并实现界面理解与操作执行的闭环。新版本已在火山方舟上线，旨在为企业提供高性价比的全模态任务部署方案。

AI HOT原文

05/06 03:30X：Testing Catalog (@testingcatalog)模型

Google released Multi-Token Prediction （MTP） drafters for the Gemma 4 family. It comes with a 3x spe…

Google为Gemma 4系列发布了多令牌预测（MTP）草稿模型。它在不损失性能的情况下带来了3倍的速度提升。期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4！

AI HOT原文

05/06 00:39X：xAI (@xai)模型

Grok 4.3正式上线API 速度与智能双突破

Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。它在 @ArtificialAnlys 排行榜上的智能体工具调用和指令遵循方面位居榜首，并在 @ValsAI 的企业领域（如判例法和公司金融）中排名第一。 Grok 4.3 支持 100 万令牌的上下文窗口，定价为输入每百万令牌 1.25 美元，输出每百万令牌 2.50 美元。创建 API 密钥并开始构建：http：//console.x.ai/team/default/api-keys

AI HOT原文

05/05 18:00OpenAI：官网动态（RSS · 排除企业/客户案例）模型

GPT-5.5 Instant：更智能、更清晰、更个性化

ChatGPT的默认模型已更新为GPT-5.5 Instant。新版模型能提供更智能、更准确的答案，并有效减少了幻觉现象。同时，用户获得了更强的个性化控制能力，使交互体验更贴合个人需求。此次升级标志着模型在理解精度与响应定制化方面取得了显著进步。

AI HOT原文

正在整理新的社区内容

正在整理新的社区内容

AI 资讯

精选 · 模型发布/更新

HappyHorse上线阿里云，AI视频无需等待

ERNIE 5.1发布，预训练成本仅需对标模型6%

StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

Ring-2.6-1T发布：万亿参数思维模型专为复杂任务设计

EMO：为涌现模块化预训练的专家混合模型

万亿参数指令模型Ling-2.6-1T发布

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

通过 API 中的新模型推进语音智能

SenseNova-U1开源8步蒸馏LoRA，推理速度大幅提升

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

Google released Multi-Token Prediction （MTP） drafters for the Gemma 4 family. It comes with a 3x spe…

Grok 4.3正式上线API 速度与智能双突破

GPT-5.5 Instant：更智能、更清晰、更个性化

AI 日报 · 5月9日

数据来源