Loading · 页面切换
正在整理新的社区内容
稍等一下,正在准备页面数据、图片和交互状态。
Loading · 页面切换
稍等一下,正在准备页面数据、图片和交互状态。
AI News · 资讯流
聚合值得关注的 AI 动态、产品发布、行业变化和社区相关机会。
推出帕累托代码:一款全新、免费、实验性的编码路由工具 在请求中设置 `min_coding_score`,即可路由至符合您标准且成本最低的编码模型,排名由 @ArtificialAnlys 提供。 实时查看帕累托前沿的变化👇
Peekaboo 3.0 现已上线。这是自 2.0 以来最重要的版本。 ⚡ 以操作为先的 macOS 电脑使用体验 👁️ 统一的截图 + 界面检测功能 🧩 CLI + MCP 间更简洁的 JSON 交互 🛠️ 更好的快照功能 我去年就开始了这项工作,但当时的模型还不够好。现在它们已经准备好了。https://peekaboo.sh
思小建大🔥 @Alibaba_Qwen 3.5 和 Qwen3.6 系列现已在 SiliconFlow 上线 🎉 9B 到 397B · MoE 与 Dense · 原生多模态 ✅ Qwen3.6-35B-A3B · Qwen3.6-27B ✅ Qwen3.5-397B-A17B · Qwen3.5-122B-A10B ✅ Qwen3.5-35B-A3B · Qwen3.5-27B · Qwen3.5-9B 更小的模型。更大的成果。社区的最爱。 现在,选择你的尺寸并开始构建 👇 https://cloud.siliconflow.com/
Grok 升级 【引用 @grok】:… 今天就在 iOS、Android 和 http://grok.com 上的所有计划中添加您的连接器到 Grok。
OpenRouter Agent SDK 新增功能:人工介入工具。 自动处理常规工具调用。暂停高风险调用以供审核。 返回值可保持代理运行。返回 null 则将该调用提交至您的应用以获取人工输入。
Gemini中的笔记本功能为复杂任务带来条理性。 以研究生院申请流程为例:通过笔记本,您可以将成绩单、文书草稿和录取要求集中在一处,让Gemini帮助追踪截止日期、提供反馈并评估您的进展。
Bugbot宣布将团队与个人计划从每月每席位40美元的订阅制改为按使用量计费。现有用户的变化将于2026年6月5日后的下一个账单周期开始生效,例如2026年5月购买的年订阅将在2027年5月切换。团队按需消费计费,个人按包含使用量计费,平均每次运行成本约为1.00-1.50美元,具体取决于PR大小和复杂度。同时,用户现在可配置Bugbot审查PR的工作强度:默认强度下80%被识别的问题在合并时得到解决;高强度模式下可多发现35%的问题,解决率仍保持在80%。现有客户可在Cursor面板中提前切换至用量计费。
阿里云发布Smart Studio平台,旨在整合AI模型测试与服务的全流程,终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型(如Qwen3.6-Max、DeepSeek-v4)的能力,支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室,用于并排比较开源与闭源模型的输出效果,并能快速将Hugging Face上的模型转化为实时API,简化部署流程。
Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础,引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径,并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项,VSCode 扩展也修复了相关错误。
您的客户服务需要一个为现实世界打造的语音助手。 Grok Voice Think Fast 1.0能以速度和准确性处理复杂工作流,即使在嘈杂环境中也能胜任。从多步骤故障排除到高频工具调用,它都能从容应对。
OpenAI 在 GitHub 开源了官方命令行工具 openai-cli,采用 Apache 2.0 协议,支持通过 Homebrew 或 Go 安装。该工具允许开发者直接在终端调用 OpenAI API,无需编写 SDK 代码。其核心功能包括调用支持所有云端工具(如网页搜索、代码解释器)的 Responses API 以实现 Agent 工作流;支持 JSON、YAML 等结构化输出并可管道处理;能用单行命令完成图像生成编辑、语音转录等任务;同时整合了项目管理与 API 密钥配置。工具采用资源化命令结构,旨在弥补官方此前仅提供语言 SDK 的不足,便于集成到自动化流程和服务器端环境中。
开发者开源了一款专为AI Agent设计的网盘NeuDrive,能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源,同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景,付费版在付款时输入优惠码"vivo50"可兑换三个月免费使用权。
你已有标语。现在将其变为广告。 输入你的标语。定义美学风格。Luma Agents 将据此构建广告。 赋予它生命 → http://lumalabs.ai/app
Codex现可直接在macOS和Windows的Chrome中运行。 它在处理Chrome中的应用和网站时表现更佳,并能在后台跨标签页并行工作,而不会占用浏览器控制权。 要开始使用,请在Codex应用中安装Chrome插件。
DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。
Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。
我们安全承诺的下一步:安全中心2.0。 我们极大地简化了理解您管理的每个Replit应用安全状况的流程,并支持批量对所有应用执行操作。 通过安全中心2.0,您可以: - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单(SBOM)以集成外部工具
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。
1/ 音频现已成为OpenRouter的一等公民。 今日上线两个新端点: 📢 /api/v1/audio/speech - 文本转语音(TTS) 🎤 /api/v1/audio/transcriptions - 语音转文本(SST) 沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。
4K超分功能现已上线!在一处增强您的图像和视频。 获得3次免费使用机会,之后享受35%的积分折扣。 限时活动:5月7日至14日,UTC时间08:00。 转发+关注+回复=私信领取300积分(仅限72小时)。
该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。
阿里千问在PC端上线AI语音输入功能,用户通过快捷键即可在各类桌面应用中直接使用。该功能不仅支持去除语气词、纠错和格式化整理口语内容,更能基于上下文智能回复,并可直接下达创作、问答、翻译等指令。其设计逻辑超越传统语音打字工具,旨在成为跨应用的AI任务调度中枢:用户通过按住快捷键启动语音输入模式,或双击切换至AI指令模式,可直接派发信息检索、文档生成等任务。该功能覆盖文档编辑、网页浏览、即时通讯等主流办公场景,无需切换客户端或打开额外窗口,目前所有用户可免费使用。
Amp发布CLI工具Neo,标志着Coding Agent从"陪伴式"转向"长链路"新方向,核心是减少人工介入、支持随处运行与触发。关键更新包括:实现本地线程的远程控制与编排;引入自动上下文压缩,淘汰手动管理;正式发布Plugin API,支持扩展工具与交互;采用队列与引导机制优化工作流;权限模型彻底反转,默认允许所有操作,将安全控制权移交插件系统;性能大幅提升,CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。
OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。
ChatGPT 推出了一项名为"可信联系人"的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。
现在所有Replit开发者都能安全地将webhooks、GitHub、Slack等外部服务连接到私有应用 这样内部工具可以发布Slack更新,或商业应用可以接收Stripe付款,同时保持对组织或团队的私密性。 要实现此功能,请将应用私有发布,您将在发布面板的"安全"部分看到外部访问令牌选项,可在此创建和管理这些外部服务的令牌
Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。
Tilde.run 发布了一款代理沙箱,其核心特点是具备事务性和版本控制功能的文件系统。该系统支持事务操作,确保文件更改的原子性,同时提供完整的版本历史记录。该工具旨在为开发者提供一个安全、可回溯的代码执行环境,适用于需要高可靠性的自动化代理或脚本测试场景。目前该项目已在 Hacker News 上获得 102 点关注度。
OrcaRouter-Lite 现已开源,这是一个采用MIT许可、可自托管的大型语言模型路由工具。它支持用户自带密钥,无需外部数据库,并能对接OpenAI、Anthropic、Google、Groq等多种服务提供商。其核心创新是model="auto"模式,可自动为每次请求选择成本最低且能力匹配的模型,并具备跨提供商的确定性提示缓存功能,使得重复的相同请求能在毫秒内以零成本返回。该项目旨在解决开发团队手动编写复杂模型选择逻辑的痛点,通过简单的Docker部署即可实现路由功能,托管版本将于本周稍晚推出。
通过个人智能与Nano Banana 2的协同工作,您现在可以将兴趣转化为Gemini中的图像。 请勿错过我们在Discord上的下一次社区活动,届时将有最新版本团队的现场演示和问答环节。 👉加入我们的Discord观看直播:http://discord.gg/gemini 📅 今天太平洋时间中午12:00
我们正在推出领域特定能力评分,使用与通用ECI相同的量表,追踪模型在软件工程和数学基准测试中的能力。我们还支持用户自定义创建ECI变体。链接如下!
2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过"Dish"附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。
Perplexity Agent API 现已提供金融搜索功能。 开发者只需一次工具调用,即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。
NVIDIA宣布其Spectrum-X以太网扩展架构现已支持多资源容器(MRC)。这一AI原生的开放以太网架构旨在为构建千兆级AI工厂提供网络标准,以满足大规模AI训练与推理对高性能、可扩展网络的需求。MRC的加入增强了资源隔离与管理能力,使Spectrum-X能够更好地支持多租户、多工作负载的复杂AI环境,确保AI计算集群的性能与效率。
AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。
Cloudflare宣布其代理商合作伙伴现可直接创建Cloudflare账户、购买域名并部署服务。这一功能整合了账户创建、域名注册和项目部署流程,简化了代理商的管理与操作步骤。此举旨在提升合作伙伴的自主性和效率,进一步扩展Cloudflare的生态系统与服务覆盖范围。
Claude Code 发布 v2.1.129 版本,带来多项功能新增与问题修复。新增功能包括支持通过 `--plugin-url` 从 URL 获取插件压缩包、新增 `CLAUDE_CODE_FORCE_SYNC_OUTPUT` 环境变量以强制启用终端同步输出,以及为 Homebrew 或 WinGet 安装提供后台自动更新提示。功能调整方面,插件清单中的 `themes` 和 `monitors` 现在建议在 `"experimental"` 下声明;网关模型发现功能改为通过环境变量手动启用;Ctrl+R 历史记录选择器恢复为默认搜索所有项目的提示。此外,修复了约 20 项问题,涉及 `/clear` 命令、会话标题显示、外部编辑器切换、令牌浪费、OAuth 凭证刷新、缓存警告等多个方面。
xAI正式向企业开发者和团队推出Grok Imagine API的"Quality Mode"图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。
关注常州本地的一人公司、独立产品和 AI 创业实践。
追踪常州及国内 AI 产业政策、项目申报与政企机会。
内容来自公开资讯源与社区整理,原文链接会保留在每条资讯中。
访问 AI HOT