Loading · 页面切换
正在整理新的社区内容
稍等一下,正在准备页面数据、图片和交互状态。
Loading · 页面切换
稍等一下,正在准备页面数据、图片和交互状态。
AI News · 资讯流
聚合值得关注的 AI 动态、产品发布、行业变化和社区相关机会。
在2025年元旦引发洛杉矶致命野火的纵火案审判中,检察官将被告Jonathan Rinderknecht的ChatGPT日志作为关键证据,包括其用ChatGPT生成火焰图像、询问"为什么我总是这么愤怒"以及抱怨富人毁掉世界等记录,并出示了一段屏幕录制显示其问ChatGPT是否可因香烟引火而追责。但陪审团以10比2的投票支持辩方,法官宣布悬案。一名陪审员表示她"经常和ChatGPT聊天",认为此举不能证明任何问题,并对检方用聊天记录指控感到愤怒。
从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动,无需依赖文本提示即可提供精确、一致的结果。
Google vs Meta 🤖 > 据《金融时报》报道,Google因容量短缺对Meta使用Gemini施加限制。 > 据报道,这负面影响了Meta内部与客户支持和内容审核相关的项目,导致项目延期。 我敢打赌,从长远来看,token效率将成为一个巨大的市场,其商业模式非常透明且可预测。
奥地利数字化国务秘书亚历山大·普罗尔(Alexander Pröll)致信欧盟委员会,敦促各成员国将 Anthropic 作为战略重点引入欧盟,提供法律确定性、市场准入、资本和价值观。此举意在反制美国阻止外籍人士使用最先进 AI 模型的举措。普罗尔认为,Anthropic 扎根欧洲能吸引人才、留住资金并制定行业标准。此前欧盟委员会发言人曾表示欧洲必须强化技术自主权。
马斯克宣布Grok 4.5基于1.5T V9基础模型,并在补充训练中加入Cursor数据,现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型,Grok Build工具每日改进。此外,SpaceX今年将每月发布完全从零训练的新模型。
99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户,一定要看看。原推主感叹:我特么还真想成为那1%的人,可惜我也不知道😄
腾讯Youtu Lab联合多所中国大学发布调查论文,提出AI系统需从聊天机器人转向数字同事,核心是结合持久工作空间和可重用技能。思考型LLM(如OpenAI o1、DeepSeek-R1)采用链式推理实现慢思考;工作空间(如
Anthropic的商业案例值得研究。2025年底至2026年初,其企业/商业领域的使用量出现了惊人增长,使其成为第一。
LoanLens从六类借款人文档抽取结构化字段,进行欺诈检测与可解释评分,并附带案件RAG问答。采用Schema驱动抽取,可追溯字段来源;欺诈检测包括姓名TF-IDF比对和护照篡改检测;评分透明(信用23%、DTI 23%等),≥60批准,40-59复核,<40拒绝。
Agent-Reach(3.5K Star)通过CLI工具让AI Agent免费读取Twitter、Reddit、YouTube、GitHub、B站、小红书等多平台内容。核心是智能选择当下最稳定的开源后端,自动健康检查和故障切换,无需自写爬虫。安装后Agent可直接处理"看视频字幕"、"搜产品评价"等任务,全程零API费用、本地运行。项目将碎片能力封装为Agent可调用的skill,实现多后端路由和自动降级,补齐Agent低成本、可靠获取网页和社交媒体内容的能力。
Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型,采用智谱 GLM 5.2 和月之暗面 Kimi 2.7,token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4,Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限,Armstrong 表示"AI 支出越多,预期影响越大"。这些举措使 AI 总支出减半。同时,OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token,并推出两个廉价变体,加剧与 Anthropic 的价格战。
字节跳动向努比亚M153"豆包手机"用户赠送价值68元/月的标准版会员额度,有效期至2026年12月31日,支持全端通用。会员默认发放至设备登录的豆包账户,若设备登录多个豆包UID,则发给近期使用豆包手机助手最活跃的账户。权益一周左右生效,用户可在7月3日23:59前确认。该会员对应豆包专业版服务,基于豆包2.1系列大模型。
Grok 4.5 基于 1.5T V9 基础模型,补充训练加入 Cursor 数据,已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型,Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。
Grok 4.5 基于 1.5T V9 基础模型,补充训练引入了 Cursor 数据,现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力,Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。
AI智能体安全公司Manifold Security发现,OpenClaw的插件市场ClawHub上1508个技能中有557个采用"@owner/技能名"格式,其中23个直接冒用"@OpenClaw/"或"@ClawHub/"名称,实际发布者与官方无关。该命名空间抢注手法可能用于供应链投毒,但暂未发现恶意代码。ClawHub于6月17日更新命名空间规则,仅允许拥有@openclaw权限的发布者上传,6月19日已移除23个误导技能,并新增命名空间申诉机制。
Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造,并引入 Cursor 数据完成补充训练,已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。基于人类反馈的强化学习持续提升模型能力,Grok 配套调度框架每日迭代优化。马斯克还透露,SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。
BREAKING: Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。 • 早期评估显示性能接近,甚至可能超过 Opus • 基于 xAI 的 1.5T V9 基础模型 • 训练中加入了 Cursor 数据 • Grok Build 工具每天都在改进 • 今年每月将发布从头训练的新模型 SpaceXAI 的节奏简直疯狂。
据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现"看-想-动"。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
Grok 4.5,基于我们的1.5T V9基础模型,并在补充训练中加入Cursor数据,现已在SpaceX和Tesla进入私测。初步评估显示其性能接近,或许超越Opus。 强化学习仍在持续显著改进模型,Grok Build工具链也在日益完善。 所有参与者的出色工作! 今年,@SpaceX 将每月发布完全从头训练的新模型。
据晚点 Auto 消息,比亚迪计划于 2027 年在腾势品牌量产新车上首次搭载自研智驾芯片璇玑 A3。智驾芯片从流片到上车通常需要至少一年。此前 5 月 28 日,比亚迪已发布该芯片并启动规模化量产,支持 L3/L4 自动驾驶。董事长王传福表示,电动化上半场看电池,智能化下半场看芯片。三颗璇玑 A3 芯片总算力超 2100TOPS,结合自研算法深度优化,算力利用率提升 100%。
普林斯顿大学推出CEO-Bench基准测试,让AI智能体在模拟环境中运营订阅软件公司NovaMind 500天,起始资金100万美元。14个测试模型中,仅Claude Fable 5(最佳轮次盈利4715万美元)、Claude Opus 4.8(2780万美元)和GPT-5.5(2130万美元)在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法通过固定定价、配额和针对性开发达到1576万美元,超越除上述三款外的所有模型。多数模型无法保持连贯策略,在模拟结束前破产。该测试旨在衡量AI的长期战略决策能力。
OpenAI 正在为 Codex 测试一种新的努力选择器 UI,采用滑条形式。 此外,实时语音支持似乎将被彻底重写,因为之前可用的组件已被移除。
为用户提供不依赖微调或开发的Hermes代理优化方案:通过Memory.md文件构建"会话学习-记录沉淀-迭代优化"闭环。核心流程:1)桌面新建Memory.md,固定偏好、更正、模式、学到的经验四层框架;2)绑定提示词,每次会话前读取并完整应用,任务结束后记录有效做法与失败根因,新结论覆盖旧内容;3)每周精炼压缩零散经验为通用规则;4)定期日期命名归档备份。无需模型微调或部署,几分钟启动,使代理越用越贴合个人工作习惯,从单次随机输出收敛为专属智能体。
中国网络安全公司360安全科技发布两款AI工具:"屠龙锋"用于自动化漏洞挖掘,"倚天镇"用于自动化网络防御。创始人周鸿祎称"屠龙锋"已发现3432个漏洞。他认为中国顶级AI模型仍落后西方20%-30%,因此采用基于智能体的方法将模型与安全专业知识及自动化工具结合。周鸿祎将Mythos类模型比作"AI时代的网络核武器",呼吁中国建立对等战略威慑能力,避免美国垄断。清华大学教授唐杰(Z.ai创始人,近期发布GLM-5.2)预测中国"类Mythos"模型将在2027年第一季度前出现。
有传言称zAI新模型在网络安全方面至少与Fable5相当。博主@Kim查找发现只有《华尔街日报》一篇相关文章,但提及的是智谱AI的GLM-5.2,并非新模型。WSJ称GLM-5.2在某些找bug场景可匹配美国顶尖模型;360安全称其Tulongfeng工具可比肩Anthropic的Mythos。@Polymarket也曾引用消息称智谱AI新模型在查找安全漏洞上达到Claude Mythos水平。目前这些说法均未获官方确认,存在信息混淆可能。
如果有一天程序员写代码的速度提升了10倍 那程序员应该选择: 1. 写100倍的代码 2.用省下来的时间90%做稀缺的重要的事 你的选择是1还是2? 你的老板对你的要求是1还是2?
6月28日,法拉第未来在芝加哥Automate展会上推出"全美首款工业级轮臂机器人"Faber系列(U/T/S三款),应用于工业上下料与物流转运等场景。同时发布全新Futurist人形机器人标准版:身高173cm、重55kg(减重14%)、全身31自由度、膝关节峰值扭矩320N·m、1152Wh双电池续航6小时(上代3倍),支持7×24小时商用部署,定价89900美元(约61.2万元)。Ultra版年内发布,搭载Jetson Thor芯片,支持自主充电,面向高强度场景。
Kim认为美国政府基于自身安全评估(担忧模型被中国通过蒸馏获取)而非CEO言论决定禁运Fable 5和GPT-5.6。她批评Anthropic沟通失误(拒配合国防部、电话不畅通),并赞同模型被禁源于其真实破坏性能力,Anthropic应主动报告风险而非让Amazon先行披露。
instructor 1.15.4 发布 主要是维护性扫除: - 修复了 v2 列表/标量响应模型 - 保留了流式 JSON 字符串中的反引号 - Image.autodetect 现在处理原始字节 - 刷新了过时的文档模型字符串,包括 Ollama llama3.2 小补丁,更少奇怪边缘
新浪发布仅3B参数的VibeThinker-3B,在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型,LiveCodeBench超越所有20B以下模型,LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B,经SFT、强化学习、自蒸馏等多阶段后训练。研究提出"参数压缩-覆盖假说":逻辑推理依赖少数可压缩模式,而广泛世界知识仍需大参数。模型已开源。
Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程,适合无需上下文延续的任务,如每日 9 点自动总结邮件、日历;Scheduled Messages 在同一现有线程反复运行,适合需要历史上下文的场景,如每 30 分钟检查 PR 状态并处理评论,直至合并。推文还给出创建可复用循环技能的提示词,让 Codex 自动判断使用哪种方式并引导用户填写关键参数。
美国官员将与中国的人工智能竞赛定位为国家安全对抗,称微小领先也能改变结果。众议院外交委员会主席Brian Mast在哈德逊研究所活动上称美国是"超级英雄"、中国是"超级反派"。参议员Jim Banks表示这场竞赛涉及经济、军事和道德层面,警告美国不能输给"最大对手"。财长Bessent直言,中国愿意讨论AI是因为美国目前仍领先,但华盛顿担忧这一优势正不断缩小。作者认为,"Fable 5禁令"必须在此背景下理解。
一项新研究(arXiv: 2606.21880)表明,AI正在将部分自由职业市场变成价格竞赛,高技能简历的优势被削弱。在ChatGPT出现后,AI暴露程度最高的职业中,人力资本信号(经验、声誉)的重要性下降了约7.8%,而价格的重要性上升了约1.1%。强背景工作者失去了部分需求优势,需求向更便宜的工人转移,表明AI使这些工作者显得更可互换。
本教程使用Hugging Face上的Fable 5 Traces数据集,在Google Colab中搭建轻量环境并手动下载JSONL文件。流程包括预览原始agent trace示例、规范化工具调用与文本输出、审计数据结构、检测密钥模式,以及可视化输出类型、工具、源根目录和文本长度等分布。还创建了安全的no-CoT聊天/SFT导出,构建关键词搜索辅助,并训练纯Python朴素贝叶斯基线,评估trace上下文能否预测助手的输出类型与工具使用。
智元今日宣布第15000台通用具身机器人精灵G2正式量产下线。该机器人搭载NVIDIA Jetson Thor芯片,配备19自由度灵巧手、3D触觉感知、高精度力控双臂及5自由度腰腿全向底盘,引入真机RL工具链。支持多人连续语音对话与知识库问答,采用双电池热插拔换电,配备360环视鱼眼和前后双激光雷达实现主动避障,并优化超视距遥操作。可覆盖工业作业、巡检巡逻、安检引导、讲解导览、家庭服务等场景。
本文介绍如何配置两节点 AMD Strix Halo 集群,通过 Intel E810 (RoCE v2) 网卡实现 RDMA 互联,用于分布式 vLLM 推理(Tensor Parallelism)。硬件采用两块 Framework Desktop 主板(AMD Ryzen AI MAX+ "Strix Halo",128GB 统一内存)及 E810-CQDA1 100GbE 网卡,直连无需交换机。软件栈基于 Fedora 43,使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5μs(TCP/IP 为 70-100μs)。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。
据X用户Rohan Paul爆料,OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构,激活参数量48B,动态激活范围33B-56B,原生支持1M token上下文窗口。已在OpenRouter秘密测试近两月,成为全球使用最多的AI智能体模型之一。OpenRouter数据显示其排名:Hermes Agent第1、Claude Code第2、OpenClaw第3;月处理token 10.1T,日token 559B,月增长率242%。
Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力,谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力,导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元,CEO 皮查伊表示算力供给瓶颈制约云业务增速,同时令云部门积压订单量环比近乎翻倍。
福特因激进采用AI质检系统导致成本损失数十亿美元,三年内返聘350多名资深工程师(内部称"gray beards"),负责质量审查并帮助改进AI。首席运营官Kumar Galhotra承认自动化系统未达预期,经验丰富的工程师能预先发现故障点。返聘后,福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。公司表示不会放弃AI,但未来将结合人类监督与经验使用该技术。
一项新研究指出,基于聊天日志的AI职业暴露评分可能将平台流行度误当作真实劳动力暴露。分析发现,此类平台指标往往高估计算机与办公室工作,低估食品、运输、生产和体力服务岗位。在将数据按真实就业分布重新加权后,估计的就业影响缩水42%至93%,部分结果几乎归零。研究提示当前测量可能更多反映平台采用情况而非实际工作流程改变。论文题为《谁在使用AI?平台选择与职业AI暴露的测量》。
Liquid AI 推出 LFM2.5-230M,230M 参数开源文本模型,基于 LFM2 架构,开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理,内存占用 293-375 MB。Galaxy S25 Ultra 上达 213 tok/s,Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71,领先 Qwen3.5-0.8B(59.94)和 Gemma 3 1B IT(63.49);CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens,预训练于 19 万亿 tokens。专为数据提取和工具调用设计,不适用于数学推理、代码生成或创意写作。
针对AI研究论文因同行评审周期长导致结果过时的问题,一篇医疗AI论文开源其评估框架(GitHub: health-ai-readiness-eval)。@yishan 用该框架在最新模型上复现测试:GPT-5.5 Pro 在放射影像解读中得分79/100,优于论文原始最佳模型(69/100),但未达到论文设定的"适合可靠医疗使用"标准(需抗扰动、识别信息不足、给出临床合理推理)。@yishan 未能完整复现定性评估,但基本测试表明最新模型虽有提升,尚不足以可靠用于临床。他呼吁所有AI论文开源实验框架,以便社区持续验证。
6月28日,比亚迪董事长王传福与地平线创始人余凯会面并体验智驾,暗示深度合作。余凯回应股价称"搞了一票特别大的",并预告HSD 2.0将推出。地平线4月国内乘用车域控芯片装机量跃居第二(8万套,占比13.6%),余凯称明年排名将变。尽管比亚迪已发布自研4nm智驾芯片"璇玑A3",地平线仍为天神之眼C主力供应商,其舱驾融合芯片可单辆车节省1500-4000元硬件成本,HSD V2.0有望在比亚迪车型首发落地。
文章引用《心灵捕手》中罗宾·威廉姆斯饰演的Sean对Will的经典独白,指出面对AI生成的垃圾内容、海量建议与网络噪音,最好的回应不是更多信息,而是真实的个人体验与情感联结。Sean用艺术、战争、爱情、失去等话题质问Will,强调二手知识无法替代亲身经历。作者认为这段台词完美概括了AI slop问题的本质--信息堆砌不等于真正理解。
主动型Agent Vida通过读取电脑屏幕、苹果原生应用及文件系统获取完整上下文,用户无需提供详细背景即可自动理解项目,优化提示语并生成可直接用于Claude Code或ChatGPT的生产级Prompt。还能在群聊中结合历史消息自动回复,扫描全盘查找重复文件,重新设计Obsidian架构以区分本地与iCloud存储,通过定时任务整理Downloads文件夹,以及通过浏览器自动化分析邮件并分类。与Computer Use不同,Vida通过双击Option键零帧起手启动。
Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。
Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无 agent 工作时,合盖后 Mac 正常睡眠。它通过各 agent 的钩子系统调用 CLI,往返延迟低于 50ms,支持引用计数断言、热切出(温度阈值强制释放)、空闲释放及进程嗅探。需要 macOS Tahoe 26.4,Xcode 26+ 构建,以签名公证的磁盘映像提供。
Anthropic CEO Dario Amodei 认为,开源在 AI 领域与传统开源不同,属于"红鲱鱼"(干扰因素)。他指出,当前 AI 模型通常只开放权重而非源代码,无法看到内部逻辑,因此传统开源带来的多方协作、累加式改进等优势不成立。他不在乎模型是否开源,只关心其在关键任务上的表现。此外,大模型必须托管在云端进行推理,并非免费,任何用户都需要支付推理成本。该观点出自 Alex Kantrowitz 的 YouTube 访谈。
OpenAI 发布 planttalk 构建指南,让植物拥有声音。 主推文评论:和植物对话不再奇怪,只需 codex 即可。
红魔游戏平板5 Pro公布软件功能:内置AI战术教练,支持赛前赛中提供选英雄、出装等指导;AI魔姬嘴替接入DeepSeek,实现自然回复交流。投屏助手支持1080P 185Hz/4K 144Hz无黑边低延迟投屏;新增剪辑应用和电子书模式(彩墨/黑白两种方案,可指定App开启)。该平板搭载第五代骁龙8至尊版(CPU主频4.6GHz),配备185Hz OLED电竞屏、新思S3930触控芯片(2000Hz瞬时报点率、300Hz多指原生触控采样率、10X超分辨率触控),升级红魔CUBE擎天游戏引擎3.0,支持2K 144Hz超分超帧并发及PC模拟器Steam直连。外观提供氘锋透明银翼/暗夜两款配色,RGB水冷灯效均匀度提升200%。
Sakana Fugu 发布技术报告,提出智能正从模型转移到其周围系统。Fugu 是一个编排器,由数据训练的管理器动态选择最合适的专家模型,而非简单规则(如投票或固定分工)。Regular 版快速选出单个 worker 模型;Ultra 版则能针对每个任务实时设计工作流,例如让一个模型求解、另一个检查、第三个从不同角度求解,再综合最佳答案。工作流非预设,而是根据任务实时构建。
深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。
整理社区讨论中的工具、案例和观点。
关注常州本地的一人公司、独立产品和 AI 创业实践。
追踪常州及国内 AI 产业政策、项目申报与政企机会。
内容来自公开资讯源与社区整理,原文链接会保留在每条资讯中。
访问 AI HOT