图片

橘鸦 AI 早报 2025-09-27

概览

  • 快手Kwaipilot发布KAT-Dev-32B与KAT-Coder #1

  • 蚂蚁inclusionAI开源Ring-linear系列模型 #2

  • 腾讯混元开源3D双模型 #3

  • Cloudflare推出AI Index与Code Mode #4

  • 阿里Qoder上线Quest远程模式 #5

  • OpenAI升级函数调用支持文件与图像输出 #6

  • Google发布Genkit Go 1.0 #7

  • Cherry Studio 1.6.0 发布 #8

  • Sparse VideoGen2开源并获NeurIPS 2025 Spotlight #9

  • EditVerse统一图像视频编辑生成 #10

  • Code Supernova升级百万上下文 #11

  • Grok Vision 上线客户端 #12

  • Calibre 8.11.1发布:新增Ask AI功能 #13


快手Kwaipilot发布KAT-Dev-32B与KAT-Coder #1

快手发布两款基于MoE架构的代码模型KAT-Dev-32BKAT-Coder,在SWE-Bench上表现出色,并已通过Hugging FaceStreamLake平台开放。

快手Kwaipilot发布KAT-Dev-32BKAT-Coder,模型基于MoE架构并采用多阶段Agentic RL训练,在SWE-Bench Verified分别取得62.4%73.4%的通过率。KAT-Dev-32B已上线Hugging FaceKAT-Coder可通过StreamLake平台提供API调用,配套技术报告即将发布。

KAT-Dev-32B权重与推理代码已在Hugging Face开源。开发者亦可通过StreamLake“Wanqing”控制台申请API Key与端点ID,配合Claude Code即刻体验KAT-Coder,官方技术报告与VSCode插件等将在近期陆续发布。

图片

图片

<span leaf="">https://kwaipilot.github.io/KAT-Coder/  
<span leaf="">https://huggingface.co/Kwaipilot/KAT-Dev  
<span leaf="">https://console.streamlake.com/console/wanqing/api-key  

蚂蚁inclusionAI开源Ring-linear系列模型 #2

蚂蚁集团inclusionAI团队开源两款基于混合线性注意力架构的大模型Ring-flash-linear-2.0Ring-mini-linear-2.0,主打“大参数、低激活”的高效推理和超长上下文支持。

蚂蚁集团inclusionAI团队同步开源两款基于混合线性注意力架构的大模型:1040亿总参数的Ring-flash-linear-2.0164亿总参数的Ring-mini-linear-2.0。两款模型均继承Ling 2.0系列的MoE设计,通过1/32专家激活比例与MTP层优化,实现“大参数、低激活”的高效推理,在长文本、数学、代码与科学任务上取得同级开源模型领先成绩,并分别支持128k512k超长上下文。

Ring-flash-linear-2.040B等效性能下仅激活61亿参数,额外续训1TtokenRing-mini-linear-2.08B等效性能激活16亿参数,续训600Btoken并借助YaRN将窗口外推至512k。官方测试显示,二者推理速度分别达到同规模MoE2倍32B稠密模型的10倍

图片

<span leaf="">https://huggingface.co/inclusionAI/Ring-flash-linear-2.0  
<span leaf="">https://huggingface.co/inclusionAI/Ring-mini-linear-2.0  

腾讯混元开源3D双模型 #3

腾讯混元开源两款3D生成模型Hunyuan3D-OmniHunyuan3D-Part,分别实现了多条件可控生成和部件级可拆装功能,代码与权重均已公开。

腾讯混元同时开源Hunyuan3D-OmniHunyuan3D-Part,前者首次实现四条件融合的可控3D资产生成,后者以原生3D分割与部件级生成让模型“可拆可装”,代码与权重全部公开,面向游戏、打印、XR等场景加速落地。

图片

<span leaf="">https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni  
<span leaf="">https://github.com/Tencent-Hunyuan/Hunyuan3D-Part  
<span leaf="">https://3d.hunyuan.tencent.com/studio  

Cloudflare推出AI Index与Code Mode #4

Cloudflare推出AI Index私有测试,为网站提供AI优化的搜索索引,并发布Code Mode,允许大语言模型通过TypeScript API直接调用其工具,旨在构建更高效的内容发现生态。

Cloudflare宣布启动AI Index私有测试,为每个接入域名自动生成AI优化搜索索引,并配套发布Code Mode,将MCP工具转为TypeScript API供LLM直接编写代码调用,构建更公平高效的内容发现生态。

Cloudflare发布AI Index私有测试版,为域名自动生成AI优化搜索索引,并开放MCP服务器、LLMs.txt、搜索API等标准工具。网站主可自主控制内容是否纳入索引、谁可访问,并通过Pay per crawlx402集成实现内容变现;AI开发者则可通过pub/sub订阅特定站点,实时获取结构化更新,替代传统全网抓取。Cloudflare还将汇总参与站点构建“Open Index”,支持批量检索与质量过滤,收益仍归原站点。

Cloudflare同步推出Code Mode,将MCP工具转译为TypeScript API,让LLM直接编写代码调用,而非使用传统tool calling。实测显示,模型可并行或循环调用数十个复杂工具,显著减少token与时间开销。

图片

<span leaf="">https://blog.cloudflare.com/an-ai-index-for-all-our-customers/  
<span leaf="">https://blog.cloudflare.com/code-mode/  

阿里Qoder上线Quest远程模式 #5

阿里Qoder发布 0.2.4 版本,新增Quest远程模式,可将GitHub仓库的重任务转存至云端沙盒异步执行,并增加了AI自动修复Mermaid图的功能。

Qoder发布 0.2.4版本,推出Quest远程模式,支持把GitHub仓库的繁重任务一键转存云端沙盒异步执行,本地零干扰;同时Repo Wiki新增AI自动修复破损Mermaid图功能,并同步修复多项错误与稳定性问题。

图片

<span leaf="">https://qoder.com/changelog  

OpenAI升级函数调用支持文件与图像输出 #6

OpenAI函数调用功能现已支持直接返回文件和图像作为输出,简化了模型处理图表、图片等非文本结果的流程。

OpenAI宣布函数调用功能已可返回文件与图像,开发者可直接把图表、图片等非文本结果喂回模型,无需再手动转JSON或文本。

更新后,函数generate_chartload_image等可把生成的图表、加载的图片作为tool call输出对象完整回传,模型据此继续推理或对话,流程更简洁。官方已同步更新接口文档,示例代码与参数说明已上线。

图片

<span leaf="">https://platform.openai.com/docs/guides/<span leaf="">function<span leaf="">-calling  

Google发布Genkit Go 1.0 #7

Google正式发布Genkit Go 1.0,这是一个用于构建全栈AI应用的开源框架,利用Go语言的优势,为多模型、多模态和智能体工作流提供统一接口。

Google 正式发布 Genkit Go 1.0Genkit 是一个用于构建全栈 AI 应用的开源框架,它为多个模型提供商提供统一接口,并为多模态内容、结构化输出、工具调用、检索增强生成(RAG)和智能体工作流提供了简化的 API。借助 Genkit Go,可以利用 Go 语言的速度、安全性和可靠性,构建和部署生产级 AI 应用。

图片

<span leaf="">https://developers.googleblog.com/en/announcing-genkit-go-10-and-enhanced-ai-assisted-development/?linkId=16710004  

Cherry Studio 1.6.0 发布 #8

Cherry Studio 1.6.0版本发布,通过重构底层框架和引入新AI SDK提升了性能,并新增了多个模型提供商、本地OCR、内置API服务器以及对富文本编辑器和知识库的多项功能优化。

Cherry Studio****1.6.0 版本更新,带来了多项核心升级和功能增强。

| 分类

|

更新内容

核心升级

引入全新 AI SDK 并重构底层框架,提升响应速度与交互流畅度。

| | 模型与服务 |

新增 Perplexity SDKAionly 提供商及 Anthropic OAuth 登录;集成 PaddleOCR 本地识别引擎;支持通义千问 qwen-longqwen-doc 原生文件上传;新增字节跳动IdeogramSiliconflowQwen-Image)等模型接口。

| | 开发者功能 |

开放内置 API 服务器,支持以 Cherry Studio 为后端构建应用。

| | 功能优化 |

富文本编辑器新增目录导航与字号调节;知识库支持文件与文件夹批量上传;聊天文本附件可一键预览;翻译结果自动复制;链接自动解析 OG 数据生成卡片。

| | 桌面端体验 |

可自定义窗口控制按钮样式;支持更换全局字体;新增“重命名话题”、“编辑上条消息”等快捷键。

|

<span leaf="">https://mp.weixin.qq.com/s/JWCnXpNmJzo88JGieVnsog  

Sparse VideoGen2开源并获NeurIPS 2025 Spotlight #9

Sparse VideoGen2项目开源,其提出的训练无关稀疏注意力机制能将主流视频扩散模型推理速度提升约2倍,相关论文被NeurIPS 2025接收为Spotlight

Sparse VideoGen2开源,以训练无关的稀疏注意力机制将主流视频扩散模型推理速度提升约2倍,被NeurIPS 2025接收为Spotlight论文。

Sparse VideoGen2针对令牌识别不准与冗余计算问题,提出语义感知稀疏注意力高效令牌置换算法,集成动态注意力内核Triton编写的Flash k-Means内核,支持HunyuanVideoWan 2.1Cosmos模型。在保持无闪烁、无失真画质的前提下,HunyuanVideo最高提速2.5倍Wan 2.1提速1.9倍;项目同期开源Flash k-Means,较传统实现再提速10倍以上。

<span leaf="">https://svg-project.github.io/v2/  

EditVerse统一图像视频编辑生成 #10

一篇arXiv论文提出EditVerse框架,使用统一的token序列同时处理图像和视频的生成与编辑,并发布了包含232K样本的数据集和首个指令式视频编辑基准EditVerseBench

arXiv论文2509.20360提出EditVerse,用统一token序列同时完成图像与视频的生成与编辑,并发布含232K视频编辑样本的数据集与首个指令式视频编辑基准EditVerseBench,实验显示其开源模型在编辑保真度上超越商业工具Runway Aleph

图片

<span leaf="">https://arxiv.org/abs/2509.20360  
<span leaf="">http://editverse.s3-website-us-east-1.amazonaws.com/  

Code Supernova升级百万上下文 #11

Code Supernova模型将其上下文窗口从200ktoken大幅扩展至100万token,新版本已在Kilo CodeRoo Code等平台上线并免费开放测试。

Code Supernova模型已将上下文窗口从200ktoken一次性扩展至100万token,已同步上线Kilo CodeRoo Code等,目前免费开放,开发者正将其与主流大模型对比测试。

图片

<span leaf="">https://kilo.love/Code-Supernova  

Grok Vision 上线客户端 #12

Grok的视觉理解功能Grok Vision现已登陆iOSAndroid客户端,用户可通过手机摄像头实时识别物体并进行提问。

Grok 的 Grok Vision 视觉理解功能,已同步上线iOSAndroid客户端。用户打开相机对准任意物体,取景同时即可提问。系统可识别场景、读取文字、估算物体尺寸与材质,并直接给出购买链接或相关百科摘要。

图片

<span leaf="">https://x.com/elonmusk/status/1971472472718655974  

Calibre 8.11.1发布:新增Ask AI功能 #13

开源电子书管理软件Calibre发布8.11.1版本,新增“Ask AI”功能,允许用户选中文字后直接向AI提问,支持通过云端服务或本地Ollama接入多种模型。

开源电子书管理软件Calibre发布8.11.1版本,在字典查找区新增“Ask AI”选项卡,用户选中文字后可即时向AI提问。该功能通过GoogleOpenRouterGitHub等云端服务或本地Ollama接入,涵盖数百模型;除非手动配置,否则不加载任何AI代码,保持完全可选与隐私安全。

<span leaf="">https://calibre-ebook.com/whats-new  

提示:内容由AI辅助创作,可能存在幻觉错误

作者橘鸦Juya,视频版在同名哔哩哔哩。欢迎点赞、关注、分享

图片