2月27日 周五
2026-02-271 条Perplexity Computer
Perplexity AI 推出 AI 代理系统,能像人一样操作软件,协调 19 个 AI 模型执行多步骤工作流,可运行数小时至数月。仅限 Max 用户,标志着从“回答问题”到“执行任务”的转变。
2月26日 周四
2026-02-263 条Nano Banana 2
Google 最新 AI 图像生成模型,支持 512px 至 4K 分辨率、精确文本渲染、最多 5 角色一致性,已在 Gemini 全线产品铺开。
Gemini Android 任务自动化
Google Gemini 在 Android 上推出多步骤任务自动化(Beta),可将待办事项委托给 Gemini 处理,在设备安全虚拟窗口中运行。首批支持 Pixel 10 和 Galaxy S26。
Android AppFunctions
Google 推出设备端 AI 代理框架,让 Android 应用直接向 AI 代理暴露数据和功能,类似设备端 MCP。已在 Galaxy S26 和 Pixel 10 上推出早期预览。
2月25日 周三
2026-02-256 条Logic Apps MCP Server Wizard
Microsoft 推出配置向导(Preview),几次点击即可将现有 Logic App 转换为 MCP 服务器,支持身份验证、API 密钥生成和工作流转 MCP 工具。
Anthropic 收购 Vercept
Anthropic 收购 Vercept 推进 Claude 计算机使用能力,Sonnet 4.6 在 OSWorld 计算机使用得分从 15% 提升至 72.5%,接近人类水平。
Mistral Voxtral Mini Transcribe 2 & Realtime
Mistral AI 推出设备端语音转录模型,专为速度和隐私设计,对话不传输到云端,标志着设备端 AI 的重要进展。
Qwen 3.5 中型模型系列
阿里推出 4 款中型模型:Flash、35B-A3B、122B-A10B、27B。35B-A3B 已超越 Qwen3-235B,Flash 支持 100 万 tokens 上下文。更强智能、更低算力,在复杂智能体任务中表现突出。
Amazon Ads MCP Server
Amazon Ads 推出 MCP Server 开放测试版,AI 代理可通过自然语言执行广告工作流,支持与 Claude、ChatGPT、Gemini 等平台集成。
New Relic Agentic Platform
企业级 AI 代理平台,无代码构建器让运维团队无需编程即可构建 AI 代理,原生支持 MCP 和工作流自动化。
2月24日 周二
2026-02-241 条Claude Cowork 企业集成
Anthropic 发布 Cowork 平台重大更新,新增 Google Workspace、Docusign、WordPress 等连接器,可跨 Excel 和 PPT 传递上下文执行多步骤任务。
2月20日 周五
2026-02-203 条Windsurf Wave 13 Arena Mode
首个部署到数百万用户的产品内 AI 编码竞技场,开发者可在真实编码任务中并排比较 LLM 性能。
Claude Code Security
Anthropic 代码安全产品,内置于 Claude Code,用 Opus 4.6 扫描代码库漏洞并建议修补方案,已在开源项目中发现 500+ 漏洞。
Cloudflare Code Mode (MCP)
通过 MCP 让 AI 代理在 1000 tokens 内访问整个 API,大幅减少 token 消耗,解决 MCP 核心效率问题。
2月19日 周四
2026-02-194 条Microsoft Agent Framework RC
Semantic Kernel 和 AutoGen 的继任者达到 RC 状态,提供统一编程模型构建、编排和部署 AI 代理,支持 A2A、AG-UI、MCP 标准。
Gemini 3.1 Pro
Google 核心推理能力升级,ARC-AGI-2 达 77.1%(Gemini 3 Pro 的两倍多),支持代码动画生成和复杂系统合成。
Google Cloud Managed MCP Servers
为 AlloyDB、Spanner、Cloud SQL、Firestore、Bigtable 提供托管 MCP 服务器,使 AI 代理能安全访问数据库和 Google 文档。
2月18日 周三
2026-02-183 条2月17日 周二
2026-02-173 条Cursor 2.5
推出官方插件市场 Marketplace,支持 MCP 服务器、技能、子代理一键安装,异步子代理可并行执行。首批合作伙伴包括 AWS、Stripe、Figma、Linear。
Grok 4.20 Heavy Beta
xAI 公测版,4 代理协作系统(Grok、Harper、Benjamin、Lucas),约 3 万亿参数。AIME 100%,GPQA 87.5%,256K 上下文(API 支持 2M),多代理协作降低幻觉率 65%。
Claude Sonnet 4.6
Anthropic 最强 Sonnet 模型,OSWorld-Verified 达 72.5%,部分场景超越 Opus 4.5。训练数据截止 2026年1月。
2月16日 周一
2026-02-163 条2月14日 周六
2026-02-141 条2月13日 周五
2026-02-135 条Gemini 3 Deep Think
Google DeepMind 科学研究专用模型,ARC-AGI-2 达 84.6%,IMO 金牌水平。
2月12日 周四
2026-02-123 条2月11日 周三
2026-02-111 条2月6日 周五
2026-02-061 条Claude Opus 4.6
Anthropic 旗舰模型,根据任务难度自动调整测试时计算,支持 100 万 token 上下文,与 OpenAI 同日发布。