全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 408|回复: 0
打印 上一主题 下一主题

GPT 5.5发布,在AI agent工具调用协调方面 遥遥领先!

[复制链接]
跳转到指定楼层
1#
发表于 昨天 14:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
        Rank        Agent        Model        Date        Agent Org        Model Org       
Accuracy

       
1
Codex        GPT-5.5        2026-04-23        OpenAI        OpenAI       
82.0%± 2.2

       
2
ForgeCode        GPT-5.4        2026-03-12        ForgeCode        OpenAI       
81.8%± 2.0

       
3
TongAgents        Gemini 3.1 Pro        2026-03-13        BIGAI        Google       
80.2%± 2.6

       
4
ForgeCode        Claude Opus 4.6        2026-03-12        ForgeCode        Anthropic       
79.8%± 1.6

       
5
SageAgent        GPT-5.3-Codex        2026-03-13        OpenSage        OpenAI       
78.4%± 2.2

       
6
ForgeCode        Gemini 3.1 Pro        2026-03-02        ForgeCode        Google       
78.4%± 1.8

       
7
Droid        GPT-5.3-Codex        2026-02-24        Factory        OpenAI       
77.3%± 2.2

       
8
Capy        Claude Opus 4.6        2026-03-12        Capy        Anthropic       
75.3%± 2.4

       
9
Simple Codex        GPT-5.3-Codex        2026-02-06        OpenAI        OpenAI       
75.1%± 2.4

       
10
Terminus-KIRA        Gemini 3.1 Pro        2026-02-23        KRAFTON AI        Google       
74.8%± 2.6



======================================================

国产开源模型 kimi最高, 排名62  
62
Terminus 2        Kimi K2.5        2026-02-04        AfterQuery        Kimi       
43.2%± 2.9
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-4-25 21:24 , Processed in 0.055457 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表