AgentBench: Evaluating LLMs as Agents
论文:Liu, Xu et al., 清华 + 上交 + UC Berkeley + Microsoft + Stanford 等
原文链接:https://arxiv.org/abs/2308.03688
发表:2023.8 | 引用:1000+(Semantic Scholar)
开源:https://github.com/alibabaagents/agentbench
本文记录我的论文学习过程与核心理解
2026年5月6日...大约 11 分钟