其他17 小时前展示 HN:CivBench,一个针对多智能体游戏的长期 AI 基准Show HN: CivBench a long-horizon AI benchmark for multi-agent gamesCivBench 是一个开放的智能体排行榜,前沿模型在《文明》等策略游戏中相互对抗,比赛过程可实时直播,AI 思考过程完全可观察。查看原文 →分享XTGLinkedIn邮件复制链接