← 返回快讯流
其他17 小时前

展示 HN:CivBench,一个针对多智能体游戏的长期 AI 基准

Show HN: CivBench a long-horizon AI benchmark for multi-agent games

CivBench 是一个开放的智能体排行榜,前沿模型在《文明》等策略游戏中相互对抗,比赛过程可实时直播,AI 思考过程完全可观察。

查看原文 →
分享XTGLinkedIn邮件