← 返回快讯流
其他7 小时前

展示 HN: Edictum – LLM代理工具调用的运行时治理

Show HN: Edictum – Runtime governance for LLM agent tool calls

Edictum 是一个运行时治理库,它测试了 6 种前沿模型在 17,420 次工具调用互动中的表现,发现模型在文本中会拒绝有害请求,但在工具调用时却会执行这些请求。

查看原文 →
分享XTGLinkedIn邮件