# あずさ監査法人とSakana AIが共同研究契約を締結、AIエージェント評価のベンチマークを発表

> 有限責任 あずさ監査法人は、Sakana AI 株式会社と監査に関する共同研究契約を締結した。研究の第一弾として、AIエージェントの長期的な意思決定能力を評価するベンチマーク「CoffeeBench」を発表。AIが企業活動の一部を担う将来に向け、リスク管理や監査手法のあり方を検証していく。

**企業:** 有限責任あずさ監査法人 | **日付:** 2026-06-27 | **カテゴリ:** 事業提携・協業

## Key Facts

| 項目 | 値 |
|------|------|
| 共同研究パートナー | Sakana AI 株式会社 |
| 研究成果 | CoffeeBench: Benchmarking Long-Horizon LLM Agents in Heterogeneous Multi-Agent Economies |
| 発表予定 | ICML 2026 ワークショップ「Failure Modes in Agentic AI」 |
| 研究目的 | AIエージェントが長期的な事業遂行の中でどのような意思決定を行い、どのような挙動を示すのかの検証 |

---

*配信元: [prtimes.jp](https://prtimes.jp/main/html/rd/p/000000035.000140551.html)*
*本記事は有限責任あずさ監査法人が配信した公式発表に含まれる事実情報を、WorkPickが報道目的で構造化したものです。*
*Published on WorkPick Press: 2026-06-27*
