LLMSnare Arena

ライブ benchmark のタイムラインと最近の変更を一つのページで確認できます。

[ BENCHMARK // LIVE ARENA ]

ライブ Benchmark

主要モデルの継続的な Benchmark 結果を見られます。

絞り込み軸

Normalized Scores

[ UPDATES // RECENT CHANGES ]

更新ログ

benchmark の読み方に関わる最近の変更だけを載せています。

2026-04-19 23:00 UTC

更新頻度を 3 時間ごとに変更し、Claude Sonnet 4.5Claude Opus 4.5 を削除しました。

2026-04-17 02:00 UTC

Claude Opus 4.7 を追加し、OpenAI GPT 4.1Claude Haiku 4.5 を削除し、新しい search_text ツールを加え、難易度も引き上げました。

2026-04-12

Google の Gemma 4 31B と Xiaomi の Mimo v2 Pro の 2 モデルを追加しました。

2026-04-11

満点を取るモデルが増えたため、難易度を引き上げました。

2026-04-10

LLMSnare のライブ benchmark を開始しました。