Anthropic、クロード・ファブルの目に見えないガードレールについて謝罪
⚡ クイックサマリー
Anthropic は、新しい AI モデルである Claude Fable 5 を、競合システムの開発に使用している研究者とライバルの両方を弱体化させる隠れたガードレールでこっそりとスロットリングしていたことを謝罪した。同社は、方針を転換し、たとえそれがFableがさらに多くの問い合わせを拒否することを意味するとしても、制限がいつ始まるかについてより透明性を高めると述べた。 Fable は、Anthropic の Mythos クラスの AI システムで広く利用可能な最初のモデルであり、同社はこのグループについて、危険すぎて一般公開できないと数か月かけて警告してきた。 Anthropic は、特定の「高リスク」への対応を防ぐ安全策を備えた Fable を起動することで、これらのリスクの一部に対処したと述べています。 The Verge で全文をお読みください。