Масштабне оновлення. Anthropic представила Claude Sonnet 4.5

1 жовтня 2025, 07:00
Логотип Anthropic (Фото: mobilinchen/Depositphotos)

Логотип Anthropic (Фото: mobilinchen/Depositphotos)

Випробувати нову ШІ-модель уже можна в чатботі Claude. Sonnet 4.5 також доступна для розробників через API: ціна — $3 за вхідні та $15 за вихідні мільйони токенів.

Як зазначає Anthropic в офіційному релізі, її нова модель є найсучаснішою в бенчмарку SWE-bench Verified, що вимірює реальні навички програмування. Також Sonnet 4.5 лідирує в тесті OSWorld, який перевіряє здатність ШІ виконувати завдання на комп’ютері, показуючи результат 61,4% (попередня версія мала 42,2%).

Реклама

Anthropic
Фото: Anthropic

Разом із новою моделлю Anthropic випустила низку оновлень для своїх продуктів. Так, у Claude Code з’явилися «контрольні точки» (checkpoints), що дозволяють зберігати прогрес і миттєво повертатися до попереднього стану, було оновлено інтерфейс термінала та випущено нативне розширення для VS Code.

В Claude API додали функцію редагування контексту та інструмент пам’яті, що дозволяє ШІ-агентам працювати довше і справлятися зі складнішими завданнями.

У застосунки Claude інтегрували виконання коду та створення файлів (таблиць, слайдів, документів), а розширення Claude для Chrome стало доступним для користувачів тарифу Max, які раніше записувалися у список очікування.

На додачу компанія відкрила доступ до Claude Agent SDK — набору інструментів, який Anthropic використовує для розробки Claude Code. Тепер розробники можуть використовувати цю інфраструктуру для створення власних ШІ-агентів.

Anthropic також наголошує, що Sonnet 4.5 — їхня «найбільш узгоджена» модель на сьогодні. Завдяки розширеному навчанню з безпеки вдалося суттєво знизити проблемні поведінкові патерни, такі як підлабузництво, обман, прагнення до влади та схильність заохочувати маячне мислення.

Для підписників плану Max на п’ять днів відкрили дослідницький режим «Imagine with Claude». У цьому експерименті модель генерує програмне забезпечення на льоту в режимі реального часу, реагуючи на запити користувача.

Показати ще новини