Справжній поліглот. Просунута ШІ-модель OpenAI раптово переходить на мандаринську мову

IT-індустрія

15 січня 2025, 16:35

Модель штучного інтелекту зі здатністю до міркування o1 від OpenAI почала раптово змінювати мову спілкування з користувачем, обираючи то французьку, то мандаринську мови.

Незабаром після того, як OpenAI випустила o1, свою першу модель ШІ зі здатністю до міркування, користувачі почали помічати цікаве явище. Модель іноді починала «думати» китайською, перською або якоюсь іншою мовою, коли їй ставили запитання англійською.

Приміром, один користувач англійською попросив модель порахувати, скільки R в слові strawberry. Зазвичай модель відповідає англійською на запит цією мовою. Але цього разу o1 розпочала процес «роздумів» англійською, а потім продовжила міркування китайською.

OpenAI не надала пояснень дивній поведінці o1, і навіть не визнала наявність проблеми, пише TechCrunch. Деякі експерти припускають, що це могло статися через те, що моделі міркування, такі як o1, навчаються на наборах даних, які містять багато китайських ієрогліфів. Також OpenAI використовує сторонні служби маркування даних китайською мовою, і перехід o1 на китайську може бути прикладом «китайського лінгвістичного впливу на міркування.

«OpenAI і Anthropic використовують служби маркування даних для даних міркувань докторського рівня для науки, математики та кодування. Через доступність експертної робочої сили та вартість багато з цих постачальників даних знаходяться в Китаї», — зазначає Тед Сяо, дослідник з Google DeepMind.

Однак інші експерти зазначають, що o1 з такою ж ймовірністю перейде на хінді, тайську або іншу мову, крім китайської, під час пошуку рішення. Це може траплятися тому, що o1 та інші моделі міркувань можуть використовувати мови, які вони вважають найбільш ефективними для досягнення мети. Досвід користувачів підтверджує це. В соцмережах також скаржилися, що модель відповідає на запитання про пісні французькою мовою, а про синтетичну біологію — мандаринською.

Інші новини

Всі новини