Тепер це з нами назавжди. Фейковий біологічний термін раптово став популярним, бо його «завчив» ШІ

21 квітня 2025, 02:21

Кількість згадок фейкового терміну «вегетативна електронна мікроскопія» у наукових публікаціях раптово зросла. Дослідження продемонструвало, що це пов’язано з ШІ.

Штучний інтелект, переглядаючи величезне сховище журнальних статей в інтернеті, «завчив» позбавлений сенсу термін «vegetative electron microscopy» (вегетативна електронна мікроскопія). Команда дослідників з Retraction Watch зацікавилася його походженням і знайшла джерело проблеми.

Реклама

Було встановлено, що термін, можливо, було взято з паралельних колонок тексту у випуску журналу Bacteriological Reviews, який вийшов у 1959 році. Вони стосувалися двох різних статей, які пізніше були заскановані та зацифровані та містили слова «vegetative» в одному стовпці та «electron» в іншому. Розташування колонок у тих статтях сплутало програмне забезпечення для зацифрування, тож ці слова з різних текстів злилися в позбавлену сенсу фразу «vegetative electron», що далі перетворилася на «vegetative electron microscopy». Останнє дослідники помітили у наукових роботах з Ірану. Вони висловили припущення, що термін виник внаслідок помилки перекладу, оскільки слова «вегетативний» і «сканування» відрізняються лише крапкою в перській мові.

У будь-якому разі, термін «вегетативна електронна мікроскопія», якого не існує, потрапив до навчальних даних для штучного інтелекту, і почав частіше зустрічатися в наукових публікаціях. Загалом «vegetative electron microscopy», за даними Google Scholar, можна зустріти 22 статтях.

Наразі дослідники припускають, що термін міститься у наборі даних CommonCrawl, що складається з петабайтів даних. Старіші моделі, такі як GPT-2 та BERT від OpenAI, не знають його, але «вегетативна електронна мікроскопія» відома пізнішим моделям, як GPT-4o і Claude 3.5 від Anthropic.

«Це свідчить про те, що безглуздий термін тепер може бути назавжди вбудований в бази знань ШІ», — кажуть дослідники.

Показати ще новини