Стендаперы в безопасности. Искусственный интеллект до сих пор не умеет писать хорошие шутки — исследование
Исследователи Google DeepMind изучили опыт профессиональных комиков, которые используют искусственный интеллект в своей работе. Эксперимент подтвердил неспособность искусственного интеллекта создавать высококачественный комедийный материал.
Популярные модели искусственного интеллекта от OpenAI и Google были эффективными в простых задачах, таких как структурирование комедийного монолога или создание грубого черновика к нему, но им было трудно создать материал, который был бы оригинальным и смешным, показало недавнее исследование, проведенное командой DeepMind.
Исследователи попросили 20 неназванных профессиональных комиков, которые уже использовали искусственный интеллект в своем рабочем процессе, создать материал, который им было бы удобно представить в комедийном контексте, пользуясь помощью ChatGPT или Gemini (бывший Bard). Чат-боты с ИИ должны были либо писать новые шутки, либо помогать авторам переделать уже имеющийся материал.
Результаты были неоднозначными, пишет MIT Technology Review. Хотя юмористы сообщили, что им очень понравилось использовать модели искусственного интеллекта для написания шуток, они также сказали, что не особо гордятся полученным материалом.
Несколько комиков отметили, что искусственный интеллект может быть полезным для того, чтобы начать что-то писать. Однако качество комедийного материала от ИИ оставляет желать лучшего. Комики назвали шутки моделей мягкими и скучными. Один участник сравнил их с «комедийным материалом круизного лайнера 1950-х годов, но чуть менее расистским».
Неспособность искусственного интеллекта создавать высококачественный комедийный материал не совсем удивительна. Те же фильтры безопасности, которые используют OpenAI и Google, чтобы предотвратить насильственные или расистские реакции моделей, также мешают создавать такие материалы, которые часто встречаются в комедии, как оскорбительные или непристойные шутки и черный юмор.
Эксперимент также показал предвзятость больших языковых моделей. Несколько участников обнаружили, что модель не будет генерировать комедийные монологи с точки зрения азиатской женщины, но она могла это сделать с точки зрения белого мужчины.