Искусственный интеллект научили определять пол человека по написанному тексту

24 апреля 2018, 14:46

Коллектив российских ученых разработал метод, который обучает компьютер распознавать пол человека по написанному им тексту с точностью до 80 процентов.

Научная разработка ядерного университета МИФИ, Национального исследовательского центра "Курчатовский Институт" и Воронежского государственного университета относится к области компьютерной лингвистики, говорится в статье РИА Новости.

Видео дня

Научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора – пол, психологические особенности, уровень образования. На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний (деменции, депрессии) и склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.

Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.

В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения, с другой стороны – нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).

"Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия", – говорит доцент НИЯУ МИФИ Александр Сбоев.

Отмечается, что в текстах, которые были размещены на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.

Результаты этого исследования показали, что подход, основанный на использовании сверхточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным. Сейчас группа исследователей работает над задачей распознавания возраста.

Показать ещё новости
Радіо NV
X