Математическое совершенство. Польские ученые обнаружили удивительные сходства в разных языках

21 апреля, 15:32
Тексты на немецком, английском, польском, русском, французском, испанском и итальянском имеют кое-что общее (Фото:Kiwar/Depositphotos)

Тексты на немецком, английском, польском, русском, французском, испанском и итальянском имеют кое-что общее (Фото:Kiwar/Depositphotos)

Исследователи из Польской академии наук выяснили, что знаки препинания в текстах на английском, немецком, французском, итальянском, испанском, польском и русском языках располагаются в соответствии с распределением Вейбулла.

Выбор языков был неслучайным. Ученые подбирали те из них, на которых говорит не менее 50 млн человек, а написанные на них литературные произведения должны получить не менее пяти Нобелевских премий.

Видео дня

Определившись с языками, ученые приступили к отбору литературы. Главным критерием стало то, что книга должна содержать не менее 1500 последовательностей слов, разделенных знаками препинания.

В результате были отобраны произведения Конрада, Диккенса, Дойля, Хемингуэя, Киплинга, Оруэлла, Сэлинджера, Вульф, Грасса, Кафки, Манна, Ницше, Гёте, Лафайета, Дюма, Гюго, Пруста, Верна, Эко, Сервантеса, Сенкевича.

Проанализировав их тексты, ученые обнаружили четко прослеживаемую последовательность в расположении знаков препинания. Они создали ее модель и выяснили, что она описывается кривой Вейбулла.

Распределение Вейбулла в теории вероятностей — двухпараметрическое семейство абсолютно непрерывных распределений. Эта функция применяется во множестве отраслей науки: статистике, инженерии, электротехнике, метеорологии, гидралогии и других.

Исследователи были удивлены своим открытием, поскольку не ожидали, что соответствие известной математической функции будет таким точным для разных языков. Они продолжили свое исследование, чтобы выяснить, насколько сильное влияние на смысл написанного оказывает пунктуация.

Оказалось, что наименее зависимым от знаков препинания был английский язык. Лингвистов это не слишком удивит. Как и то, что следом за ним идет испанский, для которого обилие точек и тире тоже нехарактерно.

Наиболее зависимыми от знаков препинания оказались славянские языки: русский и польский.

Показать ещё новости
Радіо NV
X