Дослідники з Фуданського університету, Гарварду і Stony Brook University вивчили, як влаштовані словники різних мов і як вони змінювалися з часом. Для цього вони використовували методи обробки природної мови - тобто алгоритми, які вміють представляти слова як точки в смисловому просторі. Деталі Якщо говорити простіше, близькі за змістом слова в такій моделі виявляються "поруч".

Наприклад, слова, пов'язані з їжею, технікою, владою або сім'єю, утворюють свої смислові області. Вчені перевіряли, як часто використовувані та нові слова розподіляються в цих областях. Виявилося, що у різних мов є загальні закономірності.

Фото до матеріалу: Учені знайшли спільні закономірності в розвитку 22 мов

Часто вживані слова тяжіють до інших часто вживаних слів, утворюючи свого роду "популярні зони" словника. Нові слова теж з'являються не рівномірно, а групами - поруч з іншими поняттями, що недавно виникли. Це схоже на те, як у суспільстві з'являються нові теми: якщо розвивається нова технологія, професія чи культурне явище, навколо нього швидко виникає цілий набір нових слів.

Учені також виявили, що мови мають схожу ієрархічну структуру: слова групуються не тільки за окремими темами, а й за більшими смисловими областями. Ці закономірності проявилися у всіх 22 мовах, які увійшли в аналіз. Чому це важливо Дослідження показує, що мова розвивається не просто як набір випадкових нових слів.

Її зростання пов'язане з тим, які теми стають важливими для суспільства. Коли змінюється культура, технології, політика чи побут, мова відповідає на це сплесками нових слів і значень. При цьому схожі процеси відбуваються в різних мовах, навіть якщо їхні носії живуть у різних країнах і культурах.

Це допомагає краще зрозуміти не тільки еволюцію мови, а й культурну історію: словник зберігає сліди того, що було важливим для людей у різні епохи. Бекграунд Раніше вчені вже знали, що в мовах діють статистичні закономірності - наприклад, найчастіші слова використовуються набагато частіше за більшість інших. Нова робота розширює цей підхід: вона показує не тільки частоту слів, а й те, як слова розподіляються за змістом і часом появи.

Автори також запропонували математичну модель, яка відтворює схожі закономірності. Це може допомогти вивчати не тільки мови, а й інші форми культурної еволюції - наприклад, розвиток наукових ідей, технологій або суспільних тем. Джерело Дослідження Xingzhi Guo та співавторів опубліковано в Proceedings of the Royal Society B 2026 року під назвою Statistical structure and the evolution of languages.

У роботі використовували дані з англійської та ще 21 мови, а також методи NLP і статистичного моделювання.