Яндекс составил карту России, на которой отмечены характерные для каждого региона слова из «Толкового словаря живого великорусского языка» Владимира Даля. В Самарской области это «рассевалка», «водинка», «крымза», «балуша» и «подстёпок». Эти слова в Самарской области используются в поисковых запросах гораздо чаще, чем в среднем по стране.
Часть слов употребляются в поиске в значении, приведённом Далем, а часть являются омонимами: у Даля они значат одно, а в запросах — совсем другое.
Другие характерные для Самарской области слова из словаря Даля можно посмотреть на интерактивной карте.
Карта характерных слов — часть исследования «Русский язык в словаре Даля и поиске Яндекса». Аналитики Яндекса сравнили слова из словаря Даля со словами, которые встречались в поисковых запросах в течение последнего года. Это позволило проследить, как изменилась лексика русского языка за полтора века — первое издание словаря вышло в 1863–1866 гг.
В наше время продолжают использоваться 60% слов из словаря, то есть примерно 2,5 тома из 4. Около половины из них — живые слова: к ним постоянно прибегают при поиске. Вторая половина — «уходящие»; они либо появляются в запросах крайне редко, либо люди ищут их в основном для того, чтобы узнать значение: [хлудец это], [что такое прокоробить].
Оставшиеся 40% слов можно признать ушедшими. Они практически полностью вышли из употребления: пользователи в течение года ничего не искали с их помощью и даже не спрашивали, что они означают.
Некоторые слова из словаря встречаются в запросах, однако их современное значение не имеет ничего общего с приведённым у Даля. Это, например, слова «порно», «двач», «клубняк» и «прикол». У Даля «порно» — наречие со значением «крепко, надёжно, дюже, прочно, споро». «Двач» — «предмет, состоящий как бы из срослых двойней, близнят». «Клубняк» — «вообще всё клубоватое, образующее клубки». «Прикол» — существительное, обозначающее действие по глаголу «прикалывать».
Цифры и факты
В словаре Даля даны толкования около 200 тысяч слов — количество обычно оценивают примерно. Сам Даль называл такие слова красными. В словаре красные слова организованы в гнёзда, которых насчитывается чуть больше 40 тысяч.
За год Яндекс ответил примерно на 70 млрд запросов из России. В них встречается больше 285 млн разных «слов». Далеко не все из них настоящие: часть написаны с опечатками или в неправильной раскладке, а часть — непонятные последовательности букв.
Чтобы отсеять несуразицу, Яндекс сравнил слова из запросов со словами из Национального корпуса русского языка. В нём оказалось 840 тыс. слов, причём 130 тыс. из них не упоминаются в запросах — это некоторые топонимы и слова, выдуманные писателями.