Ссылки для упрощенного доступа

logo-print

Яндекс на страже нового русского языка


Специально для сайта

Владимир Губайловский

Поисковая система Яндекса запустила новый сервис проверки орфографии Query-based speller. Фактически Яндекс претендует на собственное определение орфографической нормы в русскоязычном интернете.

В корпоративном блоге Яндекса о новом сервисе написал Алексей Пяллинг, разработчик поисковых сервисов. В чем новизна этого сервиса? Раньше, если в запросе содержалось слово, отсутствующее в словаре, или в интернете находилось мало страниц, содержащих это слово, Яндекс брал на себя смелость предлагать исправить это "плохое", по его мнению, слово на "хорошее" - близкое по написанию и словоупотреблению. В этом случае под строкой поиска появлялась фраза: "Опечатка? возможно, имелось в виду: [предлагаемое «хорошее» слово]".

Именно к такой форме орфографической проверки и привыкли пользователи. Но, с точки зрения Яндекса, этого сегодня уже недостаточно. Алексей Пяллинг пишет: ""Обычный" словарь – это, конечно, хорошо. Но в наше время, когда новые слова появляются чуть ли не каждый день, поддерживать актуальность словаря невозможно. Сами посудите, ежедневно регистрируются новые фирмы, появляются новые музыкальные группы, новые спортсмены выигрывают новые соревнования. Возникающие при этом новые слова часто бывают непроизносимыми, нечитаемыми и даже непечатными. Разбором и анализом таких ситуаций в Яндексе как раз и занимается новый алгоритм, автоматически строящий словарь исправлений. Запросы пользователей собираются и анализируются, обрабатывается статистика. Если оказывается, что по какому-то слову есть много вариантов исправлений, то из кластера выбирается похожее слово из наиболее распространенных в интернете. Таким образом, появляется база пар "плохих" и "хороших" слов – слов с ошибками и исправленных, и каждое слово в запросе пользователя теперь проверяется по такому "народному" словарю".

"Афтар" и "автор" с точки зрения Яндекса

Инициатива – наказуема. И Яндекс начал получать письма возмущенных пользователей, которые обвинили поисковик в безграмотности. На такое письмо ответил директор Яндекса по технологиям и разработке Илья Сегалович: "Нам задают вопросы про Query-based speller, который наряду со словарным орфографическим корректором работает на поиске Яндекса.

>Однако меня все равно не устраивает, когда в ответ на запрос "афтор"

>с одной опечаткой мне говорят, что возможно следует писать "афтар",

>а не "автор"

Отвечаем: [автор] и [афтар] — два разных слова, они принадлежат к двум разным пластам языка, имеют разную сочетаемость. По ассоциациям запросов видно, что такую опечатку делают т.н. "падонки", которые намеренно пишут это слово через "ф". Нормальный человек не поставит случайно вместо "в" букву "ф" — и по звучанию не похоже, и расположена она на клавиатуре не рядом. Иными словами замену [афтор] -> [афтар] мы считаем вполне адекватной. Более того, по-видимому, орфографической ошибкой является написание [автор жжот]. Правильно [афтар жжот]".

Если выполнить запрос "афтар" – Яндекс дает 463 153 упоминания. Это достаточно много, чтобы сказать, что слово адаптировано языком. Впрочем, запрос "афтор" дает тоже немало - 192 771 упоминаний. Причем контекст примерно тот же, что и у слова "афтар" – сочетание "афтор жжот", которое Илья Сегалович предлагает считать опечаткой, тоже широко распространено. Но с традиционным "автор" пока ни одно из этих написаний конкурировать не может – "автор" упоминается 148 335 011 раз и побеждает за явным преимуществом.

Язык "падонкоф(в)"

Появление в русском языке большого количества намеренных искажений и даже возникающий языковой пласт – "новый русский язык, нах" – стал темой статьи "У языка есть афтар" в журнале "Русский NewsWeek". Это явление исследовал известный филолог, профессор Боннского университета Гасан Гусейнов в статье "Берлога веблога. Введение в эрратическую семантику".

"Эрратический" (англ. erratic) - можно перевести, как "переменчивый, непостоянный". Эрратическая семантика, как ее определяется Гусейнов, это - семантика, возникающая при намеренном искажении слова. Областью исследования известного филолога стала "эрратическая семантика" в ее бытовании в "Живом Журнале (ЖЖ)". Но на сегодняшний день можно сказать, что "афтары" уже в изобилии разбрелись по всему русскоязычному Интернету.

Комментарий эксперта

Статью Гасана Гусейнова для радио "Свобода" прокомментировал доктор филологических наук, директор Института лингвистики РГГУ Максим Кронгауз.

Владимир Губайловский: Я приведу несколько цитат из работы Гусейнова, которые показались мне наиболее характерными. Гусейнов сравнивает литературу-факта, возникшую в России в 20-х годах, и современные блоги. Он пишет: "При всех очевидных различиях "литературы (раннего советского) факта" и постсоветского интернетного веблога есть фундаментальные структурные совпадения. Как и в литературе факта, блоггер занят описанием "биографии вещи". Но "вещь", или "факт", блоггера это не персонаж блога, а его высказывание, передача мгновенного словесного отчета лже-юзера (lj-user, то есть пользователь Livejournal – В.Г.), иногда сдобренное изображением его самого или – чаще – изображением фрагмента увиденной им действительности. В связи с этим главной проблемой активного блоггера оказывается перегретость находящейся в его распоряжении нормативной словесной сферы. Сопротивление материала исчезает, можно максимально приблизить слово к очагу высказывания – ко рту, к пальцам, ударяющим по клавиатуре. Перед тем как попасть в блог, слово произносится всего один раз и летит на экран еще расплавленным, горячим. Слово-факт блоггера – это то, что осталось от Леса, Железа и Льна человека "литературы факта"".

Какова, на Ваш взгляд, связь практики языковых искажений, возникшей в ЖЖ, с литературой-факта?

Максим Кронгауз: На мой взгляд, блог (как мы его наблюдаем, например, в ЖЖ) - это новый письменный жанр, публичный дневник с обратной связью. Строго говоря, его нельзя назвать даже литературным жанром (как, кстати, и обычный дневник). Поэтому мне кажется некорректным сравнивать жанр текста (не принадлежащий целиком литературе) и литературное направление (как если бы мы сравнили постмодернизм и пьесу или репортаж). Другое дело, что некоторые группы блогов достаточно однородны и претендуют на то, чтобы быть явлением литературы или, шире, искусства. Чтобы обсуждать и эти претензии, и само явление, надо все-таки четко понимать, какие блоги мы имеем в виду.

Владимир Губайловский: Насколько можно рассматривать интернет-дневники как творческую практику?

Максим Кронгауз: Безусловно, да. Это - творческая практика. Мне кажется, что открытие собственного блога, даже если это просто следование моде, а также его ведение является творческим актом, естественно, далеко не всегда успешным, но кто сказал, что все творческие акты должны быть успешными.

Владимир Губайловский: Гусейнов пишет "жаргонное слово или предложение, возникшее как эрратив, мало-помалу становится самостоятельной единицей, семантика которой должна обсуждаться отдельно от слова-источника". Можно ли рассматривать описанное явление, как рождение новой семантики?

Максим Кронгауз: Есть некоторые семантические законы, которые определяют жизнь слова и развитие его значения. В интернете вообще и в ЖЖ в частности можно найти массу интереснейших языковых примеров и явлений, но они только подтверждают известные законы семантики. Пока никаких новых семантических законов на основе материала ЖЖ открыто не было. В частности, образование в жаргоне нового значения у вполне обычного слова и "семантическое удаление" от него хорошо известны. Этому помогает и само искажение, как правило, орфографическое. Говорить о "новой семантике" можно только в одном смысле. Сегодня в русский язык приходит довольно много новых значений. Иногда новое значение образуется у существующего в языке слова, иногда оно появляется вместе с новым словом (например, заимствование). Это происходит и в интернете, и в ЖЖ, хотя, конечно, не исключительно там.

Владимир Губайловский: Может ли новая семантика закрепиться в общеупотребительной языковой практике и сформировать, например, новый жаргон?

Максим Кронгауз: У меня нет уверенности, что можно говорить об отдельном жаргоне (жаргон подразумевает существование постоянной группы его носителей и достаточно разработанный лексикон). Если это все же так (в чем я, еще раз подчеркну, сомневаюсь), то безусловный интерес представляет прежде всего его распространение, ведь раньше никогда не использовались такие совершенные технические средства. Однако и это не так уж ново, например, словечки и выражения Масяни распространялись почти мгновенно с помощью интернета, а потом и телевидения.

Лев Рубинштейн: Язык подобен океану.

Новый сервис Яндекса - проверка орфографии Query-based speller, чутко реагируя на перемены, возникающие в языке, в определенном смысле способствует нормализации и закреплению этих перемен. Норма возникает естественным образом – накоплением словоупотреблений. Выработанная Яндексом орфография ненавязчиво (как вариант запроса) напоминает, что нормой большинство носителей считает написание "афтар", а не "афтор". Но Яндекс тем самым работает как бы расщепляет традиционное слово "автор" по областям употребления и нормализует новое слово "афтар". Это многим не нравится, поскольку происходит искажение традиционной лексики. То, что Яндекс сумел настолько оперативно отреагировать на языковые перемены введением нового сервиса – "гибкого" определения правописания, говорит о том, что технические средства сегодня, как никогда, совершенны. Но всегда ли стоит их настолько оперативно приводить в действие?

Язык несравнимо более подвижен сегодня чем когда бы то ни было. И периодически возникают проекты защиты языка. Это характерно не только для российских парламентариев, но и, например, для английских филологов, которые обеспокоились тем, как влияют на письменную речь тотальные сокращения, используемые в SMS или интернет-пейджерах, очень популярных у молодого поколения.

Не исказим ли мы, не потеряем ли русский язык? Лев Рубинштейн отвечая на вопросы ПОЛИТ.РУ сказал: "…я этот наш с вами родной язык не просто люблю, а эротически люблю. И эту его способность все в себя впитывать и в результате все поэтизировать считаю его невероятным, волшебным качеством. Более того, в нашей вымороченной и вполне призрачной социальной жизни язык представляется мне едва ли не единственной реальностью. Я не верю в то, что его можно испортить и отравить, он вроде океана в смысле способности к самоочищению".

XS
SM
MD
LG