Ссылки для упрощенного доступа

logo-print

В русскоязычной Википедии уже 100 тысяч статей


Символ Википедии

Символ Википедии

Число статей в русскоязычном разделе интернет-энциклопедии Википедия превысило 100 тысяч. Юбилейной стала статья о советском режиссере-мультипликаторе по Леониде Алексеевиче Амальрике. В настоящий момент русскоязычный раздел международной интернет-энциклопедии занимает одиннадцатое место по числу словарных статей. Бесспорным лидером является англоязычный раздел – в нем более одного миллиона трехсот тысяч статей.


В январе этого года в русскоязычной версии было 55 тысяч статей, а всего за полгода это число почти удвоилось. Теперь открытая сетевая энциклопедия сравнялась с «Большой советской энциклопедией», и уступает только «Брокгаузу и Эфрону». Как сообщает пресс-релиз русскоязычной Википедии в настоящее время энциклопедия ежедневно пополняется более чем сотней новых статей, и каждый час в ее содержание вносится около сотни правок. Первые статьи на русском языке появились в Википедии в 2003 году. Согласно исследованию, проведенному журналом Nature, качество статей Википедии не уступает знаменитой «Британнике». Википедия создается коллективным трудом добровольных писателей. Авторов русскоязычной Википедии несколько тысяч.


При очень быстром росте Википедии в ней как в своего рода программной среде возникают внутренние программы – обработчики информации. Человек просто не в состоянии отследить и поправить миллионы технических деталей и подробностей. Один из тех авторов Википедии, которые пишут не словарные статьи, а программы, работающие со словарными статьями, – Юрий Астрахан. Ему 29 лет. Он выходец из Санкт-Петербурга. С 15-летнего возраста живет в Нью-Йорке. Сегодня он работает на фирме, разрабатывающей и сопровождающей информационные системы больших финансовых корпораций, фармацевтических компаний и правительственных организаций. Юрий Астрахан – профессиональный программист. Этим он зарабатывает на жизнь, а в свободное от работы время он вносит свой вклад в проект Википедия. Юрий Астрахан рассказал о своей работе в этом проекте.


Работой это трудно назвать, так как мне за нее никто не платит. Это – чистое хобби. По-моему, всего шесть человек сейчас работают на Википедию. Все остальные – волонтеры. Но мне нравится эта идея. Уже года полтора назад я заинтересовался, стал активно наблюдать за тем как создаются статьи, потом стал вносить правки. А потом понял, что больше всего пользы я могу принести тем, что я знаю, а именно программированием. Благодаря этому, я стал акцентировать свое внимание на программной части этого проекта.


Сейчас я являюсь одним из разработчиков самой программной оболочки, той основы, которая позволяет людям редактировать статьи. Недавно я написал систему, которая позволяет другим программам как бы через программный интерфейс подключаться к Википедии и брать оттуда данные, которые требуются. Благодаря этому, возникло довольно много приложений, которые используют эту систему для поиска и получения данных.


Википедия поддерживается более чем на ста языках, и поэтому возникает естественная проблема связи между словарными статьями об одном и том же но на разных языках. Я написал программу программу, которая эти связи отслеживает. Например, если у вас есть три статьи английская, французская, немецкая, скажем о Шекспире, а потом кто-то написал на статью, например, на русском, автор скорее всего, добавит ссылку в английскую статью. Но хорошо бы добавить ссылки еще и на французскую, и на немецкую, и на суахили – если там тоже есть статья «Шекспир». Все это приходится отслеживать и проделывать вручную, а это очень неудобно и трудоемко.


Поэтому я запускаю программы, которые выполняют такие автоматические простые правки, в частности, просто расставляют ссылки, «подчищают» мусор. Дело в том, что статья в Википедии имеет совершенно определенный стиль и формат, и часто статью необходимо «википедизировать», чтобы она стала корректной. Это как бы работа дворника. Но это очень ответственная работа. Я с помощью моих программ внес в Википедию около 3 миллионов изменений. И это те правки, которые не показываются в основных списках поправок, иначе они будут мешать людям работать со статьями. Конечно, это очень ответственно, и возможно только при очень высоком доверии к программисту.


Это – доверие сообщества, которое знает, кто это делает, и верит, что человек, зарегистрированный под таким именем, ничего плохого не желает. Ему можно больше доверить, чем случайному пользователю. Это не значит, что кого-то другого тут же сотрут. Это просто значит, что на них посмотрят более внимательно, чем на ту правку, которую сделает моя программа или я сам.


XS
SM
MD
LG