Ссылки для упрощенного доступа

logo-print

Программы - Седьмой Континент

  • Алексей Цветков

Сегодняшнюю передачу откроет материал Александра Костинского о "Национальной электронной библиотеке" - первый из серии, посвященной обширным хранилищам информации в сети.

Затем Олег Родин расскажет о сайте Григория Белонучкина "Политика".

Радио "Свобода", программа "Седьмой континент". Александр Костинский рассказывает о "Национальной электронной библиотеке".

Костинский

Цифровые технологии быстро меняют информационный рынок. Сократилось до считанных секунд время обмена практически любыми по форме и наполнению сообщениями.

На узлах Всемирной паутины разместилась самая разнообразная информация и стала принадлежать всем жителям сети.

Но есть еще одно несомненное достижение информационной революции - создание сверхбольших цифровых массивов и полнотекстовый поиск в них. Это приведет, по нашему мнению, в самом скором будущем к появлению новых методов изучения и управления массовым сознанием.

В ближайших передачах мы расскажем о трех таких массивах, самых объемных информационных ресурсах русского Интернета. Это Национальная электронная библиотека, Информационный проект Гарант-Парк и проект "Интегрум" компании Интегрум - Техно.

Каждый их них имеет свои достижения и особенности, свою любопытную историю. Начинаясь по разному, они обнаруживают в развитии много общих черт.

Начнем с проекта под названием "Национальная электронная библиотека". Точнее ее было бы назвать "Электронная библиотека русскоязычных средств массовой информации". Поскольку в цифровой банк данных заносятся газеты, журналы, аналитические отчеты, тексты телевизионных и радиопередач, но не входит художественная литература во всех ее разновидностях. Для краткости средства массовой информации мы будем называть дальше - СМИ.

Возник проект пять лет назад, когда издательский дом "Коммерсантъ" создал Национальную службу новостей. При ней и начал формироваться цифровой архив отечественной прессы. Два года назад служба новостей уснула летаргическим сном, оставив электронной библиотеке свое запоминающееся имя www.nns.ru . По первым буквам английских слов: National news service. Теперь библиотека - независимый от родителей ресурс с собственной коммерческой жизнью.

Сейчас "Национальная электронная библиотека" - самый большой цифровой архив русскоязычных СМИ. В нем более четырех миллионов документов. Каждый день он растет в среднем на семь тысяч текстов, которые поступают от 300 - 400 СМИ. Общее число источников более двух тысяч.

Необходимо уточнить, что самостоятельным документом электронной библиотеки является не газета или журнал, а отдельная статья. Такое деление разумно, если учесть тексты радио и теле передач, где часто при круглосуточном потоке информации просто нельзя выделить разумную более крупную единицу хранения.

Одна из главных особенностей библиотеки - она собирает все русскоязычные тексты. Что ценно, ее содержимое - не только центральная, но и региональная пресса. С уменьшением тиражей московских изданий уменьшилось и их влияние. Архивы же позволяют видеть страну последнего пятилетия целиком и в движении. Причем видеть не только изнутри, но и снаружи. Самым динамичным сегментом проекта "Национальная электронная библиотека" стала сейчас зарубежная русскоязычная пресса. И не только из стран - осколков Советского Союза. Ее пополняют и издания всех волн российской эмиграции.

Важным преимуществом команды, которая создает библиотеку, стала поточная линия газетного сканирования и распознавания. Это позволяет переводить в машиночитаемый цифровой вид не только современные издания, но газеты и журналы прошлых лет. Линия оснащена дорогими промышленными сканерами, которые обрабатывают газетную полосу целиком. Треть современных изданий, поступающих в библиотеку, приходится переводить в электронный вид. Но они представляют значительную часть российской жизни, и без них архив будет неполным. Обладание поточной линией оцифровки сулит и принципиальные преимущества. "Национальная электронная библиотека" может двигаться и назад во времени. Сейчас в планах прошить несколькими ключевыми изданиями весь советско-большевистский отрезок русской истории. Если получится - двигаться дальше вглубь.

Но большинство материалов образующих библиотеку приходят уже в цифровом виде, причем от поставщиков информации требуют идентичности бумажных и цифровых вариантов. Ведь практически все Интернет - версии известных изданий значительно отличаются от печатного оригинала.

Возникает естественный вопрос. Зачем собирать вместе весь этот разнородный и разноуровневый материал? Появляется ли в результате объединения хоть какое - нибудь качественно новое понимание?

Вспомним "Американу" Вайля и Гениса. Всего восемь лет назад они писали: "Новости всегда свежие, известия всегда последние. Мы живем исключительно в сегодняшнем дне. Значительно только то, что происходит сейчас. Сиюминутность диктует нам дискретную картину мира. Кому прейдет в голову читать старую газету? А завтрашней не существует вовсе. Все прошлое и будущее должно уместиться в день сегодняшний" (конец цитаты).

Замечательно, что уже сейчас можно возразить авторам русской "Американы" и твердо ответить - да, старые газеты будут читать, если они попадут в доступные цифровые архивы. Новое понимание, о котором мы спрашивали, возникает при использовании полнотекстового поиска по всей базе данных. Это означает, что при поиске просматриваются все до единого слова всех без исключения текстов.

Полнотекстовый поиск извлекает из "временной ленты" все, что причастно к интересующей нас теме. Он безразличен к политической ориентации изданий. Он сшивает все информационно-временное пространство в единую ткань. Попавшие в известный электронный архив документы остаются актуальными всегда. Он возвращает нам память. Сохраняет широту и горизонт мнений, что так важно при всеохватной зависимости СМИ.

Первым следствием становится обостренное отношение к полемическим статьям и непроверенным фактам. Теперь на обвинение нельзя не ответить. Оно ложится на обвиняемого и лежит. Прямая ложь, манипуляции цифрами, рассчитанные на сиюминутное воздействие, теперь не защищены дефектами нашей памяти и ждут своего часа, как больной на операционном столе.

Другим многообещающим достижением становится частотный анализ употребления слов и языковых конструкций в СМИ. По нашему мнению, его роль в лингвистике, социальной психологии и социологии неизмеримо возрастет. Дело в том, что до сих пор не создан частотный словарь русского языка, который бы отражал его реальное состояние. Старые словари имели небольшую базу, которая позволяет их назвать только частотным словарем нескольких советских газет. Теперь, имея выборку в миллиард двести миллионов слов можно с достаточной полнотой построить общий частотный словарь русскоязычных СМИ. Но стоит ли создавать единый словарь отечественной и зарубежной прессы, газет и телевидения. Может быть, интереснее было бы создать несколько словарей? Ведь динамика словоупотребления контролируется гораздо меньше, чем политическая направленность материалов. Это настолько важная, по нашему мнению, тема, что к ней стоит позже вернуться еще раз.

Вот два не очень строгих, но показательных примера применения частотного анализа. Их привел Валерий Бардин, директор по развитию "Национальной электронной библиотеки". После экономического кризиса 17 августа прошлого года резко увеличилось частота упоминаний трех понятий. Мыло. Соль. Спички. Это тем более интересно, что именно эти три продукта не производила российская сельская община, а получала извне. И поэтому именно их не хватало в периоды частых в нашей истории катаклизмов. Интересно, что во время развития кризиса Москву больше беспокоили спички, Санкт - Петербург - мыло, а регионы - соль.

А вот известная отечественная проблема дураков и дорог. Столичных журналистов больше волнуют дураки, а остальных жителей страны - дороги.

Доступ к основному массиву информации на Интернет - узле "Национальной электронной библиотеки" платный. Читатель должен зарегистрироваться и заплатить аванс в сорок долларов. Он получает пароль и запрашивает по Интернету нужные документы. Поиск по слову или группе ключевых слов стоит 40 центов. С сентября он будет бесплатным. Просмотрев заголовки, можно познакомиться с нужными текстами. За каждый надо заплатить тоже 40 центов. Деньги снимаются со счета автоматически. Несколько изданий не согласились с общей ценовой политикой и установили более высокую цену за свои статьи. Но об этом пользователь узнаёт заранее.

Есть на сайте и бесплатные ресурсы. Имея под рукой информационную базу, "Национальная электронная библиотека" создает собственный популярной продукт: ежедневные обзоры центральной, региональной и зарубежной прессы. По рейтингу популярности Rambler они стоят высоко, часто входя в первую тройку. Другой интересной площадкой стала рубрика "Перекресток", куда, по словам авторов, "попадают статьи СМИ явно или скрыто полемичные. Интересны темы, отношение к которым со стороны общества не определилось, либо кардинально меняется в данный момент" (конец цитаты). Многим понравится, вероятно, и рубрика "Интервью недели", где можно узнать из первых рук мнения людей, чьи имена "на слуху".

Заслуживает внимания раздел "Аналитические материалы". Они касаются политических, экономических, общественных процессов, национальной безопасности и сферы политологического сервиса. Здесь институты и фирмы размещают свои обзоры. Подробное препарирование ключевых современных проблем разными инструментами на общей площадке будет интересно многим. Кроме того, поможет ориентироваться в рынке аналитических услуг.

От "Национальной службы новостей" библиотеке в наследство остался архив персоналий ведущих российских политиков. С небольшими дополнениями он находится на уровне 1997 года, но в нем есть интересные подробности недавнего прошлого.

И все-таки, мы считаем, что самые большие неожиданности ждут того, кто решится самостоятельно ворочать всю махину накопленной информации, обнаруживая в СМИ появление и развитие многих новых понятий, и уход в тень старых. А потом с помощью социологических измерений наблюдать, как изменяются после этого язык и представления читателей, телезрителей и радиослушателей. А значит и наша жизнь.

Олег Родин расскажет о сайте Григория Белонучкина "Политика".

Родин

В материалах программы "Седьмой континент" мы уже обращались к политическим страницам российского Интернета. Сегодня мы предлагаем познакомиться поподробнее с одним из самых информативных источников в разделе Политика: это сайт Григория Белонучкина, который так и называется "Политика и имеет адрес "www.cityline.ru/politika". По количеству ссылок на всевозможные Интернет-адреса, вероятно, сайт "Политика" занимает одно из первых мест в российской компьютерной сети и открывает его главную страницу список "Ссылки первой необходимости". Среди них Пресс-служба Президента и Министерство иностранных дел Российской Федерации, основные информационные агентства, сайты некоторых партий и персональные страницы нескольких известных политиков, упомянуты Интернет - форумы, в частности, посвященный правам человека и размещенный на страницах Русского журнала в Интернете, отмечены актуальные проблемы нашего общества такие как лицензирование в Интернете, введение повременной оплаты за телефон, что больно бьет по российским пользователям Всемирной Паутины, тайный контроль спецслужб за российскими информационными сетями и так далее.

Сайт Белонучкина "Политика" непосредственно с главной страницы даетвозможность пользователям получить доступ к информационным источникам (а также и к адресам соответствующих Web-узлов Администрации Президента и Правительства России, Совета Федерации и Государственной Думы, Конституционного суда, Уполномоченного по правам человека, Счетной Палаты, Центральной избирательной комиссии и Центробанка России, причем в адрес последнего можно послать по электронной почте свои вопросы и советы по выводу страны из экономического кризиса. Есть ссылки на адреса сайтов различных радиостанций и телекомпаний, можно узнать новости о российских налогах и познакомиться также с реестром наших олигархов: а это страница столь любопытная, что туда стоит заглянуть надолго!

"С конца 1997 - начала 1998 года , - сообщает Григорий Белонучкин, - в российском политическом лексиконе с легкой руки таких людей как Борис Березовский, Борис Немцов и другие укоренились слова "олигархия" и "олигархи" в применении к группе граждан и организаций, владеющих и распоряжающихся львиной долей промышленных предприятий, средств массовой информации и банковских капиталов России. Весной 1998 на сайте Немцова работал тематический форум "Будущее России: олигархия или демократия?" Некоторые участники форума выражали сожаление, что не знают, чем именно владеют олигархи и кто это вообще такие, хотя точно знают, что они все плохие и с ними надо всенародно бороться. В ответ на пожелания трудящихся с 5 мая 1998 года на сайте "Политика" создается Реестр олигархов. В дополнение к традиционно упоминаемым в качестве олигархов частным банковским и сырьевым финансово-промышленым группам в Реестр с самого начала были включены 2 государственных (полугосударственных) финансово-промышленных группы: "Российская Федерация" и "Москва". Здесь рядовой пользователь Интернета может познакомиться с собранными

Григорием Белонучкиным сведениями о новых владельцах бывшей собственности бывшего государства, именовавшегося "Советский Союз". Рассмотрен даже такой субъект рынка как Российская Федерация в целом: в качестве ее менеджеров обозначены: Президент, Председатель Правительства, его Первый заместитель, Министр финансов, Председатель Центробанка, Министр госимущества, Управляющий делами Президента. Можно понять основы банковской структуры и распределение собственности на стратегические ресурсы, в частности, нефть. Из содержания этой страницы становится ясно - кому по мнению составителя сайта "Политика" теперь принадлежит, скажем, "Газпром" или "Аэрофлот", РАО ЕЭС России или "Связинвест"; как велика доля иностранной собственности в крупнейших российских компаниях; каковы внешние долги России и под чьи гарантии они подпадают; кто владеет средствами массовой информации, газетами, радио и телевидением в России; чем распоряжается столичная мэрия во главе с менеджером Юрием Лужковым; как возникали российские банки; как предприимчивые собственники становились олигархами и так далее. Есть на сайте "Политика" страницы, посвященные работе Счетной Палаты: появился список многих проверок, проведенных ею, хотя в Интернете пока доступны результаты только проверки по Газпрому. Если то, что сообщается здесь, действительно соответствует реальности, то обнаруживается, что имеющееся законодательство не предусматривает предоставления Правительству права на передачу доверительного управления имуществом, находящимся в федеральной собственности, а это ставит под сомнение в соответствии закону имеющуюся ситуацию с распоряжением Компанией Газпром частью ее наиболее крупных акционеров. Впрочем, с юридическими аспектами предоставим разбираться специалистам. Посмотрим что еще интересного для пользователей Интернета есть на сайте Белонучкина. А есть там страница со странным названием "И-ГО-ГО", "маленький русский иерархический индекс с заметным политическим уклоном", как гласит подзаголовок. Это в помощь постоянным посетителям Интернета - "указатели и искалки", каталоги и ссылки, адреса и списки конференций, ресурсы Всемирной Паутины, рассортированные по темам Политика и Общество, Культура и Наука, Право и Регионы, Интернет и Бизнес, Власти и Средства массовой информации. Естественно, для нашей передачи более всего любопытны сведения по Интернету: можно познакомиться с законодательством, так или иначе связанным со Всемирной компьютерной Сетью, есть данные о компьютерах и модемах, о провайдерах в различных российских городах, об электронных библиотеках в Интернете, о партиях и популярных сайтах. Есть ссылка на раздел "Политика" известной поисковой системы Рамблер, определяющей рейтинг различных сайтов, в частности, политической тематики. Есть подсказки - как в Интернете найти людей или Универсальный конвертер русских кодировок, и так далее.

Думается, что не мне одному бросалось в глаза перенасыщение политической тематикой именно российского Интернета в сравнении с информационными узлами в других странах. Видимо, по мере приближения думских и президентских выборов активность политических страниц российской компьютерной сети будет еще более нарастать и мы будем внимательно наблюдать за этим процессом в том числе с помощью сайта Григория Белонучкина "Политика".

XS
SM
MD
LG