Программы - Седьмой Континент

24 августа 1999

Алексей Цветков

Материалы для сегодняшнего выпуска подготовлены совместно Олегом Палько и Александром Костинским. Передачу откроет материал о современных методах перевода книжного текста в цифровой код.

Затем вы услышите рассказ о компьютерных играх и о будущем игровых телевизионных приставок.

Радио "Свобода", программа "Седьмой континент". Каким образом текст старых книг, отпечатанный на бумаге, переводится в цифровой компьютерный код? Рассказывают Олег Палько и Александр Костинский.

Костинский

Цифровые технологии и Интернет создали совершенно новую среду общения, обучения, познания и бизнеса. Узлы Всемирной паутины ежедневно впитывают и отдают новую информацию и знание, которые приходят к администраторам сетевых серверов по электронной почте или скачиваются с других доступных в Сети ресурсов. Большинство информации рождается сейчас в цифровом виде.

Но есть огромный пласт культуры, запечатленный в текстах, написанных до цифровой эпохи. Без них многое в Интернете кажется связкой ярких воздушных шаров. И во Всемирной паутине уже ощущается вакуум качественного знания. Можно ли, и если можно, то, как прибавить Интернету немного интеллекта?

Сегодня мы расскажем о методах превращения обычного книжного, газетного и журнального текста в цифровой.

Первое, что приходит в голову, это набор текстов с клавиатуры. Как на пишущей машинке, только запись в память компьютера. Действительно, на заре цифровой эры это было единственным способом переноса информации с бумажных носителей. Однако печатание - очень трудоемкий и медленный процесс: квалифицированная машинистка небольшой детектив "вбивает" неделю, серьезный роман - месяц. Оцените затраты квалифицированного труда и вы поймете, что этот путь переноса книг на машинные носители приемлем только для очень важных текстов.

Второе, что представляется возможным, это "чтение" книг прямо самим компьютером. На первый взгляд неспециалиста, проблемы собственно-то и нет: есть сканеры (устройства перевода изображения в электронный вид), есть цифровые фотокамеры, которые и введут изображение в машину. Все эти устройства переводят видимую "картинку" в память компьютера точка за точкой. Изображение разбивается на множество микросекторов (пикселей) в зависимости от разрешения устройства ввода и последовательно считывается. В конечном файле содержатся координаты каждого пикселя и процентные доли красного, зеленого и желтого дающие при наложении цвет, близкий к реальному. Поэтому, требуется много памяти. Сейчас серьезной проблемы получения компьютерной фотографии страницы не существует. Если десяток лет назад подобный качественный ввод производился только на компьютерных системах высокого уровня, то сейчас такое доступно рядовому пользователю.

Однако при этом текст остается картинкой. Так для человека, не знающего китайский язык, картинкой представляется иероглифическое письмо. Пользоваться таким текстом можно, но это связано с множеством неудобств: требуется большой объем памяти для хранения (в 100-1000 раз больше, чем для хранения набранного на компьютере текста), невозможно производить поиск, цитирование и исправление, затруднено переформатирование и распечатка такого текста. То есть основные преимущества электронного хранения информации теряются.

Машина уподобляется ребенку, не знающему грамоты, для которого что изображения мячика, что буквы "О" - одно и тоже. Задача "освоения грамоты" машиной - часть более общей проблемы "распознавания образов". Необходимо научить машину тому, что перекладина с палочкой - это буква "А", а кружочек - буква "О" или ноль. Взрослый человек проделывает такую работу, когда читает текст с огромной скоростью (до тысячи символов в секунду), совершенно не задумываясь. Как человек добивается такого поразительного результата? С самого рождения кибернетики, ее подраздел, называемый "Искусственный интеллект" занимается проблемой "распознавания образов" человеком, но пока не достиг существенных результатов.

Поэтому программисты, как обычно в таких случаях, стараются задействовать сильную сторону компьютера - быстрые вычисления. Подход к распознаванию образов в этом случае таков: сначала отделим буквы друг от друга; затем предложим оператору выбрать, какой образ какой букве соответствует; запомним это. В дальнейшем уже будем предлагать оператору символ, наиболее близкий к картинке. Естественно, такое обучение лучше провести заранее и поставлять программу с набором готовых "шаблонов" для разных текстов. Если скорость машины достаточно велика, то процесс постоянного сравнивания каждой буквы текста со всеми возможными вариантами "шаблона" происходит незаметно для пользователя.

Простейшие программы OCR (optical character recognition), что означает "оптическое распознавание символов" именно так и действовали. К сожалению, адекватного русского соответствия этого термина нет. Сразу же выяснилось множество недостатков такого подхода: стоило шрифтовому стилю текста слегка "уклониться" от шаблона, как необходимо было начинать обучение заново. Поэтому более "продвинутые" программы с увеличением мощности процессоров и доступности памяти начали работать с использованием "обобщенного понятия буквы". Это похоже на процесс обучения ребенка, когда вы говорите: законченный кружочек - это буква "О", незаконченный - буква "С", а кружочек с длинной палочкой слева - буква "Р". В этом случае отпадает необходимость обучения программы новому шрифту - буквы-то во всех шрифтах одни и те же.

Если вы подумали, что на этом проблемы кончились, то, к сожалению, заблуждаетесь. Да, на сегодня лучшие программы на лучших по качеству текстах делают примерно 1-5 ошибок на лист, что соответствует уровню ошибок средней машинистки. Но "плохих" текстов оказалось значительно больше, чем "хороших". Под "плохим" текстом для программы понимается недостаточная пропечатанность или, наоборот, их сильная пропечатка; небольшой размер букв; серая бумага; наличие множества картинок и сложное форматирование текста. Например, человек способен практически без ошибок распознать разрывный, плохо пропечатанный текст высотой 2-3 мм, а лучшие программы перевода в цифровой вид на таких текстах делают более 50% ошибок! Мы уже не говорим про рукописные тексты...

При этом приходится признать, что методы распознавания с помощью "шаблонов" и "образов букв" практически исчерпали ресурс улучшения. Сейчас компьютерные программы остановились на уровне ребенка, который знает уже все буквы, и даже все слова, но почти не понимает смысла взрослых книжек.

Сами того не замечая, при чтении мы восстанавливаем от 10 до 80% читаемой информации на основе контекста, то есть тех знаний, которые мы получаем в течение всей жизни. У компьютера же таких знаний нет - ему все равно, что "читать" - роман Льва Толстого или Годовой отчет Центрального Банка.

Вот и возникают такие казусы распознавания: "Лолита, огонь твоих Кресел", вместо "Чресел", или "Ты бы стал это делать? Я не стОл", вместо "стАл". Программа выжала максимум из начертания букв в тексте - но дальнейшая правка возможна только на основе понимания текста.

Таким образом улучшить распознавание можно, только научив машину "понимать" тексты. Однако, как мы уже говорили, эта задача неразрывно связана с проблемой "искусственного интеллекта" и пока не решена. Упомянем только, что её решение означало бы появление искусственных "писателей" и "поэтов", общение с машиной на живом языке, исчезновение многих профессий, требующих рутинной обработки информации.

Вернемся к тому положению, которое сложилось сейчас с переводом бумажных текстов в машиночитаемый вид. Оно достаточно хорошее. Даже на общедоступном недорогом оборудовании обученный пользователь способен вводить с дальнейшей обработкой и почти одновременной оцифровкой одну - две книги в день. Правда, для того, чтобы книга соответствовала издательскому качеству, корректуру ее придется сделать вручную.

Несмотря на это, осмелимся предположить, что разрыв между машиночитаемой информацией в Интернете и книжным знанием будет быстро сокращаться. Как быстро, будет зависеть не столько от улучшения качества сканеров и программ оцифровки, сколько от более медленных изменений в сознании, навыках и привычках многих людей профессионально работающих с информационными и цифровыми технологиями. Ведь недавнее широкое исследование высших менеджеров японских компаний показало, что больше половины к компьютеру до сих пор относятся с опаской и недоверием.

Но это тема уже для другого разговора.

Радио "Свобода", "Поверх барьеров". Наш следующий очерк, подготовленный Олегом Палько и Александром Костинским, посвящен судьбе популярных телевизионных приставок. У микрофона вновь Александр Костинский.

Костинский

Хейзинга, Ортега-и-Гассет, Герман Гессе потратили немало сил, чтобы доказать, что игра первична, а культура вторична. Философы призывали играть по возможности бесцельно, ради самой игры. Им не хотелось считаться кому с политиками, кому с толпой, а кому и с буржуазным индивидуализмом. Они не знали, что с началом компьютерной эпохи у них появится такое большое число последователей, правда, не всегда сознательных. На работе, под строгими взорами начальства, дома, под не менее осуждающими взглядами родных они совершенно бескорыстно будут превращаться из человека разумного в человека играющего. И в точном соответствии с мрачными предсказаниями философов капиталистическая промышленность стала предлагать разные способы удовлетворения страсти к игре.

Наш разговор сегодня пойдет о компьютерных играх. Точнее, о жесткой и динамичной борьбе и взаимопроникновении игровых устройств разных платформ.

Кроме персонального компьютера, с универсальными возможностями, появились "специализированные" игровые компьютеры. Назвали их "видеоприставками" или "консолями". Поскольку вместо монитора для вывода изображений они чаще всего используют телевизор. Но, как и у обычного компьютера, у них есть процессоры разного назначения, память и устройства ввода-вывода.

Сразу возникает вопрос: если существуют универсальные компьютеры, способные справиться с любой задачей, зачем нужны игровые приставки? Краткий ответ будет звучать так: из-за цены и специализированной мощности. Полный ответ требует обращения к истории компьютеров.

До середины 80-х годов коммерческих игр для компьютеров не существовало. Первые персональные компьютеры родились для бизнес- и научных приложений. Они имели черно-белый (поначалу даже неграфический экран), очень скромные возможности графики и убогий интерфейс (систему взаимодействия с пользователем). Однако, несмотря на это, игры на них уже были - они писались одиночками-энтузиастами.

Многие помнят, с каким вниманием в те времена вглядывались в экран, судорожно нажимая клавишу пробела, младшие научные сотрудники и инженеры. И немудрено. Со всех сторон на Вас летели вражеские самолеты и вертолеты, сбрасывая бомбы в форме буквы "о". И только отшлифованное многочасовыми упражнениями мастерство позволяло метким огнем восклицательными знаками уничтожать превосходящего числом противника, переходя с уровня на уровень.

Видя повальное увлечение пользователей такими играми, сразу в нескольких фирмах родилась идея сделать недорогой, упрощенный специализированный компьютер - без жесткого диска, клавиатуры, с телевизором вместо монитора - и только для игр. Так родились видеоприставки.

Первым действительно массовым образцом стала "Nintendo" одноименной фирмы (хотя у нее были очень неплохие предшественники приставки "Atari", "Commodore", "NEO"). Это случилось в конце 80-х начале 90-х годов. Персональный компьютер тех времен в лучшем случае имел небыструю 16-цветную графику. Звук отсутствовал. При этом стоил он от полутора тысяч долларов и требовал немалых знаний для управления. А видеоприставки имели быструю 256-цветную графику, неплохой звук и стоили ниже двухсот долларов. Все управление сводилось к включению и установке в гнездо приставки картриджа с игрой.

Новизна, красота, простота и дешевизна предопределила успех этого продукта. Приставка и ее многочисленные клоны (помните "Дэнди"?) с множеством игр для них надолго закрепились на рынке.

В начале 90-х годов "Nintendo" выпустила приставку следующего поколения "Super Nintendo". Новый 16-битный процессор, новый видеопроцессор, новый звук - и опять же менее чем за 200 долларов. Расчет был тот же - среднестатистический американец (европеец или японец) шел за подарками на Рождество для своего ребенка, имея среднестатистические $200. Он не мог купить персональный компьютер, который по-прежнему стоил от $1500 и по-прежнему был весьма слаб в отношении игр.

Успех, естественно, породил подражания. Примерно в то же время появились приставки с похожими характеристиками: "Sega MegaDrive", "Saturn". Но именно "Nintendo" захватила большую часть рынка из-за хорошего сочетания цены и качества приставки и агрессивной маркетинговой политики.

Но передышки не последовало. На игровое поле вернулись преображенные персональные компьютеры. Появились хорошие мониторы, видеоадаптеры, поддерживающие высокое разрешение и цветность, недоступную для телевизоров. Звуковые платы понемногу переставали быть роскошью. Началось победное шествие "дружественных" графических операционных систем, типа "Windows". Благодаря всему этому стал быстро расширяться рынок игр для персоналок.

Переломными годами можно назвать середину 90-х: персональные компьютеры стали массовыми, их "мультимедийные" возможности сильно возросли. Игры на них теперь мало отличались по качеству от игр на видеоприставках, которым с этого времени даже стали предрекать гибель. Действительно, появившуюся приставку следующего поколения "Panasonic 3DO" ждал весьма кратковременный успех. Ведь в это время на персоналках были реализованы игровые возможности, недоступные приставкам. Шагнула вперед графика высокого разрешения. Стало возможным запоминание, изменение и доработка игры "на ходу". Вместе с распространением локальных сетей и Интернета возникли сетевые игры для многих участников. С появлением компакт-дисков в компьютерные игры проникли видеофрагменты. Словом, персональный компьютер снова вырвался вперед.

Ответный удар не заставил себя ждать. На сцену вышли сразу две приставки нового поколения: "Sony Playstation" и "Nintendo 64". Общей особенностью их было применение мощных графических процессоров и (для "Sony") - компакт-диска в качестве носителя. "Но это же характерно и для современных компьютеров", - скажете вы. Да, конкуренция между видеоприставками и персональными компьютерами вступила в новую фазу. Теперь игры для видеоприставок не могут похвастаться какой-то особенной графикой - возможности сравнялись. Цена тоже не играет большого значения - в развитых странах компьютер появился в каждой второй семье (кто не может позволить себе ПК, обычно, не может позволить и приставку).

Положение приставок осложнило появление так называемых "эмуляторов" видеоприставок на ПК. "Эмулятор" - это программа для исполнения кода одного компьютера на другом. Она как бы подменяет, симулирует чужое аппаратное устройство на вашем. То есть, теперь игры для видеоприставок можно запускать на персональном компьютере.

Нельзя рассказать об игровом рынке, не упомянув еще одного активного участника - пиратов. Появились пиратские "клоны" видеоприставок. Для них широко распространилось несанкционированное размножение картриджей и компакт-дисков.

В России, например, сегодня вы практически не найдете "родных" компакт-дисков для "Sony Playstation". Это притом, что в приставку встроена аппаратная защита от таких "левых" дисков. Но умельцы продают "доработанные" специальным чипом-микросхемой приставки, которые понимают любые "левые" диски. Для "Nintendo-64" продается "Doctor Nintendo" - устройство ввода игр для этой приставки с компакт-диска. На этом диске вы найдете ВСЕ до единой выпущенные для нее игры.

Итак, трудности видеоприставок очевидны. Но не фатальны. Недавно фирма "Sony" заявила о разработке приставки следующего поколения. Нельзя не упомянуть и новой 128-битной приставки следующего поколения "DreamCast". Их параметры сегодня перекрывают возможности даже графических станций - очень дорогих компьютеров специально ориентированных на обработку изображений. Но и персональный компьютер идет вперед экспоненциальными шагами по пути видеоускорения. Похоже, на видеоприставках еще рано ставить крест. Они еще поживут. И кто победит еще не ясно. В любом случае вклад приставок в развитие цифровой графики огромен. Они были и остаются катализатором и проводником будущего в этой области.

Вместе с Вами с удовольствием посмотрим за борьбой и развитием новых игровых аппаратов. Не зря же именно в нашем веке игра признана необходимой, если не основной составляющей современной культуры. Благодаря играм неотъемлемым элементом этой культуры стал сам компьютер, ведь уже выросло поколение, которое относится к нему без страха и повышенных ожиданий.

Ссылки для упрощенного доступа

Социальные сети

Программы - Седьмой Континент