27 июня 2016

    Архивы Свободы / Архив 1997-2004

    Поиск в Интернете и поисковые машины

    Поиск в Интернете и поисковые машины





    Александр Костинский

    Интернет - это огромные информационные ресурсы. Всемирная паутина развивается свободно, без какого-то наперед заданного плана, и, как следствие, ресурсы Интернета плохо структурированы. Несмотря на это, многие люди идут в Интернет именно за информацией. Но как ее найти среди миллиардов документов? На помощь приходят специальные поисковые серверы. Набрав в окошке запроса ключевые слова, можно получить ссылки на страницы Сети, где это слово встречается.

    Сегодня мы будем говорить о поиске в Интернете и поисковых машинах. Как они устроены, почему так быстро выдают информацию, какую часть Интернета они охватывают, и как, предположительно, будут развиваться. Мои собеседники - сотрудники российской поисковой системы Яndex (www.yandex.ru) Елена Колмановская, Илья Сегалович и автор книг, посвященных ресурсам Интернета - Юрий Поляк.

    Говорит Илья Сегалович

    Илья Сегалович

    Поисковые машины были с самого начала возникновения того, что называется Интернетом. Добрая треть пользователей шла в Интернет потому, что там можно найти информацию. Поисковые машины - не боковая пристройка к Интернету, а неотъемлемая его часть, которая для многих пользователей - сам Интернет, олицетворение Интернета.

    Александр Костинский

    Можно сказать, что Интернет и рос во многом благодаря поисковым машинам.

    Илья Сегалович

    Не только. Есть еще почта, есть другие сервисы, но это - добрая треть.

    Александр Костинский

    А как устроена поисковая машина? Благодаря чему она так быстро ищет?

    Илья Сегалович

    Для каждого слова, которое встречается в тексте, составляется список. Если мы откроем научную книгу, то там в конце есть глоссарий, в котором напечатаны все слова и номера страниц, где они встречались. Примерно так же устроен и индекс поисковой машины. Для каждого слова, которое есть в текстах Интернета, указывается, где оно встречалось. И когда вы делаете запрос, скажем, "Ньютон", никто не просматривает гигабайты и терабайты информации заново. А просто достают по слову Ньютон ссылки из списка мест в Интернете и эти ссылки вам показывают.

    Александр Костинский

    Получается, что процесс выглядит так. Вначале некая машина (ее иногда называют червяком) обходит какое-то количество ресурсов и находит все слова, которые там есть, и каждое слово кладет в ячейку со своим номером. А потом, когда слово появляется в запросе, поисковая машина сразу же из ячейки этого слова вызывает все документы, где оно встречалось.

    Илья Сегалович

    Совершенно верно. Есть физический список слов. Его можно назвать как угодно, например, словарь. Из этого словаря поисковая машина может быстро доставать все слова, которые вообще встречались в текстах и предоставлять пользователю все Интернет-адреса, где они обнаружены. Но при этом возникает много проблем. Этот червяк, он же робот, он же паук. У него много разных имен.

    Александр Костинский

    Это программа, реализованная на компьютере?

    Илья Сегалович

    Да. Задача этого создания все время лазить по Интернету, собирать информацию. То, что происходит в фоне, то, о чем обычно пользователь поисковой машины не догадывается, это - подготовительная работа, во много раз превышающая работу обычного поиска.

    Александр Костинский

    На вашем сервере стоит программа, которая все время бродит по русскоязычному Интернету?

    Илья Сегалович

    Россия по объемам всемирного Интернета и количеству пользователей пока мала, всего два процента, и мы ни по деньгам, ни физически не можем обойти весь Интернет. Просто денег на это не хватает. И вообще задача такая не стоит. Поэтому мы обходим только то, что считаем русской частью. Этого вполне достаточно, потому что мы стараемся обходить как можно более полно.

    Александр Костинский

    Не обязательно российская часть, а русскоязычная?

    Илья Сегалович

    Совершенно верно. В Интернете вообще отсутствует понятие границ. Это - "Седьмой континент", у вас правильно называется передача. Там нельзя понять, кто это и где он живет. Есть некоторый адрес, на нем что-то написано по-русски. Это мы берем.

    Александр Костинский

    Подытожим. Есть некий червяк, который бродит по Интернету и индексирует слова. Потом он их складывает в некую базу данных, можно ее назвать словарем. Человек, который пришел в Интернет и что-то хочет найти, делает запрос. И по запросу ему на голову из этого словаря вываливаются ссылки на все документы, где это слово встречалось.

    Илья Сегалович

    Основная задача так их вывалить, чтобы человека не сшибить с ног, чтобы он остался жив и после этого опять пришел в поисковую систему и еще раз что-нибудь спросил. Безусловно, это не всегда удается, но все поисковые системы к этому стремятся.

    Александр Костинский

    Если сравнить с первыми искалками, как изменилась выдача, как изменился червяк, как изменилась база данных слов?

    Илья Сегалович

    В выдаче много чего изменилось, но тут как бы нет соревнования. Один рисует так, другой эдак - маленькое поле для совершенствования. А вот в том, как работают основные поисковые механизмы, произошли колоссальные перемены. Когда Интернет только начинался, представление о поиске было примерно такое: у нас есть столько-то документов, в которых есть столько-то слов. Нужно проиндексировать эти документы и выдать список. Про ранжирование кто-то что-то думал, были какие-то алгоритмы, но они были в основном статистическими. Скажем, слово "А" встречается в документе "В" чаще, поэтому это слово в документе считается с большим весом и этот документ нужно показать на первом месте. Такие примитивные, достаточно несложно устроенные механизмы перестали работать, когда документов стало очень много. Кроме того, документы сознательно портятся разными людьми, потому что они понимают, как устроен механизм ранжирования. Когда появился Интернет, не было представления о том, что тексты могут создаваться специально для роботов. Сейчас это основная проблема всех поисковых систем. Многие тексты создаются специально для роботов, чтобы попасть на первое место выдачи.

    Александр Костинский

    Теперь человек так выкладывает документ на сайт, чтобы его машина нашла?

    Илья Сегалович

    Она его и так найдет. Проблема не просто в факте нахождения. Поскольку на каждое слово находятся миллионы или десятки тысяч ссылок, то важно оказаться в первых рядах выдачи пользователю. Почему важно, тоже понятно. Поисковый сервис востребован третью пользователей Интернета. Они заходят на поисковую систему и дальше, задав запрос, разбредаются по всему Интернету. Человек ленив, он обычно дальше одной-двух страниц результатов запроса не смотрит, естественно, у создателей сайтов задача оказаться на первой странице выдачи поиска.

    Елена Колмановская

    Посковые машины являются тем, что называется трафикогенератором. То есть с поисковых машин уходит много ссылок на другие ресурсы и у многих сайтов это от 20 до 40 процентов посетителей. Это то, что приходит к ним с поисковых машин. Когда Интернет начинался, то люди просто хотели публиковаться. Теперь Интернет стал большим. Мало сделать сайт. Еще хотелось бы, чтобы на этот сайт кто-то зашел. Всем сайтостроителям это интересно. С появлением в Интернете коммерции им это не просто интересно как личностям, а еще и стало приносить непосредственные деньги, будь то размещение баннеров, будь то показ инвесторам, что посещаемость высокая и сайт можно продать. И поэтому начались попытки злостного обмана поисковых машин с целью получения себе на сайт дополнительного трафика.

    Илья Сегалович

    Не так страшно. Большой разброс от злостного до совсем не злостного.

    Александр Костинский

    А что такое обман поисковой машины?

    Илья Сегалович

    Есть несколько базовых техник. Такие страшные слова, например - клоакинг (cloaking), способ обмана поисковой системы, который заключается в следующем. Когда человек заходит на поисковую систему и спрашивает страничку, то ему выдается страничка с нормальным содержанием, в которой можно увидеть какой-то текст. Когда тот же самый адрес запрашивает робот, то сервер этого ушлого товарища так хитро настроен, что он опознает роботов и специально для роботов подсовывает другую страничку.

    Александр Костинский

    А, даже так. Жульничество в чистом виде.

    Илья Сегалович

    В чистом виде. Это называется - клоакинг. Техника номер два - создание дорвеев (doorway), опять извините за нехорошее слово. Там такая технология. Просто создается много-много страниц, которые подсовываются роботу, с которых есть перенаправление на нужную злоумышленнику страничку. То есть робот съедает массу страниц, считает их более ли менее релевантными, находит, но пользователь их реально не видит. Как только он попадает на страницу дорвея, его перебрасывают на другой адрес.

    Александр Костинский

    Человек получает то, чего он не просил.

    Илья Сегалович

    Абсолютно не связанное с его запросом.

    Александр Костинский

    А какая часть русскоязычного Интернета проиндексирована поисковыми машинами?

    Илья Сегалович

    Веб устроен следующим образом. Со странички на страничку можно переходить по ссылкам, а иногда нужно заполнять формы.

    Александр Костинский

    Когда вы пришли на сайт и вам говорят. "У нас бесплатный сайт, можете здесь играть в шахматы, но для этого заполните форму". Червяк форм не заполняет.

    Илья Сегалович

    Червяк действительно форм не заполняет, поэтому огромную часть Интернета поисковая система просто не видит. Даже если говорить о видимой части, то тут тоже проблема.

    Елена Колмановская

    Еще есть просто закрытая часть Интернета, куда доступ только по паролю.

    Илья Сегалович

    На том же сайте Яндекс или на любом портале есть регистрация. Если вы зарегистрируетесь, то вы попадаете в свою приватную зону с вашей почтой:

    Александр Костинский

    Тоже бесплатно, но червяк сюда зайти не может.

    Илья Сегалович

    Никогда. Он просто не знает вашего пароля. Он не будет его подбирать, потому что у него нет такой задачи. А если говорить о той части, которая называется связанной, которая по ссылкам доступна, там проблема непостоянства информации, ее изменения, просто большого объема и так далее. Все равно невозможно обойти Интернет одномгновенно, сделать слепок всего Интернета физически невозможно. Никакого устройства в мире не существует, которое способно это сделать. Все что делают роботы, это аппроксимации, как обходить Интернет так, чтобы постоянно поддерживать его и свежим и большим.

    Александр Костинский

    С какой частотой ходит червяк?

    Илья Сегалович

    У нас постоянно. База выкладывается два раза в неделю. Но это вовсе не означает, что каждая страничка будет два раза в неделю спрошена. Есть целая наука, какие странички когда спрашивать. Мы стараемся создавать иллюзию некоторой полноты и свежести. Это делают все: создают эту иллюзию. Реально абсолютную полноту и свежесть создать невозможно.

    Александр Костинский

    Сколько из видимого, незапароленного Интернета обошел Яндекс и сколько обошли в совокупности все системы: Яндекс, Aport, Rambler, Google?

    Илья Сегалович

    Если говорить о русской части Интернета?

    Александр Костинский

    Конечно, о русской.

    Илья Сегалович

    У нас в Яндексе процентов 30-40.

    Александр Костинский

    А все системы?

    Илья Сегалович

    Все системы - процентов 70, но речь идет о русском Интернете, который относительно хорошо обходится.

    Александр Костинский

    Хорошая, замечательная система Яндекс, но если я делаю поиск, то мне, вообще говоря, разумно проводить его по четырем поисковым системам.

    Илья Сегалович

    Действительно, на редких запросах желательно спрашивать всех.

    Александр Костинский

    В начале было два типа поиска. Первый тип - поиск по запросу, его олицетворяли Lycos и AltaVista. Потом появилась Yahoo - аналог систематического каталога. Яндекс начинал с просто поиска, теперь у вас есть некий систематический каталог.

    Илья Сегалович

    Каталог - это востребованная, полезная вещь, которой пользуется огромное количество людей, и мы всегда понимали, что нам не хватает своего каталога, потому что он очень помогает, если каталог интегрирован с поисковой системой. Когда человек делает запрос, можно понять, в каких категориях каталога нашлись для него слова, и предложить ему тематический спектр. Каталоги, которые в тот момент существовали, нас по качеству не устраивали, и мы решили, что мы сделаем самый правильный и самый лучший, а Юрий Евгеньевич нам в этом помогал.

    Юрий Поляк

    Не секрет, что и у поисковых машин и у каталогов есть свои плюсы и минусы. Каталоги, как правило, готовятся в живых человеческих коллективах, поэтому они в чем-то более точны, но зато их гораздо труднее обновлять и они просто не успевают за развитием Интернета. Поэтому им хорошо было привить черты поисковых систем. И наоборот.

    Илья Сегалович

    Каталог помогает поисковой системе в ответах на запрос. А поисковая система помогает каталогу в свежести. У нас есть очередь на описание ресурсов. Она все время строится по результатам действий робота. Мы понимаем, какие сайты - самые цитируемые, какие самые большие, какие надо описать в первую очередь. Между этими механизмами поиска есть взаимопомощь.

    Юрий Поляк

    Абсолютно верно. Я хотел бы еще подчеркнуть, что бессмысленно сейчас говорить о полноте какого-нибудь каталога с учетом тех объемов Интернета, которые здесь уже назывались. Поэтому любой каталог должен представлять наиболее важные информативные и актуальные ресурсы. В этом, конечно, незаменимы поисковые системы с индексом цитирования, который показывает, насколько эта информация востребована и каков реальный объем сайта.

    Елена Колмановская

    Еще надо сказать про пользователей. Есть пользователи клавиатуры и пользователи мышки. Пользователи клавиатуры - это те, кто готов сформулировать свой запрос поисковой машине. Пользователи мышки - это люди, которым приятнее, удобнее и логичнее кликать по дереву. Каталог это - дерево, по веткам которого осуществляются переходы. И это отражает два типа запросов. Когда человек точно знает, чего он хочет, например он хочет узнать, в каком году родился Путин, он идет и спрашивает у поисковой машины. Когда человек в принципе хочет отдохнуть, но не знает, где и когда конкретно, ему конечно, логичнее пойти в раздел каталога "отдых" и посмотреть, какие сайты там есть. Потому что на запрос "отдых" поисковая машина ничего разумного ответить не может, кроме как показать разнообразие существующих ресурсов.

    Александр Костинский

    Насколько важна в поиске роль того человека, который ищет?

    Илья Сегалович

    Есть разные идеи, как улучшить полноценное качество поиска. Одна из них - анализировать, какие документы выбирает человек после запроса. Вот человек спросил что-то, ему не понравилось. Он дальше пошел. Выбрал другие документы, не те, что мы ему показали на первой странице. Но из этих данных не очень получается построить удачную систему.

    Александр Костинский

    Какова длина среднего запроса? Кажется, что чем больше слов вы введете, тем более частую рыболовную сетку вы настроите, тем более вероятно, что вы поймаете ту рыбу, которую хотите поймать, когда вы используете связки типа "и", "или", "не". На всех поисковых машинах эти механизмы есть, но практически никто ими не пользуется.

    Илья Сегалович

    Вообще говоря, эти механизмы есть у всех поисковых систем хотя бы потому, что это лежит у них внутри, в поисковом движке. Кроме того, есть два или три процента совершенно сумасшедших математиков, которые думают, что они все понимают, с булевой алгеброй справляются и могут с ее помощью все найти. Вот ровно для этих двух процентов почти все поисковые системы делают доступными логические операторы булевой алгебры. Но при этом все поисковые системы стремятся изо всех сил, зубами грызут камень, чтобы уметь отрабатывать запрос на естественном языке. Чтобы человек спросил абы как, не думая, допустим, домохозяйка два слова набила, кнопочку нажала - и ей был предоставлен идеальный ответ.

    Елена Колмановская

    У нас давно нет иллюзии, что можно научить всех пользователей делать что-то. Им можно предложить что-то, что будет естественным. Они могут на это согласиться. Думать, что более этих 2-3 процентов начнут использовать в поиске булеву логику - это все равно, что думать, что завтра все будут в совершенстве знать английский или китайский язык. Конечно, приятно, но нереалистично. Их хотя бы приучить писать в запросе грамотно по-русски. И поэтому Яндекс долго приучал людей, что нужно грамотно обратиться по-русски. Не надо думать, как именно, в каком падеже, в какой форме поставить слова и какие слова выкинуть. Ты спроси, а мы постараемся. Такая парадигма. Она работает, потому что она для людей естественна. Кстати, средняя длина запроса в Яндексе - две целых семь десятых слова.

    Александр Костинский

    То есть, два-три слова.

    Юрий Поляк

    Это означает, что большинство запросов из одного слова.

    Елена Колмановская

    Потом то, что Илья говорил про каталог. Когда у нас есть каталог, скрещенный с поиском, и человек нашел слишком много, то ему дается совет: уточните свой поиск вот так, так и так. Мы, естественно, таким образом даем советы, как лучше искать.

    Александр Костинский

    Советы даются автоматически поисковой машиной?

    Елена Колмановская

    Стараемся автоматически, например, когда мы видим, что это опечатка, или слово запроса не является нормальным словом русского языка. Тогда мы предлагаем варианты.

    Юрий Поляк

    Простите, пожалуйста. должен добавить со стороны пользователя, что это совершенно замечательный сервис. Если я задаю в запросе, допустим, слово "танк", то поисковая система мне сама подсказывает, искать ли мне в разделе "армия и вооружение" или среди танкеров, или среди анекдотов про танки или где-нибудь еще.

    Александр Костинский

    У вас этот сервис уже есть?

    Елена Колмановская

    Это и есть собственно каталог.

    Илья Сегалович

    Это то, что мы назвали скрещиванием каталога с поиском.

    Александр Костинский

    Поисковые машины - это самые посещаемые сайты. Сколько у вас посетителей в день?

    Елена Колмановская

    Сейчас 600 тысяч.

    Александр Костинский

    А сколько они просматривают страниц?

    Илья Сегалович

    На поиске сейчас один миллион восемьсот тысяч самих запросов, и мы показываем примерно 4 или 5 миллионов страниц. А на всем Яндексе 15 миллионов.

    Юрий Поляк

    Речь о том, что Яндекс - это не только поисковая машина, но и много других сервисов. И почта, и поиск товаров, и многое другое.

    Илья Сегалович

    У нас же еще и самый большой в России бесплатный хостинг, сайт "Народ".

    Александр Костинский

    Народ.ру? http://narod.yandex.ru/

    Илья Сегалович

    Народ.ру - это наш проект.

    Александр Костинский

    Яндекс - коммерческий проект?

    Елена Колмановская

    Нет, к сожалению, другой модели жизни.

    Илья Сегалович

    Наш проект - содержательно-коммерческий.

    Александр Костинский

    За счет чего вы живете?

    Елена Колмановская

    У нас рекламная модель. В некотором смысле мы - как средство массовой информации. Не в том смысле, что у нас есть журналисты и мы производим новости, а в смысле, что мы живем с продажи рекламы. У нас недавно был совет директоров. Могу сказать официальные цифры. Мы за прошлый год заработали миллион долларов. Это прямых денег, не считая бартера. И соответственно, продолжали быть планово-убыточными. У нас, собственно, такой план развития. Но рекламный рынок поднялся, спасибо ему за это, и мы собираемся стать самоокупаемыми в конце 2002 года.

    Александр Костинский

    Что вы могли бы посоветовать человеку, который ищет в Интернете?

    Елена Колмановская

    Спокойствия.

    Александр Костинский

    А что, чувствуется нервный ритм поиска?

    Илья Сегалович

    У нас же каждый день приходят сотни самых разных писем: гневных, возмущенных, благодарственных. "Спасибо вам, вы самая лучшая система!" "Какой кошмар, что вы тут наделали!?"

    Елена Колмановская

    Разумная стратегия поиска - это быть готовым к нескольким последовательным итерациям. Если человек задал вопрос и сразу не получил того, что он хотел, имеет смысл внимательно посмотреть на то, что ты нашел. Возможно, там возникнут слова из той предметной области, которой ты интересуешься, и будет понятно, что нужно в вопрос добавить или как его переформулировать. Может быть, не с первого поиска, а со второго, третьего доберешься до полезной информации.

    Юрий Поляк

    Нужно пользоваться разными поисковыми инструментами. В одних случаях проще найти информацию в базе данных, где находится нужное предприятие или учебное заведение, или фирма просто находится внутри отсортированного по регионам или по сферам деятельности списка. Кроме того, при всем уважении к Яндексу, есть другие хорошие поисковые системы. В России это прежде всего Апорт. Из иностранных сейчас нет конкурентов у Google www.Google.com и Fast www.fast.no , да?

    Илья Сегалович

    Конечно, номер один - Google.

    Александр Костинский

    А за счет чего они так продвинулись, ведь они недавно появились и вдруг такая экспансия?

    Илья Сегалович

    Они появились довольно давно, года четыре назад. Одним из способов улучшения выдачи, который оказался неперспективным, было изучение запросов пользователя. Off-page - критерии (а по-русски - внетекстовые критерии), которые влияют на релевантность данной страницы. То, что не лежит на данной странице, но тем ни менее влияет на ранг ее выдачи. Google учитывает гипертекстовую структуру Интернета, и какие страницы на какие ссылаются. Предпосылка здесь такая. Страница, на которую ссылаются чаще, более релевантна и более популярна.

    Александр Костинский

    Ссылки с других сайтов на эту страницу.

    Илья Сегалович

    Здесь немножко хитрее. Дело в том, что примитивный индекс цитирования тоже легко накрутить. Это называется непотизмом. Извините, еще за одно неприличное слово, мало кто его знает. Это - кумовство. То есть кукушка хвалит петуха и так далее. Идея в чем? Давайте обменяемся ссылками.

    Александр Костинский

    И все всплывем.

    Илья Сегалович

    Да, все всплывем. Более умные алгоритмы, те, что использует Google (и многие другие системы), состоят в том, что они не просто анализируют число ссылок на страничку, но и учитывают вес тех страничек, которые ссылаются на сайт.

    Александр Костинский

    Куда все это движется?

    Илья Сегалович

    Интернет будет улучшаться, так как в нем будет появляться информация, которая сейчас отсутствует. Безусловно, будет появляться и мусорный, и организованный тип информации. Так же, как и в жизни. Мы идем по городу. Вот этот дом хороший, чистый, а этот грязный и замусоренный. Так и в Интернете, законы те же. Что касается поисковых систем, то их доля, как трафикогенераторов, как доставщиков информации, я думаю, никуда не исчезнет.

    Елена Колмановская

    Интернет производит впечатление свалки, в частности, потому, что там информация принципиально неструктурированная. Она свободная. И поэтому нет никакого шаблона, который применим ко всем страницам. Еще одно направление развития. Это добавление к Интернету всяческой структурированной информации. Это направление отражено у нас в параллельном поиске по новостям, в параллельном поиске по энциклопедиям. Еще есть несколько массивов структурированных данных, которые мы имеем в виду подключить. Когда понятно, что человек спросил, то часто и понятно, что именно в этом массиве информации ему разумно найти ответ.

    Илья Сегалович

    По мере роста Интернета поисковые системы - это уже не просто задача на один компьютер или для нас с вами. Вот мы взяли и решили сделать поисковую систему. Сейчас это - колоссальная техническая проблема. Скажем, AltaVista выбрала определенную архитектуру, в таком-то году приняла решение вот так-то строить систему. Вложила огромные деньги. Все было рассчитано под Интернет, который был тогда, и под его механический рост. Те, кто стартовали позже, они поняли, что все устроено по-другому, учли ошибки предшественников и выстроили систему совсем другого плана, тот же Google. Но фокус состоит в том, что чем дальше, тем сложнее будет стартовать. Вот сейчас у Google 15 тысяч компьютеров.

    Александр Костинский

    Только у них?

    Илья Сегалович

    Еще раз. 15 тысяч компьютеров. Понятно, да? Это такие деньги, такие физические мощности:

    Александр Костинский

    А у вас сколько компьютеров?

    Илья Сегалович

    Поиском занимается сорок компьютеров

    Александр Костинский

    У вас 40 компьютеров, а у них 15 тысяч. Вы сколько просматриваете?

    Илья Сегалович

    Я уже говорил: 2 процента.

    Александр Костинский

    А в абсолютных единицах?

    Елена Колмановская

    Около терабайта.

    Илья Сегалович

    У нас 60 миллионов страниц, а у них 3 миллиарда. Стартовать сейчас, просто сказать: давайте возьмем деньги у какого-нибудь большого капиталиста и мы все заиндексируем, построим и так далее. Чем дальше, тем сложнее будет преодолеть этот колоссальный барьер начального старта.

    Александр Костинский

    Да, 15 тысяч компьютеров сразу не купишь.

    Илья Сегалович

    Возможно, барьер станет таким высоким, что останется одна-две поисковые системы или вообще - одна.

    Александр Костинский

    Одна для английского языка, одна для русского.

    Илья Сегалович

    Не знаю. Может быть, мы умрем.

    Александр Костинский

    Нет, нет. Не умирайте. Пока не умирайте.

    Илья Сегалович

    Я хочу сказать, кто знает, что будет через двадцать лет. Возможно, будет так: Интернет и одна поисковая система. Множественное число просто исчезнет.

    Александр Костинский

    Это связано именно с экономическими факторами?

    Елена Колмановская

    Компьютеры тоже ускоряются, так что остается еще вопрос.

    Илья Сегалович

    Ускоряются, но медленнее. Процент охвата растет. Только в Америке он достиг насыщения. Но Интернет сейчас растет за счет всего остального мира. И за этой скоростью не поспевают никакие процессоры и диски.

    Александр Костинский

    Получается, что Интернет сейчас - самая быстро растущая система. И вы пытаетесь весь этот хаос вместе с коллегами:

    Илья Сегалович

    И мы своими жалкими сорока компьютерами пытаемся безбрежный русский Интернет упорядочить.

    Александр Костинский

    Но вам помогает Google со своими несчастными 15 тысячами машин.

    Елена Колмановская

    Кто на нас с Гуглом?

    Юрий Поляк

    Совершенно справедливо, что Интернет развивается свободно и хаотично. Может быть, на радио "Свобода" об этом уместнее говорить, чем где-нибудь еще. Я бы еще сказал, что поиск в Интернете - это не столько наука со всеми булевыми алгебрами и прочими алгоритмами. Это еще своего рода искусство, именно потому, что очень много возможностей, очень много поисковых механизмов. Все запросы уникальны. Задавая какие-то слова, заранее, как правило, не знаешь, что придет в ответ. Я бы сказал, что здесь процесс встречный. С одной стороны, несомненно, будут совершенствоваться поисковые системы, но с другой стороны, и к пользователям это предъявляет высокие требования. Лучших результатов достигают те, кто все-таки платит некоторый вступительный взнос в виде изучения инструкций, языков запроса, наконец, те, кто просто перед обращением к окошку поиска, на несколько секунд задумается, как лучше спросить, и что именно они хотят увидеть в тексте документа, который ищут.


    Все ссылки в тексте программ ведут на страницы лиц и организаций, не связанных с радио "Свобода"; редакция не несет ответственности за содержание этих страниц.


    О чем говорят в сети