Ссылки для упрощенного доступа

Приз компьютерной программе, которая лучше всего имитирует разговор с человеком, достался британской программе "Джордж"


Специально для сайта

Владимир Губайловский

Британская компьютерная программа "George" одержала победу в ежегодном конкурсе разговорных программ (chat-bot) Loebner Prize. Программа George и ее создатель Роло Карпентер (Rollo Carpenter) соревновались в Нью-Йорке с тремя другими разговорными программами - финалистами 2005 года. В том числе со знаменитой программой Alice (автор – Ричард Уоллес (Richard Wallace)), которая уже трижды побеждала в Loebner Prize – в 2000, 2001 и 2004 году. Программы соревнуются в выполнении теста Тьюринга или игре в имитацию. Программа должна убедить экспертов в том, что они говорят с человеком. Если бы это полностью удалось, то программа могла бы претендовать на золотую медаль и гран-при в размере 100 тысяч долларов. Соревнования Loebner Prize проходят с 1991 года, но пока все ежегодные победители получают более скромную награду – бронзовую медаль и 3 тысячи долларов.

Тест Тьюринга

В 1950 года знаменитый британский математик Алан Тьюринг опубликовал статью "Может ли машина мыслить?" ("Can the Machine Think?"). В этой работе Тьюринг отказывается давать определение понятию "мышления", но он предлагает вычислительную процедуру, которая, во-первых, проверяема, а, во-вторых, не противоречит представлению здравого смысла о том, что такое мышление. Тьюринг предлагает сыграть в имитацию: если программа сможет поддерживать диалог с человеком, и человек не догадается, что говорит с машиной, то мы будет называть такую машину мыслящей. Определение мышления, данное Тьюрингом, кажется весьма примитивным. Оно уже многократно было подвергнуто критике,

Джон Сирл (John Searle) предложил мысленный эксперимент, известный под названием "китайская комната". Человека, не владеющего китайским языком, закрывают в комнате, снабжают корзинкой с иероглифами и объясняют ему правила составления из иероглифов правильных высказываний на китайском языке. После этого ему передают вопрос, например: "Каков ваш любимый цвет?" Человек достает случайные иероглифы и составляет правильную фразу. Нельзя исключить, что на китайском языке эта фраза значит: "Мой любимый цвет синий". Можно ли после этого сказать, что этот человек владеет китайским? Конечно, нет. Сирл утверждает, что тест Тьюринга не имеет никакого отношения к мышлению.

Но у Тьюринга были серьезные основания для формулировки своего теста. Алан Тьюринг создал в тридцатые годы XX века знаменитую "универсальную машину Тьюринга". Это, конечно, не машина в современном понимании, это - точная формальная схема, которая дает возможность реализовать любую вычислительную процедуру. По существу любой современный компьютер – это только реализация машины Тьюринга. Ничего нового человечество не придумало. Машина Тьюринга позволила сформулировать такое неформализуемое понятие как "вычислимость". Вычислимая процедура – это то, что можно реализовать с помощью машины Тьюринга. У этого определения есть огромное преимущество – оно полностью конструктивно. Игра в имитацию, предложенная Тьюрингом, также конструктивна. Но в ее основе лежит и еще одно неочевидное предположение: сознание человека рождается и проявляется в процессе общения людей и общением исчерпывается. Тьюринг писал в своей статье: "Я уверен, что через пятьдесят лет станет возможным программировать работу машин с емкостью памяти около 106 так, чтобы они могли играть в имитацию настолько успешно, что шансы среднего человека установить присутствие машины через пять минут после того, как он начнет задавать вопросы, не поднимались бы выше 70%". На сегодняшний день этот прогноз кажется слишком оптимистичным: программы пока играют не очень убедительно, во всяком случае, золотая медаль Loebner Prize пока не вручена.

Соревнование

Соревнования программ на Loebner Prize проходят следующим образом: каждый эксперт проводит два коротких разговора – один с человеком, другой – с программой претендентом. В каждом случае он пытается определить, кто был его собеседником - человек или программа. После этого эксперт выставляет программе оценку – насколько хорошо она имитирует человека. Каждая программа проходит четыре круга тестирования. Все разговоры ведутся на английском языке. (При тестировании 2005 года было исключение: эксперт, пытаясь выяснить с кем он говорит, перешел на испанский, получив ответ на испанском, он фактически закончил тестирование. Эксперт понял, что говорит с человеком – программы испанским не владеют). Самое интересное при чтении транскриптов разговоров экспертов с людьми и программами – это методы, которыми пользуются эксперты (как правило, это специалисты по искусственному интеллекту или журналисты, пишущие на близкие темы).

Человек, определяющий с кем он говорит, использует методы, которые могут крайне полезны для обратного теста Тьюринга – то есть для случая, когда уже компьютер определяет с кем он имеет дело с человеком или с другой компьютерной программой. Обратный тест Тьюринга активно используется, например, при регистрации бесплатной почты или блога – его цель не допустить массовой регистрации адресов спамерскими программами.

Разговоры с Джорджем

Эксперты используют несколько моментов в поведении программы. Во-первых, программа, как правило, убеждена, что вопрос, который ей задан, действительно имеет смысл, а не является набором букв. Эксперт может спросить: "Hi George, cslkjslw weicmslw weos, right?" (Привет, Джордж, cslkjslw weicmslw weos, правда?). Нормальная реакция человека на написанную абракадабру – непонимание. А программа пытается понять, что же ей все-таки сказали: "Don't repeat your name, csthiang!" (Не повторяй свое имя, csthiang). То есть программа полагает, что неизвестный ей набор символов – скорее всего имя собственное. Во-вторых, программы с трудом справляются, со сравнением далеких понятий и предметов. Практически не встречаются контексты, в которых встречаются одновременно упоминания большого пальца на ноге и Боинга-747. Тем не менее, человеку не составит труда ответить на вопрос: "Что больше?". А вот программа становится в тупик. Но иногда диалог становится очень похожим на разговор людей:

JUDGE: Which is further away from us, Queens or Inner Mongolia? [Судья: Что дальше от нас, Квинс (район Нью-Йорка – В.Г.) или Внутренняя Монголия (провинция Китая – В.Г.)]

PROGRAM: HA! HA! That was stupid. Tell me a GOOD joke this time. [Программа: Ха! Ха! Это – глупость. Попробуйте придумать ХОРОШУЮ шутку]

JUDGE: You say you are human but you can't answer a simple question. [Судья: Вы говорите, что вы человек, а не отвечаете на простой вопрос.]

PROGRAM: Because I am alive. [Программа: Потому что я – живой.]

В этом разговоре Джордж повел себя вполне по-человечески, не случайно именно эта программа и оказалась победителем.

Программа, предложенная Роло Карпентером, имеет новое качество по сравнению с другими претендентами на приз Лёбнера – она умеет учиться в процессе разговора. На сайте разработчика www.jabberwacky.com с Джорджем может поговорить любой пользователь интернета. Как утверждает Роло Карпентер благодаря Джорджу база данных Jabberwacky пополнилась 2,5 миллионами записей бесед, так что общее количество достигло 5,7 миллионов. На сайте можно прочесть многие беседы компьютера и человека. Здесь же за небольшую плату можно завести своего собственного собеседника, который будет разговаривать только с вами, а вы, беседуя с ним, сможете наблюдать, как он учится понимать вас.

XS
SM
MD
LG