Когнитивная лингвистика и искусственный интеллект: результаты и тенденции взаимодействия

А. А. Худяков, Е. М. Чухарев

В статье рассматриваются проблемы взаимодействия языкознания и теории искусственного интеллекта в контексте современной антропоцентрической парадигмы, составляющей основу когнитивной лингвистики. Показано, что адекватное распределение нагрузки между компьютером и человеком в антропоцентрической системе позволит повысить эффективность совместной работы автоматики и человеческого разума в решении актуальных лингвистических задач, не поддающихся формализации в рамках традиционного алгоцентрического подхода.

Когнитивная лингвистика, имея предметом своих забот массу частных проблем и реализуясь в достаточно гетерогенном множестве направлений и теорий, все же едина в признании методологических установок и наиболее общих принципов исследования. К числу таких установок и принципов относится, в частности и в особенности, антропоцентрический подход к языку, суть и основные черты которого слишком хорошо известны, чтобы вновь излагать их. Цель настоящей статьи состоит отнюдь не в том, чтобы еще раз указать на антропоцентризм как основу когнитивизма, а в том, чтобы вскрыть импликации антропоцентрической парадигмы для теории искусственного интеллекта [1], реализованной, в частности, в программном обеспечении современных компьютеров и овеществленной в компьютерных сетях разного масштаба и различной степени разветвленности. Для начала, однако, рассмотрим вопрос о соотношении лингвистики и информатики в плане их взаимозависимости или, лучше сказать, взаимополезности.

Компутационная лингвистика или лингвистическая информатика? Компутационная (= компьютерная, инженерная) лингвистика возникает как ответ на информационно-технологические вызовы современного общества и как реакция на внедрение принципиально новых способов манипуляции информационными ресурсами. Лингвистическая информатика — по сути, та часть компьютерной науки, которая отвечает за языковой аспект работы ЭВМ. Таким образом, обе рассматриваемые зоны знания имеют очевидные точки и даже области соприкосновения, различаясь при этом в рамках противопоставления «цель — средства»: компутационная лингвистика, являясь наукой о языке, хочет понять те свойства своего объекта, которые становятся явленными в свете новых технологических возможностей, открываемых компьютером. Последние, таким образом, рассматриваются как средство верификации лингвистических гипотез, как удобный инструмент обработки массивов языкового материала и как поле лингвистического эксперимента, которое имеет практически неограниченные возможности. Напротив, лингвистическая информатика интересуется естественным языком постольку, поскольку, во-первых, он является важнейшим средством получения, хранения, накопления и трансляции информации (важнейшим, но далеко не единственным — в круг интересов информатики входит также создание и передача информации в виде схем, графиков, статичных картинок типа фотографий, анимационных блоков вплоть до появившихся в самое последнее время так называемых Computer Generated Images (CGIs), представляющих собой электронные копии реальных людей, [стр. 94] как правило, известных актеров и актрис, которые «снимаются» в электронном кинематографе, часто не ведая об этом). Во-вторых, хотя бы минимальные знания о системном устройстве языка необходимы для создания языков программирования — на память приходят такие популярные уже лет 15 назад «бренды», как BASIC, ALGOL, FORTRAN и др., достоинства и недостатки которых широко обсуждались в средствах массовой информации, включая неспециализированные общенациональные газеты и телевидение. Наконец, немаловажной задачей лингвистической информатики является обеспечение связи между компьютером и пользователем, каковым выступает человек. Для человека же, как известно, наиболее приемлемый и простой способ общения — языковой. Именно поэтому специалисту-информатику приходится немало потрудиться с тем, чтобы симулировать появление у своего детища — персональной ЭВМ — некоего подобия естественно-языковой способности.

Итак, компутационная лингвистика смотрит на компьютер как на эффективное и удобное средство достижения своей основной цели — максимально полного и всестороннего изучения языка во всех его ипостасях и формах. Лингвистическая информатика смотрит на язык как на средство оптимизации диалога между человеком и компьютером, между человеком и человеком посредством компьютера, а также как на своего рода модель, по образу и подобию которой можно создавать существенную часть программного обеспечения. Несмотря на отмеченную разнонаправленность целевых векторов компутационной лингвистики и лингвистической информатики, эти направления отнюдь не являются антагонистичными. По сути, они дополняют друг друга, обеспечивая синергетический (взаимно усиливающий) эффект при решении обществом информационных задач. Как будет показано ниже, наиболее эффективным для компьютерных наук оказывается тот подход к языку, который осуществляется когнитивной лингвистикой с ее подчеркнутым вниманием к антропогенному фактору. Вначале, однако, надлежит сказать несколько слов об историческом фоне, на котором появилась и делала первые шаги компутационная лингвистика.

Восходящее к Ф. де Соссюру представление о языке как о системном механизме, функционирование которого проявляется в речевой деятельности его носителей и подчиняется определенным закономерностям, ввело лингвистику в своего рода «семиотический цикл» дисциплин, к которому принадлежит также и математика и классическая аристотелевская логика. Взаимодействие языкознания и математики имеет богатую и во многом противоречивую историческую традицию. Задача построения формальной математической модели языка и речи на протяжении десятилетий занимала и занимает умы многих исследователей.

В 50-х годах XX века в связи с назревшей в языкознании потребностью уточнения его основных понятий возникает математическая лингвистика, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Центральное место в современной математической лингвистике принадлежит теории формальных грамматик, основанной на работах Н. Хомского.

В начале 60-х годов в связи с бурным развитием информационных технологий и ростом производительности вычислительных систем формируется новое научное направление — компутационная лингвистика. Это является вполне закономерным: сам факт, что бóльшая часть информации, накопленной обществом к настоящему времени и продолжающей аккумулироваться, представлена в языковом виде, наводит на мысль о близости сфер интересов лингвистики и информатики. С одной стороны, довольно заманчива идея использовать компьютер для решения лингвистических задач (индексирование, реферирование, аннотирование, перевод, обработка текста, установление авторства, формирование репрезентативных корпусов и проч.); с другой — очевидно, что без должного лингвистического обеспечения современные информационные системы и технологии зайдут в тупик и не смогут помогать человеку справляться с колоссальным потоком информации.

Компутационная лингвистика на протяжении вот уже полувека с переменным успехом пытается разработать алгоритмы автоматического понимания текста. Возникающая здесь фундаментальная проблема заключается в алгоцентрическом характере систем обработки лингвистической информации: их центральным понятием является алгоритм — формально определенная заранее заданная последовательность действий, которые преобразуют исходные данные в конечный результат решения поставленной задачи. Человеку при этом отводится роль стороннего наблюдателя, ожидающего получить на выходе алгоритма готовый результат вычислений. Как известно, никакой алгоритм не может работать с неформализованными данными; язык же, а тем более — речь, [стр. 95] формализуемы лишь на поверхностном уровне. Задача анализа речевых высказываний, достаточно глубокого для понимания их смысла, до сих пор не решена формально.

Современное когнитивное направление лингвистики, в рамках которого язык рассматривается как одна из ментальных способностей человека наряду с памятью, интуицией и проч., вообще отрицает применимость формального логико-математического аппарата к глубокому описанию и изучению языка и речи. Так, приводятся убедительные доказательства алогичности человеческого мышления вообще и языка как его отражения в частности [Худяков 2003]. Происходит отказ от классической платоновско-аристотелевской модели категоризации в пользу альтернативной прототипической модели. Аналогичные мысли высказываются и в зарубежных исследованиях [Winograd 1972; Winograd 1977; Johnson-Laird 1983; Winograd 1983; Johnson-Laird 1988; Виноград, Флорес 1995]. В чем же конкретно проявляются слабые стороны алгоцентрического подхода к языку и почему компутационная лингвистика, в основу которой положен этот подход, весьма ограничена в способности решать стоящие перед ней задачи?

Чтобы лучше представить себе проблемы, связанные с автоматическим пониманием текста, остановимся на описании общих принципов работы современного лингвистического автомата, функционирующего исключительно на основе заранее заданного алгоритма.

Алгоцентрическая модель в современном лингвистическом автомате. Компьютерный анализ текста на естественном языке активно развивается в последние годы многими коллективами. Доступные сегодня вычислительные мощности позволяют применять для обработки больших массивов документов широкий класс математических методов, способствующих эффективному решению задач поиска, классификации, кластерного анализа, выявления скрытых закономерностей в данных и др. Широкое практическое применение находят такие приложения автоматической обработки текста, как:

информационно-поисковые системы;
нтерфейсные системы на естественном языке;
системы машинного перевода.

Информационно-поисковая система (ИПС) осуществляет поиск информации в некотором банке данных по вводимым пользователем ключевым словам. Задача системы — выдать пользователю документы, наиболее релевантные сформулированному поисковому запросу. Релевантность определяется как частотность заданных ключевых слов в тексте документа.

После того, как была решена первоочередная задача реализации оптимальных алгоритмов индексации документов и быстрого поиска в базе, разработчики ИПС стали стремиться к упрощению взаимодействия с системой пользователя-неспециалиста. Прежде всего это коснулось языка поисковых запросов: в идеале, пользователь должен формулировать запрос в виде предложения или словосочетания на естественном языке и получать в ответ репрезентативную и релевантную выборку документов. Для достижения этой цели требовалось решить задачу идентификации различных словоформ одной лексемы, т. к. очевидно, что ключевые слова могут встречаться в запросе и тексте документа в разных грамматических формах. Это требовало привлечения алгоритмов морфологического анализа, которые по положенным в их основу принципам можно разделить на стемминг и лемматизацию.

Суть метода стемминга заключается в выделении неизменяемой основы слова при помощи набора формальных правил. Это позволяет квалифицировать различные словоформы как принадлежащие одной лексеме, решая таким образом описанную выше проблему ИПС.

Стемминг хорошо работает на некоторых языках агглютинативного типа (например, тюркских), а также флективно-аналитического подтипа (например, английском) — за счет упорядоченности словоизменительной морфологии в первом случае и ее крайней скудости — во втором. Так, стемминг достаточно качественно определяет основы английских слов, отсекая суффиксы -ing, -(e)s, -ed.

Попытки применить метод стемминга к анализу флективно-синтетических языков, к каковым относятся русский и немецкий, успехом не увенчались. Выделить правила, по которым можно отсечь часть русского слова справа и не породить при этом сильного шума (высокого процента неверно обработанных слов), очень сложно. Например, можно сформулировать правило, на основании которого словоформа, оканчивающаяся на ать, будет считаться инфинитивом глагола, основа которого получается путем отбрасывания форманта -ть. Легко видеть, что данное правило будет часто ошибаться. Так, в слове кровать оно распознает инфинитив глагола, спрягаемого, очевидно, как *я кроваю, *ты кроваешь, *он кровает.

[стр. 96] Богатая словоизменительная морфология требует применения иного подхода к морфологическому анализу, заключающегося в использовании словарей и парадигм словоизменения. Такой подход получил название лемматизации, реализация его более трудоемка, но, тем не менее, оправданна: алгоритмы лемматизации, во-первых, хорошо работают на языках всех типов, а во-вторых, позволяют определять не только формальную основу, но и начальную словарную форму (лемму) и грамматические признаки (граммемы) словоформы. Основным ограничением метода лемматизации является принципиальная неполнота объема подключаемого словаря.

Для синтетических языков задача лемматизации почти всегда решается неоднозначно ввиду хаотичной морфологической омонимии, устранить которую на этапе морфологического анализа можно лишь в исключительных случаях по ближайшему контексту словоформы (например, когда существительному непосредственно предшествует предлог). Как правило, омонимия остается неразрешенной до следующих этапов анализа текста. Например, в предложении: (1) Женщина мыла оконное стекло. все словоформы, кроме первой, будут представлены рядом морфологических омонимов. Так, слово мыла может быть квалифицировано либо как форма прошедшего времени глагола мыть, либо как форма родительного падежа существительного мыло.

Вообще, задача морфологического анализа на сегодняшний день может считаться формально решенной. Разработаны быстрые и надежные алгоритмы, практически используемые в лингвистических автоматах.

Поскольку стемминг строит эвристические догадки относительно формальной основы и флексии в слове, он не выделяет никакой содержательной информации, релевантной для дальнейшего лингвистического анализа текста. Лемматизация, напротив, выдает структуру «лемма + граммемы», пригодную для последующей обработки на более глубоком уровне — синтаксическом. В большинстве современных ИПС не требуется анализ синтаксической структуры поискового запроса. Однако в ряде других приложений лингвистических алгоритмов синтаксический анализ совершенно необходим. Таковы, например, системы автоматического машинного перевода связного текста с одного языка на другой.

Формальной целью синтаксического разбора (парсинга) является построение дерева зависимостей между словами во фразе. В случае удачи предложение сворачивается в связное дерево с единственным корневым узлом. В лингвистической традиции синтаксис как раздел грамматики делится на синтаксис предложений и синтаксис словосочетаний. Соответственно этому, синтаксический анализ осуществляется в двух встречных направлениях. С одной стороны, исходное предложение делится на клаузы или фрагменты, обладающие предикативностью (фрагментационный анализ), с другой — внутри предложения происходит поиск синтаксических групп (словосочетаний), каждая лексема в которых имеет определенную синтаксическую интерпретацию.

В синтаксическом анализе обычно используются наборы формальных правил, аналогичных правилам трансформационно-генеративной грамматики Н.Хомского. Порядок применения правил задается алгоритмом разбора, который на каждом шаге проверяет возможность применения следующего правила к очередному фрагменту фразы (двум-трем словам, знакам препинания и т. п.). В случае удачи фрагмент сворачивается. Обычно это приводит к его замене одним главным словом, т. е. удалением зависимых слов, после чего разбор продолжается. Если дальнейшее применение правил невозможно, на любом из шагов происходит возврат к предыдущему шагу. При этом последний свернутый фрагмент восстанавливается, и предпринимается попытка применить другие правила. Окончательным вариантом разбора считается такая последовательность применения правил, которая приводит к максимальной свертке предложения, что соответствует наибольшему количеству правильных синтаксических связей в нем.

Анализатор порождает множество гипотез относительно синтаксической структуры разбираемого предложения. Так, в приведенном выше примере (1) может быть построено восемь различных гипотез, включая такую: «(кто?) Женщина (чего?) мыла (что?) оконное (что сделало?) стекло». Семантика данной гипотезы может быть эксплицирована примерно следующим образом: «Женщина, принадлежащая мылу, имеет некоторое отношение к событию, когда нечто оконное стекло вниз». При всей абсурдности такой трактовки с точки зрения здравого смысла лингвистический автомат вынужден рассматривать ее наряду с остальными. После сопоставления данной гипотезы с другими она будет отбракована на том основании, что в ней меньше правильных синтаксических связей. Так, отсутствует какая-либо связь между двумя частями предложения: «женщина (чего?) мыла» и «оконное (что сделало?) стекло».

[стр. 97] Как видно, явление морфологической омонимии весьма негативно отражается на скорости работы программы синтаксического анализа. На «длинных» предложениях количество комбинаторных вариантов иногда достигает нескольких сотен, поэтому используются разного рода математические и лингвистические ухищрения, позволяющие избежать анализа всех комбинаторно возможных вариантов. Так, синтаксический анализ может частично уничтожить морфологическую омонимию, принимая во внимание уже не только ближайший контекст словоформы, но и всю клаузу или все предложение.

Практические реализации модулей синтаксического анализа в составе систем машинного перевода зачастую оставляют желать много лучшего. В частности, вследствие недоработок в синтаксическом анализаторе система «Сократ Персональный 4.1» (2001 год выпуска) [2] переводит предложение (1) следующим образом: The Woman of the soap windowpane. Тем не менее, большинство машинных переводчиков вполне корректно выполняют синтаксический разбор и дают адекватный перевод данного конкретного предложения. Однако не все случаи синтаксической омонимии могут быть разрешены путем простого комбинаторного перебора и подсчета числа правильных синтаксических связей.

Рассмотрим, к примеру, две синтаксически эквивалентные фразы: (2) Человек стрелял из ружья. и (3) Человек стрелял из окна. Легко заметить, что в примере (2) ружье является аргументом глагола-предиката стрелять в роли косвенного дополнения, а окно в примере (3) есть обстоятельство места, являющееся дополнительной характеристикой всей ситуации в целом (детерминантом). Роли ружья и окна в описываемых ситуациях, таким образом, кардинально различаются. Такое различие может оказаться релевантным для понимания текста и его адекватного перевода.

Последствия ошибок в интерпретации синтаксических ролей слов и словосочетаний в предложении можно проиллюстрировать следующим примером. Предложение (4) На месте пожара был обнаружен мертвым пожилой сторож. однозначно будет воспринято любым носителем русского языка как «Некто обнаружил на месте пожара пожилого сторожа. Сторож был мертв». Однако синтаксическому анализатору ничто не помешает квалифицировать слово мертвым как агентивное дополнение при страдательном причастии обнаружен и интерпретировать предложение в том смысле, что сторожа на месте пожара нашел некий мертвец. В результате система машинного перевода, опирающаяся на синтаксическую структуру, вполне может выдать что-нибудь вроде *An elderly guard was found on the place of fire by a dead man.

Как было сказано выше, синтаксический анализ изначально разрабатывался в рамках исследований по автоматическому машинному переводу. Целесообразность проведения парсинга при создании ИПС остается дискуссионной, и большинство разработчиков на настоящий момент склонны от него отказываться. В отличие от морфологического, синтаксический анализ работает далеко не безошибочно. Современные анализаторы плохо справляются с предложениями, не отвечающими «классической» аристотелевской структуре «S есть P» (эмоционально-экспрессивные, коллоквиальные, художественные и проч. конструкции).

Для решения проблемы синтаксической омонимии в большинстве случаев необходим более глубокий анализ, строящий пропозициональную модель предложения. Основу семантического описания языка для нужд инженерной лингвистики составляют системы синтагматических и парадигматических отношений между лексемами.

Модель синтагматики — толково-комбинаторный словарь — призвана описать ограничения на сочетаемость лексических единиц в определенных синтаксических ролях. Так, в рассмотренных выше примерах (2) и (3) такой словарь, с одной стороны, должен декларировать, что аргумент предиката стрелять, представляющий орудие действия, относится к классу «оружие», а с другой — установить все слова, относимые к этому классу: ружье, пистолет, рогатка и др. Применение толково-комбинаторного словаря способно оказать неоценимую помощь в разрешении синтаксической омонимии. Однако, помимо колоссального объема необходимого ручного труда, разработку подобного словаря усложняет отсутствие достаточно полной, формализованной и устоявшейся системы классификации типов синтагматических отношений (например, базиса лексических функций). Вследствие этого на сегодняшний день неизвестны хоть сколько-нибудь полные [стр. 98] описания какого-либо из языков, пригодные для задач компьютерного анализа текста.

Второй тип описания семантических отношений — тезаурус — представляет иерархическую классификацию лексики в рамках парадигматических рядов. Тезаурус языка представляет многоуровневый тематический словарь-классификатор по устоявшимся отраслям знаний, отражающий несколько видов известных парадигматических отношений между словами (синонимические, гипо-гиперонимические и т. п.).

В настоящее время предложено несколько теорий компьютерной семантики, как правило, сочетающих синтагматический и парадигматический подход к формализации семантических отношений. Так, в рамках концепции Н. Н. Леонтьевой смысл текста выражается семантическим графом, в узлах которого стоят леммы отдельных слов или единицы, равные по объему словам. Под семантикой понимается комплекс алгоритмов, устанавливающих с привлечением смысла слов и выражений те семантические отношения (отношения на семантическом графе), которые не вычисляются напрямую из синтаксических. Семантическим узлом считается такой объект текстовой семантики, у которого заполнены все валентности, как эксплицитно выраженные в тексте, так и имплицитные (получаемые из экстралингвистических источников). Семантические узлы образуются из слов исходного предложения. Основным источником гипотез о составе семантических узлов является синтаксический анализ [Леонтьева 1990].

Семантическая концепция Н. Н. Леонтьевой была реализована в проекте системы машинного перевода «Диалинг» в модуле анализа русского текста. Семантический анализатор в понимании инженерной лингвистики является не более чем «довеском» к традиционному синтаксическому, и его роль в системах автоматической обработки текста нельзя преувеличивать. По оценке разработчиков системы, актуальность семантического анализатора составляет не более 10–20% [Сокирко 2001].

Еще одна попытка совершить прорыв в области автоматического анализа семантики текста принадлежит В. А. Тузову, который в своих исследованиях по функциональной компьютерной семантике стремится к «построению формального семантического языка и двухстороннему переводу с семантического языка на естественный». Под семантикой слова в данной концепции понимается некоторая функция f(x₁,x₂,...,x_n), а предложение есть не что иное, как «единая законченная суперпозиция функций. Т. е. предложение это выражение — в математическом смысле этого слова. <...> Смысл предложения вычисляется в процессе построения и выполнения суперпозиции.» [Тузов 2001].

Поскольку утверждается строго математическая выводимость «смысла предложения» из семантики его конституентов, очевидно, речь идет не о смысле, а о значении предложения как знака онтологической ситуации. Происходит подмена понятий: теория компьютерной семантики претендует на построение алгоритмов вычисления смысла высказывания, хотя на самом деле остается в границах анализа системного значения сентенционального знака.

Как указывает Г. Дерновой, один из программистов, реализующих практические приложения теории В. А. Тузова, в ходе экспериментов «стало понятно, что в том виде, в каком была предложена теория, использовать ее нельзя. Классическая лингвистика близка к философии и далека от строгости математики.» Тузову «пришлось значительно расширить и уточнить базис языка, описания, придав всей работе вид нормальной математической теории, благодаря чему появилась возможность практического использования знания о языке в программах.» [Дерновой 2002]. Казалось бы, промежуточная цель достигнута, и лингвистическим автоматом наконец-то будет построена по крайней мере поверхностная семантическая структура текста. Однако в конце цитируемой публикации Г.«Дерновой замечает, что разрабатываемая при его участии поисковая система «Алхимик» пока «не способна создать полное смысловое описание текста <...> оперирует только поверхностным описанием слов и не может со стопроцентной точностью вычислять смысл сложных языковых конструкций» [Дерновой 2002]. Таким образом, даже задача анализа значения предложения пока не может считаться решенной.

Первичная семантика в ее компьютером варианте дает ответы далеко не на все вопросы. Рассмотрим следующий пример: (5) В 1999 году в ФРГ переехало 95 тысяч этнических немцев. Как замечает Л. Л. Иомдин, это предложение вполне может быть понято компьютером так, как будто все эти люди были задавлены автомобилями: *In 1999 in the Federal Republic of Germany 95 thousand ethnic Germans were run over. «Как ни невероятно это звучит, интерпретация абсолютно законна, поскольку все мыслимые лексические и синтаксические условия для нее полностью соблюдены. [стр. 99] Человек, конечно, не примет такой интерпретации и скажет, во-первых, что мир не так плох, чтобы столько народу погибло под колесами за один год, во-вторых, что погибших не стали бы характеризовать по национальной принадлежности, наконец, что слово «переехать» слишком разговорно, чтобы его применяло солидное агентство новостей. Но попробуйте все это формализовать!» [Иомдин 2002].

Приведем еще один образчик работы машинного переводчика, демонстрирующий несовершенство семантических моделей. Дана следующая фраза: (6) Thousands of fans gathered in the Red Square of Moscow. Перевод, выполненный системой «Сократ Персональный 4.1», в комментариях не нуждается: Тысячи вентиляторов собирались в Красном Квадрате Москвы.

Итак, мы показали, что пределом возможностей алгоритмов автоматического понимания текста является первичный семантический анализ, строящий пропозициональную модель предложения. Адекватность семантической структуры зависит от целого ряда собственно языковых и экстралингвистических факторов и часто оставляет желать лучшего. Об автоматическом понимании смысла высказывания не идет и речи.

Невозможным на сегодняшний день является даже вычисление узуального смысла предложения, который, по А. А. Худякову, «будучи производным от системно закрепленных языковых значений предложения — языкового знака <...>, является относительно стабильным, прогнозируемым с высокой степенью вероятности и потому потенциально поддающимся исчислению» [Худяков 2000: 170]. Окказиональный смысл, понимание которого совершенно необходимо для адекватного перевода на другой язык, и вовсе «является вариабельным, трудно уловимым, ускользающим от аналитических процедур, уникальным для каждого отдельного акта речи» [Худяков 2000: 172], а потому он не сводим к математической модели.

Семиозис (конструирование значений и смыслов) и процесс, обратный ему (рецепция речи), имеют творческих характер, их конечный результат напрямую не выводим из исходных данных. В случае же лингвистического автомата, «какой бы длинной ни была цепочка лингвистического поиска, выдаваемая речевая реакция потенциально присутствует уже с момента получения автоматом сигнала, стимулировавшего данное целеполагание и поиск. Эта речевая реакция, напоминающая поведение душевнобольного со систематизированным бредом, не может иметь альтернатив, поскольку в современном лингвистическом автомате отсутствует аналог коммуникативно-прагматического оператора» [Пиотровский 1999: 168].

Это затруднение принципиально непреодолимо в рамках компутационной лингвистики в том виде, в котором она существует на настоящий момент, поскольку оно обусловлено попыткой подчинить большее меньшему, создать модель, превосходящую по сложности моделируемый объект. Язык как первичная знаковая система, существующая в неразрывной связи с другими когнитивными способностями человека и занимающая метаположение по отношению к любым иным, искусственным системам, описывающая, объясняющая и изучающая их, сама не может быть описана или изучена посредством этих последних.

Обобщая сорокалетний опыт разработки и эксплуатации систем автоматического понимания текста, Р. Г. Пиотровский констатирует: «удовлетворяющие массового потребителя результаты можно получить только при условии предварительной адаптации текста на естественном языке к искусственному языку-исчислению компьютера. Коллективы, использующие «алгебраическую» стратегию, пытаются решить эту задачу путем ручного предредактирования. Такой подход оправдывает себя лишь при демонстрации работы алгоритма на небольших отрезках текста.» [Пиотровский 1999: 162].

Антропоцентризм: сущность и перспективы. В предыдущей части статьи были сделаны неутешительные выводы относительно перспектив алгоцентрического подхода к моделированию языка и речи. Однако из этого не следует, что взаимодействие лингвистики и информатики обречено на неудачу. Напротив, оно жизненно необходимо для существования и развития информационного общества, которое уже сегодня не может обходиться без вычислительных мощностей и интеллектуальной телекоммуникационной инфраструктуры.

Знаковым явлением в этом плане стало зарождение и развитие глобальных распределенных информационных сетей, объединенных в консорциум Интернет. Невиданный ранее объем информации, к которой получает доступ человек, остро ставит вопрос об оптимизации процессов ее получения, накопления, обработки и передачи. Поскольку, как уже указывалось, подавляющее [стр. 100] большинство данных представлено в языковой форме, в решении этого вопроса одну из главных ролей суждено играть лингвистике.

Можно прогнозировать, что ведущая роль в продуктивном общественно полезном взаимодействии двух научных дисциплин — языкознания и информатики — будет отведена созданию антропоцентрических структур и систем, в основу которых (по контрасту с алгоцентрическими системами) полагается ориентация в качестве «решателя» задач на человеческий мозг, а не на компьютер.

Применение антропоцентрического подхода оказывается в высшей степени оправданным и продуктивным во многих приложениях компьютерной лингвистики. Так, глобальная ИПС «Google» (www.google.com) занимает лидирующее место в мире именно благодаря привлечению человеческого ресурса к оценке релевантности документов поисковым запросам. Такое решение оказалось наиболее эффективной мерой защиты от спама (информационного шума). Под спамом здесь понимается недобросовестная практика подготовки специальных документов, призванных обмануть поисковые системы. Такие документы, как правило, содержат в больших количествах определенные ключевые слова и потому формально являются релевантными соответствующим запросам, однако фактически не представляют адекватного интереса для читателя. В простейшем случае это обычный документ, в конец которого добавляется многократно повторенная фраза, включающая требуемые слова. Тривиальные случаи спама, подобные только что описанному, легко отслеживаются лингвистическими алгоритмами современных ИПС, однако зачастую машина оказывается бессильна против изощренной фантазии владельцев Интернет-ресурсов, стремящихся путем спама повысить посещаемость своих сайтов. Предложенная разработчиками «Google» система «PageRank» при оценке релевантности того или иного документа учитывает не только результаты автоматической обработки его содержания, но и мнение посетителей данного ресурса. Сбор данных от информантов обеспечивает интеллектуальная панель «GoogleBar», встраиваемая в веб-браузеры пользователей Интернета. Кроме того, учитывается так называемый «индекс цитирования», т. е. количество ссылок на данный гипертекстовый документ из других документов (об этом подробнее см. ниже).

Еще одним значимым феноменом является компьютерно-опосредованная коммуникация. Уступая человеку по праву принадлежащее ему центральное место в информационной структуре, антропоцентрические системы оказывают активное преобразующее воздействие на его когнитивную деятельность. С одной стороны, компьютер как инструмент познания играет активную трансформирующую роль в концептуализации действительности, с другой — электронные средства, занимая все более ощутимое место в структуре коммуникации, оказывают заметное влияние на характер дискурса. Изучение компьютерно-опосредованной коммуникации в дискурсивно-прагматическом и когнитивном аспектах, вероятно, позволит дать мотивированные рекомендации по ее оптимизации и реализовать их практически в соответствующих программных средствах. Более того, результаты таких исследований могут иметь высокую теоретическую значимость для коммуникативной лингвистики.

Обратимся теперь к рассмотрению реализации антропоцентрического подхода в реально действующих информационных системах на примере гипертекстов.

Гипертекст как антропоцентрическая система. Визуальная манифестирующая субстанция (бумага), безусловно, по сравнению со звуковой является шагом вперед в области хранения и передачи информации [стр. 101], однако она хорошо приспособлена лишь для представления двухмерного информационного потока: линейного и иерархического. Мы читаем последовательно слева направо, сверху вниз, переворачиваем страницы. Иными словами, линейные синтагматические ограничения устной формы речи в целом не снимаются в речи письменной.

Вопрос соотношения ментального субстрата и его языковых манифестаций неоднократно поднимался в лингвистических исследованиях. Различные теории порождения речи объединены постулатом о нелинейном, многомерном характере исходных гносеологических структур, служащих источником речевых высказываний. Соответственно, возникает необходимость в дополнительных процедурах взаимного перехода между объемными и линейными сущностями. Так, при формировании высказывания происходит линеаризация глубинной объемной структуры, а при его восприятии — обратный процесс разворачивания линейного информационного потока в многомерное представление.

В данных условиях вполне естественным оказывается стремление человека к нейтрализации ограничений линейного представления информации. В литературе, особенно справочной и научной, выработаны конвенции, использование которых в некоторой степени преодолевает линейность текста. В основном, это различного рода ссылки (связи), соединяющие ключевые слова с соответствующими информационными блоками. Можно выделить три типа таких ссылок, используемых в книгоиздательской практике:

предметный указатель;
библиографические ссылки;
сноски.

Предметный указатель существенно облегчает чтение научной литературы. Столкнувшись с некоторым незнакомым термином в тексте, мы можем открыть указатель и по приведенной там ссылке найти дефиницию интересующего нас термина. Само вхождение данного термина в тексте книги при этом не содержит формально выраженных указаний на то, что в другом месте издания имеется более подробная информация о нем. Иными словами, ссылка в тексте присутствует скрыто, имплицитно. В отличие от этого, в библиографических ссылках и сносках факт наличия ассоциативной связи с иным текстом эксплицирован.

В отдельных типах изданий используется сложный механизм перекрестных ссылок. Например, в так называемых Study Bibles это ссылки между текстом Писания, комментариями к нему и прочими справочными материалами. Однако, во-первых, подобные системы ссылок не стандартизированы, а во-вторых, их использование представляет собой достаточно трудоемкий и далеко не интуитивно-понятный процесс, требующий от читателя предварительного обучения и повышенной концентрации внимания.

Компьютерные технологии позволили обобщить и развить идею сносок, вывести ее на качественно новый уровень — уровень гипертекстовых структур. Термин гипертекст (hypertext) был предложен Т. Нельсоном в 1965 году «для описания документов (например, представляемых компьютером), которые выражают нелинейную структуру идей, в противоположность линейной структуре традиционных книг, фильмов и речи. Более поздний термин гипермедиа близок к нему по смыслу, но он подчеркивает наличие в гипертексте нетекстовых компонентов, таких как анимация, записанный звук и видео» [Microsoft Press 1995]. Техническая реализация гипертекстовой структуры получила название гипертекстовой системы (hypertext system).

Как справедливо отмечает В. Л. Эпштейн, «в течение последних нескольких лет «гипертекст« превратился в популярную тему многих конференций по информатике, научно-технической информации, искусственному интеллекту, лингвистике, психологии и теории обучения. Интерес вызывает принципиально нелинейная организация информационных единиц, которые могут быть представлены текстом, аудио- и видеоинформацией, дружелюбная и гибкая форма нелинейного управления этими единицами в гипертекстовой системе.» [Эпштейн 2000].

Наиболее распространенной гипертекстовой системой является один из самых популярных компонентов сети Интернет — так называемая Всемирная паутина. Всемирная паутина представляет собой децентрализованное хранилище всевозможных информационных ресурсов, для просмотра которых используется специальное программное обеспечение — обозреватель, или браузер. При работе с браузером на экране монитора читатель (пользователь) видит интересующий его текст, как правило, со статичными иллюстрациями или анимированными вставками. Внутри текста отдельные ключевые слова или словосочетания особым образом выделяются (подсвечиваются), и при их активации (например, с помощью манипулятора «мышь») на экран вызывается новый гипертекстовый документ, содержащий сведения, ассоциативно связанные с указанным ключевым словом.

Можно утверждать, что высокая популярность и эффективность гипертекстовых систем обусловлена следующими причинами:

объемное представление информации, релевантное ментальному субстрату когниции;
антропоцентричность;
наличие интуитивно-понятного инструментария для конструирования гипертекстов и навигации в гиперпространстве.

Остановимся подробнее на обозначенных пунктах.

Объемное представление информации является очень важной особенностью гипертекстовых систем, выгодно отличающей их от традиционных линейных текстов. Гипертекст содержит сеть узлов (фрагментов, модулей, фреймов) и заданные на них ассоциативные связи, порождает объемное, трехмерное информационное пространство, создавая таким образом информационную среду, адекватную глубинным механизмам переработки информации человеческим мозгом.

[стр. 102] Информация в гипертекстовой системе структурируется в виде графа, в вершинах (узлах) которого находятся информационные единицы, содержащие сведения, потенциально интересные для читателя. Данные информационные единицы, как правило, объективируются в виде гипертекстовых документов. Дуги графа представляют структурные и семантические отношения, связывающие информационное содержание узлов. Нужно заметить, что исследование связей между информационными единицами гипертекста может иметь для читателя не меньшую ценность, чем информация, содержащаяся собственно в узлах графа. Таким образом, структурно гипертекстовая система в определенной степени адекватна семантическим сетям — одному из современных представлений о хранении знаний в памяти человека, где «каждый узел мыслится как представляющий, или репрезентирующий определенный концепт <...> Любой узел может быть связан с любым количеством других узлов.» [Кубрякова и др. 1996: 169].

Антропоцентричность отличает гипертекст от систем обработки информации и знаний, а также информационно-поисковых систем, центральным понятием которых является алгоритм (см. выше). Напротив, центральным понятием гипертекстовых систем является навигация в гиперпространстве, образованном множеством узлов и дуг гипертекста. Под навигацией имеется в виду интерактивно управляемый читателем (пользователем) процесс перемещения из одних узлов в другие. При этом — в отличие от алгоцентрических систем — не предъявляется никаких специальных требований к структурированию или формализации представления информации. Репрезентация сведений и методы навигации в гипертекстовых системах ориентируются не на компьютер, а на мозг человека.

Специальный инструментарий оказывается необходимым для создания (authoring) гипертекста, с одной стороны, и для его восприятия в процессе ассоциативной навигации, с другой, поскольку конструирование и перцепция гипертекста являются нелинейной (непоследовательной) деятельностью. Такие инструментальные средства, как правило, являются удобными и интуитивно-понятными, поскольку изначально метафора гипертекста ориентирована на когнитивные особенности человеческого мозга.

Психолог Ф. Галаш на конференции по гипертекстам в 1987 году указал на следующие перспективные направления развития гипертекстовых систем:

улучшенные средства поиска;
возможность определения композитов (наборов узлов и связей);
виртуальные (динамические) структуры;
вычисления в гипермедийных сетях;
управление версиями документов (versioning);
поддержка групповой работы;
расширяемость и настраиваемость [Halasz 1988].

Большинство перечисленных идей в настоящее время уже воплощены в жизнь. Интерактивность гипертекста — одно из его свойств, подвергающихся планомерному развитию.

Справедливости ради нужно заметить, что помимо несомненных преимуществ гипертекст обладает рядом существенных недостатков, среди которых низкая наглядность, неочевидность структуры, плохая запоминаемость пройденной в ходе ассоциативной навигации последовательности ссылок и проч. Как правило, основной результат сколько-нибудь длительной работы со сложным гипертекстом — ощущение, что ты «потерялся», и желание вернуться к началу пути. Как известно из психологии, средний человек с трудом запоминает иерархические структуры с уровнем вложенности более трех, а этим количеством уровней никогда не удается обойтись при создании крупных структур данных.

Как было сказано выше, центральным понятием гипертекстовой системы является навигация в информационном пространстве. Навигация представляет собой форму деятельности человека, поэтому закономерно поставить вопрос о лингвистическом статусе гипертекста в ракурсе деятельностно-ориентированного подхода, а именно, теории речевых актов Дж. Остина. В рамках данной концепции разрабатываются понятия иллокутивной силы и перлокутивного эффекта высказывания. Как известно, под иллокутивной силой понимается коммуникативное намерение говорящего, под перлокутивным эффектом — поведенческая реакция адресата речи, на которую рассчитан речевой акт. Для именования собственно речевого акта используется термин локуция. Первоначальная ориентация теории на анализ и классификацию перформативных высказываний закономерно сменилась попытками выявить механизм кодирования иллокутивных сил в косвенных речевых актах.

На первый взгляд, теория речевых актов неприложима к описанию деятельности человека в ходе навигации в гипертекстовой системе. И действительно, обычно пользователь, осуществляя [стр. 103] переходы по ссылкам, не порождает оригинальных речевых высказываний. Однако можно заметить, что высказывания в форме оригинальных «правильных» предложений также не порождаются участниками таких распространенных форм коммуникации, как эхолалические диалоги (Вы хорошо себя чувствуете? — Хорошо себя чувствую.), заполнение всевозможных анкет (Отношение к рок-музыке: положительное, отрицательное, нейтральное — нужное подчеркнуть.), ответы на общие вопросы (Вы подтверждаете, что видели подсудимого на месте преступления, да или нет?). Это обстоятельство не мешает нам рассматривать деятельность коммуникантов в обозначенных ситуациях как косвенные речевые акты, поскольку при перефразировке такого рода неполноценных высказываний остается возможной экспликация иллокутивной силы перформативным глаголом: Я сообщаю, что хорошо себя чувствую. Я оцениваю свое отношение к рок-музыке как нейтральное. Я подтверждаю, что видел подсудимого на месте преступления. Также очевидно, что приведенные высказывания направлены на достижение некоторого вполне определенного перлокутивного эффекта.

Если это так, то нам ничто не мешает рассматривать деятельность, связанную с навигацией в гипертексте, в рамках теории речевых актов. Переход по ссылке можно считать продуцированием высказывания, обладающего иллокутивной силой запроса (требования) информации, ассоциативно связанной с ключевым словом, а также, возможно, иллокутивной силой констатации факта заинтересованности в соответствующей теме.

Переходы по ссылкам оказываются в высшей степени информативными для авторов ресурсов. Изучая пути навигации читателей по узлам в гипертекстовом пространстве, можно сделать выводы о составе и преференциях читательской аудитории, прагматической ценности информационных ресурсов и проч. Обобщая опыт разработчиков коммерческого программного обеспечения, С. В. Жарков пишет: «разработчику обязательно нужно иметь доступ к детальной статистике посещений своего сайта (узла Всемирной паутины. — А. Х., Е. Ч.), сгруппированной и отсортированной по различным параметрам: дате, времени, стране (откуда пришел пользователь), ссылкам (т. н. referrer, т. е. информация о том, со ссылок на каких сайтах приходят посетители), объеме трафика и т. д. Это позволяет <...> оценить эффективность своих действий по продвижению программы и сайта: например, из каких стран больше всего ходят пользователи на сайт; какие интернет-архивы программного обеспечения приводят на сайт пользователей; как изменилась динамика посещений после выхода новой версии программы и т. п.» [Жарков 2002: 219].

В ряде случаев акты навигации могут обладать иными иллокутивными силами и достигать иных перлокутивных эффектов. Например, если перед началом работы с некоторым информационным ресурсом пользователю предъявляется текст лицензионного соглашения (публичной оферты, описывающей условия использования материалов данного узла), то переход по ссылке «I agree» («Я согласен») есть по сути перформативный речевой акт, влекущий за собой юридические последствия - акцепт и вступление в силу положений оферты. Также в качестве примера можно рассмотреть чрезвычайно распространенные сегодня приложения электронной коммерции, построенные на метафоре магазина самообслуживания. Посетителю предлагается ассортимент товаров в виде списка ссылок, переходя по которым можно просмотреть описание заинтересовавшего изделия. Далее, переход пользователя по следующей за описанием товара ссылке «Purchase!» («Купить!») означает его желание сделать покупку. В случае использования систем электронных платежей (например, банковских карт) непосредственным результатом данного акта станет безналичный перевод стоимости товара со счета покупателя на счет магазина, а также инициация процедуры доставки товара покупателю.

Можно небезосновательно возразить: в теории речевых актов перлокутивный эффект связывается с изменением эпистемического состояния либо поведенческой реакцией партиципанта коммуникации; напротив, переходы по ссылкам могут оказывать непосредственное воздействие на состояние лишь самой гипертекстовой системы и вызывать ответную реакцию аппаратного и программного обеспечения, реализующего структуру гипертекста, но никак не человека-собеседника, который попросту отсутствует в структуре гипертекстового акта. Возражения снимаются, если рассматривать гипертекст как разновидность компьютерно-опосредованного общения. На переход пользователя по ссылке отреагирует человек-собеседник, например, автор гипертекста или лицо, ответственное за поддержку ресурса. Реакция будет отложенной во времени (асинхронной) и опосредованной механизмами обратной связи, предоставляемыми гипертекстом. Например, учитывая высокую популярность некоторого узла, [стр. 104] зафиксированную системой сбора статистики перехода по ссылкам, автор может увеличить объем информации по данной теме. Сотрудник электронного магазина, в свою очередь, произведет отгрузку товара покупателю, получив уведомление от системы автоматической обработки заказов.

Резюмируем сказанное выше. Гипертекстовая информационная модель, основанная на гипотезе о том, что переработка и генерация идей человеческим мозгом происходит ассоциативно, получает все большее признание в качестве структуры для эффективного представления и передачи знаний. Если рассматривать гипертекст как асинхронную форму компьютерно-опосредованной коммуникации, то к нему оказываются применимы положения теории речевых актов. К гипертекстовым речевым актам можно отнести как создание гипертекста, так и ассоциативную навигацию в гипертекстовом пространстве.

Заключение. Традиционный алгоцентрический подход к созданию лингвистических структур и систем не решает задачу формального моделирования языковых явлений и речемыслительной деятельности человека. Алгоритмы автоматического понимания связного текста, существующие на настоящий момент, осуществляют достаточно адекватный анализ речевых высказываний только на поверхностном морфологическом уровне, при условии наличия полных словоизменительных парадигм и морфологических словарей. Синтаксический, а тем более — семантический анализ выполняется весьма неуверенно и не дает удовлетворительных результатов, кроме отдельных предложений с простой и очевидной структурой, а также случаев, когда исходный текст предварительно адаптируется человеком к возможностям лингвистического автомата. За пределами даже теоретических возможностей лингвистических алгоритмов остается автоматическое понимание узуального и окказионального смысла, абсолютно необходимое для адекватного машинного перевода и желательное для качественного (смыслового, а не формального) поиска информации в текстовом массиве.

К настоящему времени накоплены огромные объемы информации, структурированной в гипертекстах. Можно утверждать, что количество необходимо переходит в качество. В антропоцентрических системах появляется реальная возможность использования качественно нового подхода к решению задач, практически неразрешимых методами алгоцентрической компутационной лингвистики (поиск ассоциаций, реферирование текста, репрезентативный поиск релевантных запросу документов, оценка значимости для аудитории того или иного информационного ресурса и проч.).

«Искусственный интеллект» компьютера и ментальные способности человека имеют принципиально различную структуру. Как результат, лингвистическая задача, представляющая определенную сложность для человека, может быть быстро и качественно разрешена машиной. Например, предложения типа русск. Об этом уже уже можно сказать, что он не уже молодого ужа. или англ. Police police police poll. ‘Полиция охраняет избирательный участок для полицейских.’ могут быть адекватно проинтерпретированы лингвистическим автоматом быстрее, чем это сделает человек. В то же время, очевидные для носителя языка случаи, как было неоднократно показано выше, заводят автомат в тупик, из которого принципиально не существует надежного выхода.

Адекватное распределение нагрузки между компьютером и человеком в антропоцентрической системе, вероятно, позволит повысить эффективность совместной работы автоматики и человеческого разума в решении актуальных лингвистических задач, высокая важность которых для современного постиндустриального общества не вызывает сомнений. Проведение дальнейших исследований в этом направлении представляется нам весьма перспективным.

Список литературы

Виноград Т., Флорес Ф. О понимании компьютеров и познания // Язык и интеллект. — М.: Издательская группа «Прогресс», 1955.

Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. — СПб.: Питер, 2001.

Гаскаров Д. В. Интеллектуальные информационные системы. Учеб. для вузов. &mdsah; М.: Высш. шк., 2003.

Дерновой Г. О пользе случайностей // Компьютерра. - 2002. - №25.

Жарков С. В. Shareware: профессиональная разработка и продвижение программ. — СПб.: БХВ-Петербург, 2002.

Иомдин Л. Л. Уроки русско-английского (из опыта работы системы машинного перевода). // Диалог-2002: Мат-лы конф. — М., 2002. — <http://www.dialog-21.ru/archive_article.asp?param=7564&y=2002&vol=6078>

Кубрякова Е. С., Демьянков В. З., Панкрац Ю. Г., Лузина Л. Г. Краткий словарь когнитивных терминов / Под общ. ред. Е. С. Кубряковой. — М., 1996.

[стр. 105] Леонтьева Н. Н. Строение семантического компонента в информационной модели автоматического понимания текста. Дисс. : докт. техн. наук. — М., 1990.

Пиотровский Р. Г. Лингвистический автомат и его речемыслительное обоснование: Учеб. пособие. — Мн.: МГЛУ, 1999.

Сокирко А. В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ). Дисс. : канд. техн. наук. — М., 2001.

Тузов В. А. Компьютерная семантика русского языка // Материалы конференции "Диалог-2001". — М., 2001. — <http://www.dialog-21.ru/Archive/2001/volume2/2_53.htm>

Худяков А. А. Логическое и сублогическое в языке и познании. // Филология и культура: Мат-лы IV Междунар. науч. конф. 16–18 апреля 2003 года. — Тамбов: Изд-во ТГУ им. Г. Р. Державина, 2003.

Худяков А. А. Семиозис простого предложения: Монография. — Архангельск: Поморский государственный университет, 2000.

Эпштейн В. Л. Введение в гипертекст и гипертекстовые системы. - 2000. - <http://newasp.omskreg.ru/intellect/f27.htm>

Halasz F. Reflections on NoteCards: Seven issues for the next generation of hypermedia systems // CACM 31:7. — 1988.

Johnson-Laird P. N. Mental Models: Towards a Cognitive Science of Language, Inference, and Consciousness.. — Cambridge (Mass.): Harvard University Press, 1983.

Johnson-Laird P. N. The Computer and the Mind. An Introduction to Cognitive Science. — Cambridge (Mass.): Harvard University Press, 1988.

Microsoft Press. Толковый словарь по вычислительной технике. — М.: Издательский отдел «Русская редакция» ТОО «Channel Trading Ltd», 1995.

Winograd T. A Framework for Understanding Discourse // Cognitive Processes in Comprehension. — Hillsdale, New Jersy: Lawrence Erlbaum Associates, Publishers, 1977.

Winograd T. Language as a Cognitive Process. Vol. 1: Syntax. — Reading (Mass.): Addison-Wesley Publishing Company, 1983.

Winograd T. Understanding Natural Language. — New York, London: Academic Press, 1972.

A. A. Hudyakov, E. M. Chukharev

COGNITIVE LINGUISTICS AND ARTIFICIAL INTELLIGENCE: RESULTS AND TENDENCIES OF INTERACTION
This article discusses the problems on the interface of linguistics and the theory of artificial intelligence within the guidelines of the modern anthropocentric paradigm which forms the basis of cognitive linguistics. It is argued that the adequate load distribution between the computer and the human in an anthropocentric system will increase the efficiency of their collaboration in solving the current linguistic problems which cannot be formalized and solved with traditional algocentric methods.

Примечания

1. Поясним, что под искусственным интеллектом мы понимаем «одно из направлений информатики, целью которого является разработка аппаратно-программных средств, позволяющих пользователю-непрограммисту ставить и решать свои, традиционно считающиеся интеллектуальными задачи, общаясь с ЭВМ на ограниченном подмножестве естественного языка» [Гаврилова, Хорошевский 2001: 15]. «К сфере искусственного интеллекта относятся те весьма различные области, в которых мы действуем, не имея абсолютно точного метода решения проблемы» [Гаскаров 2003: 7]. Такая трактовка искусственного интеллекта именуется «слабой» и противопоставляется «сильной», для которой «компьютер — полное повторение мышления» [Кубрякова и др. 1996: 41]. К тексту

2. Здесь и далее в качестве примеров привлекаются результаты работы отдельных систем машинного перевода, однако наша задача состоит в том, чтобы указать не на недостатки данных конкретных систем, а на сложности, характерные для функционирования таких систем, как класса. К тексту

Когнитивная лингвистика и искусственный интеллект: результаты и тенденции взаимодействия / А. А. Худяков, Е. М. Чухарев // Вопросы когнитивной лингвистики. — 2004. — № 2–3. — С. 93–105. — ISSN 1812-3228.