Синтаксические структуры

Хомский Ноам

3. ЭЛЕМЕНТАРНАЯ ЛИНГВИСТИЧЕСКАЯ ТЕОРИЯ

 

 

3.1.

Допустим, что нам дано множество грамматически правильных предложений английского языка. Спрашивается, «какого рода механизм может порождать это множество (другими словами, какого рода теория дает адекватное описание структуры этого множества высказываний). Мы можем представлять себе каждое предложение этого множества как последовательность фонем конечной длины. Язык — необычайно запутанная система, и совершенно очевидно, что любая попытка представить непосредственным образом множество грамматически правильных последовательностей фонем привела бы к грамматике столь сложной, что практически она стала бы бесполезной. По этой причине (существуют и другие причины) для лингвистического описания используется система «уровней представления». Вместо того чтобы устанавливать фонемную структуру предложений непосредственно, лингвист исходит из элементов «более высокого уровня»— морфем; затем он отдельно устанавливает морфемную структуру предложений и фонемную структуру морфем. Легко понять, что совокупное описание этих двух уровней значительно проще непосредственного описания фонемной структуры предложений.

Рассмотрим теперь различные способы описания морфемной структуры предложений. Какого рода грамматика необходима для порождения всех последовательностей морфем (или слов), представляющих собой грамматически правильные английские предложения, и только такие последовательности?

Одно из требований, предъявляемых грамматике, состоит в том, что она должна быть конечной. Отсюда следует, что грамматика не может быть просто списком всех последовательностей морфем или слов, поскольку число их бесконечно. Обычная теоретико-коммуникационная модель языка предоставляет нам один из способов, которым мы можем воспользоваться, чтобы обойти эту трудность. Предположим, мы имеем машину, способную принимать одно из конечного числа различных внутренних состояний, и пусть эта машина при переходе из одного состояния в другое вырабатывает определенный символ (скажем, английское слово). Одно из этих состояний является начальным, некоторое другое — конечным. Допустим, машина начинает свою работу с начального состояния, проходит ряд промежуточных состояний (выдавая некоторый символ при каждой смене состояний) и оканчивает работу конечным состоянием. Порожденную таким способом последовательность слов назовем «предложением». Каждая подобная машина, таким образом, определяет какой-то язык, а именно — множество предложений, создаваемых с ее помощью. Всякий язык, который может быть порожден машиной такого рода, мы назовем языком с конечным числом состояний; самую машину мы можем назвать грамматикой с конечным числом состояний. Грамматику с конечным числом состояний можно представить в виде «диаграммы состояний». Например, грамматика, порождающая равно два предложения — The man comes «Человек приходит» и The men come «Люди приходят»,— может быть представлена следующей диаграммой состояний:

(7)

Мы можем усовершенствовать эту грамматику, с тем чтобы она порождала бесконечное число предложений путем добавления к ней замкнутых петель. Так, грамматика части английского языка, содержащей, кроме упомянутых, еще предложения The old man comes «Старый человек приходит», The old old man comes «Старый-старый человек приходит», .., The old men come «Старые люди приходят», The old old men come «Старые-старые люди приходят», .., представляется диаграммой состояний (см. стр. 424).

Имея диаграмму состояний, мы порождаем предложение, совершая путь от начальной точки слева до конечной точки справа и каждый раз передвигаясь в направлении стрелок. По достижении некоторой точки диаграммы мы можем следовать по любому пути, исходящему из этой точки независимо от того, проходили ли мы по этому пути когда-либо прежде при построении данного предложения или нет. Каждый узел диаграммы, таким образом, соответствует некоторому состоянию машины. Мы можем допустить переход из состояния в состояние по нескольким путям и иметь некоторое число петель любой длины.

(8)

Машина, порождающая языки таким способом, известна в математике под именем «марковского процесса с конечным числом состояний». Для завершения этой элементарной теоретико-коммуникационной модели языка припишем некоторую вероятность каждому переходу из одного состояния в другое. Мы можем теперь вычислить «неопределенность», связанную с каждым состоянием, и определить количество информации в данном языке как взвешенное среднее неопределенностей, причем весовым коэффициентом для каждого состояния будет вероятность нахождения системы в этом состоянии. Поскольку мы изучаем здесь грамматическую, а не статистическую структуру языка, это обобщение не должно нас интересовать.

Данная концепция языка обладает очень большой силой и общностью. Приняв ее, мы можем рассматривать говорящего, по существу, как машину описанного типа. Производя предложение, говорящий начинает с начального состояния, произносит первое слово предложения и тем самым переключается во второе состояние, которое ограничивает выбор второго слова и т. д. Каждое состояние, через которое он проходит, соответствует грамматическим условиям, ограничивающим выбор следующего слова в этой точке высказывания.

Учитывая общий характер этой концепции языка и ее значимость для таких смежных дисциплин, как теория коммуникации, важно установить следствия приложения ее к синтаксическому изучению таких языков, как английский, или к формализованной системе математики. Всякая попытка построить грамматику с конечным числом состояний для английского языка с первых же шагов наталкивается на серьезные затруднения и сложности, которые читатель легко может себе представить. Однако нет необходимости иллюстрировать это примерами, поскольку существует следующее более общее утверждение, относящееся к английскому языку:

(9) Английский язык не является языком с конечным числом состояний. Это значит, что невозможно, а не только трудно построить механизм описанного выше типа (диаграмма вида (7) или (8)), который порождал бы все грамматически правильные предложения английского языка, и только их. Чтобы убедиться в справедливости утверждения (9), необходимо определить синтаксические свойства английского языка более точно. Ниже мы опишем некоторые синтаксические свойства английского языка, благодаря чему станет ясно, что при любых разумных ограничениях множества предложений языка утверждение (9) может считаться теоремой для английского языка. Возвращаясь к вопросу, поставленному в § 3.2, мы можем сказать, что утверждение (9) равносильно утверждению о невозможности установления морфемной структуры предложений непосредственно с помощью таких механизмов, как диаграмма состояний, и о неприемлемости, по крайней мере для целей грамматики, концепции языка, основанной на марковском процессе, описанном выше.

 

3.2.

Язык определяется путем задания его «алфавита» (т. е. конечного множества символов, из которых строятся его предложения) и его грамматически правильных предложений. Прежде чем приступить непосредственно к исследованию английского языка, рассмотрим несколько языков, алфавит которых содержит всего две буквы a и b и предложения которых определяются правилами (10 I—III):

(10) (I) ab, aabb, aaabbb и вообще все предложения, состоящие из n вхождений a, за которыми следуют n вхождений b, и только такие предложения;

(II) аа, bb, abba, baab, аааа, bbbb, aabbaa, abbbba,.. и вообще все предложения, состоящие из цепочки X, за которой следует «зеркальное отражение» X (т. е. Х в обратном порядке), и только такие предложения;

(III) аа, bb, abab, baba, аааа, bbbb, aabaab, abbabb,.. и вообще все предложения, состоящие из цепочки X (содержащей в некоторой комбинации буквы а и Ь), за которой следует точно такая же цепочка X, и только такие предложения.

Легко доказать, что каждый из этих трех языков не является языком с конечным числом состояний. Сходным образом и языки типа (10), в которых буквы а и b не следуют друг за другом, а включены в другие цепочки, также не являются языками с конечным числом состояний при весьма общих условиях.

Но ясно, что существуют части английского языка, имеющие структуру вида (10 I) и (10 II). Пусть S1, S2, S3,.. — повествовательные предложения английского языка. Тогда мы можем записать английские предложения так:

(11) (I) If S1, then S,.

„Если S1 то S2“.

(II) Either S3, or S4.

„Либо S,, либо S4“.

(III) The man who said that S5, is arriving today.

„Человек, который сказал, что S5, прибывает сегодня".

В (11 I) мы не можем поставить or вместо then, в (11 II) нельзя заменить or словом then, в (11 III) мы не можем поставить are на место is. В каждом из этих случаев существует некоторая зависимость между словами, стоящими по обе стороны запятой (т. е. if — then, either — or, man — is). Однако между взаимозависимыми словами мы можем вставить повествовательное предложение S1, S3, S5, и это повествовательное предложение может, разумеется, иметь вид одного из (11 I—III). Так, если принять, что в (11 I) S1 есть (11 II), a S3 есть (11 III), мы получим предложение:

(12) if, either (11 III), or S4 then S2

«если, либо (11 III), либо S4, тогда S2»,

a S5 в (11 III) может оказаться снова одним из предложений (11). Отсюда ясно, что в английском языке можно найти предложение a+S1+b, в котором существует зависимость между a и b, затем в качестве S1 выбрать другое предложение типа c+S2+d, в котором существует зависимость между с и d, а затем в качестве S2 выбрать еще одно из предложений такого типа и т. д. Множество предложений, образуемых таким способом (а мы видели из примера (11), что существует несколько возможных вариантов построения, причем (11) далеко не исчерпывает этих возможностей), обладает всеми зеркальными свойствами множества (10 II), исключающими его из совокупности языков с конечным числом состояний. Следовательно, в английском языке можно обнаружить различные модели, не отвечающие условиям конечного числа состояний. Все сказанное здесь является общим указанием на путь, следуя по которому можно представить строгое доказательство утверждения (9), если принять, что такие предложения, как (11) и (12), принадлежат английскому языку, а предложения, противоречащие указанным зависимостям (11) (например, either S1, then S2 «либо S1, то S2» и т. п.), не имеют места в этом языке. Заметим, что многие предложения типа (12) и т. п. выглядят весьма странно и необычно (их часто можно сделать менее странными, подставив вместо if «если» выражения whenever «всякий раз, когда», on the assumption that «в допущении, что», if it is the case that «если верно, что» и т. п. без изменения существа наших замечаний). Все это тем не менее грамматически правильные предложения, построенные по правилам настолько простым и элементарным, что самая примитивная грамматика английского языка непременно должна включать эти предложения. Их можно понять, и мы даже можем весьма просто определить условия, при которых они представляют собой истинные высказывания. Трудно представить себе сколько-нибудь основательные мотивы для исключения их из числа грамматически правильных предложений английского языка. Кажется, таким образом, весьма очевидным, что никакая теория лингвистической структуры, основанная исключительно на марковской и подобных ей моделях, не в состоянии объяснить способность говорящего по-английски производить и понимать новые предложения и вместе с тем отбрасывать некоторые новые последовательности как не принадлежащие языку.

 

3.3.

Предположим, что процессы построения английских предложений, подобные рассмотренным, могут осуществляться не более n-ного количества раз при некотором фиксированном n. Тем самым английский язык превратится, разумеется, в язык с конечным числом состояний (к тому же результату приведет, например, ограничение длины английского предложения миллионом слов). Такие произвольные ограничения не приносят, однако, никакой пользы. Важно то, что существуют процессы построения предложений, которые грамматики с конечным числом состояний в принципе не способны истолковать. Если эти процессы не имеют конечного предела, мы можем доказать буквальную неприложимость данной элементарной теории. Если процессы имеют предел, то построение грамматики с конечным числом состояний не является в буквальном смысле слова немыслимым, поскольку предложения можно перечислить, а список и есть по существу тривиальная грамматика с конечным числом состояний. Но такая грамматика окажется настолько сложной, что не будет представлять интереса и не принесет никакой пользы. Вообще допущение о бесконечности языка делается для упрощения его описания. Если грамматика не содержит рекурсивных механизмов (замкнутых петель, как в (8), для случая грамматики с конечным числом состояний), она оказывается недопустимо сложной. Если же в ней появляются некоторого рода рекурсивные механизмы, она порождает бесконечное число предложений.

Короче говоря, метод анализа выдвигаемого здесь понятия степени грамматической правильности в терминах марковского процесса с конечным числом состояний, порождающего предложения слева направо, заводит в тупик в той же мере, как и гипотезы, отклоненные выше (см. § 2). Если грамматика подобного типа порождает все английские предложения, она произведет на свет также много и непредложений. Если она порождает только английские предложения, то мы можем быть уверены, что найдется бесконечное число истинных предложений, ложных предложений, правильно поставленных вопросов и т. д., которые она просто не в состоянии породить.

Отклоненная только что концепция грамматики представляет собой простейшую лингвистическую теорию, заслуживающую серьезного рассмотрения. Грамматика с конечным числом состояний — это простейший тип грамматики, которая с конечным набором средств способна порождать бесконечное число предложений. Мы видели, что такая ограниченная лингвистическая теория не адекватна; мы вынуждены искать какой-то более сильный тип грамматики и какую-то более «абстрактную» форму лингвистической теории. Понятие «лингвистического уровня представления», введенное в начале настоящей главы, должно быть видоизменено и усовершенствовано. По крайней мере один уровень не может иметь такой простой структуры. Другими словами, на некотором уровне оказывается невозможным представлять каждое предложение просто как конечную последовательность элементов определенного рода, порождаемых слева направо некоторым простым механизмом. Если этого не сделать, то нельзя надеяться найти конечное множество уровней, упорядоченных сверху вниз, таких, чтобы можно было породить все высказывания путем задания допускаемых последовательностей элементов самого высокого уровня, разложения каждого элемента высшего уровня на элементы второго уровня и т. д. и, наконец, задания фонемного состава элементов предпоследнего уровня

В Начале § 3 мЬі предложили для упрощения описания грамматически правильных последовательностей фонем устанавливать уровни таким способом. Если язык можно описать элементарным образом (через порождение слева направо) с помощью единственного уровня (т. е. если это язык с конечным числом состояний), то такое описание действительно можно упростить, построив более высокие уровни; но для порождения таких неконечных языков, как английский, необходимы коренным образом отличные методы и более общая концепция «лингвистического уровня».