Исключение как правило: Переходные единицы в грамматике и словаре

Копотев Михаил Вячеславович

Стексова Татьяна Ивановна

Глава первая

От слова к сочетанию слов

 

 

Эквиваленты слова

[7]

 

Термин «слово» сохраняет свое центральное положение как в лингвистических описаниях, так и в наивных представлениях людей о языке. Широкое употребление этого термина не означает, что он четко и однозначно определен. Наоборот, нетрудно подобрать примеры, которые противоречат определению. Все это привело многих ученых к мысли о невозможности дать однозначное определение слову даже в рамках одного языка (см., например, [Леонтьев 1963]).

Если оценивать употребительность лексемы слово, то благодаря широкой гамме разных значений оно превышает по частоте употребления все остальные метаязыковые имена (ср. [Арутюнова 2000: 15]). Однако определяя его строго лингвистически, мы сталкиваемся с трудностями. Для иллюстрации этой сложности приведем очевидные противоречивые случаи:

(1) во дворе́

(2) ро́к-му́зыка

(3) дом-музей: дома-музея

(4) никто: ни у кого

В примере (1) два «слова» сливаются при произношении в одно «фонетическое слово»; в примере (2) приведено одно «слово» с точки зрения словарного представления, но с учетом двойного ударения и отсутствия редукции гласного в первом слоге «однословная» интерпретация становится менее очевидной; в примере (3) «однословность» нарушается морфологическими (словоизменительными) свойствами сложного слова; в примере (4) одно «слово» разделяется на две части, если оно употребляется с предлогом. Спрашивается, имеем ли мы дело во всех этих случаях с одним «словом» – с одной языковой единицей?

В истории лингвистики это обстоятельство привело к тому, что были введены более дифференцированные понятия: «фонетическое слово» (группа слогов, несущих одно ударение); «лексема» (совокупность всех форм и значений одного слова); «словоформа» (отдельная форма лексемы); «словоупотребление» (конкретное употребление какой-либо словоформы в речи/тексте); «токен», или «текстоформа» и «лемма» (аналоги «словоупотребления» и «лексемы» при машинной обработке текста). Несмотря на наличие более узких по своему значению понятий, термин слово все еще используется даже в тех случаях, когда было бы уместней употреблять более точный термин. Например, в предисловиях большинства словарей русского языка объем словника, как правило, определяется в количестве слов, хотя речь чаще всего идет о лексемах.

С функциональной и семантической точек зрения, «эквиваленты слов» – суть слова (точнее лексемы), у которых отсутствует один критерий выделения – слитное написание. Этот критерий при определении лингвистического термина может показаться неубедительным, поскольку правописание можно считать чисто внешней и, по сути дела, второстепенной стороной проявления языка [Академическая грамматика 1980: 398]. Кроме того, решение вопросов культуры письменной речи находится под влиянием экстралингвистических факторов, вызванных вмешательством нормализаторских сил языкового общества. Несмотря на эти оговорки, большинство носителей языка вовремя считает одним словом, а во время – двумя только в связи с современной нормой правописания.

Историческую изменчивость «единооформленности» отдельных языковых единиц можно проиллюстрировать историей изменения союза потому что: было время, когда он состоял из трех слов: по тому что (см. [Борковский 1979: 310–315]), сейчас он состоит из двух слов, и не исключено, что придет время, когда этот союз будет писаться слитно. Во всяком случае, написание потомучто уже зафиксировано в НКРЯ, а запрос в поисковой системе Yandex дает более полумиллиона примеров. Подобная цифра не может не вызывать некоторые размышления о возможной эволюции письменной нормы.

Опора на орфографию соответствует пониманию среднего носителя языка, который, видимо, ответит на вопрос, является ли потому что словом, отрицательно. Если же спросить, является ли это выражение союзом, число положительных ответов существенно вырастет. В принципе мы могли бы игнорировать мнение неспециалистов, как обычно делается при разработке научной терминологии. Однако ответы специалистов-лингвистов в общих чертах такие же, что подтверждает и лексикографическая практика. Лингвисты могут дополнить свои ответы разными объяснениями и рассуждениями, но в целом взгляды, очевидно, совпадают: потому что считается союзом, состоящим из двух слов, но не словом. Более того, орфографическая и пунктуационная особенность оформления таких эквивалентов слов (в течение, несмотря на, так как, потому что и др.) отражает интуитивное стремление лингвистов и нормализаторов языка отделить подобные единицы от сходных словосочетаний. Признав подобные комплексы самостоятельными лексическими единицами, можно более строго сформулировать и ряд орфографических и пунктуационных правил, например «лексемы в течение, в продолжение, являясь предлогами, пишутся через – е»; «лексемы так как, потому что пишутся без запятой между компонентами союза» и т. д.

При исследовании многокомпонентных единиц несопоставимо больше внимания обращают на знаменательные лексические фраземы (фразеологизмы), функционально сопоставимые с глагольными и именными лексемами. Именно в силу этого мы обратим основное внимание на другие единицы – полузнаменательные и незнаменательные фраземы, в частности на многокомпонентные служебные слова.

История вопроса

Теоретическое осмысление незнаменательных многокомпонентных единиц началось в 30-е годы прошлого века. Во Введении мы уже отмечали, что русская традиция в этом вопросе опирается на работы прежде всего французских ученых. На особенности многокомпонентных единиц, функционирующих в качестве одной лексемы, обратил внимание А. Е. Аничков, представив классификацию как знаменательных, так и служебных идиом. В 40-е годы прошлого века они привлекли внимание В. В. Виноградова. По-видимому, впервые В. В. Виноградов обращается к единицам, названным им «эквиваленты слова», в статье «Об основных типах фразеологических единиц в русском языке» [Виноградов 1947]. Именно в ней была представлена классификация, получившая широкое признание в русистике. Позже, в работе «Русский язык. Грамматическое учение о слове», рассматривая морфологический состав предлогов, он выделяет, кроме непроизводных, наречных, отыменных и отглагольных предлогов, и «сложные типы предложных словосочетаний», приводя примеры типа независимо от, в отношении к, согласно с, вслед за, несмотря на [Виноградов 1986: 557–560]. На основе устойчивости этих единиц В. В. Виноградов разделяет их на две категории: «Если в них не стерлись лексические значения составных элементов, то приходится рассматривать их как сложные фразеологические единства; если же компоненты срослись в неразложимое целое, можно говорить о предложных идиоматизмах» [Там же: 559]. Для нашей темы существенно отметить, что на закрепленные в узусе отыменные предлоги типа по мере, с помощью, в течение, по причине В. В. Виноградов не обращает особого внимания, перечисляя их вместе с однословными отыменными предлогами типа посредством, ввиду, насчет, вроде.

Вопросы, связанные с комплексом проблем, поставленных В. В. Виноградовым, активно обсуждались в работах В. П. Сухотина [Сухотин 1950], А. И. Смирницкого [Смирницкий 1952,1954], В. Н.Ярцевой [Ярцева 1955], М. В. Панова [Панов 2004 (1956)] и др., в которых «эквивалент слова» если и не получает статус термина, то закрепляется в лингвистическом узусе. В дальнейшем эта тема стала предметом серии конференций в Ленинградском отделении института языкознания АН СССР (см. особенно [Морфологическая структура слова 1963] и [Аналитические конструкции 1965]). Эти работы заложили основы для активно развивающейся области лингвистических исследований – фразеологии. Фразеология как учение об устойчивых сочетаниях, функционирующих в роли полнозначных лексем, стала во второй половине XX века самостоятельной и активно развивающейся дисциплиной (см. обобщающие работы: [Телия 1996; Баранов, Добровольский 2008; Stubbs 2005; Dobrovolsky & Piirainen 2005]).

Изучение других сложных по составу единиц, прежде всего служебных слов, до последнего времени оставалось маргинальной областью. В русистике можно назвать лишь локальные исследования этого вопроса. Так, относительно хорошо разработана проблематика союзов – эквивалентов слова [Колосова & Черемисина 1987а, 1987b; Ляпон 1988а, 1988b]. Т. А. Колосова и М. И. Черемисина обращают внимание на так называемые «скрепы», или слова, выполняющие в предложении союзные функции. Часть единиц этой группы (потому что, так как, несмотря на то что и др.) являются многокомпонентными, за ними закрепляется термин «функтив».

Функтивы – единицы одновременно и лексического, и грамматического фонда. Они лексичны, поскольку характеризуются относительно устойчивым строением, единой семантикой и представляют собой такое же единство планов выражения и содержания, как и обычные слова. <…> Они грамматичны, поскольку их назначение состоит в оформлении связей между компонентами синтаксических конструкций, т. е. они являются грамматическими показателями связей [Колосова, Черемисина 1987b: 19].

Предложив в монографии [Колосова, Черемисина 1987b: 136–180] структурную классификацию скреп, авторы закладывают основу для систематизации союзов – эквивалентов слова. По мнению ученых, необходимо определить статус подобных единиц, их отношение к обычным типам фразеологизмов, определить их частеречный статус, их отличие от одноместных союзов.

Близкая по объекту исследования статья Ляпон [1988а] посвящена релятивной лексике (прежде всего союзам, а также частицам, наречиям и модальным словам, функционирующим в роли квалификатора отношений). Объектами наблюдения в указанной статье становятся не только такие единицы, как если… то, конечно… но, едва… как, но и не успел… как, достаточно… чтобы и др. Исследовательница отмечает неразработанность проблемы идиоматизации служебной лексики, обозначая в то же время теоретическую сложность исследования подобных явлений. В работе отмечается, что служебные фразеологизированные единицы занимают особое положение в системе языка, оставаясь на грамматическом уровне абстракции и участвуя в образовании особых «синтаксических фразеологизмов», «фразеосхем». В этом, по мнению автора, их принципиальное отличие от лексических фразеологизмов.

В работе А. А. Лучик [1999] предлагается квалификация наречных эквивалентов слова, построенная на описании структурных схем, созданных в рамках традиционной концепции «Русской грамматики» 1980-го года. И хотя в работе вопрос о статусе и принципах выделения подобных эквивалентов слова подробно не обсуждается, автор выделяет 40 базовых моделей, самыми представительными из которых оказываются модели с начальным предложным компонентом (вне очереди, во всеуслышание и др.), затем следуют модели с начальным компонентом – наречием (просто так), местоимением (чего ради), частицей (не спеша), союзом (и все), междометием (ой как).

Систематичное описание интересующие нас единицы получили в нескольких работах лексикографического характера. Укажем на основные из них. Два издания словаря Р. П. Рогожниковой («Словарь сочетаний, эквивалентных слову» [Рогожникова 1983] и «Словарь эквивалентов слова» [Рогожникова 1991]), очевидно, представляют собой первый в русской лексикографии опыт описания многокомпонентных служебных единиц. В словаре [Рогожникова 1991] отмечается 1200 таких единиц, для которых приводятся частеречные характеристики, значение и иллюстрации. «Толковый словарь служебных частей речи русского языка» [Ефремова 2001] представляет собой первый опыт систематического и последовательного представления всех служебных единиц русского языка (к которым причислены наречия и предикативы). В словаре описано более 22 000 единиц, часть из которых составляют «многословные образования» (более 2000 единиц). И в этом состоит одно из оригинальных решений автора:

Нетрадиционность состава словника проявляется в наличии в нем в качестве самостоятельных заголовочных единиц: 1) предложнопадежных конструкций, 2) лексических единиц, состоящих из более чем одного слова, но семантически эквивалентных ему, а также 3) слов, образовавшихся в результате перехода единиц из одной части речи в другую [Ефремова 2001: 6].

Ценными источниками являются также «Корпусной словарь неоднословных лексических единиц», который представляет собой списки таких единиц, составленных на основе НКРЯ с добавлениями из словарей Рогожниковой и MAC [Корпусной словарь 2008], и справочник-компиляция «Русская служебная лексика» [Богданов, Рыжова 1997], сводящий факты из нескольких словарей и Академической грамматики 1980 года. Кроме этого, следует отметить и справочник «Дискурсивные слова русского языка: опыт контекстно-семантического описания» [Дискурсивные слова 1998], в котором пусть и на небольшом материале, но последовательно и систематично описываются в том числе и многокомпонентные незнаменательные единицы типа следующих: по крайней мере, еще раз, все равно, кроме того, как раз.

Основные классы эквивалентов слова по данным словарей

В существующих фразеологических словарях хорошо представлены единицы с глагольной, именной или адъективной основой. Эквиваленты слова, сопоставимые с другими частями речи, представлены гораздо хуже. В этой части нашей работы речь пойдет как раз о таких единицах. Как мы уже отмечали, в русской лексикографической практике не существует эксплицированных критериев и ясных принципов выделения таких единиц (за исключением словарей [Рогожникова 1991; Ефремова 2001; Корпусной словарь 2008]). Во всех словарях можно найти и непоследовательное выделение, и псевдоквалификации («вводное слово», «в значении союза» и т. п.).

Опишем кратко основные группы полузнаменательных и незнаменательных эквивалентов слова, отмеченные в основных источниках, взяв за основу частеречную классификацию, предложенную в словарях.

Самая многочисленная группа среди эквивалентов слова на основе данных источников – это наречия. [17]В эту группу включены и предикативы.

В соответствии с деривационной моделью среди них можно выделить следующие типы:

– (neg) + предлог + существительное: без следа, вне очереди, для интереса, до смерти, из любопытства, из-за рубежа, из-под мышки, от руки, со стороны, к месту, по выбору, в заключение, за полночь, на дом, под конец, между прочим, с лишним, в гостях, за границей, на днях, не по адресу, при случае;

– (neg) + предлог + прилагательное / местоимение / числительное + существительное: в равной мере, по крайней мере, до сих пор, с одной стороны, в свою очередь, в то же время, в самом деле, по всей вероятности, ни в коем случае, в первую очередь;

– (neg) + предлог + местоимение: кроме того, у себя, про себя, при этом;

– местоимение / числительное + существительное: все время, всякий раз, сию секунду, каким образом, первый раз, одним словом;

– сочетания с вопросительно-союзными словами: где угодно, куда попало, кто куда, чего ради, сколько хочешь, как всегда, как минимум, как ни странно, как никогда, как нельзя, как следует, мало где;

– сочетания с формами сравнительной степени: более того, прежде всего, не более;

– существуют и примеры, не входящие ни в одну из вышеуказанных групп: все еще, все равно, просто так, так же, не раз, шутка ли, при чем тут, так или иначе, как правило, главным образом, время от времени, в конце концов, судя по всему, шутка ли сказать, не ахти, вот так, еще раз, только что, вместе с тем, вот так вот, раз и навсегда, тому назад, ничего себе, тем самым.

Слова категории состояния или предикативы примыкают к вышеописанному классу, а иногда и объединяются с ним.

Приведем примеры: не грех, к лицу, по силам, не по дороге, в радость, не под силу, между нами, в моде, не в состоянии, на уровне, не для чего, не к чему, не по себе, при чем тут, проще всего.

Еще одну группу составляют эквиваленты слова, употребляемые в функции вводного слова [18]В лингвистической литературе можно найти обоснования для выделения этой части речи (см. [Виноградов 1950]), defacto они выделены и в MAC, БАС, Грамматическом словаре А. А. Зализняка и во многих других словарях.
.

Примеры: в сущности, к сожалению, к счастью, с другой стороны, как ни странно, если не ошибаюсь, собственно говоря, по всей вероятности, как назло, одним словом. Отметим, что словарь [Ефремова 2001], основанный на более четких исходных принципах, исключает подобные характеристики. Все слова указанной группы отнесены к определенным в предисловии частям речи.

Предлоги – эквиваленты слова:

По всей видимости, они, наряду с союзами, представляют собой наиболее типичный случай эквивалентов слова (кроме прочего, это подтверждается и тем, что и те, и другие попали в сферу интересов нормализаторов письменной формы речи, например, потому что, в течение, несмотря на и др.). И если при описании наречий эта проблема часто игнорируется, поскольку в грамматиках не приводятся исчерпывающие списки наречий, то предлоги и союзы русского языка невозможно адекватно описать без упоминания многокомпонентных единиц. Как представляется, предлоги – эквиваленты слова разделяются на четкие группы в соответствии с их деривационными моделями:

– предлог + существительное: от имени, по вине, в знак, в течение, во время, на смену, за исключением, с помощью, в конце, в результате, во главе, на основе, при условии;

– предлог + существительное + предлог: по отношению к, по сравнению с, в отличие от, в зависимости от, в связи с;

– наречие + предлог: недалеко от, незадолго до, вслед за, рядом с;

– (neg) + деепричастие + (предлог): несмотря на, судя по, исходя из, начиная от, не считая;

– другие: не без, с точки зрения.

Союзы – эквиваленты слова:

По словообразовательной структуре они составляют весьма пестрый набор. Приведем некоторые типовые случаи (для наглядности возможные запятые пропущены):

– единицы с что / чем: потому что; благодаря чему, вследствие чего, в результате чего, прежде чем;

– единицы с соотносительным то и союзом что / чтобы / как: для того чтобы, из-за того что, между тем как, благодаря тому что, вследствие того что, мало того что, в отношении того что / в том отношении что, по той причине что, по мере того как, в результате того что, за исключением того что, независимо от того что, судя по тому что;

– единицы с это / то: при этом, между тем, сверх того, к тому же, тем более, (а) тем не менее, более того;

– единицы с бы: (как) будто бы, (как) если бы, хоть бы, вроде бы, лишь бы, лишь бы только;

– временные единицы с как / пока: в то время как, до того времени как, с тех пор как, до тех пор пока; пока не;

– двойные союзы: или… или, тем… чем, сколько… столько и. Частиц – эквивалентов слова примерно столько же, сколько союзов и предлогов.

Они представляют собой многообразные сочетания единиц, не поддающиеся классификации. Вот некоторые примеры: а вот, а что, будто бы, вряд ли, все же, разве только, вроде как, разве что, да уж, только и всего, и без того, как бы, как раз, то ли дело, ну да, не так ли, вот именно, все равно, еще как, едва не, мало ли, вот что, вот и все, вот так, вот это да, так или иначе, само собой, без того, во всяком случае, по крайней мере.

В классификации частей речи междометия занимают периферийную позицию, они не являются частотным классом служебных слов. Согласно нашим источникам, существует около сотни междометий – эквивалентов слова.

Вот некоторые примеры, извлеченные из словарей: ах ты, ай да, ну то-то ж, ах вон оно что, на вот, вот как, да ну, так вот что, вот так да, вот это да, вот тебе и на, чего там, ничего себе, нечто вроде, надо же; не за что, да здравствует…, до завтра, на здоровье, всего доброго.

Кроме этих традиционных для русской лексикографической практики групп слов, Р. П. Рогожникова выделяет эквиваленты слова, которые употребляются в роли соотносительного слова (по поводу того, независимо от того, насчет того), в роли союзного слова (где бы ни, когда ни) и «обороты речи» (дело в том, речь идет о, в чем дело, тот факт что). Кроме того, в указанном словаре отмечены эквиваленты слова, «не поддающиеся классификации по принадлежности к какой-либо части речи или по их синтаксической функции»: и прочее, и так далее, и тому подобнее [1991:11]; ср. [Объяснительный словарь 2002: 7].

Представленные выше данные словарей можно считать сугубо предварительными: наборы выделенных единиц в разных словарях не совпадают, а количество единиц, как мы видим, отличается иногда в десятки раз. Однако они позволяют сделать некоторые обобщения, касающиеся частеречного статуса многокомпонентных единиц. Как известно (см., например, [Теньер 1988: 55,62–63]), определение частей речи – более или менее нечеткая процедура в связи с тем, что одновременно используются критерии, которые могут в отдельных случаях противоречить друг другу: понятийные (содержательные), морфологические (комплекс морфологических категорий), словоизменительные (система парадигм) и синтаксические критерии (см., например, [Щерба 1974 (1928), Виноградов 1986 (1947), Русская грамматика 1980: 457]).

Рассмотрим разные случаи частеречной квалификации эквивалентов слова, распределенные на две большие группы по двум критериям.

Из всех знаменательных слов (группы А приведенной таблицы) русистика не уделяла особого внимания многокомпонентным местоимениям (см. [Тестелец, Былинина 2004]; [Сичинава 2013]). Рассмотрим подробнее именно их.

Пожалуй, больше других повезло единице друг друга, которая выделяется в ряде грамматических описаний [Зализняк 1967: 53; Русская грамматика 1979: 355,521; Краткая русская грамматика 1989:210; Шелякин 2000: 109–110] и является полной фраземой. Ни один нетривиальный компонент лексемы «ДРУГ» не задействован в образовании этого местоимения. Более того, подвергается редукции и набор грамматических сем, в частности элиминируются грамматические семы числа [Зализняк 1967: 98], падежа (именительного: [Зализняк 1967: 99]). Этот пример показывает, что идиоматизация может затрагивать не только лексическую семантику, но и семантику грамматическую (и анализ этого случая лишь подтверждает правоту ученых, относящих фразему «друг друга» к классу не существительных, но местоимений).

Однако и другие местоименные единицы заслуживают обсуждения в рамках проводимой в этой книге концепции проницаемости границ. Во-первых, те местоименные формы, которые состоят из более чем одного слова только в косвенных падежах с предлогом (кое у кого, ни с кем, не к кому), вряд ли можно считать эквивалентами слова; они скорее примыкают к аналитическим формам словоизменения (ср. буду читать, хотел бы и др.). Что касается других местоименных многокомпонентных единиц, то более или менее явных случаев – таких, которые упоминаются в традиционных грамматиках, – лишь несколько: такой же самый, тот же, друг друга, тот самый, между собой и некоторые другие. Последняя единица отличается от других, «классических», местоимений неспособностью к словоизменению, однако известно, что неизменяемость ряда существительных (кофе, пальто) и прилагательных (люкс, беж) не исключает их из соответствующих классов. В поддержку того, что между собой тоже является одной лексемой, можно отметить ее семантическую и функциональную близость к местоимению друг друга, в частности оба местоимения обычно в качестве референта имеют подлежащее или прямой объект (синтаксическую группу, занимающую в синтаксической иерархии более высокую позицию); ср. [Тестелец 2001: 47], но не косвенное дополнение:

(5) Мы i заметили [друг друга]i . Судьба предназначала нас i [друг другу]i

(6) Мы i поговорили [между собой]i . [Петю и Машу]i нельзя сравнивать [между собой]i .

(7) Инициатива поделить переселенцев i [между собой]*i/j расколола европейские страны j .

Следующая группа – кто попало, кто придется, что угодно, что хочешь/хотите, мало кто – напоминает по своей структуре (и в какой-то мере и по семантике) местоимения с неизменяемой первой или второй частью (никто, ничто; ср. особенно кто-нибудь, восходящее к сочетанию местоимения кто и глагольной формы (не) будь). Есть серьезные основания считать их местоимениями (см. [Тестелец, Былинина 2004]), при этом, однако, оказывается, что такие единицы допустимы при всех вопросительных местоимениях (какой, чей, сколько, где, куда и т. д.). Если наличие соответствующего слова является главным критерием для того, чтобы считать какую-либо конструкцию эквивалентом слова, то выражения своего рода, такого рода, подобного рода можно условно отнести к местоимениям благодаря слову такой, хотя интуитивной поддержки такое решение, кажется, не получает. Отметим также, что в словаре [Объяснительный словарь 2002] из всех этих единиц зафиксирована только такого рода.

Единицы группы Б представляют собой промежуточную группу между знаменательными и незнаменательными словами. Так, и наречия, и предикативы почти не изменяются, и в этом смысле ученые лишены морфологических критериев для разграничения данных частей речи. С другой стороны, наречия не занимают монопольного положения в структуре предложения: типичная для них обстоятельственная позиция регулярно замещается и другими частями речи (Он приходил к нам вечером / вчера // в понедельник / на прошлой неделе). Таким образом, при выделении наречий не отмечается такой прямой связи между синтаксической функцией и частеречными характеристиками, как у слов группы В. Однако другой признак частеречной классификации – семантический («обобщенное значение, характеризующее все слова той или иной части речи» [Русская грамматика 1980]) – позволяет оперировать довольно строгими параметрами и отделять в контексте наречия «вдаль», «наверх», например, от предложно-падежных сочетаний «в даль» и «на верх». Ведущим классообразующим критерием и для наречий, и для предикативов необходимо считать единство общекатегориального значения и синтаксической функции. Исходя из этого, случаи типа до смерти, на цыпочках и другие вписываются в круг единиц, относящихся к наречиям.

Перейдем к рассмотрению частей речи группы В. Они отличаются друг от друга прежде всего синтаксическими функциями:

Предлоги, союзы и частицы – это служебные, т. е. лексически несамостоятельные слова, служащие для выражения различных синтаксических отношений (предлоги и союзы), а также для образования аналитических форм или для выражения синтаксических и модальных значений предложения (частицы) ([Русская грамматика 1980: II, 457]; ср. [Зализняк 1977]).

На наш взгляд, традиция считать союзами и предлогами и многокомпонентные единицы вполне приемлема. Если поступать последовательно, такое толкование ведет к изменениям в теории о частях речи в русском языке. Более того, если мы принимаем первичность синтаксической роли при классификации слов группы В и если мы допускаем, что в этих функциях могут выступать и единицы, состоящие из более чем одного слова, то решается и судьба вводных слов и выражений: подобно предлогам, союзам и частицам они употребляются в специальной функции и заслуживают статуса отдельной части речи. Ср.:

При функциональном подходе для включения в словоизменительную парадигму глагольных форм, построенных на базе одного и того же лексического морфа, необходимо и достаточно, чтобы все эти формы выполняли одну функцию – выступали в качестве ядерного элемента в одной и той же конструкции. Состоит ли словоформа из одного компонента (цельнооформленная или синтетическая словоформа) или из нескольких (раздельнооформленная или аналитическая словоформа), при указанном подходе не является существенным [Храковский 1963: 221].

Естественно, этот вопрос в плане практически-описательном потребует еще серьезных усилий, началом этой работы могло бы стать сравнение списков в словарях [Рогожникова 1991], [Ефремова 2001] и [Корпусной словарь 2008], однако уже сейчас ясно, что прорыв в этой области можно ожидать в области корпусного анализа совместной встречаемости единиц.

 

Полузнаменательные и незнаменательные фразеологизмы

 

Изучению знаменательных фразеологизмов посвящено огромное количество работ, перечислять которые здесь невозможно (см. обзоры и библиографию в [Телия 1996; Баранов, Добровольский 2008]). Единицы, о которых идет речь в этой части, занимают промежуточное положение между типичными представителями класса лексем и фразеологизмами. Если признание предлога в течение одной лексемой не вызывает сомнений, то признание лексемой составного союза не только… но и сопряжено с большим количеством сложностей. Исходя из прозрачности границ между классами, мы считаем, что в основе образования таких единиц лежит общий динамический процесс, связанный с разной степенью устойчивости компонентов, а не в наличии / отсутствии пробелов и пропусков между частями сложносоставной единицы. Для наречия сегодня (исторически формы род. падежа местоимения се и существительного день) этот процесс привел к появлению новой лексемы, тогда как для указанных союза и предлога высокая степень фразеологической связанности (еще) не привела к полному завершению процесса.

При верности базового определения фраземы конкретные представители могут быть очень своеобразны. Основным классифицирующим признаком для служебных слов считается синтаксический, тогда как семантический критерий вторичен и не является в ряде случаев классообразующим. В то же время в силу того, что основная функция служебной лексики именно реляционная, кажется, что идиоматизация не только проявляется на уровне взаимодействия единиц, входящих во фразему, но и распространяется на тот класс (или те классы) слов, реляцию (связь) между которыми они осуществляют. Рассмотрим некоторые примеры.

1. Ряд единиц представляют случаи лексической идиоматизации (т. е. фразеологизации), вполне укладывающиеся в предложенную Мельчуком схему и являющиеся, по сути, многокомпонентными лексемами. Так, наречие в лоб (спросить в лоб) можно определить как полную семантическую идиому, поскольку значение ‘прямо, однозначно’ не содержит нетривиальных сем, совпадающих с семами предлога В и существительного ЛОБ. С другой стороны, наречие на попа («поставить что-либо на попа») в значении ‘на поверхность предмета, имеющую наименьшую площадь, вертикально’ является полу-фраземой, поскольку частично сохраняет значение конструкции «на + Вин. пад.»: употребляется при обозначении предмета, на поверхность (или на верхнюю, внешнюю сторону) которого направлено действие, движение с целью расположения, размещения кого-, чего-л. на нем’ (MAC: статья «на (с вин. пад.)»).

К подобному классу полуфразем можно отнести и предлог в порядке [взаимопомощи, критики, эксперимента и т. д.] в значении ‘в виде, в качестве’, поскольку в указанном сочетании не реализуется ни одно из значений лексемы ПОРЯДОК [см. MAC: 3, 310]. То же можно сказать и про предлог в адрес [редакции, директора и т. д.], реализующий значение ‘объект/тема коммуникации’ («критика в адрес редакции» = «критика редакции»; ср. «критика в адрес редакции» и «направлять по адресу…»).

Однако существуют и другие случаи. Проанализируем лишь некоторые из них, чтобы показать реальную сложность проблемы.

2. Только что в значении ‘непосредственно перед настоящим моментом’. Эту единицу можно рассматривать как полуфразему, в которой наречие только обладает тривиальным набором сем, а второй элемент что содержит «пустую сему» (см. [Melcuk 1995а: 182]), сохраняя только синтаксическую конфигурацию (Ср. Он только что пришел = Он только (= ‘непосредственно перед настоящим моментом’) пришел). Однако кроме этого во фраземе только что лексема ТОЛЬКО способна реализовать лишь одно из своих значений – временное, (Ср. «Он только что пел» Ф «Он только пел»). Наконец, в этой фраземе реализуется и сочетаемостное ограничение, потому что лексема ЧТО в свободном употреблении не сочетается с наречиями. Таким образом, фразема только что содержит три связанных элемента: значение времени в компоненте только, использование полувспомогательного элемента что и нестандартное сочетание что с наречием. Все это позволяет нам отнести рассматриваемую единицу к двум типам фразем: семантическая (с двумя мотивировками) или сочетаемостная полуфразема.

3. Единица не только… но и интуитивно претендует на роль фраземы (один из возможных английских аналогов not just [X] but also приведен в [Melcuk 1995а: 167] в качестве примера фраземы). Однако ее семантика вполне укладывается в сумму значений входящих компонентов:

– НЕ – квантор отрицания;

– ТОЛЬКО – указание на уникальность объекта/действия/признака, к которому относится;

– НО – противительный союз;

– И – показатель эмфазы.

На первый взгляд кажется, что значение оборота не только… но и не составляет ничего большего, как сочетание указанных смысловых компонентов. Однако более внимательный анализ показывает, что в этом случае существует ограничение, связанное с употреблением именно этой единицы.

Сравним:

(8) Необходимо не только работать, но и отдыхать

(9) *Работать не только необходимо, но и отдыхать

Как показывают указанные примеры, связанным при использовании союза не только… но и оказывается объект эмфазы в обеих частях синтаксической конструкции. Говоря грубо, элементы, которые попадают под выделение, должны принадлежать одному классу, но при этом не должны совпадать. Отметим, что союз но в свободном употреблении не связан подобными ограничением. Ср.:

(10) *Он не только читал, но и медленно

(11) Он читал, но медленно.

Необходимо отметить, что ограничение на сочетаемость существенным образом отличается от той, что мы находим в лексических полуфраземах типа карие глаза или спать без задних ног. В этих случаях идиоматика (сочетаемостные ограничения) не выходит за рамки фраземы, тогда как в рассмотренном выше союзе сочетаемостные ограничения направлены, если можно так сказать, от фраземы, ограничивая свободный выбор сопоставляемых единиц определенными правилами. Если принять указанные уточнения, то рассмотренная фразема включается в класс сочетаемостных квазиидиом, по И. А. Мельчуку.

4. Предлоги в продолжение, в течение, на протяжении всегда интерпретируются как содержащие сему временной протяженности: «на протяжении вечера», «в течение полета», «в продолжение встречи». Таким образом, все три предлога имеют в своем составе нетривиальную связанную сему и должны считаться фраземами.

Однако кроме этого предлог в продолжение [года, недели и т. д.] представляет интерес тем, что компонент значения лексемы ПРОДОЛЖЕНИЕ (а именно указание на «не начало», ‘то, что располагается, следует непосредственно за чем-либо’, по формулировке MAC [1984: III, 481]), уже не входит в значение этой служебной единицы, элиминируется из состава фраземы. Так, словосочетание в продолжение всего вечера интерпретируется как ‘от начала до конца вечера, весь вечер’, но не как ‘начиная с какого-то момента в ходе вечера’ Как показывает этот пример, идиоматизация в сфере служебной лексики может приводить не только к появлению добавочного значения, но и к элиминации существующего.

5. Группа фразем, производных от деепричастий (глядя по, несмотря на, невзирая на), кроме очевидных модификаций в семантике «этимологических» деепричастий, обладает еще одной интересной особенностью.

Как известно, субъект русского деепричастия должен быть кореферентен субъекту главного предиката. Однако для фразем глядя по, несмотря на, невзирая на и др. это правило не работает:

(12) Дом будет построен несмотря на сложности с финансированием.

Ср. *Дом будет построен, используя современные материалы. Указанные предлоги являются примером того, что при идиоматизации семантические или сочетаемостные правила (так же, как и семы в случае 4) могут не только добавляться, но устраняться.

Итак, выделение в области полузнаменательной и незнаменательной лексики многокомпонентных единиц, образованных в результате фразеологизации, позволяет отметить ряд общих особенностей фразеологизмов: их недискретность и возможность множественной классификации [Мельчук 1997–2006: 1,232]. Однако существует и ряд особенностей, возможно, связанных именно с этими группами слов.

– В силу реляционной функции, которую выполняют многие служебные единицы, идиоматизация может проявляться не внутри оборота, но выходить за его рамки, навязывая определенные условия единицам, которые она связывает. При этом список полнозначных слов, вступающих в реляционные отношения, открыт, и лексемы из этого списка не могут считаться частью фраземы (не только X… но и Y).

– Связанной с первой особенностью можно назвать и способность служебных фразеологизмов менять параметры семантической сочетаемости, существующие у исходных лексем в свободном употреблении (несмотря на).

– Идиоматизация полузнаменательной и незнаменательной лексики проявляется не только в появлении дополнительных, связанных сем, но и в элиминировании части значения (в продолжение).

– Процессы идиоматизации могут влиять не только на лексический компонент в составе лексемы, но и на морфологический, добавляя те или иные особенности в морфологический облик единиц (друг друга).

Представленное выше краткое обсуждение фразеологической природы таких единиц позволяет сделать два вывода. Во-первых, мы, безусловно, имеем дело с процессом идиоматизации языковых единиц, но этот процесс обладает некоторыми особенностями, вызванными их служебной функцией. Во-вторых, разная степень идиоматизации незнаменательных и полузнаменательных лексических фразем (фразеологизмов) говорит, скорее, об их истории, а не о том, какой статус имеют эти единицы в грамматической структуре современного русского языка. Ближайшие шаги в этом направлении связаны с выявлением степени связанности компонентов и с классификацией на основе степени связанности. Описание способов измерения связанности выходит за пределы настоящего исследования (см. подробнее [Pivovarova et al. 2014]).

Именно это позволит создать полноценные описания служебной лексики, столь необходимые и в лексикографии, и в компьютерной обработке текста.

Выводы

Итак, незнаменательные лексические фраземы образуют пеструю группу единиц. Их рассмотрение показало, что трудно – даже, пожалуй, невозможно – найти строгие критерии разграничения лексемы и лексической фраземы, фраземы и синтаксической конструкции. Проводя такую работу, необходимо учесть одновременно ряд факторов, в том числе интуитивное представление о статусе этих единиц и лингвистическую традицию. В любом классе единиц отмечаются прототипичные случаи и менее типичные, периферийные, пересекающиеся с единицами соседнего класса.

Нам кажется, что в лексикографической работе необходимо подумать о возможности считать указанные случаи самостоятельными единицами словаря. При составлении «бумажных» словарей это означает выделение их в отдельные словарные статьи. При компьютерной обработке (например, составлении частотных списков лексики и лексических минимумов) такой подход позволит избежать одного существенного недостатка прикладной лексикографии. Когда единицей словаря фактически считаются только слова «от пробела до пробела», данные частотных словарей дают неправильное представление о частотности таких лексем, как сожаление или течение. Решение этой проблемы имеет своим следствием среди прочего и составление более адекватных речевой практике носителей языка лексических минимумов для учебных целей.

Если представлять процесс становления языковой системы, то можно говорить о постепенной «шаблонизации» определенных речевых выражений, их стабилизации в системе. При этом изучения заслуживают не только «речевые произведения» (как это предлагали младограмматики) или структуры, закрепленные на том или ином уровне системы языка (как это происходит в рамках структуралистской программы), но и промежуточные типы, «шаблоны», «штампы», которые оказываются не периферией, «исключениями», а точкой встречи языка и речи (ср. [Телия 1996: 11–83]). Возможно, часть из них войдет в систему языка, вступив в отношения противопоставления с другими единицами, часть из них, по-видимому, так и останется в состоянии неопределенности между языком и речью. Эта промежуточность, тем не менее, не должна заслонять от нас самую необходимость изучать эти единицы, определять их статус и значение. Принадлежность рассматриваемых единиц к речевой сфере оправдана: действительно, они рождаются в потоке речи как слияние двух или более лексем. С другой стороны, этот факт не снимает необходимости адекватным образом описывать эти единицы. Невозможно истолковать эти случаи только как феномен речи, который не должен получать отражения в описании языка в грамматиках и словарях:

Приняв теорию, в которой лексические единицы надлексемного уровня могут определять синтаксические структуры, мы сможем инкорпорировать клише и идиомы в Словарь. Более того, множество странных свойств идиом в целом сопоставимы с теми, что уже установлены в рамках описания лексических единиц, так что они не усложнят грамматическую теорию [Jackendoff 1995: 153].

 

Коллокации

 

Гипотеза Франца Боппа об образовании глагольных флексий из личных местоимений служит прекрасной иллюстрацией того, как отдельные лексемы в составе конструкции становятся связанными, сливаясь в одно фонетическое слово и в дальнейшем – в одну лексему. Открытие Ф. Боппа объясняет не только доисторические явления праиндоевропейского языка – анализ совместной встречаемости словоформ является ключевым для понимания того, как образуются новые единицы.

Как мы показали в предыдущей части, лексему невозможно определить как единицу «от пробела до пробела»: существует множество переходных случаев, и границы между лексемой и словосочетанием, лексемой и предложением оказываются размытыми. Гораздо более продуктивным кажется расположение единиц на шкале идиоматичности: словосочетание → фразема → лексема, где стрелки указывают не только направление процесса в конкретном случае, но и динамичность классификации в целом.

Всплеск интереса к совместной встречаемости единиц в последние десятилетия связан с возросшей ролью корпусной лингвистики, в которой изучение устойчивых выражений связано как с решением прикладных задач, так и с теоретическим осмыслением накопленного материала. Один из ведущих представителей корпусной лингвистики Джон Синклер уже в 1991 году сформулировал принцип идиоматичности:

Принцип идиоматичности заключается в том, что говорящий/ая имеет в своем распоряжении большое число полуоформленных фраз, которые представляют собой уже готовые единицы, даже несмотря на то, что при анализе их можно разбить на сегменты [Sinclair 1991:105] [30] .

Такие «полуоформленные фразы» получили название коллокации [31]Многозначность и неустойчивость этого термина в русистике обсуждается в [Ягунова, Пивоварова 2010].
(от англ, collocation). Эти явления шире, чем традиционные фразеологизмы, о которых шла речь выше. При всей разнице в терминологии, коллокациями в корпусной лингвистике называют

неслучайное сочетание двух и более лексических единиц, характерное как для языка в целом (текстов любого типа), так и определенного типа текстов (или даже (под)выборки текстов) [Ягунова, Пивоварова 2011:575].

Это расширенное понимание коллокаций несколько противоречит более строгому, собственно лингвистическому, пониманию коллокаций как единиц, имеющих связанное, некомпозициональное значение [Мельчук 1960; Melcuk 1995а; Борисова 1995; Кустова 2008в и др.]. С другой стороны, такой подход позволяет включить широкий и, надо сказать, слабо оформленный список единиц, предполагающий дальнейшую более строгую классификацию, исходящую не из теоретических предпосылок, а из закономерностей, выявляемых в реальном массиве языковых данных.

Для выявления коллокаций в тексте корпусная лингвистика использует специальные инструменты, которые основываются на предположении, что частота коллокаций должна быть более значимой, чем у каждой из входящих в нее единиц по отдельности. Для измерения совместной встречаемости используются специальные статистические инструменты, которые получили название «меры устойчивости»; к ним относятся тесты MI, T-score, log-likelihood и некоторые другие (см. [Pecina 2005; Браславский, Соколов 2006; Хохлова 2008]). Надо сказать, что существующие в настоящий момент методы автоматического извлечения коллокаций нельзя признать совершенными, как минимум, в двух отношениях: во-первых, с их помощью извлекается очень разнородный набор устойчивых единиц, во-вторых, полнота извлечения далека от стопроцентной.

Важно понимать, что анализ частоты совместной встречаемости не позволяет автоматически извлекать фразеологизмы в лингвистическом смысле этого слова, то есть единицы с некомпозициональным сочетанием значений. Однако анализ больших текстовых массивов позволяет выявить единицы, занимающие положение между свободными сочетаниями и связанными фразеологизмами – «неслучайное сочетание двух и более лексических единиц». Приведенная ниже в качестве примера таблица показывает, какие двухсловные коллокаций извлекаются из одного и того же корпуса (коллекция текстов портала , объем 66 млн текстоформ) с помощью двух разных мер устойчивости (использованы данные из работы [Ягунова, Пивоварова 2010]).

Совершенно очевидно, что эти списки очень неоднородны. В них попадают:

– знаменательные лексические фразеологизмы (голубые фишки, тройская унция);

– незнаменательные лексические фразеологизмы, о которых шла речь выше (при этом, кроме того);

– фрагменты бо́льших конструкций ([в] связи с [чем], в результате [чего]);

– неидиоматизированные устойчивые сочетания (сообщает РИА, дельта Нигера, миллион долларов).

– составные имена собственные (Арбат Престиж, Ролан Гаррос) Повторим еще раз: в таблице представлены результаты автоматической работы алгоритма, которые не могут считаться ни полными, ни однородными. Однако теоретическое осмысление этих результатов позволяет заново поставить вопрос о соотношении устойчивости и идиоматичности (см. [Мельчук I960]), с одной стороны, и адекватности существующих классификаций – с другой.

Разрабатываемый под руководством одного из авторов этой книги алгоритм поиска устойчивых сочетаний усложняет эту задачу, позволяя определять устойчивость не только лексических, но и грамматических параметров для произвольной цепочки единиц (см. [Kopotev et al. 2013]). Этот алгоритм отвечает на вопрос, что и с какой вероятностью появится после конкретного слова или цепочки слов. Он находит ответы на такие, например, вопросы:

– Какая морфологическая категория оказывается наиболее устойчивой для этой позиции?

– Какое значение этой морфологической категории наиболее устойчиво?

– Что устойчивее: конкретные лексические единицы или морфологические параметры (например, падеж) с открытым списком лексем?

Использованная статистическая модель помогает распределить частоты морфологических признаков и лексических единиц на единой шкале, с тем чтобы определить наиболее стабильные параметры. Предложенный алгоритм отвечает на вопрос об измерении совместной встречаемости и морфологических признаков, и лексических единиц. Например, с помощью алгоритма можно установить, что после глагола греть мы с высокой вероятностью ожидаем: форму винительного падежа существительного греть + N.acc, лексему в составе фразеологизма греть душу и лексему в составе устойчивого, но не фразеологизированного выражения греть воду. Вместе с тем причины совместной встречаемости могут лежать в совершенно разных областях, что, безусловно, нуждается в теоретическом осмыслении.

Данные, основанные на статистике совместной встречаемости, показывают сложную картину устойчивости лексических и грамматических параметров. Очевидно, что в них присутствуют единицы разной природы, обладающие разными признаками устойчивости. Эти признаки мы и обсудим ниже на примере созданного с помощью описанного алгоритма списка устойчивых сочетаний предлога без с существительным:

Без: оглядки, устали, остатка, вести, умолку, малого, исключения, шапки, погон, сомнения, преувеличения, ведома, обиняков, содрогания, спросу, разбору, промаха, выходных, галстука, раздумий.

Некомпозициональность значения

Некомпозициональность значения считается одной из главных черт, отличающих связанное словосочетание от свободных. И это действительно так. Лишь некоторые из единиц, извлекаемых с помощью алгоритма, являются традиционными фразеологизмами, о которых шла речь в предыдущей части. Об этом говорит наличие самостоятельного номинативного значения, превращающего предложно-падежное сочетание в наречную лексему: бе́з вести, без у́стали, без у́молку (ср. с лексемой бездна, образованную из предложной группы без дна). Тесная связаннность коллокатов подкрепляется в ряде случаев переносом ударения на прежде безударный предлог. Любопытно, что в НКРЯ можно найти примеры слитного написания некоторых из этих единиц не только в интернет-текстах, но и в научно-популярной (11) и художественной (12) литературе:

(11) Все они работали безустали (Л. Чуковская. Декабристы).

(12) Ей хотелось говорить безумолку , смеяться, дурачиться, но темный угол за роялью угрюмо молчал, и кругом, во всех комнатах верхнего этажа, было тихо, безлюдно. [А. П. Чехов. Бабье царство (1894)]

Профилирование коллокатов

Идея профилирования как инструмента анализа семантики лексем, прежде всего синонимов и квазисинонимов, была предложена П. Хэнксом в 1996 г. [Hanks 1996] и развита в работах С. Гриса, Д. Дивьяк, Л. Янды, О. Ляшевской и др. Она сводится к тому, что близкие по значению лексемы обладают разными «индивидуальными метками» (ID tags): это могут быть морфологические, синтаксические, семантические или другие количественные характеристики словоформ (см. [Gries 2006: 3]), создающие уникальный профиль использования лексемы в речи. Мы полагаем, что эта идея может быть чрезвычайно продуктивной не только при исследовании отдельных лексем, но и при исследовании их сочетаний – коллокаций. Ниже мы покажем, что набор форм, которыми представлена в корпусе та или иная лексема, связан с сочетаемостными ограничениями, или – другими словами – с включенностью лексемы в определенный ряд коллокаций, который в одном случае может быть довольно широким, а в другом – ограничен лишь несколькими коллокациями.

Морфологический профиль

С точки зрения языковой модели, не существует никаких ограничений на образование всех 12 форм лексемы галстук. Однако в речи некоторые из них встречаются чаще, некоторые – реже. Единицы типа без галстука/галстуков ‘неформально’, без передышки ‘без отдыха’, без ведома ‘без разрешения’ и т. п., являясь по существу фразеологизмами, отличаются формальной независимостью частей, в частности, отсутствует перенос ударения, примеров слитного написания этих единиц в НКРЯ не зафиксировано. Кроме того, в корпусе находится значительное количество примеров в прямом (13), переносном (14) значениях:

(13) И уж потом я узнал от Валерии Николаевны, что Старостин не мог прийти впервые в дом без галстука … (И. Кио. Иллюзии без иллюзий).

(14) Любой блог – общение без галстука , даже если в нем затрагиваются официальные темы,  – полагает директор Института развития свободы информации Елена Голубева (А. Белуза. Политики от блога).

Однако частотность разных форм этих слов неравномерна. Проанализируем для примера единицу без ведома. На первый взгляд, эта единица семантически и синтаксически разложима: ее семантика целиком выводима из семантики входящих компонентов, ударение не смещено.

(15) Так же, за спиной и без ве́дома Людки, Ирина отнесла остальные деньги в банк «МММ» (В. Токарева. Своя правда).

(16) Прошу тебя без моего ве́дома никому ничего не обещать! (М. Гиголашвили. Чертово колесо).

Приведем наблюдение В. В. Виноградова, в котором верно подмечена сложная природа такого рода единиц:

Ведомо, без ведома, с ведома. Процессы превращения падежных форм имен существительных в наречия протекают в современном языке очень активно. Разные именные формы, вступившие на путь адвербиализации, находятся на разных этапах этого пути. По отношению ко многим словам трудно решить вопрос, осуществят ли они с течением времени весь путь адвербиализации или же сразу перейдут в предлоги, минуя наречия. Например, бывшее слово ведомо в выражениях без ведома, с ведома , не имеет форм ни числа, ни склонения, ни даже рода в собственном смысле, хотя оно явно не женского рода (ср.: с моего ведома, без вашего ведома). Но признать выражения без ведома, с ведома наречиями невозможно. Этому противоречит их способность иметь при себе в качестве определения местоименное прилагательное и возможность отделения от них предлога посредством вставки определяющего слова (ср. с их ведома). Так как выражения с ведома и без ведома сочетаются только с родительным падежом (с ведома начальства, без ведома родителей) и согласуемые формы родительного падежа местоименных прилагательных здесь равносильны родительному определительному падежу имен существительных (ср. с моего ведома, но: с его ведома), то, по-видимому, перед нами – обороты, застывшие на промежуточной стадии между именем существительным и предлогом (ср. замечания об истории этой формы у Потебни: « Ведомо, синонимичное по отношению к известно , будучи формой явно причастной, по направлению к наречности переходило через субстанциальность, заметную в без ведома (без вести): „а тогда на них (переветников) не было ведома никакого" (Пск. I, 233), что предполагает „какое ведомо" (т. е. имя существительное среднего рода)» (Из зап. по русск. грамм., 3, с. 470) [Виноградов 1986: 380].

В целом интуиция В. В. Виноградова не противоречит данным корпуса, однако в текстах последних двух столетий все же находятся формы не только родительного, но и других падежей:

Предложный падеж

(17) Действовать в резко революционном порядке можно было только за его счет, то есть при его ведоме и согласии (Н. Суханов. Записки о революции).

(18) Познакомилась я и с заявлением Сараджева в Антиквариат – учреждение при Наркомпросе, в чьем ведоме находились уникальные, ценные предметы <…> (А. Цветаева. Сказ о звонаре Московском).

Второй родительный падеж

(19) Брюсов, приехавший разузнать, что за «группа» без его ведому издалась в альманах «Зеленый сборник», сговорился со мной и Верховским встретиться (М. Кузмин. Дневник 1934 года).

Творительный падеж

(20) Этот был, впрочем, человек добрый, но его выгнал из Литвы брат Витовта – образ человеческий носит, а нравами и ведомом не ведомано! (Н. Полевой. Клятва при гробе Господнем).

В. В. Виноградов, безусловно, прав, считая эти случаи переходными. Цитируя А. А. Потебню, он, видимо, не склонен точно определять и часть речи знаменательного слова. Важно, что знаменательное слово в составе этого оборота деформировано: в корпусе обнаруживается существенная диспропорция в употребительности падежей. Распределение падежных форм этой лексемы в текстах XIX–XX веков следующее: родительный падеж (только в оборотах без / с ведома) – 1516 раз, все остальные падежи в сумме – 4 раза. Опираясь на эти количественные данные, мы полагаем, что при такой неполной падежной парадигме знаменательная лексема является связанной. Пользуясь определением И. А. Мельчука, можно сказать, что в этой фраземе нарушенной оказывается не семантика, а синтактика знака. Или, обобщая: свобода лексических единиц определяется не их парадигматическими (то есть потенциальными) возможностями, а реальной частотой конкретных морфологических форм в речи. Существительное, употребительное во всех 12 формах, является более свободным, чем существительное, представленное в текстах лишь одной-двумя падежными формами. Таким образом, важным признаком связанности лексемы является ее морфологический профиль. Полнота парадигмы в реальном употреблении – один из существенных признаков свободной лексемы. Вероятностные предпочтения той или иной морфологической формы (включая и полную неупотребительность какой-то из них) сигнализируют о степени связанности лексемы в составе фразем.

Важным в поведении лексемы оказывается не столько парадигматическая возможность образования падежных форм, сколько реальная синтагматическая употребительность конкретной словоформы. В нашем примере безусловное частотное превосходство родительного падежа связано с конструкцией «без/с ведома», что превращает когда-то более свободную лексему ведомо в морфологический изолят в составе фразеологизма. Именно поэтому затруднено и определение части речи: в составе фразеологизма парадигматические признаки (в том числе частеречные) стираются. Один из важнейших признаков лексем состоит в том, что они профилируются таким образом, что из потенциально полной парадигмы форм в узусе может использоваться их полный (для свободной лексемы) или ограниченный набор, что говорит о большей связанности лексемы в составе устойчивого выражения. При таком подходе легко может оказаться, что совершенно свободных лексем нет: существуют лишь в большей или меньшей мере связанные.

Итак, одним признаком идиоматизации можно считать морфологическое профилирование лексемы, при котором словоформы одной лексемы употребляется с разной частотой. Вторым признаком можно считать ее конструкционное профилирование, то есть тяготение лексемы к определенным конструкциям.

Конструкционный профиль

Регулярная воспроизводимость приводит к тому, что лексемы «застывают» в определенной грамматической форме в составе определенных выражений. Например, по данным НКРЯ, из всех возможных контекстов для формы остатка 69 % приходится на оборот без остатка, который входит в извлеченный нами автоматически список устойчивых сочетаний без + N (см. выше). При потенциальной возможности этого существительного сочетаться с довольно широким списком лексем существует предрасположенность к определенным контекстам. Назовем это свойство конструкционным профилем: определенные контексты (или конструкции) задают поведение лексем или целых классов, в предельном случае сводя лексему к морфологически изолированной форме: без ведома, без обиняков и т. п.

Безусловно, конструкционный профиль во многом определяет морфологические предпочтения лексемы. В этом смысле морфологическое и конструкционное профилирование являются пересекающимися признаками. Однако между ними есть определенная разница, которую мы продемонстрируем на примере топонимов. В диаграмме ниже приведен сокращенный морфологический профиль (данные о частотности падежей без разделения ед. и мн. чисел) для семантического класса топонимов и для двух представителей этого класса: Москва и Америка.

Топонимы как семантический класс чаще употребляются в номинативе, генитиве и локативе. Лексема Москва в этом смысле почти не отличается от всего класса: морфологические профили лексемы и класса совпадают (коэффициент согласия – 0,93; см. первый и второй столбцы диаграммы). Однако для лексемы Америка ситуация несколько иная: форма предложного падежа употребляется существенно чаще, а именительного – реже, чем соответствующие формы топонимов в целом (это подтверждает и низкий критерий согласия – 0,64). Вероятно, это несовпадение вызвано частотностью предложного падежа предположительно в локативной конструкции: в Америке. НКРЯ подтверждает нашу догадку: из 214 форм предложного падежа 211 (98,6 %) управляются предлогом в [37]Топонимы, естественно, часто употребляются в локативной конструкции, однако из общего числа топонимов в форме предложного только 82,84 % стоят после предлога в. Это почти на 16 % меньше, чем доля в Америке.
. В итоге сочетание в Америке является семантически свободным, однако связанным сочетаемостно, что потенциально создает условия для развития устойчивого выражения и даже фразеологизма. Другими словами, для возникновения лексической фраземы (фразеологизма) необходимо, чтобы его компоненты встречались в тексте совместно: чем чаще это происходит, тем вероятнее возникновение нового, некомпозиционального значения.

Итак, конкретная лексема может использоваться в разных конструкциях и обладать собственным морфологическим профилем, который может более или менее совпадать с профилем семантического класса. Употребление конкретной морфологической формы может быть связано с определенной конструкцией, которая определяет большую частотность этого падежа в сравнении с классом. Конструкционный профиль говорит о синтаксической связанности словоформы, тогда как морфологический определяет, насколько конкретная лексема ограничена в образовании конкретных форм.

Проницаемость

Обсуждение последнего критерия связанности начнем с рассмотрения следующего примера. Обороты без шапки / без погон / без перчаток не являются фразеологическими. В то же время мы знаем, что с предлогом без устойчиво сочетаются определенные классы существительных, например, обозначающие часть или вид одежды. Такие конструкции с определенной семантикой, конечно, не обойдены вниманием исследователей (см., например, [Подлесская 2007; Шеманаева 2007]). Наличие списка семантически однородных переменных, подчиненных определенному конструкционному профилю, позволяет считать эти единицы представителями синтаксической непредикативной конструкции, построенной по модели «без + N.gen ‘одежда (или ее часть) и обувь’». Здесь мы хотим обратить внимание на такой параметр, как проницаемость, то есть возможность/невозможность вставки лексического материала между компонентами оборота. Сравним данные контактного / дистантного расположения компонентов (см. диаграмму).

И конструкция «БЕЗ + [одежда и обувь]», и ее конкретный представитель без шапки гораздо чаще употребляются с контактным распоряжением элементов (ок. 86 % и 96 %, соответственно), чем конструкция «В + [одежда и обувь]» и ее представитель в шапке (примерно 34 % в обоих случаях). Это свидетельствует о большей связанности компонентов первой конструкции. При этом коллокация без шапки слабо проницаема для других элементов. Так, при потенциальной возможности и естественности примера Без теплой шапки в Сибири не проживешь определители при существительном в без шапки встречаются, по данным корпуса, очень редко. Еще одним примером является оборот без галстука/галстуков, который, с одной стороны, является реализацией непредикативной конструкции «без + N.gen ‘одежда (или ее часть) и обувь’», а с другой, – лексической фраземой с некомпозициональным значением ‘неформально’. При этом он практически непроницаем: в 97,5 % от всех примеров, найденных в НКРЯ, мы находим контактное расположение элементов. Таким образом, непроницаемость является еще одним индикатором устойчивости, которая, в свою очередь, является базой для дальнейшей идиоматизации.

Выводы

Речевое произведение развивается линейно: сказав А, мы с большой вероятностью скажем Б, а не Щ. В речевом потоке можно выделить многокомпонентные единицы, не являющиеся в строгом смысле фразеологическими, однако обладающие общим свойством – устойчивостью совместной встречаемости. Их можно считать свободными с точки зрения фразеологии, но именно из этой речевой стихии возникают единицы, которые мы называем фразеологизмами, именно они потенциально могут стать однословной лексемой. Совокупная шкала устойчивой воспроизводимости формируется из набора взаимосвязанных признаков, который включает в себя конструкционные ограничения, ограничения конкретной лексемы, проницаемость границ между лексемами и, в ряде случаев, семантическую некомпозициональность.

Мы далеки от мысли, что перечисленные факторы являются единственным условием для возникновения лексического фразеологизма. Играют свою роль и такие не названные выше факторы, как наличие прецедентных текстов, просодический или ударный контур и даже рифма. С помощью корпусного количественного анализа появляется возможность вычленять такие единицы, размещать их в многофакторной матрице и подвергать качественному анализу. В качестве заключения покажем разные параметры устойчивости на примере трех слов из нашего списка: без оглядки, без шапки и без переводчиков.

Без оглядки (см. диаграмму на вклейке)

1. Морфологический профиль: по данным НКРЯ, лексема оглядка употребляется в четырех формах: единственное число родительного (21), творительного (9), винительного (2) и именительного (1) падежей: оглядки, оглядкой, оглядку, оглядка.

2. Конструкционный профиль: все формы родительного падежа встретились после предлога без (9 форм творительного падежа – в антонимичной конструкции с оглядкой).

3. Проницаемость этой коллокации равна нулю: примеров с дистантным расположением коллокатов в корпусе не зафиксировано.

Это устойчивая коллокация, ограниченная как морфологически, так и конструкционно, с нулевой проницаемостью.

Без шапки (см. диаграмму на вклейке)

1. Морфологический профиль: по данным НКРЯ, лексема шапка употребляется во всех формах, кроме предложного падежа множественного числа. Такого отчетливого профилирования, как для лексемы оглядка, мы не видим.

В целом лексема шапка является более свободной, чем лексема оглядка.

2. Конструкционный профиль: для сравнения с лексемой оглядка возьмем только конструкционный профиль формы родительного падежа единственного числа, который показывает, что в 52 % случаев эта форма употребляется после предлога без.

3. Проницаемость этой коллокации близка к нулю, но не равна ему: в 4 % из всех примеров – дистантное расположение элементов:

(21) Говорят: в холодное время года нельзя ходить без шапки (И. Покровская, М. Алексейкина. По волосам не плачут).

(22) В дверях уже стоял подполковник Климентьев – молодо, без шинели и шапки (А. Солженицын. В круге первом).

(23) Если не купили вам пирожное

И в кино с собой не взяли вечером,

Нужно на родителей обидеться

И уйти без шапки в ночь холодную (Г. Остер. Вредные советы).

Без переводчика (см. диаграмму на вклейке)

Возьмем для чистоты эксперимента сочетание, которое интуитивно кажется нам более свободным, чем два рассмотренных выше.

(24) И все эсперантисты свободно говорили между собой без переводчиков (С. Тимохин (Тим Собакин). Эсперанто).

1. Морфологический профиль: распределение форм лексемы переводчик примерно совпадает с таковыми для лексемы шапка. В этом смысле обе являются более свободными, чем оглядки (см. диаграмму).

2. Конструкционный профиль: форма родительного падежа переводчика не проявляет устойчивой связи с определенными словами в предшествующем контексте: из 21 примера по два раза употребляются сочетания работа переводчика, услуги переводчика и в качестве переводчика, что не позволяет говорить о наличии какой бы то ни было частотно превалирующей коллокации, как это было в случае с оборотом без шапки. Таковой точно не является сочетание без переводчика, встретившееся всего один раз. Таким образом, с точки зрения конструкционного профиля форма родительного падежа этой лексемы оказывается несвязанной.

3. Проницаемость оборота без переводчика велика: четверть всех употреблений приходится на дистантное расположение элементов:

(25) Все обратили внимание на то, что часовой разговор с министром обороны Грачевым Рабин провел без своего официального переводчика (А. Бовин. Пять лет среди евреев и мидовцев, или Израиль из окна российского посольства).

(26) Андреич всегда мотался к нему один, без переводчика (До после победы // «Солдат удачи», 2004).

Таким образом, по всем трем критериям оборот без оглядки оказывается самым связанным, на втором месте – оборот без шапки, а без переводчика оказывается самым свободным. Важно подчеркнуть, что устойчивость предшествует семантическому сдвигу. Примеры выше показывают семантическую композициональность устойчивого сочетания без шапки. С другой стороны, в примере (ходить без шапки) без шапки может выступать уже в обобщенном значении «одетым легко, не по погоде». Эта грань между регулярным и смещенным значениями очень зыбка, однако, как мы стремились показать, ей предшествует устойчивость совместной встречаемости, которая и создает условия для сдвига.

Идея, что «слова характеризуются тем, что их окружает» [Firth 1957], имеет долгую историю. В последнее время она стала чрезвычайно популярной в связи с появлением больших массивов данных и возможностью экспериментально определять сочетаемостную дистрибуцию. Такой анализ позволяет выявлять единицы, занимающие промежуточное положение между многокомпонентной лексемой (фразеологизмом) и словосочетанием: с одной стороны, эти единицы отличаются устойчивой воспроизводимостью (как фраземы), с другой – синтаксической и семантической регулярностью (как свободные словосочетания). Назовем их вслед за И. А. Мельчуком квази-фраземами.

 

Переходные случаи: синтаксис или лексика?

В силу сложившейся традиции в русистике несопоставимо больше внимания уделяется лексическим фразеологизмам, явление идиоматизации в синтаксисе изучено гораздо меньше. Под темой «фразеология и синтаксис» часто понимают изучение лексических фразем с точки зрения их синтаксического поведения (см., например, [Андра-монова 1982; Добровольский 2005, 2007; Tronenko 2003]). Естественно, осложняет ситуацию то, что лексический фразеологизм по своей природе часто представляет собой одновременно и единое понятие, и синтаксически разложимый комплекс, например железная дорога, сесть в лужу. Ниже мы обсудим несколько переходных явлений, которые трудно однозначно расположить в зоне лексической или синтаксической идиоматики.

Отбросить копыта

(27) Штирлиц зашел в кабинет к Мюллеру и отбросил копыта.

Вы бы тут еще рога набросали! – сказал Мюллер.

Отбросить копыта может, в принципе, даже тот, у кого их нет. Эта единица является классической лексической идиомой (фразеологизмом), которая фиксируется в соответствующих словарях как отдельная статья [Федоров 2008], обладающая своей морфологией, сочетаемостными возможностями и т. д. (см. [Богуславский, Иомдин 1982]). Среди прочего этот фразеологизм обладает и определенными синтаксическими особенностями – как внутренними (аккузативное управление), так и внешними (невозможностью пассивизации: *копыта были отброшены). В этом смысле этот фразеологизм, оставаясь в кругу лексических единиц, безусловно, представляет интерес и для синтаксиста (о синтаксисе подобных единиц см. еще [Tronenko 2003]; [Иомдин 2003]; [Добровольский 2005,2007]; [Апресян 2007]; [Баранов, Добровольский 2008]; [Nenonen 2007] и др.).

Мало ли что

(28) – Иди ешь кашу!

– Ты же суп варила?

– Мало ли что я варила…

В работах И. Н. Кайгородовой, посвященных синтаксической идиоматике, выделяется такая «фразеосхема», как «мало ли + что + глагол настоящего и прошедшего времени» [Кайгородова 1999: 143 и далее]. В то же время в словарях ([Рогожникова 2003]; [Ефремова 2004]) выделены лексические единицы мало ли (наречие в [Рогожникова 2003: 209]; наречие и частица [Ефремова 2001: 275], частица мало ли что [Рогожникова 2003: 209]; [Ефремова 2001: 275]). За разногласием ученых, числящих эти конструкции по лексическому или по синтаксическому ведомству, стоит серьезная теоретическая проблема. Рассмотрим следующие примеры.

(29) Он просил не встречаться у гостиницы – мало ли что произойдет? – например, могут его сфотографировать с иммигрантом (В. Голяховский. Русский доктор в Америке).

(30) Мало ли кому еще придет в голову попросить краски? (А. Житков. Кафедра).

(31) А что касается убийства какого-то переводчика, то мало ли где, кого и за что убивают (В. Войнович. Дело № 34840).

На первый взгляд кажется, что идиоматичность может быть равно приписана наречию мало ли (имеющему ограничения на сочетаемость) или целиком синтаксической конструкции. Но проанализируем примеры более внимательно. Отметим прежде всего неточность описания И. Н. Кайгородовой. Во-первых, как показывают примеры (29) и (30), употребление форм будущего времени также возможно. Во-вторых, наряду с лексемой что могут употребляться и другие местоимения (примеры (30), (31) выше). Таким образом, следуя логике И. Н. Кайгородовой, следует выделять также и синтаксические фраземы «мало ли + кто + Verbum finitum», «мало ли + где + Verbum finitum» и т. д. Однако более целесообразным выглядит все же другой путь: наречие мало ли можно признать лексической фраземой (фразеологизмом), которая обладает следующими особенностями.

Часть речи:

наречие

Значение:

мало ли1 ‘несущественно’: Мало ли она наделала глупостей.

мало ли2 ‘неизвестный, неопределенный, возможный N’ (где N – соответствующее неопределенное местоимение что-то/что ‘что-то’, кто-то/кто ‘кто-то’ и т. д.): Мало ли кто (-то) еще придет.

Сочетаемость:

мало ли 1 : в позиции наречной группы при глаголе;

мало ли 2 : в позиции наречной группы; с неопределенными местоимениями (дублируя значение суффикса – то).

Итак, оказывается существенным, что идиоматичность может быть полностью выведена из сочетаемостных особенностей лексемы, а не из конструкций, в которых выступает эта лексема. Конечно, сочетаемостные особенности реализуются в конструкциях, и в этом смысле обе возможности для ее описания допустимы. Однако целесообразнее считать более компактным для описания подход «от лексемы» и, следовательно, фиксировать в словаре единицу мало ли с определенными сочетаемостными ограничениями, а не описывать синтаксические конструкции «мало ли + кто + Vƒ», «мало ли + где + Vƒ» и т. д. (схожим образом обсуждает двойственную природу этих единиц В. Ю. Апресян [2007]).

Была не была

(32) «Была не была», – решилась она вечером.

«Была? Не была?» – решал он утром.

Была не была – идиоматическая единица с семантикой ‘окончательного, но не мотивированного решения’. Она представляет пример идиоматизированной единицы: ни один из морфологических параметров, обычно вызываемых согласованием, не мотивирован синтаксически (Ср. *Она была не была, *Он был не был). Однако она существует как единица, выполняющая определенные синтаксические (в данном случае предикативные) функции.

К стр. 60. Морфологический профиль лексем оглядка и шапка.

К стр. 60. Конструкционный профиль словоформы шапки (Род. пад., ед. ч.).

К стр. 61. Морфологический профиль лексемы переводчик.

К стр. 61–62. Сравнение коллокационных особенностей лексем оглядка, шапка, переводник.

В этом смысле она представляет определенную параллель таким лексическим фраземам, как ничто-же сумнящеся и т. п., которые фиксируются в словаре (см., например, «коммуникемы» в [Меликян 2001]), поскольку они не подчиняются грамматике и не выводимы из существующих синтаксических правил (ср. [Янко 2001: 23]). Застывшая морфология превращает это выражение в изолированную идиоматическую единицу с фиксированным составом словоформ. С другой стороны, эта единица практически всегда функционирует без контекстной поддержки как самостоятельная единица текста, что сближает ее с предложениями. Как всякое законченное высказывание, она обладает определенным интонационным рисунком, предикативностью и другими атрибутами синтаксической единицы. В качестве несамостоятельной единицы она употребляется крайне редко, на грани грамматической приемлемости:

(33) Да, правильно вы говорите, они тоже так думают, уж лучше один раз была не была, чем вот так, все время ждать чего-то, жить в какой-то неизвестности (интервью с Р. Аушевым // Эхо Москвы, 2003).

По своим структурным параметрам (жесткий порядок слов, невариативность) фразема была не была сближается с лексическими фраземами, но по функциональным возможностям (независимое употребление, интонация, предикативность, модальная рамка и др.) является коммуникативно достаточным высказыванием. Функционируя как самостоятельное предложение, она представляет интерес, связанный с областью супрасинтаксиса, с включением этого выражения в текст и т. п. Итак, эта «коммуникема» может быть описана и в рамках синтаксиса, и в рамках лексики. Однако стабильность списка лексических переменных (даже конкретных морфологических форм) делает предпочтительным ее лексикографическое представление.

Считать до трех

(34) Рина Зеленая изобрела прекрасное средство от бессонницы: надо считать до трех, максимум – до половины четвертого.

На первый взгляд, оборот считать до трех является фразеологизмом со значением ‘отсчитывать время до начала события’, сопоставимым по своим идиоматическим свойствам с глагольным фразеологизмом отбросить копыта. Однако эта единица является примером фраземы с вариативным лексическим наполнением: считать можно до трех и тридцати, до пяти, пятнадцати и пятидесяти, до шестидесяти, до ста и до тысячи. Других вариантов НКРЯ не содержит. Таким образом, можно говорить о синтаксической конструкции, в которой заданы определенные формальные ограничения на переменную в предложной группе. Эта единица не образует самостоятельной предикативной единицы и в этом смысле принадлежит микросинтаксису, являясь кирпичиком для построения предложений. Назовем ее непредикативной синтаксической фраземой. Следует подчеркнуть, что, с одной стороны, в одном шаге от синтаксических стоят лексические фраземы типа отбросить копыта, которые по сути являются фраземами, где место переменной занимает ровно одна лексема. Расширение списка лексических компонентов превращает лексическую единицу в синтаксическую. С другой стороны, непредикативные синтаксические фраземы (особенно с глагольной вершиной) стоят в одном шаге от собственно предложений, и граница, их разделяющая, предельно условна.

Как мы отметили выше, в современных работах по идиоматике можно найти существенные разногласия по поводу того, какие конкретные единицы следует считать лексическими, а какие синтаксическими фраземами: их четкого разделения не существует. Они демонстрируют лексико-синтаксический континуум, или плавный переход от лексики к синтаксису, который иногда называют конструктивном (construction; см. [Goldberg 2000; Schultze-Berndt 2002]), коллострукциями (constructions; см. [Stefanowitsch & Gries 2003]). Часть этих единиц целесообразнее описывать как лексические единицы (и соответственно, включать в словарь), другие – как синтаксические конструкции (и учитывать в грамматике). В следующей главе, в рамках разговора о синтаксической идиоматике, речь пойдет о предикативных синтаксических фраземах, отличительным свойством которых является возможность лексической вариативности, ограниченной, естественно, самой конструкцией.