Квантитативный подход к морфологической типологии языков


Дж. Гринберг

КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ

(Новое в лингвистике. Вып. III. - М., 1963. - С. 60-94)


Один из шагов, которые должна предпринять любая наука, если она хочет ясноосмыслить потенциальные возможности своего научного метода, заключается в том,чтобы, не ограничиваясь простым описанием изучаемых объектов, перейти к их сравнениюи классификации. На то, что лингвистика сделала такой шаг, указывает само существованиетак называемого "сравнительного языкознания", особой отрасли науки, котораяк тому же занимает почетное место среди наук, изучающих человека. Однако сравнительно-историческийметод представляет собой лишь один из двух основных методов, при помощи которыхможно сравнивать языки. Второй метод (его можно было бы назвать типологическим)является предметом рассмотрения настоящей статьи. Судьба его была не столь гладкой,как судьба историко-генетического метода, являющегося неотъемлемой принадлежностьюсравнительного языкознания. Важно по возможности более отчетливо дифференцироватьразличия, существующие между этими двумя методами. Каждый из них вполне правомеренв своей собственной сфере, но смешение указанных методов, например в тех случаях,когда типологические критерии используются для установления родственных связей,принесло много вреда в прошлом.
Историко-генетический метод классифицирует языки по "семьям", которые имеютобщее историческое происхождение. Известным примером является развитие современныхформ романских языков - французского, испанского, португальского, итальянского,румынского и других - из первоначально единой латыни в результате измененийодной и той же речевой формы в различных ареалах. Если бы подобное расхождениеязыков не было таким отдаленным во времени, что исчезли все его следы, сравнениемогло бы вскрыть характерные черты сходства между языками, имеющими общее происхождение.При этом наиболее существенным для подобных сравнений является сходство междуотдельными формами языков как в их звучании, так и в их значении. Например,англ. nose и нем. Nase имеют сходные звуки и фактически тождественные значения- "нос"; англ. hound "охотничья собака", "гончая" и нем. Hund "собака" сходныпо звучанию и близки, хотя и не совпадают полностью, по значению. В любом языкеесть тысячи форм, обладающих как звучанием, так и значением, связь между которымине мотивирована. В принципе любое звучание может передавать любое значение.Поэтому, если в каких-либо двух языках значительное число таких единиц совпадает- как, например, в немецком и английском - и если (эта проблема здесь не рассматривается)случаи сходства нельзя объяснить заимствованием, мы по необходимости приходимк выводу об общем историческом происхождении этих языков. Подобные генетическиеклассификации не являются условными, поскольку они не допускают установлениядругих критериев, могущих привести к иным результатам. Это объясняется тем,что подобные классификации отражают исторические события, которые либо действительноимели место, либо нет. Либо немцы и англичане говорят на языке, полученном внаследство от первоначально единого протогерманского речевого коллектива, либонет. Использование таких терминов, как "семья", "родственный" и "генетический",сближает эту классификацию с биологической классификацией. С генетическими гипотезамив языке дело обстоит также, как в биологии, где мы относим виды к одному и томуже роду или к подразделению более высокого порядка, поскольку их сходство таково,что наводит на мысль об их общем происхождении.
Можно, однако, сравнивать и языки, генетическую близость которых нельзя продемонстрироватьлибо в отношении звуковых, либо в отношении семантических явлений. Приводимыениже два примера послужат иллюстрацией такой возможности и в то же время покажут,что при подобном сравнении возникает ряд научных проблем, имеющих полное правона существование. Во всех языках должны быть средства для выражения сравнения- того, скажем, факта, что один предмет больше, чем другой. Если мы сопоставимвсе языки мира в этом отношении, мы обнаружим, что число таких приемов ограниченно- особая словоизменительная форма прилагательного (англ. greater "больше" [ср.great "большой".- Перев.]), использование предлога со значением "от"(семитские языки), использование глагола, означающего "превосходит, превышает"(широко распространено в Африке), - и что некоторые из них встречаются чащедругих и имеют вполне определенные границы распространения, не совпадающие сгенетическими границами. Все эти факты, несомненно, представляют научный интереси требуют объяснения. Пример, который мы привели выше,- факт семантический.В области фонетических моделей, безусловно, заслуживает внимания независимоестановление системы из пяти гласных с двумя ступенями долготы - a,a';e,e';i,i';o,o';u,u'- в классической латыни, в языке хауса (Зап. Африка), в йокутс (= Yokuts) -индейском языке Калифорнии и, несомненно, также в других языках. Именно подобныеявления изучали Трубецкой и другие, пытаясь определить, какие типы систем гласныхи согласных возможны, сколь часто они встречаются и какова область их распространения.
Если сравнение языков в генетическом плане позволяет нам установить классыязыков, то есть языковые семьи в общепринятом смысле, то разве типологическаяклассификация не дает такой возможности? Конечно, дает, но в отличие от генеалогическойклассификации у нее нет конкретных связей с историей, и она условна, то естьв зависимости от выбранного критерия или совокупности критериев она приводитк различным результатам.
В этом отношении она похожа на классификацию по расам, основанную на рядеусловно выбранных признаков. Если, например, мы выберем такой чисто фонетическийкритерий, как наличие или отсутствие округления губ, в качестве признака, различающегопары гласных фонем, языки мира распадутся на две группы: на языки, в которыхданный принцип противопоставления используется, и языки, в которых он не используется.Английский и итальянский языки, не использующие лабиализации, попадут в одинкласс А с бесчисленными другими языками, а французский и немецкий вместе с меньшимчислом языков из различных частей света попадут в класс Б. Если будет выбранкакой-либо иной типологический признак, скажем, позиция зависимого родительногопадежа по отношению к существительному, опять возникнут два класса языков, ноони не совпадут с теми, которые были получены на основе критерия противопоставлениялабиализованных и нелабиализованных гласных. Приняв во внимание оба фактора,можно получить четыре класса. Некоторые признаки позволят выделить более чемдва класса. Если классифицировать языки семантически на основе имеющихся в нихсистем числительных, мы получим несколько классов языков: языки с двоичными,пятеричными, десятичными, двенадцатеричными и, без сомнения, также другими системами.Короче говоря, в отличие от генеалогической классификации, в данной, то естьтипологической классификации, число языковых групп и их состав будет различным,в зависимости от числа и определенного выбора языковых явлений, использованныхдля сравнения. Одним крайним случаем окажется такой случай, когда в качествеединственного критерия будет взят какой-либо признак вроде наличия системы гласныхи когда языки мира распадутся на две группы: языки, обладающие системой гласных(в эту группу войдут все языки земного шара), и языки, где такая система отсутствует.Этот последний класс, разумеется, не будет включать ни одного языка. С другойстороны, возможен и такой крайний случай, когда при классификации учитываюттак много признаков, что каждый язык становится единственным представителемособого языкового типа.
Многие из таких классификаций, как явствует из только что приведенных примеров,приносят мало пользы. Мы стремимся создать типологическую классификацию, котораязатрагивала бы важнейшие основные признаки языка и которая была бы полезна вомногих отношениях. Такая классификация действительно существует - это идущееот XIX в. деление языков на три типа (в своем классическом варианте) - изолирующие,агглютинирующие и флектирующие.
Эта trop fameuse classification ("пресловутая классификация"), если вспомнитьязвительное замечание Мейе, обнаруживает весьма существенные недостатки, которыенеминуемо привели к тому, что в настоящее время она пользуется дурной славой.И тем не менее сама эта проблема представлялась настолько важной Сепиру, чтоон сделал ее центральной темой своей книги "Язык", единственной книги, внесшейпосле XIX в. значительный вклад в изучение типологии языков. Какими бы несовершеннымини казались сейчас рассуждения ученых XIX в. на эту тему, все же главного достоинствавыдвинутых схем отрицать нельзя. В качестве основы для классификации инстинктивнобыло найдено нечто, имеющее кардинальное значение для всесторонней общей характеристикиязыка, а именно морфологическая структура слова, и Сепир просто продолжил, визмененной, форме, эту важнейшую традицию более раннего времени. Возможны идругие типологические классификации, в частности фонологические, и эти последниестояли в центре внимания в типологических дискуссиях последних лет. Однако проблемаморфологической типологии остается нерешенной, о чем свидетельствует недавнеезаявление Рулона Уэллза: "Позор, что не существует общепринятой таксономии языковмира" (1950, стр. 31). Свидетельством ожившего интереса к этой теме является,далее, фактически одновременное и независимое развитие идей, сходных с изложеннымив настоящей статье, предпринятое Хокеттом из Корнелльского университета [1].Короче говоря, наступил благоприятный момент пересмотреть подход к данной проблеме,характерный для ученых XIX в., с тем чтобы, отбросив все теории, несостоятельностькоторых была за истекший период доказана лингвистической критикой, и, взяв навооружение все новейшие достижения лингвистических методов, дать существующимгипотезам более строгую и точную формулировку. Краткий критический обзор болееранних попыток создания типологических классификаций послужит надлежащим фономдля излагаемой здесь теории.
В основе всех позднейших классификаций лежит различие, впервые выдвинутоеФридрихом фон Шлегелем в его сочинении "Ueber die Sprache und Weisheit der Inder"(1808), между языками с аффиксами и языками с флексиями. Оценочное отношение,столь явно проступавшее на протяжении всей последующей истории развития даннойтеории, ясно видно уже в этой наиболее ранней ее формулировке. Аффиксирующиеязыки выражают отношения чисто механическим путем. В примечательном сравненииони уподобляются "груде атомов, рассеиваемых или сметаемых вместе любым случайнымветром" (стр. 51). Флективными языками являются только индоевропейские, хотяв этом же направлении развиваются и семитские языки.
Эта классификация языков по двум типам была переработана братом Фридриха ШлегеляАвгустом фон Шлегелем, который в сочинении "Sur la litterature provencale" (1818)описывает уже три класса языков: "языки без грамматической структуры, аффиксирующиеи флективные языки" (стр. 559). О языках первого типа, названных последующимиавторами изолирующими или корневыми, Шлегель говорит: "Можно было бы сказать,что все слова в них - корни, но корни бесплодные, не производящие ни растений,ни деревьев" (стр. 159). Писать научное сочинение таким языком - это tour deforce ("просто подвиг"). Аффиксирующие языки используют прибавляемые элементы("аффиксы") для передачи отношений и оттенков понятий, выражаемых корнями, ноэти аффиксы все еще сохраняют самостоятельное значение. Относительно флективныхязыков, в которых подобные аффиксы лишены значений (то есть не имеют конкретныхзначений), мы узнаем, что в них можно обнаружить нечто вроде органической жизни("организм"), потому что "им присущ жизнеспособный принцип развития и роста"(стр. 159). У Шлегеля, как и у последующих авторов, образцом корневого языкаявляется китайский язык, к флективной группе относятся только семитские и индоевропейскиеязыки; все остальные принадлежат к обширному и неоднородному промежуточному,или агглютинирующему, классу. Немало смущает его, так же как и других, позднейшихавторов, тот затруднительный факт, что индоевропейские языки обнаруживали тенденциюутрачивать флексии. Поэтому Шлегель вводит дальнейшее подразделение флективныхязыков на более ранние - синтетические и более поздние - аналитические. Всеизвестные нам аналитические языки возникают в результате переразложения синтетическихязыков. Не касаясь других авторов, рассматривавших данный вопрос в основномтакже, как Шлегель, мы подходим к Вильгельму фон Гумбольдту, который в своемсочинении "Ueber die Verschiedenheit der menschlichen Sprachen" (1836) сделалтипологический тип анализа центральным при исследовании языка. Гумбольдт виделв каждом языке особое, индивидуальное самораскрытие духа (Geist). Каждое такоесамовыражение духа имеет свою ценность и право на существование, но обнаруживаетбольшую или меньшую степень совершенства. В схеме Гумбольдта выделены четырекласса языков. К ставшей к тому времени уже традиционной тройной классификацииязыков он добавляет четвертый - инкорпорирующий тип, чтобы охватить некоторыеязыки американских индейцев, в которых очень сложные модели слова включают случаи,когда приглагольное дополнение инкорпорировано в том же самом слове в виде глагольногокорня. Гумбольдт совершенно недвусмысленно отказывается от какого бы то ни былоисторико-эволюционного объяснения, при котором более высокоорганизованные типывыводятся из более низких типов. Эти четыре типа - идеальные типы, связанныес различными степенями развертывания формы. Изолирующие языки "бесформенны",инкорпорирующие языки в силу чрезмерной перегруженности своих форм также необнаруживают подлинного чувства формы. Как и можно было ожидать, истинным пониманиемформы наделяются только флектирующие языки, так как только в них мы встречаемгармоническое слияние корня и аффикса в единое целое.
Изложение данной теории в ее окончательном виде мы находим в работах А. Шлейхера,который находился под двойным влиянием Дарвина и Гегеля. Классы языков рассматриваютсятеперь как соответствующие историко-эволюционные фазы в развитии языков. Числотипов ограничивается тремя, и они приравниваются к трем ступеням гегелевскойдиалектики. Флектирующий класс языков понимается как более высокая ступень синтеза,возникающая из прежней оппозиции. Распад флексий в историческое время знаменуетновую фазу развития духа (Geist), для которой материальная сторона языка уженесущественна. Поскольку шлейхеровский вариант типологической классификациивполне гармонировал с интеллектуальными тенденциями века и был снабжен внушительнымаппаратом квазиалгебраических формул для обозначения различных отношений междукорнем и подчиненными элементами, он завоевал широкое признание и был использовандвумя великими популяризаторами лингвистической науки - Максом Мюллером в Европеи Дуайтом Уитни в Соединенных Штатах. Последующие варианты, такие, например,как вариант Штейнталя-Мистели, лишь усложнившие схему Шлейхера, ничем ее взаменне улучшив, никогда не имели такой популярности, как вариант Шлейхера, который,таким образом, закрепился в качестве основной формы данной теории.
На протяжении всего этого периода этноцентризм и расплывчатость указанныхтипологических классификаций неоднократно подвергались критике. Приведем лишьодин пример: Уитни, который отнюдь не был столь восторженным почитателем типологическойклассификации Шлейхера, как его современник европеец Макс Мюллер, указывал,что английское loved "любил" от love "любить"- такая же удачная форма претерита,как led "вел" от lead "водить" или sang "пел" от sing "петь" (1876, стр. 362).Loved - это, несомненно, случай применения способа агглютинации, в то времякак в led и sang используется внутренняя флексия. И все же в применении к изолирующимязыкам он говорит об "отсутствии способов, присущих более развитым языкам; ...мысльвыражена лишь отрывочно, и ее орудие [то есть язык. - Перев.] ей слабопомогает". Другие лингвисты, особенно в более поздний период, относились к типологическойклассификации в высшей степени критически или даже презрительно, как, например,Маутнер, по словам которого "... оценивать [языки] в зависимости от того, насколькоотчетливо проступают в них флексии, столь же глупо, как судить о достоинствахевропейских армий по тому, насколько заметны швы на брюках их солдат" (1923,стр. 309).
Обращение Сепира к этой теме в книге "Язык" (1921) открывает новую эпоху.Он решительно отбрасывает как оценочный, так и эволюционный аспекты типологическойтеории. Нет никаких реальных оснований полагать, что китайский или венгерскийязыки не являются столь же эффективными орудиями мысли, как латинский или английский."Когда дело доходит до языковых форм, Платон равен македонскому свинопасу, аКонфуций - охотящемуся за черепами дикарю из Ассама" (стр. 234). Язык, по-видимому,существует по крайней мере 500 000 лет; следовательно, если и есть линия развития- изолирующие, агглютинирующие п флектирующие языки, - то современные изолирующиеязыки никак не могут отражать соответствующую первобытную стадию. И действительно,данные палеонтологии человека и геологии ледникового периода уже давно показалинесостоятельность такого допущения. Ко времени Сепира было уже известно (какиз более ранних памятников китайского языка, так и из сравнения с тибетскими другими родственными языками), что китайский язык, выдвигавшийся в качествеклассического примера изолирующего языка, ранее обладал более сложной морфологическойсистемой.
Вероятно, более серьезными недостатками, чем те, которые содержатся в этихуже развенчанных идеях, были другие логические дефекты, на что время от времениуказывалось. Критерии разграничения различных типов языков так и не получиличеткого определения и ни разу не были применены объективно. Когда мы читаемработу в духе теории Штейнталя-Мистели, нас не покидает ощущение, что авторведет нечестную игру. Во всех тех случаях, где на основе его же собственнойаргументации неарийский или несемитский язык оказывается обладателем какого-либодостойного похвалы явления, путем неожиданного молчаливого изменения определенияполучается, что в виду не имеется "истинная форма" или "истинная флексия". Определениявыглядят не только расплывчатыми, но частично относятся к совершенно разнымвещам, и в результате оказывается, что какой-либо язык принадлежит одновременнок нескольким в принципе взаимоисключающим классам. Так, агглютинация рассматриваетсяобычно как характеристика способа механической аффиксации, и, по выражению МаксаМюллера, "различие между арийскими и туранскими языками несколько напоминаетразличие между хорошей и плохой мозаикой. Арийские слова кажутся сделаннымииз одного куска, в туранских же словах ясно видны швы и трещины в тех местах,где соединяются вместе небольшие камешки" (1890, стр. 292). Термину агглютинациядолжен противостоять термин флективность. Но термин флективностьиспользуется также для указания на наличие аффиксов, лишенных конкретного значенияи служащих для обозначения отношений между словами в предложении; таковыми являются,например, падежные окончания у существительных или флексии лица и числа у глагола.Исходя из этих определений, турецкий язык является одновременно и агглютинирующим(если принимать во внимание способ), и флектирующим (если учитывать падежнуюсистему и систему спряжения глагола).
Как указывали некоторые критики, другой недостаток данной теории заключаетсяв том, что язык причисляется к какой-либо одной определенной категории, хотяучитываемые при классификации признаки могут характеризовать его в большей илименьшей степени. Термин, подобный термину агглютинирующий, применим главнымобразом к какой-то отдельной конструкции. В то же время язык вполне может содержать,и обычно действительно содержит, как агглютинирующие, так и неагглютинирующиеконструкции. Иными словами, речь идет скорее о преобладающей общей тенденции,чем о наличии или отсутствии тех или иных отличительных признаков вообще. Подвергнуврассмотрению различные критерии, используемые в традиционной классификации бессознательнои совершенно непоследовательно, Сепир создает более сложную систему, в которойязыки классифицируются по ряду независимых друг от друга критериев, а традиционныетермины хотя и сохранены, но используются строго определенным образом и частоотносятся к разным аспектам сравнения, в силу чего они уже больше не являютсявзаимоисключающими.
Один из таких аспектов, различаемых Сепиром, связан с учетом общей сложностислова в целом, то есть со степенью сложности, проявляющейся в количестве содержащихсяв слове подчиненных значимых элементов. Термины, используемые здесь Сепиром,- аналитический, синтетический и полисинтетический - расположены в порядкевозрастающей сложности. С теоретической точки зрения крайний случай анализаздесь представлен языками, в которых каждое слово состоит только из одной значимойединицы и, таким образом, не имеет внутренней структуры. К этому полюсу действительноприближаются языки китайский, вьетнамский и эве (Западная Африка). Данные языкитрадиционно называются изолирующими, но, как мы увидим, Сепир использовал этоттермин в другом смысле. Языки, подобные английскому, где слова не отличаютсябольшой сложностью, Сепир включил в группу аналитических. Однако степень синтеза- это лишь один критерий и к тому же относительно поверхностный, поскольку онничего не говорит нам о том, в чем именно заключается сложность слова. Второе,совершенно иное соображение относится к технике построения конструкций. Грубоговоря, здесь противопоставляются языки, в которых подчиненные элементы механическиприбавляются к корневым элементам, то есть ни те, ни другие элементы не подвергаютсяникаким изменениям (таково наиболее распространенное значение агглютинации вклассической схеме классификации), и языки, в которых наблюдается фузия, в результатечего составные элементы трудно узнать и выделить. Для иллюстрации воспользуемсяпримерами Сепира: good+ness в английском языке [goodness "доброта", ср. good"добрый". - Перев.) - это агглютинация, dep+th - фузия (depth "глубина",ср. deep "глубокий". - Перев.). Неоднократно возвращаясь к этому вопросуи приходя к различным выводам, Сепир в конце концов устанавливает четыре группыязыков: а) изолирующие; b) агглютинирующие; с) фузионные; d) символические.Изоляция, под которой Сепир разумеет значимый порядок элементов, включаетсяим сюда потому, что он истолковывает эту категорию как имеющую отношение к техникесоединения элементов. Подобно тому как в John hit Bill "Джон ударил Билла" Johnвыступает в конструкции с hit в качестве субъекта глагола, поскольку оно предшествуетглаголу, так и в dep-th изменение deep в dep- указывает, что последнее связанов конструкции с -th. Поскольку противопоставление агглютинация - фузия относитсяскорее к способам выражения, чем к объектам отношения, Сепир рассматривает этушкалу также как несколько поверхностную, хотя и полезную в качестве дополнительногокритерия.
Деление, которое представляется Сепиру наиболее существенным, вызывается следующимисоображениями. Существует два типа понятий, которые должны быть выражены вовсех языках: корни с конкретными значениями, например "стол", "есть", и чистореляционные понятия, "служащие для установления связи между конкретными элементамипредложения" и, таким образом, придающие ему определенную синтаксическую форму;например, в латинском языке -um является знаком глагольного дополнения. Этидва класса понятий Сепир ставит в начале и в конце своей шкалы - I (конкретные),IV (чисто-реляционные), поскольку они представляют собой два полюса - конкретносгьи абстрактность. Между ними он располагает две группы понятий, являющихся факультативными,так как в одних языках они имеются, а в других отсутствуют. Класс II состоитиз деривационных (словообразовательных) понятий, которые "отличаются от типаI тем, что выражают идеи, не относящиеся ко всему предложению в целом, но придающиекорневому элементу более конкретное значение и, следовательно, связанные специфическимобразом с понятиями типа b. В качестве примера Сепир приводит английский суффикс-er в слове farmer "фермер", уточняющий значение farm- "ферм-", но не связанныйсо структурой остальной части предложения. Язык, не содержащий понятий типаII, использовал бы для передачи значения "фермер" какой-либо один неразложимыйэлемент. Понятия типа III (конкретные, реляционные понятия) подводят к типуIV (чисто-реляционные понятия), поскольку они помогают установить связь однихчленов предложения с другими, но отличаются тем, что содержат в своем значенииэлемент конкретности. Примером являются элементы, указывающие род в языке типанемецкого: -еr в d-er в предложении Der Bauer totet das Entelein "Фермер убиваетутенка" связывает d- с Bauer при помощи согласования в числе, роде и падеже.Оно указывает, таким образом, на то, что d- определяло Bauer и что Bauer стоитв единственном числе и является подлежащим этого предложения. Однако, крометого, оно выполняет еще важную функцию указателя рода, в данном случае мужского.
Такие понятия Сепир называет конкретно-реляционными. Поскольку существует4 типа понятий, из которых I и IV обязательно наличествуют во всех языках, аII и III - необязательно, выделяются следующие четыре класса языков: класс А- включает языки, содержащие только I и IV типы понятий. Сепир называет их "простымичисто-реляционными языками". Таков, например, китайский язык. Группа В - включаетязыки, в которых наряду с обязательными I и IV типами имеется еще и тип II.Это "сложные (то есть словообразующие) чисто-реляционные языки". Группу С составляютязыки, в которых имеются типы I, III и IV, но нет II-го. Это "простые смешанно-реляционныеязыки". И, наконец, в группу D включаются те языки, которым присущи все четыретипа понятий - это "сложные смешанно-реляционные языки". Из двух признаков -наличия или отсутствия понятий чипа II (деривационные) и наличия или отсутствияпонятий типа III (конкретно-реляционные) - последний, объединяющий классы Аи В в противоположность классам С и D, Сепир считает более важным. В своей своднойклассификационной таблице Сепир рассматривает ряд языков и, используя выдвинутыевыше критерии, сначала подводит тот или иной конкретный язык под один из ужеупомянутых "основных типов" А, В, С, D. Он также указывает степень синтеза.
Третий фактор - техника установления связи между элементами языка - особоуточняется для каждой из групп понятий II, III (когда они имеются налицо) иIV, исходя из вышеупомянутой шкалы: а) изоляция; b) агглютинация; с) фузия;d) символизация. Сепир часто говорит одновременно о двух, а иногда и трех способах.В случае, если тот или иной способ развит в языке слабо, Сепир заключает соответствующееусловное обозначение в скобки. Затем он приводит общие данные о преобладающихспособах, употребляемых в языке в целом, нередко используя при этом такие составныетермины, как, например, агглютинативно-фузионный, для указания на относительноравную распространенность обоих этих способов. Отметим, что в окончательнойредакции своей классификации Сепир нигде не употребляет термин флектирующие.Он определяет флексию (inflection) как использование способа фузии всфере словоизменительных единиц. Он полагает, что при таком определении термин"флектирующие" не настолько важен, чтобы фигурировать в качестве основного терминав его классификации. О наличии флективности, таким образом, свидетельствуетпоявление b, указывающего на фузию, или b u d, указывающих на фузию и символизмв связи с понятиями группы III (смешанно-реляционные). Для иллюстрации общейсхемы Сепира обратимся к его классификации семитских языков. Эти языки в целомпричисляются к D, то есть к сложно-смешанно-реляционным языкам, содержащим всечетыре типа понятий. Они синтетичны. В области словообразовательных понятий(II) используемые способы характеризуются как d и b именно в таком порядке,то есть это символизация и фузия. В области смешанно-реляционных понятий (III)используются приемы b и d, то есть фузионные, символические. В рубрике IV указанспособ (а) - изоляция, то есть значимый порядок слов, скобки указывают на егослабое развитие. Наконец, в целом эти способы определяются как символико-фузионные.
Предлагаемый здесь метод базируется на классификации Сепира, представленнойв переработанной форме. Основные критические замечания в адрес Сепира, уже высказанныеМоустом (1948, стр. 183-190), сводятся в целом к двум.
Первое и наиболее важное замечание заключается в том, что в своем деленииязыков на четыре основных типа Сепир, казалось бы, говорит о понятиях, но вдействительности исходит из формальных критериев, а не из семантических - обстоятельство,которое приводит к некоторым трудностям при изложении материала. Например, Сепиррассматривает понятие множественности, которое он считает в высшей степени абстрактным.Однако, как он указывает, в каком-либо конкретном языке оно может быть помещенов любом месте вдоль шкалы I-IV. Следовательно, является ли множественность понятиемкорневым (I), деривационным (II) или реляционным (III и IV), зависит от того,к какому формальному классу тот или иной конкретный язык ее причисляет. Сепирсам признает это несоответствие. "Мы не можем заранее сказать, куда следуетпоместить то или иное понятие, именно потому, что наша классификация понятийпредставляет собой скорее скользящую шкалу, чем философский анализ опыта" (1921,стр. 117). В типологической классификации, предлагаемой в настоящей статье,исходный пункт является формальным. Мы признаем, что в силу действительно существующейтенденции корневые морфемы (I у Сепира) обычно более конкретны по значению,чем деривационные (II у Сепира) или словоизменительные морфемы (III или IV);однако эта тенденция слишком расплывчата, чтобы на ней можно было строить обоснованнуюметодику. В данном случае, так же как в современной лингвистике вообще, мы выделяемнаши дистинктивные единицы при помощи формального, а не семантического критерияпо чисто практическим соображениям.
Второе критическое замечание относится к шкале Сепира: а) изолирующие; b)агглютинирующие; с) фузионные; d) символические. Изоляция - это способ связи,так же как и другие приемы, но применяется он почти исключительно к словам,поскольку относительный порядок расположения элементов внутри слова имеет значениелишь в редких случаях. Изоляция, следовательно, в данной шкале неуместна, иэто сказывается на асимметричности ее появления в схеме Сепира: она выступаетв качестве способа только под рубрикой IV (чисто-реляционные понятия) и относитсяк связям, осуществляемым не внутри слова, как другие способы, но между словами.
Метод классификации языков, предлагаемый в настоящей статье, - это в своейоснове метод Сепира, но с некоторыми видоизменениями в свете указанных критическихзамечаний. Более того, вместо интуитивных определений, опирающихся на общиевпечатления, делается попытка охарактеризовать каждый признак, используемыйв данной классификации, через отношение двух единиц, каждая из которых получаетдостаточно точное определение посредством исчисления числового индекса, основанногона относительной частотности этих двух единиц в отрезках текста. В основу классификацииположено пять признаков вместо трех у Сепира и устанавливается ряд из одногоили более индексов для определения места того или иного языка в отношении каждогоиз них. Первый из этих параметров - степень синтеза или общая сложность слова.Со времен Сепира минимальная значимая последовательность фонем в языке сталав американской лингвистике называться морфемой. Например, англ. sing-ing "пение"содержит две морфемы, но образует одно слово. Отношение M/W, где М - число морфем,a W - число слов [ср. англ. word "слово". - Перев.], является мерой синтезаи может быть названо индексом синтетичности. Теоретически низшим пределом егоявляется 1,00, поскольку каждое слово должно содержать по крайней мере однузначимую единицу. Высший предел теоретически отсутствует, но на практике величинывыше 3,00 встречаются редко. Показатели этого индекса для аналитических языковбудут низкими, для синтетических - более высокими, а для полисинтетических -самыми высокими.
Второй параметр относится к способам связи. На одном полюсе здесь находятсяязыки, в которых значимые элементы, соединяясь, не изменяются совсем или изменяютсянезначительно. Таково классическое определение агглютинации. Явление, противоположноеагглютинации, - взаимная модификация или слияние элементов. Здесь также можновыделить несколько конструкций и таким образом построить более детальную типологическуюклассификацию. Для целей настоящей статьи выбрана альтернатива, которая представляетсянаиболее точно соответствующей идеям Сепира и обычных исследований XIX в. Используясовременную терминологию, можно сказать, что имеется в виду степень морфо-фонематическихальтернаций. Значимые отрезки, реально обнаруживаемые в высказывании, называются"морфами". Ряд сходных морф подводится под одну основную единицу - морфему.Различные морфы, следовательно, находятся в отношении альтернации. Например,в английском языке мы связываем морфу lijf (leaf "лист") с морфой lijv-, котораявстречается только в сочетании с морфой множественного числа -z и образует lijvz(leaves "листья"). Lijf и lijv- - это морфы, альтернирующие в пределах однойи той же морфологической единицы. Правила констатации подобного альтернированияотносятся к морфо-фонематической части описания английского языка. В тех случаях,когда среди морф, составляющих морфему, варьирования не наблюдается или когдаварьирование происходит автоматически, о самой морфеме говорят, что она автоматична.Под автоматической альтернацией понимается такая альтернация, при которой всеальтернанты можно образовать от основной формы, зная ряд правил сочетаемости,сохраняющих в данном языке силу для всех аналогичных случаев. Этот вопрос будетрассмотрен ниже более детально. Если обе морфы в какой-либо конструкции относятсяк морфемам, являющимся автоматическими, конструкция называется агглютинативной.
Индекс агглютинации - это отношение числа агглютинативных конструкций к числуморфных швов. Число морфных швов в слове всегда на единицу меньше, чем числоморф. Так, в leaves две морфы, но только один морфный шов. Индекс агглютинации- A/J, где А равно числу агглютинативных конструкций, a J - числу швов междуморфемами [англ. juncture "стык, шов". - Перев.]. Язык с высоким индексом агглютинацииявляется агглютинирующим, а язык, имеющий малый по величине индекс, - фузионным.В целом, чем ниже первый индекс (индекс синтетичности), тем меньше фиксируетсяграниц между морфами и тем менее важен для характеристики языка второй индекс- индекс агглютинации. Если язык достигает теоретически низшего предела в синтетическоминдексе (1,00), исчисление второго индекса становится невозможным, посколькуэто означает, что никаких границ между морфемами вообще нет. Иными словами,индекс агглютинации становится равным О/О, что бессмысленно. При исчислениииндекса агглютинации не принимались во внимание различия между степенью агглютинации,которые можно обнаружить в конструкциях, включающих понятия групп II, III иIV у Сепира, и которые как мы видели, фигурируют в окончательной формулировкеего классификации. Такие индексы можно было бы вычислить на основе разграниченияклассов корневых, деривационных и словоизменительных морфем, ибо именно этикатегории наиболее точно соответствуют делению понятий у Сепира. Они не былиустановлены, частично чтобы избежать слишком больших общих осложнений в типологическойклассификации, а отчасти потому, что исчисление их сопряжено с значительнымитрудностями.
Третий параметр соответствует наиболее точно тому, что для Сепира было центральнымпризнаком при классификации языков, - это наличие или отсутствие деривационныхи конкретно-реляционных понятий. Поскольку, как мы видели, взяв за отправнуюточку значения понятий, нельзя добиться необходимой научной точности, в настоящемисследовании мы исходим из возможности исчерпывающего деления морфем на трикласса - корневые, деривационные и словоизменительные. Каждое слово должно содержатьпо крайней мере одну корневую морфему, и многие слова во многих языках большеничего и не содержат. Наличие в слове более чем одной корневой морфемы называетсясловосложением (compounding). Это важный признак, благодаря которому языки существенноотличаются друг от друга. В некоторых языках словосложение либо вообще отсутствует,либо встречается очень редко. Другие, напротив, широко используют словосложение.Однако большинство языков занимает в этом отношении промежуточное положение.Примечательно, что Сепир, по-видимому, не принимает этого во внимание в своейклассификации. Указанное явление можно легко измерить при помощи структурногоиндекса (compositional index) R/W, где R равно числу корневых морфем [ср. англ.root "корень". - Перев.), а W равно числу слов. Второй класс морфем -деривационные морфемы. Примерами деривационных морфем в английском языке могутслужить re- в re-make "пере-делать", -ess в lion-ess "льв-ица", -er в lead-er"предводи-тель". Деривационный индекс D/W - отношение числа деривационных морфем[ср. англ. derivational "словообразовательный, деривационный". - Перев.]к числу слов. Языки с высоким D/W принадлежат к сложным, или деривационным,подтипам у Сепира и, таким образом, попадают в классы Б и Г его классификации.Словоизменительные морфемы образуют третий класс. Примеры из английского языка:-s в eats "ест" и -es в houses "дома".
Словоизменительный индекс I/W есть отношение числа словоизменительных морфем[ср. англ. inflectional "словоизменительный". - Перев.] к числу словЭто, как будет показано, не вполне тождественно сепировским понятиям типа III(конкретно-реляционные). Однако язык, в котором эти понятия существуют и который,таким образом, принадлежит у Сепира к смешанно-реляционным типам В и Г, обязательнохарактеризуется довольно высокой величиной индекса словоизменения; обратноеотношение верно не всегда.
Четвертый параметр связан с фактором, который Сепир считал важным для морфологическойструктуры языка, но который он не включил в окончательную формулировку своейклассификации. Это порядок следования подчиненных элементов по отношению к корню.Основным различием здесь является различие между использованием префиксов исуффиксов. Префиксальный индекс P/W представляет собой отношение числа префиксовк числу слов, а суффиксальный индекс S/W -отношение числа суффиксов к числуслов. Сходным образом можно исчислить и индекс инфиксации, то есть количестваподчиненных элементов, которые инкорпорируются внутри корня, но в исследованныхязыках инфиксы встречались настолько редко, что представлялось обоснованнымих опустить. Существует неопределенное число и других возможных типов положенияподчиненных элементов по отношению к корню, например обрамление (containment),как у арабского имперфективного префикса второго лица женского рода, которыйокружает глагольную морфему в taqtuli' "ты (ж. р.) убиваешь", где морфемой второголица женского рода является ta- - -i-, в то время как "убивать" передается припомощи -q-t-l, а "имперфектное время" - через -u-. Точно так же существует ивставка (intercalation), обнаруживаемая опять-таки в семитских языках, при которойчасть подчиненного элемента предшествует корню или следует за ним, а другаячасть вставляется внутрь. Все эти способы, встречаются настолько редко, что,по крайней мере для изученных нами языков, вычислять их индексы не имело смысла.Сюда же по существу относится и сепировский символизм, который он рассматриваеткак особый технический прием наряду с изоляцией, агглютинацией и фузией. Сепировскийсимволизм, или внутреннее изменение, является, на мой взгляд, просто инфиксациейсловоизменительного элемента: ср., например, инфикс прошедшего времени -а- ванглийском sang "пел". Когда подобные элементы являются деривационными, какв индонезийских языках, процесс обычно называется инфиксацией. Это выявляеттот факт, что с использованием термина "символизм" у Сепира связаны два определенныхсоображения - позиция и регулярность. Процесс инфиксации вполне может быть регулярным,и в этом случае конструкция должна быть агглютинирующей. В действительностиже, однако, это вряд ли когда-либо случается.
Последний параметр имеет дело со способами, используемыми в различных языкахдля установления связи между словами. Он, следовательно, вводит критерии каксинтаксического, так и морфологического порядка. Существуют три способа, которыеязыки могут использовать, - словоизменение без согласования, значимый порядокслов и согласование.
Языки, применяющие первые два способа, принадлежат, по классификации Сепира,к чисто-реляционной категории, в то время как языки, применяющие согласование,являются смешанно-реляционными. Словоизменительный индекс, рассмотренный выше,будет включать как несогласуемые, так и согласуемые словоизменительные морфемы.Этот индекс, который можно было бы назвать индексом преобладающего словоизменения,для настоящей проблемы можно использовать лишь с известными ограничениями. Весьмавероятно, что, разграничив согласуемые и несогласуемые словоизменительные морфемыи причислив слова без словоизменительных морфем к изолирующему классу, можнобыло бы произвести четкое тройное деление. Степень характерности для языка изолирующих,словоизменительных и согласуемых приемов можно было бы исчислить тогда при помощитрех индексов, опирающихся на отношение каждого из этих типов к общему числуслов. Существует, однако, ряд осложнений, препятствующих осуществлению такойпростой методики. Во многих языках, в частности в латыни, согласуемые и несогласуемыеявления сливаются в одной и тон же словоизменительной морфеме. Так, -um латинскихприлагательных мужского рода винительного падежа единственного числа имеет двасогласуемых признака - род и число - и один чисто словоизменительный - падеж.В подобных случаях наша методика заключается в том, что одну и ту же морфемумы считаем обычно несколько раз, т. е. столько, сколько в ней дифференциальныхпризнаков. Другая трудность возникает в связи с порядком следования элементов.Порядок, по-видимому, всегда имеет известное значение для установления связимежду элементами даже там, где существует словоизменение. Мы связываем винительныйпадеж с ближайшим глаголом даже при наличии нефиксированного порядка слов. Порядокможет быть фиксированным даже тогда, когда в наличии имеются и другие средства,указывающие на то, какие слова входят в конструкцию. В целом это, например,справедливо в отношении немецкого языка. Значимый порядок придется ограничитьтакими случаями, при которых изменение порядка элементов вызывает изменениезначения конструкции. Использованный здесь критерий ближе всего к этому последнему,но более легко применим. Отсутствие словоизменительной морфемы в том или иномслове принималось за указание на то, что связь осуществлялась при помощи порядка.Если назвать каждый случай использования того или иного принципа указания отношениймежду словами в предложении нексусом (nexus), то можно вычислить три индекса- О/N, Pi/N и Co/N, где О - порядок (order), Pi - чистое словоизменение (pureinflection), Co - согласование (concord) и N - нексус.
Таким образом, в общей сложности были охарактеризованы следующие типологическиеиндексы:
1) M/W - индекс синтеза
2) A/J - индекс агглютинации
3) R/W - индекс словосложения
4) D/W - индекс деривации
5) I/W - индекс преобладающего словоизменения
6) P/W - индекс префиксации
7) S/W - индекс суффиксации
8) О/N - индекс изоляции
9) Pi/N - индекс словоизменения в чистом виде
10) Co/N - индекс согласования
Ценность данных индексов заключается в том, что мы можем определить использованныевеличины последовательно и таким образом, что они окажутся применимыми ко всемязыкам. В действительности почти все величины, употребленные в приведенных вышеформулах, допускают несколько определений. Предпочтение, оказанное здесь темили иным определениям, обусловлено конкретными задачами исследования. Мы всегдазадаем вопрос, что же, собственно, мы хотим измерить. С этой точки зрения внекоторых случаях, как представляется, нет достаточных оснований для предпочтениятого или иного определения, и выбор производится совершенно произвольно, посколькук какому-то решению волей-неволей нужно было прийти. Известным утешением являетсято, что теоретически широкий диапазон возможных определений для некоторых величиноказывает влияние на решение только сравнительно небольшой части трудных случаев.В качестве доказательства приведем результаты индексов, вычисленных для отрывкаиз 100 слов на английском языке в 1951 г. при помощи методов, которые уже невозможноретроспективно полностью восстановить, и сравним их с индексами для отрывкаиз 100 слов, полученными недавно в соответствии с методами, охарактеризованнымиздесь.
19511953
Синтез1,62 1,68
Агглютинация0,31 0,30
Словосложение1,03 1,00
Префиксация1,00 1,04
Суффиксация0,500,64
Преобладающее словоизменение 0,640,53
Следует подчеркнуть, что в равной степени возможны, а для других целей, напримердля создания грамматики того или иного языка, вероятно, заслуживают предпочтениядругие определения единиц, чем те, которые были выбраны здесь.
В нижеследующем разделе обсуждаются основные проблемы, которые возникают приопределении единиц, использованных в индексах. Они касаются морфы, морфемы,агглютинирующих конструкций и разграничения корня, деривационных и словоизменительныхморфем и слова. Мы не пытаемся здесь дать ничего приближающегося к исчерпывающемуизложению этих проблем. Цель настоящего обсуждения - наметить главные проблемы,возникшие в данном исследовании, и указать основания для решений, принятых вкаждом конкретном случае.
Основной для индекса синтеза, так же как для большинства других, являетсявозможность сегментирования любого высказывания языка на определенное числозначимых последовательностей, которые уже нельзя подвергнуть дальнейшему членению.Такая единица называется морфой. Существуют вполне очевидные деления, которыеполностью оправданы и которые может произвести любой исследователь. Например,каждый разделил бы английское eating "принятие пищи" на eat-ing и сказал бы,что оно состоит из двух единиц. Существуют и другие членения, столь же явнонеоправданные. Например, анализ chair "стул" на ch- "деревянный предмет" и -air"нечто для сидения" был бы всеми, безусловно, отвергнут. Имеются, однако, промежуточныенеясные случаи, относительно которых мнения расходятся. Следует ли, например,разлагать английское deceive "обманывать" на de- и -ceive? Именно такие неясныеслучаи нам и нужно научиться анализировать. Начнем с ряда форм, которые мы вдальнейшем будем называть квадратом (square) Квадрат существует тогда, когдав языке имеется четыре значимые последовательности, принимающие форму АС, ВС,AD, BD. Примером в английском языке может служить eating "принятие пищи": sleeping"процесс сна":: eats "ест": sleeps "спит", где А = eat-, B = sleep-, C = -ingи D - это -s [2]. В тех случаях, когда квадратсуществует с соответствующим варьированием значения, мы вправе сегментироватьвсе последовательности, из которых он состоит. После того как квадрат расчленен,каждый из его сегментов следует подвергнуть анализу, чтобы выяснить, не являетсяли он также членом квадрата. Если да, тогда он в свою очередь будет разделенна две морфы. Если же этого сделать нельзя, значит, мы достигли предела анализаи дальнейшее членение невозможно. Во избежание возникновения таких квадратов,как hammer "молоток": ham "ветчина":: badger "барсук": badge "значок, медаль",прибегают к проверке соответствия в значении. Квадрат, отвечающий описаннымусловиям, всегда даст нам возможность правильного и в общем приемлемого анализа.Однако он слишком ограничен в том смысле, что исключает некоторые членения,которые могли бы быть приняты всеми. Прежде всего необходимо несколько расширитьпонятие морфы. Последовательность, которая встречается с каким-либо членом квадрата,выделяется как морфа также и в других случаях, если по отношению к этому члену(а) последовательность фонем является тождественной (за исключением автоматическихизменений, о которых см. ниже) и (б) если значение ее одинаково. На этом основаниимы признаем членение huckleberry "черника" на huckle+berry, поскольку berry"ягода" само является в других случаях морфой. Отсюда и huckle- также оказываетсяморфой, хотя оно никогда не встречается в составе квадрата. Если бы обнаружилось,что huckle- встречается в каком-нибудь другом сочетании, мы бы выделили егои там и, следовательно, добавили бы еще одну новую морфу. Этот процесс продолжаетсядо тех пор, пока мы не подойдем к последовательности, которая не повторяетсябольше ни в каком сочетании. В нашем примере такой последовательностью являетсяhuckle-.
Границы должны быть расширены и для случаев так называемого неполного квадрата,недостаточного с формальной точки зрения. Было бы очень желательно выделитьв men "люди" две морфы, одну со значением "человек", а другую - "множественноечисло", но нет такого квадрата, в который его можно было бы включить. Так, квадратman "человек": men "люди":: boy "мальчик": boys "мальчики" формально недостаточен.Мы формулируем следующее правило: если можно найти квадрат, подобный толькочто приведенному, в котором boy: boys само является парой другого правильногоили полного квадрата, например boy : boys:: lad "парень": lads "парни", и еслиboy всегда можно заменить man, a boys - men и получить нормальное с грамматическойточки зрения (хотя и семантически невероятное) предложение, тогда man : menможно подвергнуть сегментации, аналогичной сегментации boy : boys, и men можнорассматривать как две морфы. В случае sheep "овца": sheep "овцы":: goat "коза":goats "козы" мы признаем в sheep "овцы" две морфы, одна из которых являетсянулевой. Подобный анализ не следует смешивать с членением на две или более семантическиекатегории, где для субституции не существует обоснованного квадрата. В латыни,например, мы не можем разложить -us "именительный падеж единственного числа"на две морфемы - именительный падеж и единственное число. Квадрат -us : -o ::-i : -is - "им. п. ед. ч.: дат. п. ед. ч.:: им. п. мн. ч.: дат. п. мн. ч." -не имеет пары, которой можно было бы заменить члены формально полноценного квадрата,и, следовательно, сегментация этих форм неосуществима. Подобно тому как существуютформально неполноценные квадраты, существуют также квадраты неполноценные семантически.В них, если возможно параллельное неавтоматическое варьирование, членение допускаетсядаже несмотря на то, что морфам нельзя приписать определенных значений. Так,в английском языке ряды deceive "обманывать": receive "принимать":: decep-tion"обман": recep-tion "прием":: decei-t "обман": recei(p)t "получение, расписка"оправдывают сегментацию de+ceive и re+ceive. Данное правило позволяет обычновыделить морфы для производных форм глагола в семитских языках. Без этого правила,ввиду многообразия значений в подобных примерах, трудно было бы работать.
Существуют и другие пути расширения понятия морфы, которые, однако, здесьотвергаются как несоответствующие задачам настоящего исследования, хотя и полностьюприемлемые для других целей. Не принимаются, например, прерывающиеся морфы,сегменты которых содержатся в двух различных словах. Это понятно, посколькумы хотим вычислить отношение морфем к словам и, следовательно, хотим, чтобыкаждое слово содержало определенное число морфем, ограниченных пределами самогослова. Подобным же образом мы не рассматриваем в качестве морф значимые единицы,сопровождающие грамматические отрезки более длинные, чем слово, например интонационныемодели предложения. Причины этого также ясны. Мы хотим, чтобы морфемы были частямислов, а они не могут быть таковыми, если они появляются одновременно с целойпоследовательностью слов. В этой связи следует заметить, что ни индекс синтеза,ни какой-либо иной индекс, используемый в настоящем исследовании, не являетсямерилом сложности того или иного языка в целом. Не включаются в число морф такжеинтонационные модели и некоторые другие явления, усложняющие функционированиеязыка.
Следующий шаг, который нужно сделать после отождествления морф, - это установлениеболее сложных единиц - морфем - с морфами в качестве их членов. Именно даннаясторона проблемы как составляющая основное содержание морфемного анализа получиланаиболее полное освещение в трудах Хэрриса, Хокетта, Блока, Найды и др. В целомпринципы, выдвинутые Найдой (1948, стр. 414-441), являются вполне обоснованнымии достаточными. Они включают общепринятые критерии сходства значения (здесьэтот критерий применяется очень строго) и дополнительной дистрибуции, а такжеследующее правило: если мы хотим подвести под одну и ту же морфемную единицуморфы, различные по своей фонематической форме, нужно иметь по крайней мереодну неварьирующую единицу со столь же широкой дистрибуцией.
По этому вопросу, однако, по причинам, которые будут раскрыты в дальнейшем,нецелесообразно принимать дополнения, рекомендуемые Найдой в соответствии сего правилом о том, что "дополнительная дистрибуция в тактически различных окруженияхявляется основой для объединения различных форм в одну морфему только при условии,если какая-то другая морфема, принадлежащая к тому же дистрибуционному классуи имеющая либо одну-единственную фонематическую форму, либо фонологически определяемыеальтернирующие формы, встречается во всех тех тактически различных окружениях,где мы находим данные формы" (стр. 421). Например, в арабском языке существуютместоименные суффиксы, обозначающие принадлежность, когда они присоединяютсяк существительному, и другой ряд суффиксов, указывающих на глагольное дополнение,когда они присоединяются к глаголу. Эти окружения тактически различны, то естьглагол, как правило, не может быть заменен существительным, и наоборот. Наличие-ka со значением "второе лицо мужского рода единственного числа" и Других фонематическитождественных форм в обоих рядах должно было бы, согласно правилу Найды, позволитьнам объединить морфы первого лица единственного числа -i и -уа (притяжательностьу существительного) и -in (глагольный объект) как морфы, составляющие одну иту же морфему. Эта альтернация, разумеется, нерегулярна, и если бы мы согласилисьс указанной точкой зрения, то, вычисляя наш индекс агглютинации, мы должны былибы считать любую конструкцию, включающую одну из форм суффикса 1-го лица единственногочисла, неправильной или неагглютинативной. Таким образом, мы поставили бы арабскийязык в невыгодное положение, и только из-за того, что данные формы характеризуютсяизвестной степенью регулярности. В языке с двумя совершенно различными рядамиместоимений в подобных употреблениях, согласно правилу Найды, нельзя было быобнаружить указанного ограничения; следовательно, не существовало бы нерегулярныхальтернаций такого происхождения, хотя с точки зрения здравого смысла мы должныбыли бы назвать подобную ситуацию еще более нерегулярной. Поэтому только членыодного и того же структурного ряда, то есть те, которые могут заменять другдруга в одинаковом тактическом окружении, рассматриваются здесь как возможныеальтернанты одной и той же морфемы.
Если нам даны некоторые морфы как альтернанты одних и тех же основных морфемныхединиц, мы можем определить агглютинативную конструкцию. Для традиционного пониманиятермина "агглютинация" характерно, по-видимому, то, что основной ее чертой считаетсяморфологическая регулярность. Однако в термин "регулярность" вкладывалось самоеразличное содержание. В работах Блумфилда, Уэллза и других обычно различаютсяразные типы и степени регулярности и нерегулярности. В данной статье мы придерживаемсяопределения регулярности, наиболее близкого к тому, которое в настоящее времяраспространено в работах по проблемам типологии. Согласно нашему определению,понятие регулярности подразумевает, что все фонематически варьирующиеся формыморф можно произвести от нефиктивной (то есть реально встречающейся) основнойформы с помощью правил сочетаемости (rules of combination), сохраняющих силудля всех сходных комбинаций в языке. Обычно это является автоматической альтернацией(случай, когда морфема являет собой один морф, то есть когда она представляетсобой одну и ту же фонематическую последовательность во всех своих употреблениях,является частным случаем, который тоже, конечно, рассматривается как случайавтоматического альтернирования. Иногда сам выбор одной формы в качестве основнойуже ведет к автоматичности, то есть позволяет предсказать производные формы,исходя из основной, в то время как выбор другой формы такой возможности не дает.В сомнительных случаях за основные принимаются те формы, которые дают наибольшуюстепень автоматизма при исчерпывающем описании языка. Разумеется, это нельзясчитать точным правилом, но на практике никаких особых трудностей в этом планене возникает.
Мы называем автоматичной всю морфему в целом тогда, когда каждая из ее морфнаходится в автоматической альтернации со всеми другими ее морфами. Часто морфыможно сгруппировать в субальтернирующие ряды. Для них одной автоматической альтернацииуже недостаточно. Морфема множественного числа в английском языке имеет статистическинаиболее часто встречающийся ряд морф -s, -z, -еz, которые находятсяв автоматической альтернации между собой. Существуют, однако, и другие альтернанты,а именно -en, -нуль и т. п., которые в целом не находятся в отношениях автоматическойальтернации с -s, -z, -ez. Таким образом, английская морфема множественногочисла не является автоматической.
Возможность исчисления индексов словосложения, деривации и словоизменениязависит от нашего умения различать корневые, деривационные и словоизменительныеморфемы. Из них, пожалуй, класс корневых морфем поддается определению труднеевсего, но выделить его легче чем другие классы. Этим мы хотим сказать, что напрактике существует полное единодушие относительно того, какие морфемы считатькорневыми. Корневые морфемы в слове характеризуются конкретностью значения ивходят в обширные и легко увеличивающиеся ряды. В этом смысле корневым морфемамнаиболее четко противостоят морфемы словоизменительные, число которых обычновесьма невелико, а значения абстрактны и выражают отношения. Все согласилисьбы, видимо, также и с тем, что каждое слово должно включать по крайней мереодну корневою морфему.
В отличие от корней, деривационные и словоизменительные морфемы встречаютсяне всегда; существуют, например, языки - так называемые корневые или изолирующие,- в которых деривационные и словоизменительные морфемы встречаются редко иливообще не встречаются. Деривационные морфемы можно определить как морфемы, которые,вступая в конструкцию с корневыми морфемами, образуют последовательность, котораявсегда может быть заменена каким-то определенным классом отдельных морфем, невызывая изменений в этой конструкции. Если такой класс отдельных морфем, длякоторых деривационная последовательность может быть заместителем, включает однуиз морфем самой деривационной последовательности, то мы называем подобную последовательностьэндоцетрической; если же нет, последовательность является экзоцентрической.
Так, например, duckling "утенок" в английском языке - это деривационная последовательность,потому что ее всюду можно заменить посредством goose "гусь", turkey "индюк"и т. д. без изменения значения конструкции. Поскольку duck включается в такойкласс отдельных морфем, которые могут быть заменены duckling, -ling являетсяздесь эндоцентрической деривационной морфемой. Singer "певец" - это экзоцентрическаяпоследовательность, ибо тот класс единых морфемных последовательностей, длякоторого заместителем может быть singer, состоит из одних только одноморфемныхсуществительных и не включает глагола sing "петь".Следовательно, -er - это экзоцентрическаядеривационная морфема.
Теперь мы можем определить словоизменительную морфему просто как некорневую,недеривационную морфему. Получившиеся три класса морфем охватывают все видыморфем в языке и являются взаимоисключающими. Подобно деривационным морфемам,словоизменительные морфемы также в принципе вовсе не обязательны для каждогоконкретного языка в отдельности. Однако если они представляют собой часть моделислова, их появление в надлежащем месте столь же обязательно, как и наличие корня.Один из членов этого класса часто является нулевым. В подобных случаях отсутствиематериально выраженной фонематической последовательности является значимым таккак слово в этой нулевой форме определенным образом ситуативно oграничено всвоем употреблении; так обстоит дело с именительным падежом единственного числав турецком языке или единственным числом существительных в английском языке.
Теперь мы подходим к тому, что в известном смысле представляет собой наиболеетрудную проблему, а именно к определению слова как особой единицы языка. Нетсомнения, что это имеет важнейшее значение для целей настоящего исследования,ибо все рассматриваемые здесь индексы так или иначе связаны с вычислением количестваслов В большинстве случаев это вполне очевидно; в других молчаливо подразумевается,как, например, для индекса агглютинации, в котором число морфемных швов всегдана единицу меньше количества слов. В настоящее время единого общепринятого определенияслова не существует. Некоторые вообще отрицают значение слова как особой языковойединицы. Другие признают важное значение слова, но отрицают необходимость учитыватьслово при описании конкретных языков. Третьи утверждают, что определить словоможно только для каждого языка в отдельности, ad hoc. Одни определяют словос позиций фонологии, другие - с точки зрения морфологии. На практике, однако,слово продолжает оставаться ключевой единицей в большинстве существующих описанийязыков. Из двух основных типов общих определений слова - фонологического и морфологического- первое, и это совершенно ясно, для целей настоящего исследования не подходит.Определяя слово фонологически, мы исходим из какого-либо одного фонологическогопризнака или из сочетания отличительных признаков, служащих особыми указателями.Таковыми обычно являются ударение или пограничные модификации фонем, то естьявления стыка. Однако помимо того факта, что использование фонологических признаковдля определения слова ведет к выделению отдельных единиц, которые по ряду другихпричин нежелательно было бы причислять к словам, во многих языках подобные явлениявообще отсутствуют, поэтому на основе фонологического анализа универсальногоопределения слова создать нельзя. Отправная точка других определений слова -морфологическая, так как они исходят из дистрибуции значащих элементов. Из определенийэтого рода определение слова Блумфилдом как минимальной свободной формы следуетпризнать наиболее удовлетворительным, поскольку оно универсально по своему применениюи правильно указывает на наличие или отсутствие свободы (или связанности) какна основной критерий слова. Однако применение этого критерия, то есть проверкавозможности изолированного употребления, на практике затруднительно и иногдаприводит к неожиданным результатам; так, если исходить из определения Блумфилда,артикль the в английском языке нельзя было бы признать отдельным словом.
Метод, которым мы пользовались в настоящем исследовании, может быть описанлишь в самых общих чертах. Он дал удовлетворительные (для поставленных здесьзадач) результаты в тех относительно немногочисленных сомнительных случаях,которые были связаны с выяснением наличия или отсутствия границ слова в изучаемыхязыках. Вместо того чтобы задаваться вопросом, свободна или связанна та илииная минимальная форма вообще, как это обычно делается, в настоящем исследованиимы исходим из морф в конкретных контекстах. Это позволяет нам, например в латинскомязыке, считать ab "от" свободной формой в качестве предлога, но связанной формойв качестве глагольного префикса в abduco "я увожу". Свобода или связанностьформы характеризуется не морфой как таковой, а контекстуально определяемым классомвзаимозаменимых морф. Такой класс называется здесь классом взаимозаменимых морф(КВМ; morph substitution class - MSC). Мы расширяем это понятие, включая в негои последовательность классов взаимозаменяемых морфем, которые во всех случаяхмогут быть заменены каким-либо определенным классом взаимозаменимых морф, ниодин из членов которого не идентичен его членам [3].Для того чтобы охватить и индивидуальные классы взаимозаменимых морф и заменяющиеих последовательности, удобно использовать термин ядро (nucleus). Разбив указаннымспособом высказывание на отдельные ядра, необходимо далее выяснить, являетсяли каждая граница между ядрами одновременно и границей между словами или нет.Граница ядра является границей слова, если в данном случае возможно вклиниваниепоследовательности ядер любой длины. Если же граница является внутрисловной,то либо вклинивание ядер невозможно вообще, либо максимальное количество вставляемыхядер строго ограниченно. Так, например, в английском предложении The farmerkilled the ugly duckling "Фермер убил уродливого утенка" девять морфем: 1) the2) farm 3) er 4) kill 5) ed 6) the 7) ugly 8) duck 9) ling; семь ядер: 1) the2) farmer 3) kill 4) ed 5) the 6) ugly 7) duckling и шесть слов: 1) the 2) farmer3) killed 4) the 5) ugly 6) duckling. Граница kill-ed является внутрисловной,так как включение ядра здесь невозможно.
С другой стороны, на границе между farmer и killed ограничения максимальногоколичества ядер, которые могут быть здесь включены нет. Мы можем говорить оfarmer who killed the man who killed the man who... killed the ugly duckling,то есть о "фермере, который убил человека, который убил человека, который...убил уродливого утенка". Расхождение с фонологическим словом в некоторых случаяхтолько кажущееся. Так, в латинском языке энклитическая частица -que "и", котораясчитается слогом, относящимся к любой предшествующей последовательности, и определяетместо ударения, служащего фонологическим признаком слова, согласно нашему текстуявляется также частью слова. Dominus "хозяин" и dominus в dominusque "и хозяин"не являются членами одного КВМ, так как они не взаимозаменяемы. Dominus- относитсяк тому же классу ядер, что и legatus-, puer-, и этот класс зависит от классапоследующих -que, -ve, поскольку они обязательно следуют за ним и, таким образом,принадлежат тому же слову. Даже односложные образования, где сдвига ударенияне происходит (ср. mus "мышь" и mus в mus-que "и мышь"), являются членами разныхядер, поскольку первое может быть заменено только dominus, puer и т. д., а последнее-только классом dominus-, puer-.
В таблице 1 приведены вычисленные индексы. Были взяты главным образом тe языки,которые чаще всего упоминаются в качестве примеров определенных языковых типовв существующей литературе по типологии. Выбор языков ограничен также моими собственнымипознаниями в области отдельных языков. В качестве примера агглютинативного языкавместо турецкого языка мною был выбран родственный ему якутский язык, посколькуобширные заимствования из арабского в османском турецком языке привели к нарушениямгармонии гласных и осложнениям в других областях в такой степени, что турецкийязык перестал быть типичным. Чтобы проиллюстрировать изменения в типе языка,происшедшие за длительный период, были выбраны два древних индоевропейских языка- англосаксонский и санскрит, а также два современных языка тех же групп - германскойи индоиранской - современный английский и персидский. Вьетнамский язык был взятв качестве представителя корнеизолирующего типа языков, эскимосский - в качествеполисинтетического, а суахили - один из языков банту - в качестве агглютинирующегоязыка, использующего согласование [4] (см.прилагаемую таблицу).
СанскритАнгло-сакс.Персид-скийАнглий-скийЯкутскийСуахилиВьетнам-скийЭскимос-ский
Синтез 2,592,121,521,682,172,551,063,72
Агглютинация 0,090,110,340,300,510,67...0,03
Словосложение 1,131,001,031,001,021,001,071,00
Деривация 0,620,200,100,150,350,070,001,25
Преобладающее словоизменение0,840,900,390,530,820,800,001,75
Префиксация 0,160,060,010,040,001,160,000,00
Суффиксация 1,181,030,490,641,150,410,002,72
Изоляция 0,160,150,520,750,290,401,000,02
Собственно словоизменение 0,460,470,290,140,590,190,000,46
Согласование 0,380,380,190,110,120,410,000,38
На основе подсчетов, подобных приведенным выше, в качестве следующего шагапосле уточнения кривой частотности дистрибуции соответствующих явлений можнобыло бы дать определение таким терминам, как аналитический, синтетический, агглютинирующий,префигирующий и т. п. Поскольку здесь представлено слишком мало языков, этузадачу осуществить невозможно. Тем не менее даже беглое ознакомление с приведеннымиздесь индексами показывает, что если мы определим аналитический язык как языкс индексом синтеза в 1,00-1,99, синтетический - в 2,00-2,99, а полисинтетический- в 3,00, то результаты будут соответствовать обычным представлениям, не связаннымс какими-либо статистическими подсчетами. Подобным же образом мы могли бы назватьагглютинативным такой язык, где индекс агглютинации превышает 0,50 и т. д.
Результаты, полученные в настоящем исследовании, необходимо также подкрепитьдальнейшими подсчетами, поскольку они были выведены для отдельных отрывков по100 слов в каждом; помимо этого, следовало бы указать возможный процент ошибок.Можно было бы вполне допустить существование различий, обусловленных различиямив стиле выбранных отрывков. Индекс синтетичности поэтому был вычислен для целогоряда разных по стилю отрывков из английского и немецкого языков, однако былидостигнуты удивительно близкие результаты.
Английский язык:
"Ladies' Home Journal", January 1950, стр. 55 - 1,62
R. Lintоn. Study of man, стр. 271 - 1,65
О. J. Карlan, Mental disorders in later life, стр. 373 - 1,60.
Немецкий язык:
Baumann, Nama Folk-tale - 1,90
Ratsеl, Anthropogeographie, стр. 447 - 1,92
Сassirеr, Philosophie der symbolischen formen, стр. 1 - 2,11.
Разумеется, это не заменяет статистических данных. Другая проблема, которуюможно изучить с помощью предложенного нами метода, - это общее направление историческихизменений в языке за длительный период времени. Совпадения, наблюдаемые в санскритеи англосаксонском языках, с одной стороны, и персидском и английском - с другой,поразительны: направление изменений при переходе от более древнего языка к современномубуквально для каждого индекса одно и то же. Быть может, при выборе более консервативныхиндоевропейских языков, например славянских, результаты были бы иными.
Настоящая работа должна рассматриваться исключительно как предварительныйнабросок Некоторые из индексов, возможно, придется исключить или заменить другими.В последующих работах вероятно, будут пересмотрены также некоторые конкретныеопределения. Вместе с тем я полагаю, что общий метод вычисления индексов, основанныхна существующих в тексте отношениях между строго определенными лингвистическимиэлементами, представляет известный интерес для типологических исследований.

Примечания

1. Аналогичный в своей основе метод был предложенв неопубликованном докладе Чарльза Хокетта, прочитанном им на ежегодном заседанииЛингвистического общества Америки в 1949 г. в Филадельфии, и в моем выступлениина заседании Нью-Йоркского Лингвистического кружка в Колумбийском университетев январе 1950 г.

2. Один из четырех элементов может быть нулевымпри условии, если последовательности, в которых он встречается, представляютсобой свободные формы, то есть встречаются в изоляции. Так, hand "рука": hands"руки":: table "стол": tables "столы" - это правильныи квадрат, и которомA hand, В table, C нуль и D -s.

3. Это необходимо для того, чтобы исключитьэндоцентрические словосочетания, где последовательность слов всегда можетбыть замещена главным, или основным, членом. Последовательность прилагательных,за которой следует одноморфное существительное, составляла бы ядро, если быне зависимость, существующая между ее членами. Прилагательные в английскомязыке не совпадают с существительными, например, потому, что они встречаютсятакже в предикативных адъективных конструкциях. В отношении понятии классавзаимозаменимых морф и деривационной последовательности я в значительной мереобязан работам 3. Хэрриса и Р. Уэллза. Особенно близки эти понятия к понятиюфокусного класса Р. Уэллза.

4. Для каждого языка были выбраны следующиеотрывки текста длиной в 100 слов: для санскрита ("Hitopadesa", ed. M. Mueller,стр. 5) - varamekas (и т. д.); для англосаксонского (J. W. Bright. An Anglo-SaxonReader, New York, 1917, стр. 5) - gelamp gio (и т. д.); для персидского (Pizzi,I, "Chrestomathie Persane", Turin, 1889. стр. 107) - ruzi Ibrahimi (и т. д.);для английского ("New Yorker", Dec. 13, 1952, стр. 29) - Anyone т. д.); дляякутского ("Ueber die Sprache der Yakuten", St. Petersburg, 1851, стр. 29)- min bayasa (и т. д.); для суахили (С. Sасlеux, Grammaire Swahilie, Paris,1909, стр. 321) - Iiyana mmoja (и т. д.); для вьетнамского (M. В. Еmenеаu,Studies in Vietnamese (Annamese) Grammar, Los Angeles, 1951, стр. 226) - mothorn; для эскимосского (W. Thalbitzer "Handbook of American Indian Languages",Pt. 1, ed. F. Boas, Wash., 1911, стр. 1066) - kaasawruuruaq (и т. д.) (в фонематическойтранскрипции).