Xreferat.com » Топики по английскому языку » Дистрибутивный анализ

Дистрибутивный анализ

РЕФЕРАТ

Дистрибутивный анализ

Оглавление:


1. Введение -------------------------------------------------------------------------- 3

2. Основные допущения и термины -------------------------------------------- 4

3. Приемы дистрибутивного анализа ------------------------------------------ 6

4. Основные этапы дистрибутивного анализа ------------------------------- 8

5. Основные процедуры анализа и типы дистрибутивных отношений 10

6. Дистрибутивные методы в фонологии ------------------------------------ 12

а). Процедуры отождествления I ---------------------------------------------- 12

б). Процедуры отождествления II (собственно фонология) ------------- 14

в). Дополнительные критерии для объединения элементов в фонемы. 15

7. Общие итоги дистрибутивного анализа на фонемном уровне ------- 17

8. Выводы. ------------------------------------------------------------------------- 19

Список литературы --------------------------------------------------------------- 20

Введение.


Одной из узловых проблем общего языкознания является проблема методов лингвистической науки. Преобладание того или иного метода в определенную историческую эпоху может даже определять общий характер развития языкознания.

Сами конкретные методы лингвистических исследований обладают довольно большим разнообразием. Они сильно варьируют в зависимости от характера объекта, цели исследования и выбранного лингвистом аспекта исследования, например, существуют особые методы расшифровки текстов на неизвестных языках, специальные методы исследования фонетических характеристик звуков языка, методы сбора языкового материала в полевых условиях, особые лингвосоциологические методы, методы изучения истории литературных языков и т.д. Словом, чуть ли не каждая область языка может иметь специфические методы, предназначенные для ее изучения.

Выдвижение в качестве предмета изучения структурных свойств языка требует особых методов, значительно более сложных, чем простое наблюдение и классификация единиц речи.

Дистрибутивный анализ как особая методика исследования языка сформировалась в аме6риканской дескриптивной лингвистике. В 40-60-е годы появились многочисленные работы, посвященные описанию отдельных сторон фонетики, морфологии, синтаксиса языков различного строя.

Одним из важных следствий, вытекающих из работ дескриптивистов, является постановка вопроса о моделировании лингвистического исследования. Модели, имитирующие исследовательскую деятельность лингвиста, предназначаются для того, чтобы обосновать выбор основных понятий, которыми он пользуется при построении грамматики или другого описания языка. В идеале они сводят до минимума роль субъективного фактора в исследовании. По сложности проблематики модели такого типа стоят рядом с моделями творческой деятельности и научного поиска вообще. Эти процессы могут рассматриваться как кибернетические процессы обработки информации.

Дескриптивная лингвистика не выдвинула своей концепции языка как предмета исследования. Ее задачи сводятся к описанию структуры плана выражения, который рассматривается в отвлечении от плана содержания. Структура языка анализируется в терминах дистрибутивных отношений (распределений) элементов различных ярусов. Конечный результат исследования заключается в построении компактного описания языка, которое обеспечивало бы понимание и построение любых высказываний на данном языке. Никаких дополнительных ограничений на форму описания не налагается, поэтому допустимы расхождения в результатах анализа у разных исследователей, работающих с одним и тем же материалом. Описания, выполненные с помощью дистрибутивных методов, предназначаются для использования в других лингвистических разделах (сравнительное изучение языков, диалектология и т.д.).

Такое ограничение задач способствовало разработке практических процедур анализа, которые применялись в процессе построения описания. Была сделана попытка изложить дистрибутивные методы как строгую систему исследовательских приемов, которая не имеет аналогии в языкознание предшествующего периода.

Этот опыт, однако, не дал идеальных результатов. Оказалось, что процесс исследования языка является весьма сложным и не допускает полной формализации процедур на всех этапах работы.

Основные допущения и термины.


В качестве общих неопределяемых понятий в дистрибутивном анализе используются следующие:

Универсум речи (анг. - universe of discourse) – объект исследования. Наряду с этим термином в лингвистике принято употреблять и другие: континуум речи, совокупность текстов, корпус; выборка (анг. - sample), представляющая данный язык или его диалект в ограниченном промежутке времени (синхронном срезе).

Конкретный акт речи (к.а.р.) (анг. – act of communication) – любой отрезок речи одного из участников коммуникации, ограниченный с обеих сторон молчанием. Речь состоит из к.а.р., которые являются однократными, происходят в определенный момент времени. Повторяющиеся отрезки речи являются разными к.а.р. (например: снег, снег, снег…). Описать к.а.р. невозможно из-за многообразия случайных моментов, сопровождающих речь индивидуума.

При описании языка выделяют некоторые существенные черты речи, которые влияют на ее содержание. Понятие существенных признаков также неопределяемо. Каждая наука имеет своим представления о том, что существенно.

Лингвист обычно описывает абстрактные акты речи или высказывания (анг. utterance), - освобожденные от конкретных, ситуативных физических признаков, отрезки речи между двумя паузами.

Получение высказываний связано с операцией отождествления к.а.р. по существенным признакам.

Необходимые условия для такого отождествления: сходство содержания к.а.р.; сходство внешних физических признаков звучания к.а.р.. Степень сходства точно не определяется. По-видимому, нельзя отождествить к.а.р. только на основе подобия в смысле (глаза и очи) или только на базе подобия во внешнем звучании (ключ – «источник» и ключ – «инструмент для отпирания замка»).

В результате мы имеем высказывания, которые имеют разные реализации в речи, каждому высказыванию соответствует множество к.а.р..

Термин высказывание соответствует различным текстовым отрезкам: слову, звуку, фразе, предложению.

Принимается фундаментальная гипотеза о том, что непрерывные акты речи (а.р.) делятся на части, называемые сегментами. Высказывание рассматривается как дискретная последовательность отрезков речи, звуковых или морфемных сегментов, цепочек морфем и т.д. Возможны различные способы сегментации текста, повторные операции сегментации на каждом этапе описания. Сегмент – это отрезок речи, вычленяемой в данной последовательности к.а.р..

Понятие сегмента занимает важное место в дистрибутивном анализе. Дескриптивисты строго разграничивают операции сегментирования и последующие операции отождествления сегментов. В этом состоит принципиальное отличие их от традиционной лингвистики, которая обычно не ставит вопроса о сегментации речевого материала. При этом либо безоговорочно принимаются графические и орфографические членения текста, либо процедуры сегментации включаются в само описания и классификацию единиц речи. В методическом отношении оказывается очень важным не смешивать сегментацию с классификацией. При этом подходе допускается гипотетическое расчленение текста, которое в случае неточностей или обнаруженных в последствии ошибочных решений может быть изменено, т.е. может быть проведена пересегментация.

Сегмент противопоставляется элементу. Элемент – это абстрактный сегмент, освобожденный от конкретных ситуативных черт. Элементы определяются путем сопоставления различных отрезков речи, т.е. в результате операции отождествления сегментов по существенным признакам. Элемент – это обозначенный определенным символом сегмент. Так, буквы или транскрипционные знаки используют для обозначения звуковых сегментов. Сегмент принадлежит высказыванию, а элемент – описанию высказываний.

Сегмент и элемент – два важнейших процедурных термина, которые последовательно употребляются на каждом этапе анализа. Остановимся на некоторых дополнительных пояснениях этих понятий:

Сегменты – простейшие отрезки, выделяемые при расчленении континуума высказывания на первом этапе анализа текста. Элементы формируются путем объединения эквивалентных сегментов.

Пример: если мы имеем следующие высказывания, расчлененные на звуковые сегменты:

дарога

дорога

дароγа

то можно следующим образом отождествить эквивалентные сегменты:

[дърога]

Сегмент есть всегда отрезок текста, принадлежит тексту, элемент же принадлежит описанию, его соотнесенность с текстом опосредована через одну ступень его классификации. Поэтому элемент всегда является сегментом. Обратное же не имеет смысла. Так, в нашем примере [д] = д, [р] = р, [о] = о, [а] = а и другие случаи, когда [ъ] = {а, о}, [г] = {г, γ}.

Сегмент можно рассматривать со стороны его состава, его физических признаков (например, взрывность и фрикативность [г]). Элемент не рассматривается по составу, т.к. является цельной единицей.

Аналогично этому сегмент можно рассматривать как часть более сложного сегмента. Элемент обычно рассматривают безотносительно к иерархически более сложным элементам.

В процессе описания многократно осуществляется переход от рассмотрения высказываний как последовательных сегментов к их рассмотрению как цепочек элементов. Шаги перехода можно изобразить на схеме:

Дистрибутивный анализДистрибутивный анализДистрибутивный анализк.а.р. высказывание


Дистрибутивный анализсегмент элемент

Как видно, движение по циклу (высказывание сегмент элемент высказывание) может проводиться несколько раз. Такая возможность допускается в пределах одного уровня языка, а также при переходе с одного уровня на другой.

Следующее важное понятие – окружение (анг. – environment, position). Окружение элемента – это соседство в акте речи других элементов. Окружения могут быть различными, могут иметь произвольную длину. Так в непосредственное окружение элемента х входят элементы, предшествующие ему (ах, bах и т.д.), или следующие за ним (хс, хсd и т.д.). Полное окружение х включает весь набор элементов в данном высказывании (ахс или bахсd).

Дистрибуция или распределение (анг. distribution) элемента – совокупность всех окружений, в которых он встречается в речи. Дистрибуция представляет собой сумму всех позиций элемента относительно встречаемости других элементов.

О двух (или более) высказываниях или признаках говорят, что они лингвистически, дескриптивно или дистрибутивно эквивалентны, если они идентичны по составу элементов и дистрибутивным отношениям между элементами.

Понятие окружения и дистрибуции коррелятивны между собой так же, как сегмент и элемент. Подобно тому как элементы получаются в результате отождествления эквивалентных сегментов, дистрибуция есть результат типизации всех окружений данного элемента. Процедуры выявления элементов проводятся параллельно с процедурами определения дистрибуций. При этом осуществляется последовательный переход с одного шага анализа на другой и обратно. Учитывая это обстоятельство, можно дополнить схему:

Дистрибутивный анализДистрибутивный анализДистрибутивный анализк.а.р. высказывание


Дистрибутивный анализДистрибутивный анализДистрибутивный анализсегмент элемент


Дистрибутивный анализокружение дистрибуция

Понятия окружения и дистрибуции при нестрогом употреблении терминов часто смешивают друг с другом и отождествляют.

Однако между понятиями дистрибуции и окружения имеется существенное различие: объектами в анализе окружений являются элементы, связанные конъюнкцией (отношением одновременного вхождения – «и»); объектами в анализе дистрибуции являются сами окружения, связанные дизъюнкцией (отношением выбора – «или»). Так, в приведенном примере непосредственное окружение | д | составляет последовательность # | -ъ |. Это окружение, наряду со многими другими входит в дистрибуцию | д |:

# - ъ | дърога |

# - у | дума |

# - р | драка |

Таким образом, дистрибутивный анализ строится на основе синтагматических отношений между элементами. Однако его результаты касаются выделения классов эквивалентных элементов, т.е. охватывают область парадигматики языка.


Основные экспериментальные приемы, применяемые в дистрибутивном анализе:

Ю.Д. Апресян выделяет следующие приемы:

1) Добавление элементов к данной форме.

Например, в английском языке из-за омонимии предлогов и наречий типа up, in, on и др. довольно трудно решить вопрос о грамматической природе этих элементов. Возьмем два предложения she was brought up by her grandmother - «она была воспитана бабушкой» и she is going up the hill – «она поднимается в гору». Для того чтобы определить, в каком предложении up является предлогом, а в каком наречием, необходимо поставить между глаголом и спорным элементом качественное наречие и проверить, получается ли в результате правильная фраза. Правильность фразы диагностирует предлог (she is going quickly up the hill – «она быстро поднимается в гору»), а неправильность – наречие (she was brought badly up by her grandmother).

Опущение элементов из данной формы.

Например, можно опустить косвенное дополнение, которое менее тесно связано с глаголом, чем прямое; прямое же дополнение опускать нельзя: Martin caused me pain - «Мартин причинил мне боль» ® Martin caused pain - «Мартин причинил боль», но не Martin caused me – «Мартин причинил мне».

перестановка элементов данной формы.

Возможность перестановки двух простых предложений в составе сложного указывает на наличие связи сочинения между ними, а невозможность такой перестановки свидетельствует о подчинительном характере этой связи.

Им можно, а вам нельзя ® Вам нельзя, а им можно.

НО: Она подумала, что собака убежала ® Собака убежала, что она подумала.

Субституция (замена) элемента другим элементом.

Для построения классов (частей речи, словоформ) используется принцип субституции: два элемента входят в один класс, если они способны замещать друг друга в одних и тех же окружениях без нарушения правильности данной фразы. Два элемента x1 и x2 считаются эквивалентными, если для любой правильной фразы вида A1x1A2 существует правильная фраза вида A1x2A2, и наоборот.

В зависимости от того, что считается элементом, окружением элемента и правильной фразой, субституция дает более или менее дробные классы: чем ближе к текстовой единице элемент и его окружение и чем жестче ограничения на правильность фразы, тем более дробными получаются классы. Например, возьмем фразу я читаю книгу. Здесь x1 является слово читаю, которое мы можем заменить на слова беру, открываю и т.д., т.е. на x2: я беру книгу; я открываю книгу.

Аналогично мы можем заменить x1 на x2 и в словах: т…м ( вместо многоточия мы можем поставить или о, или а и т.д.)

В классической дистрибутивной лингвистике в качестве элементов рассматриваются основы, их окружением считаются грамматические морфемы или классы основ и грамматических морфем, а на правильность фраз налагаются жесткие ограничения.

При замене одного элемента другим нельзя забывать о согласовательной связи: это любая синтаксическая связь между существительным и согласуемым словом, при которой форма согласуемого слова зависит от выбора существительного или от формы, в которой оно стоит. Помимо атрибутивной и предикативной связи, к этому типу синтаксический связи относятся а) связь через предлог из (один из людей, но одна из девушек);

б) связь через глагол (эту затею считают безнадежной, но это дело считают безнадежным);

в) связь со словом «который» в придаточном предложении (дело, в котором, но статья, в которой) и др.

Таким образом, через согласовательную связь определяется ключевое понятие согласовательного класса, т.е. такая совокупность существительных, что любые два ее члена, будучи взяты в любой грамматической форме, требуют при любом типе согласовательной связи одной и той же словоформы любого согласуемого слова.

Метод непосредственных составляющих (НС).

Метод НС используется для получения синтаксической информации.

Метод НС основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение – отношение подчинения; 2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.

В ходе анализа устанавливаются как единичные предложения, так и отношения между ними.

Для дальнейших определений, Ю.Д. Апресян вводит понятие ранга. Пара символов XY является синтагмой первого ранга, если в любой содержащей ее правильной конструкции она может быть заменена без нарушения правильности конструкции символом Y, а Y заменен парой XY. Возьмем предложение

Моя подруга купила очень красивое платье

An Nn V D Aa Na

В данном примере синтагмой первого ранга можно считать пару символов DAn (очень красивое платье), которую можно заменить на An (красивое платье). Синтагмой n-ого ранга называется пара символов XY, если в любой правильной конструкции, где X не входит в состав синтагмы (n – 1)-го ранга, она заменима символом Y, и наоборот. X и Y – непосредственные составляющие синтагмы, причем Y – ядро, X – зависимый элемент. Благодаря этому можно установить синтаксические связи между словоформами и иерархию связей. В приведенном выше примере синтагмами являются AnNn, DAa, NnV и др., причем главным является 2-ой элемент, а зависимым – 1-ый. Каждая синтагма по своим внешним синтаксическим свойствам эквивалентна ядру, взятому в отдельности. Анализ по НС называется свертыванием:

D + Ax® Ax

Ax + Nx ® Nx

Результирующий элемент предыдущей синтагмы является НС следующей синтагмы, т.е. более простая синтагма может вкладываться в более сложную, выступая в качестве НС последней.

Существует несколько правил свертывания по НС: 1) одновременно можно свертывать не более двух символов в один новый; 2) запрещается перестановка символов; 3) порядок применения правил фиксирован.

Весь процесс анализа предложения (свертывания по НС) может быть изображен тремя способами: в виде правил подстановки, в виде скобочной записи и в виде дерева НС.

Однако эта модель имеет много недостатков: 1) в ряде случаев приводит к грубейшим решениям, поскольку не дает возможности фиксировать различия в синтаксической структуре предложений. Возьмем два предложения:

Изучение событий становится интересным

Дистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализРазвитие событий становится интересным.


В первом случае события являются объектом некоторого действия, во втором же – события являются субъектом действия (они сами развиваются). Анализ по НС не вскрывает этих структурных различий. 2) метод НС не показывает связи между активными и пассивными, утвердительными и отрицательными, утвердительными и вопросительными конструкциями, которые связаны отношением производности. 3) с трудом поддаются анализу экзоцентрические конструкции, конструкции с так называемыми разрывными морфемами и конструкции с аппозитивными элементами вида товарищ Иванов, князь Андрей и др. 4) по настоящему эффективной эта модель является только в рамках простого предложения. 5) не дает возможности ответить на вопрос, что является элементарной единицей языка на синтаксическом уровне.

Основные этапы дистрибутивного анализа.


I. Долингвистический этап.

Исходные данные здесь – к.а.р. как физические процессы. Их части имеют физические признаки в каждый данный момент времени (характеризуются амплитудой, частотой и т.д.).

В качестве внешнего понятия используются существенные признаки к.а.р. и одинаковость содержания.

Основные операции на этом этапе: а) сегментирование а.р. на фонологические сегменты; б) классификация сегментов по существенным, смыслоразличительным признакам.

Результат – выделение фонемных элементов как классов конкретных фонологических сегментов.

II. Фонологический этап.

Элементы описания: символы фонологических элементов.

Исходные данные: высказывания, представленные как цепочки фонемных элементов.

Внешнее понятие: физическое сходство фонемных элементов.

Операции: классификация фонемных элементов по критерию дополнительной дистрибуции и физическому сходству.

Результат – выделение фонем как классов фонемных элементов (аллофонов).

III. Морфемный этап.

Элементы: символы фонем.

Исходные данные: высказывания как цепочки фонем.

Внешние пон6ятия: связь цепочки фонем с содержанием (наличие значения) и одинаковость значения.

Операции: а) сегментация – выделение морфемных сегментов как цепочек фонем (минимальных, имеющих значение); введение фиктивных морфемных элементов (для устранения неправильностей и исключений);

б) классификация морфемных сегментов по тождеству состава фонем и по дополнительности.

Результат: выделение морфем как классов морфемных элементов. Их очень много, больше, чем фонем, но теперь они связаны с содержанием.

IV. Морфосинтаксический уровень.

Элементы: символы морфем.

Внешне понятие: грамматическая правильность высказывания.

Операции: а) классификация морфем по взаимной подставимости в любых высказываниях без изменения их грамматической правильности.

б) группировка по критерию дополнительности.

Результат: Выделение класса морфем как множества эквивалентных морфем.

Количество элементов уменьшается за счет эквивалентности корневых и других морфем.

V. Синтаксический уровень.

Элементы: символы классов морфем.

Исходные данные: высказывания как цепочки классов морфем.

Внешнее понятие: фраза в данном высказывании или другой фразе.

Операции: а). Сегментация на фразы, т.е. цепочки классов морфем.

б). Классификация цепочек классов морфем по их взаимозаменяемости во всех высказываниях, где они являются фразами, без изменения грамматической правильности высказываний

в). Выписывание синтаксических уровней.

Результат: Синтаксические уравнения и результирующие классы.

В соответствии с этими этапами описания лингвистическая структура плана выражения складывается из элементов 4-х ярусов:

Синтаксический ярус – позиционные классы и их цепочки.

Морфосинтаксический ярус – классы морфем и их цепочки.

Морфемный ярус – морфемы.

Фонемный ярус – фонемы.

Каждый уровень имеет свой перечень элементов и дистрибутивных отношений между ними.

При переходе к каждому следующему уровню описания сохраняется возможность однозначного возврата к элементам предыдущего уровня. Или, имея высказывание, представленное через элементы некоторого уровня, можно восстановить его представление через элементы предыдущего уровня. Для этого применяются дополнительные данные, получаемые на каждом очередном этапе анализа.

Дистрибутивный анализ представляет собой целостную систему методов описания.

На каждом уровне:

1). Определяется форма получаемой части описания или форма записи, представления классификации.

2). Указывается вид процедуры:

а) выявление элементов на основе внешних понятий,

б) способы классификации,

в) способ получения синтаксических уравнений;

3). Даются практические рекомендации и рецепты, как проводить анализ:

а) интуитивные пояснения на конкретных примерах по аналогии,

б) значение критерия экономности и простоты получаемого описания.

Основные процедуры анализа и типы дистрибутивных отношений.


Эмпирически данным материалом для дистрибутивного анализа является конкретные акты речи. Практически лингвист имеет дело с абстрактными актами речи, или высказываниями, которые получаются путем элементарного отождествления к.а.р. Процесс анализа сводится к двум основным процедурам, последовательно повторяющимся после завершения каждого этапа обработки данных. Это операции сегментирования и идентификации, или отождествления.

Эти операции противопоставляются друг другу: первая носит неформальный, или полуформальный характер, вторая является формальной. Иногда процедуры сегментирования рассматриваются на долингвистическом этапе обработки текста, к собственно лингвистическому этапу относятся процедуры идентификации.

Исследуемый материал дан нам в виде непрерывного речевого потока, или связного текста. Начальный этап анализа состоит в расчленении его на сегменты определенного типа, например звуковые отрезки. Процедуры сегментирования носят произвольный характер, членение может начинаться от произвольной точки в потоке речи. Механизм и правила сегментации не описаны формально. Здесь нельзя предложить определенного рецепта, можно только высказать некоторые рекомендации «как взяться за дело». Поэтому операции сегментирования занимают особое место в анализе, для них не создана какая-либо теория.

Собственно лингвистический этап начинается с процедур идентификации, которые проводятся последовательно за два шага.

Вначале исходные данные должны быть представлены в виде высказываний, расчлененных на сегменты. Задачи анализа на этом шаге состоят в отождествлении сегментов, сведении их в эквивалентные классы. С этой целью рассматриваются дистрибутивные отношения между разными сегментами. Возможны два типа отношений – эквивалентность и неэквивалентность.

Два сегмента считаются эквивалентными, если они выступают как свободные варианты друг друга, т.е. допускают взаимозамену, не изменяя содержания высказывания. Этот тип дистрибутивных отношений обычно называют отношением свободного варьирования или нефункциональным варьированием.

Примеры свободного варьирован6ия звуков: | г | и | γ | в высказываниях | дарога | и | дароγа |,

| бога | и | боγа | и т.д.

Отношение свободного варьирования представляет собой простейший вид эквивалентности, дистрибутивную эквивалентность «первой степени». На первом шаге анализа устраняется свободное варьирование сегментов, такие сегменты сводятся к одному элементу и в дальнейшем перестают различаться.

Противоположный тип отношений – неэквивалентность – имеет место при контрастной дистрибуции (анг. contrastive distribution) или функциональном варьировании. Два сегмента находятся в отношении контраста, если они встречаются в минимально различающихся парах высказываний. Например, | д | и | т | в дом : том. Варьирование звуков в таких парах высказываний сопровождается изменением их смысла (имеет место ковариативность звучания и значения). Такие звуки не допускают взаимозамены без изменения содержания высказываний. Они безусловно неэквивалентны друг другу и должны быть отнесены к разным элементам.

На втором шаге анализа исходные данные, высказывания представлены в виде последовательностей элементов. Задачи теперь сводятся к рассмотрению отношений между элементами с целью выделения классов эквивалентных элементов. На этом этапе мы обнаруживаем более сложный тип дистрибуции – дополнительную дистрибуцию (анг. complementary distribution). Отношения дополнительной дистрибуции связывают два (или более) таких элемента, один из которых встречается в таком окружении, где не встречается другой, и обратно, второй встречается в таком окружении, где невозможен первый. Оба элемента рассматриваются как позиционные варианты одного и того же класса элементов, для которого устанавливается суммарная дистрибуция. Например: | а | и | ’а’ | в мат – мять.

В итоге анализа исходный перечень элементов преобразуется в классы дистрибутивно эквивалентных элементов, производится количественное сокращение списка элементов. Полученные классы рассматриваются как элементы следующего этапа анализа, как единицы вышестоящего уровня структуры. Цикл процедур повторяется снова: данный набор классов проецируется на высказывания, проводится сегментирование текста в терминах новых элементов; затем приступают к анализу дистрибутивных отношений между сегментами и элементами.

Как было показано, два основных шага идентификации связаны с определением разных типов дистрибуции: нефункциональное и функциональное варьирование на первом шаге и дополнительная дистрибуция на втором. Эти шаги соответствуют двум ступеням анализа, осуществляемого в терминах сегментов – элементов и окружений – дистрибуций. Дополнив соотношения между основными терминами, приведенными выше, мы получим общую схему дистрибутивного анализа:


Объекты языка Объекты метаязыка Типы дистрибуций

Дистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализДистрибутивный анализК.а.р. высказывание


Сегменты Элементы


Элементы Классы элементов

+ +

окружения Дистрибуция

Свободное варьирование


Контрастная дистрибуция


Дополнительная дистрибуция


Принципы дистрибутивного анализа, как показывает их рассмотрение, представляет собой стройную систему операций, осуществляемых в терминах определенного метаязыка. Они описывают процесс лингвистического анализа в виде алгоритма. Именно эта особенность дистрибутивного анализа привлекает внимание специалистов, которые занимаются дешифровкой неизвестных систем письма и языковых кодов. Были сделаны попытки построить машинные алгоритмы выделения гласных и согласных в тексте на основе дистрибутивных признаков в сочетании со статическими.

Различают четыре типа дистрибуций, эти отношения можно представить рисунками:

1


Дополнительная дистрибуция.


В такой дистрибуции находятся варианты одной фонемы: каждый из них встречается лишь в тех позициях, в которых не встречается другой. Например: в русском языке фонемы [ы] и [и].

2


Контрастная дистрибуция. В такой дистрибуции находятся варианты разных фонем. Например: в русском языке [а] и [о] в словах ток и так, том и там, сон и сан – совпадающие части дистрибуции (на схеме – часть, образованная пересечением кругов); он, вон, кто с одной стороны, и Анна, ванна, стена – с другой стороны, - несовпадающие части дистрибуции.


3

Дистрибуция свободного варьирования. В подобной дистрибуции находятся свободные варианты одной и той же фонемы, например: було[ч]ная и було[ш]ная.


Дистрибутивный анализ4


Дистрибуция частичной эквивалентности. В подобной дистрибуции находятся, например, русское взрывное [г] (на схеме – большой круг) и русское фрикативное [γ] (меньший круг), т.к. в норме русской речи оно может быть свободным вариантом взрывного [г] лишь в части окружений последнего – в словах Бога, благо и производных от них.

В дистрибутивном анализе формальные процедуры занимают весьма скромное место. Как следует из вышеприведенной схемы анализа, начальные операции сегментирования носят произвольный характер. Обращение к неявным сведениям о языке, которые лингвист привлекает извне (пользуясь интуицией или дополнительными данными о тексте), допускается на каждом этапе описания.

Дистрибутивные методы в фонологии.


Корпус материала предстает вначале как непрерывный поток конкретных актов речи. К.а.р. – это последовательности (цепочки) звуковых сегментов. Границы сегментов произвольны, поскольку у нас нет средств для указания, как точно разделить поток звуков на отрезки, которые в дальнейшем соответствовали бы его членению на фонемы. Последующие процедуры будут изменять эту сегментацию до тех пор, пока границы сегментов не совпадут с границами отдельных фонем.


ПРОЦЕДУРЫ ОТОЖДЕСТВЛЕНИЯ I.


Эти процедуры применяются, чтобы установить лингвистическую эквивалентность или неэквивалентность звуков-сегментов и перейти от уникальных неповторяющихся сегментов к меньшему числу элементов. Вначале

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: