Xreferat.com » Топики по английскому языку » Дистрибутивный анализ

Дистрибутивный анализ

рассматриваются пределы вариативности (различности) отдельных звуков в повторяющихся высказываниях. Имея запись какого-то высказывания, разделенного на сегменты, можно повторить его снова и записать. Говорят, что каждый сегмент одного повторения свободно подставляется вместо соответствующего сегмента другого повторения, или является его свободным вариантом.

Если высказывание АВС есть повторение высказывания А’В’С’, тогда А ~ А’, В ~ В’, С ~ С’.

После этого эксперименты с субституцией звуков проводятся в различающихся высказываниях. Например, проверим, можно ли подставить | б | из бутыль на место | б | в булка. Повторное произношение этих высказываний с заменой звуков будет подобно первому их произношению.

В общем случае берем высказывание с сегментами DEF, конструируем высказывание, составленное из DA’F, где А’ есть повторение А из некоторого высказывание АВС. Если информант воспринимает DA’F, как повторение DEF и если можно также построить E’BC (Е’ есть повторение Е), эквивалентное АВС, тогда А и Е (и А’ и Е’) взаимоподставимы, т.е. являются свободными вариантами друг друга (A ~ E).

Для Дескриптивного анализа важно установить не только эквивалентность некоторых сегментов друг другу, но также определить и неэквивалентность, неподставимость сегментов. Эксплицитно описать различия не менее важно, чем описать сходство, а чтобы иметь средства для различения одних высказываний от других, необходимо определить систему различительных элементов для многих высказываний. Так, чтобы различать дом, дол, дел, мы должны знать несколько различительных признаков между неэквивалентными высказываниями (дом отличается от дол третьим элементом, а от дел - вторым и третьим).

Представление речи как последовательности или аранжировки отдельных элементов связано с выделением звуковых различий между парой неэквивалентных высказываний.

Анализ пар неэквивалентных высказываний оказывается важным при установлении неэквивалентных звуков-сегментов. В особенности надежное определение разных звуков дают так называемые минимально различающиеся пары высказываний типа (дом : том), отличительными признаками которых являются одиночные звуковые сегменты. Эти сегменты | д | и | т | в данном случае имеют одинаковые окружения. Однако подстановка одного из них на место другого приводит к контрасту смысла, т.е. невозможна. Контрастирование смыслов высказываний свидетельствует о том, что различение | д | и | т | существенно для русского языка, т.е. что данные сегменты не эквивалентны, а различны.

В итоге определения эквивалентности и неэквивалентности сегментов получаем классы звуков-сегментов, или фонемные элементы. Случаи свободного варьирования исключены в данном перечне фонемных элементов. Так, если признаны эквивалентными высказываний |дарога | и | дароγа |, то соответственно перестают различаться звуки-сегменты | г | и | γ |. Они получают единое обозначение в виде фонемного элемента | г |. Приведем другие пары сегментов, которые могут считаться свободными вариантами. В русском языке допускается параллельное произношение слов | тэрмос | и | т’ермос |, | критэрий | и | крит’ерий | и т.п. Эти различия носят стилевой характер и не затрагивают смыслового содержания слов, ими можно пренебречь в целях компактного описания текстов. Тогда необходимо признать следующие эквивалентности: | т | ~ | т’ |, | э | ~ | е |. Такое «уравнивание» звуков имеет место только для данных высказываний, а не для любых их употреблений. Так | т | и | т’ | в тапка и тяпка невозможно считать эквивалентными.

Таким образом, получив перечень фонемных элементов, можно перезаписать исходные высказывания, устраняя несущественные для дальнейшего анализа различия звуковых признаков в эквивалентных актах речи. Все высказывания теперь расчленены на фонемные элементы, в каждом из них ровно столько единиц, сколько необходимо для различия высказываний, не являющихся повторениями друг друга, и не более.

Наряду с фонемными элементами, имеющими природу линейных сегментов, в высказываниях выделяются суперсегментные элементы. Такие звуковые черты речи, как тон, последовательность ударений, интонация, рассматриваются как «вторичные фонемы», «просодемы» (анг. contours). Они как бы размазаны по всей длине высказывания. Дистрибутивные методы выявляют эквивалентность высказываний по суперсегментным признакам безотносительно к их сегментному составу. Так парные высказывания с одинаковыми сегментами могут быть различными по смыслу и суперсегментным элементам: Он идет? : Он идет. Для каждого языка определяется весь набор просодем, каждая из них обозначается определенным символом | ? |, | ! |, | , |, | . | и т.д. и записывается после фонемных элементов.

ПРОЦЕДУРЫ ОТОЖДЕСТВЛЕНИЯ II (СОБСТВЕННО ФОНОЛОГИЯ)


Имея в качестве данных высказывания, записанные как цепочки элементов, переходим к рассмотрению их сочетаемости. Задача состоит в изучении закономерностей появления фонемных элементов в тексте и нахождении дистрибутивно эквивалентных элементов, которые можно сгруппировать в классы.

Представление актов речи в виде элементов и «просодем» имеет недостатки:

Каждый элемент характеризуется конкретными ограниченными окружениями,

Количество элементов велико.

Необходимо найти способы для типизации элементов и сокращения тем самым их первоначального числа. Условием для этого является выявление дополнительной дистрибуции.

Подготовка процедуры состоит в установлении окружений элементов и их суммировании.

Рассмотрим эти процедуры на примере. Пусть даны следующие высказывания: | разб’ила |, |бы |, | был |, | быт |, | б’ит’ |, | иба |, | л’уб’и |, | б’иб’и |, | двугорбый |, | падоб’ийе |. Определим окружения элементов | и | и | ы |. Для удобства рассмотрения выпишем все непосредственные окружения в таблицу №1.

табл. №1


Элементы Окружения

б’- л б-# б - л б - т б’- т’ # - б л’- б’ б’- б’ б - й б’- й
И +


+ + + +
+
Ы
+ + +



+

Сочетаемость элемента с окружением отмечается знаком + на пересечении строки и столбца. Как видно, число окружений велико. При расширении исходного списка высказываний это количество будет возрастать. Поэтому имеет смысл выявить характерные черты окружений и представить их в более компактном виде.

Просматривая окружения, легко заметить общие признаки их компонентов: наличие мягкости или ее отсутствие. По этим признакам все элементы в окружениях сгруппируем следующим образом: сгруппируем в один ряд мягкие, введя символ класса мягких С’, и все «немягкие» объединим во второй разряд С. С’ = {б’, т’, л’, й}, С = {б, т, л}. Тогда таблицу № 1 можно преобразовать в таблицу № 2.

табл. №2



C’ - C C - # C - C C’ – C’ # - C C – C’
И +

+ +
Ы
+ +

+

Отождествление некоторых окружений по признакам мягкоститвердости привело к сокращению их числа с 10 до 6.

Продолжим наш анализ окружений. Обращаем внимание на то, что не все члены окружений одинаково существенны для выбора элементов | и | и | ы |. Так, последующие элементы не диагностируют выбор, ср. | и | появляется перед –с и –с’, также и | ы |. Напротив, предшествующие элементы определяют правила выбора гласных. Учитывая это, можно представить окружения только в составе диагностических признаков, исключив постпозитивные члены. Это показано в таблице № 3.

табл. № 3



- C’- - C - # -
И +
+
Ы
+

Таким образом, упорядочения списка окружений приводит их к компактному виду. Теперь можно перейти к анализу дистрибуций элементов.

Таблица № 3 показывает, что дистрибуции | и | и | ы | дополнительны друг относительно друга: | и | встречается в таких окружениях, где не появляется | ы |, и наоборот. Отсюда следует, что | и | и | ы | находятся в отношении дополнительной дистрибуции. О таких элементах говорят, что их дистрибуции не пересекаются (в дистрибутивной таблице нет таких столбцов, в которых обе строки были бы заполнены знаком +). В общем виде дистрибутивная таблица имеет вид:



X - Y -
a +
b
+

Элементы a и b не встречаются в одинаковых окружениях (X или Y), их окружения не пересекаются. По критерию дополнительной дистрибуции элементы объединяются в единый класс, который считается элементом следующего шага описания. Для обозначения классов фонемных элементов используем прописные буквы: И = {| и |, | ы |}.

Полученные классы элементов дескриптивисты называют фонемами, а члены класса – аллофонами, или позиционными вариантами фонемы. Для фонемы устанавливается полная дистрибуция как сумма дистрибуций аллофонов. Так, дистрибуция И включает окружения C’-, C -, # -.

ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИИ ДЛЯ ОБЪЕДИНЕНИЯ ЭЛЕМЕНТОВ В ФОНЕМЫ.


Критерий дополнительной дистрибуции дает лингвисту строго формальные основания для группировки элементов. Такой тип отношений между элементами в терминах теории множеств интерпретируется как отношение множества к его дополнению. Однако этот формальный метод обеспечивает получение единственной классификации элементов только при условии, если число их не более двух. В практическом анализе приходится иметь дело с большим количеством элементов. В этом случае можно по-разному группировать элементы. Допустим, что дистрибутивная таблица имеет вид:



X - Y - Z - U -
a +
+
b
+

c


+
d
+


Тогда по критерию дополнительной дистрибуции можно построить следующие объединения элементов по два: {a, b}, {a, c}, {a, d}, {b, c}, {c, d}. Можно сгруппировать элементы и одним из следующих способов: {a, b, c}, {d} или {a, c, d} {b}. Таким образом, формальные правила разрешают несколько классификаций элементов.

Для уменьшения неоднозначностей в выделении фонем предлагаются некоторые другие критерии, которые лингвист может использовать по своему усмотрению.

Запрещается относить к одной фонеме элементы, которые входят в минимально различающиеся пары высказываний. Например, если будет обнаружено, что помимо учтенных высказываний, | и | и | ы | встречаются еще в такой паре названий букв, как «и», «ы», то это может рассматриваться в пользу необъединения их в один класс. Ср. другой пример из английского языка: при любой дистрибуции не следует объединять | k | и | t |, поскольку они образуют минимальные пары cry - «кричать, плакать» и try - «пытаться, стараться».

Иными словами, отношение дополнительной дистрибуции несовместимо с отношением контрастной дистрибуции у одной и той же пары элементов.

Критерий фонетического подобия в ряде случаев подсказывает пути группировки элементов. Покажем это на двух примерах. Пусть имеется дистрибутивная таблица для четырех элементов | и |, | ы |, | е |, | э |, которые встречаются в одинаковых окружениях.



C’ - C - # -
И +
+
Ы
+
Е +

Э
+ +

Такое распределение допускает двоякое объединение: | ы | может быть включен в класс {и, ы} или {ы, е}. Дополнительный учет степени фонетического сходства фонемных элементов поможет выбрать одну из группировок ( | ы | и | и | имеют общий фонетический признак – степень закрытости). Мы получаем фонемы {и, ы} и {е, э}.

Важным критерием при классификации является симметрия окружений. Удобно строить фонемы так, чтобы они имели большую свободу сочетаемости с другими элементами. Для дальнейшего анализа не желательно получать фонемы с ограниченными окружениями, специфичными для одной фонемы, ибо это затрудняет сопоставление фонем друг с другом.

Исходными данными для определения отношения симметрии служит список фонем обследуемого языка {a,b,c,d…} (исходное множество Р). Далее вводится абстрактная система возможностей двух фонемных сочетаний, которая заключается в том, что любая фонема может предшествовать или следовать за любой другой, включая саму себя: aa, ab, ac…ba, bb, bc…

Строится квадрат множества Р x Р:



a b c d
a aa ab ac ad
b ba bb bc
c ca cb

d da



Такой квадрат является эталоном, с которым соотносят реальную дистрибуцию. Последняя же не покрывает абстрактных возможностей сочетания фонем и заключается в том, что только некоторые сочетания действительно встречаются.

Далее устанавливаются отношения каждой фонемы ко всему множеству фонем Р.

Предварительно устанавливаются следующие понятия:

αx – альфа-поле – подмножество фонем, принадлежащих исходному множеству Р и способных выступать в качестве первого члена в последовательностях из двух фонем, если х – второй член последовательности.

βх – бета-поле – подмножество фонем, принадлежащих исходному множеству Р и способных выступать в качестве второго члена в последовательностях из двух фонем, если х – первый член последовательности.

τх – тау-поле, которое является суммой αx и βх (τх = αx U βх)

Так же определяется и пересечение αx и βх (τх = αx ∩ βх)

После этого приступают к выявлению отношений симметрии. Фонема х считается симметричной фонеме y, если встречается как последовательность xy, так и yx.

Общие итоги дистрибутивного анализа на фонетическом уровне.


Процедуры отождествления фонемных элементов по критерию дополнительной дистрибуции открывают различные возможности выделения фонем. Полученная классификация может подвергаться дальнейшему анализу и уточнению. Так, можно найти пути для устранения ограничений в дистрибуции фонем за счет учета стыков, т.е. границ между цепочками фонем, отмеченных паузами. Учитывая специфику сочетаемости фонем в началах и концах высказываний, удается сделать классификацию более обобщенной.

Повторная фонемизация также может иметь место в тех случаях, когда оказывается удобным представить какой-либо элемент с резко ограниченной дистрибуцией в виде двух сегментов с большей свободой сочетаемости (например, | č | в виде | tš |).

Конечная цель дистрибутивного анализа на уровне фонем состоит в том, чтобы определить фонемную структуру языка, т.е. дать описание фонемного состава актов речи. Для этого проводится учет комбинаций фонем в речи и их типизация. Так, если | p |, |b |, | t |, | d |, | k |, | g| встречаются перед | a |, | i |, | u |, то вводится символ класса фонем С для каждого из шести согласных и V для каждой из трех гласных, и говорят, что встречаются СV. Это утверждение равносильно утверждению, что встречаются | pa |, | pi |, | pu |, | ba | и т.д. Выделяют классы фонем (типа согласных и гласных), выводятся формулы сочетаемости их в высказываниях. Так, для языка йокут установлена следующая структура высказывания: # [CV(C:)] CV(C)#, где # – знак стыка высказываний и границ контура, C - согласный, V - гласный, : - долгота фонемы; в круглые скобки заключены компоненты, которые иногда встречаются, иногда не встречаются, в квадратные скобки – компоненты, которые встречаются редко. Подставляя вместо символов определенные фонемы, можно построить любое высказывание языка.

Оценивая результаты дистрибутивного анализа в фонологии, следует отметить некоторые важные моменты.

Последовательные процедуры идентификации приводят к ограниченному перечню фонем, количество которых значительно меньше, чем исходное множество сегментов речи. В особенности значительную роль при этом играет объединение элементов по критерию дополнительн6ой дистрибуции. Он использует как объективное средство устранения различий между объектами и по существу стоит на службе следующего этапа анализа.

Каждая фонема представляет класс аллофонов и имеет дистрибутивную характеристику. Эти дистрибуции обеспечивают однозначное преобразование записи высказываний в виде последовательностей фонем в последовательности аллофонов и обратно. По дистрибутивным таблицам можно составить алгоритмические правила выбора фонемного элемента по данному окружению, или, обратно, выбора окружения по данному аллофону.

Дистрибутивный анализ допускает также определение закономерностей комбинаторики фонем в пределах высказываний, укрупнение классов элементов и выявление фонемных структур, которые представляются либо в формулах, либо в диаграммах.

В анализе наряду с формальными критериями идентификации используются и внешние данные: оценки эквивалентности высказываний при субституции звуков, а также сведения о распределении звуков в тексте.

Дистрибутивные методы, несмотря на громоздкость применяемых операций, могут использоваться в экспериментальных исследованиях по дешифровке системы фонем. По-видимому, для хорошо изученных языков эти методы имеет смысл применять не глобально, а выборочно, при анализе неясных, спорных соотношений между звуками.

Выводы.


Принципы дистрибутивного анализа имеют большое научное значение, прежде всего в том плане, что они углубляют наши знания о процессе отождествления единиц речи. Тождества и различия – это то, на чем держится вся языковая система. Нормальная речевая деятельность осуществляется только при условии четкой работы механизмов отождествления и различия языковых элементов. Анализирую факты языка, лингвист также опирается на интуитивное отождествление и различение объектов текста. Основные процедуры дистрибутивного анализа делают шаг вперед в описании этих интуитивных действий исследователя, они расчленяют процесс идентификации на несколько ступеней.

Методы дистрибутивного анализа с успехом применяются в практике лингвистического исследования. Вместе с тем возникает теоретический вопрос о возможности получения универсального алгоритма вывода грамматики из текстовых данных. Для этого необходимо было бы иметь формальные методы описания материала, которые обеспечили бы однозначное построение грамматики без обращения к внешним понятиям. В настоящее время становится ясным, что такая задача в принципе не разрешима. Именно в силу того, что механизмы речевой деятельности протекают в скрытом от наблюдения виде, на современном этапе невозможна полная формализация анализа языка. В зависимости от внешних, неформальных данных о тексте разные исследователи, применяя приемы дистрибутивного анализа, приходят к несколько различающимся описаниям одного и того же языка.

Ценность этих методов состоит не в том, что они обеспечивают получение полного описания языка. Такая цель едва ли оправдана в отношении большинства языков, в особенности хорошо изученных. Дистрибутивный анализ эффективно применяется для задач дешифровки, которые понимаются достаточно широко. Речь идет не только о дешифровке неизвестной письменности, например, майя, карийского письма. Любой фрагмент структуры языка может быть дешифрован дистрибутивными методами. Иначе говоря, структурные закономерности языка нуждаются в реконструкции, они не могут быть полностью обнаружены описательными приемами. Свойства сочетаемости элементов друг с другом являются основными характеристиками в их синтагматической развертке. Систематический анализ дистрибутивных признаков в связи с этим позволяет проникнуть во внутреннюю организацию структуры языка на всех его уровнях, начиная с фонологического и вплоть до синтаксического. Более того, дистрибутивные методы успешно применяются и для исследования структур плана содержания. Семантические оппозиции и семантические множители также манифестируются в дистрибутивных свойствах речевых единиц. В целом дистрибутивный анализ приводит к построению различных классификационных (таксономических) описаний языка.

Список литературы:


1. Засорина Л.Н. «Введение в структурную лингвистику», М: «Высшая школа – 1974 г.

2. Апресян Ю.Д. «Идеи и методы современной структурной лингвистики», М: «Просвещение» - 1966 г.

3. Степанов Ю.С. «Методы и принципы современной лингвистики», М: «Наука» – 1975 г.

4. «Общее языкознание: методы лингвистических исследований, М: «Наука» – 1973 г.

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: