Система восходящих дифтонгов в говорах карельского языка Карелии: сравнение методов кластеризации
Русский
Номер журнала:
Рубрика:
Филология
Информация об авторе:
И. П. Новак Институт языка, литературы и истории Карельского научного центра Российской академии наук, г. Петрозаводск, Российская Федерация, [email protected]
Н. Б. Крижановская Институт прикладных математических исследований Карельского научного центра Российской академии наук, г. Петрозаводск, Российская Федерация, [email protected]
АННОТАЦИЯ
Введение. В последнее десятилетие в финно-угроведении набирают популярность статистические методы диалектологии. Результаты первого этапа применения методики кластеризации к материалам «Диалектологического атласа карельского языка» (1997) проявили основные проблемы карельской диалектологии (несостоятельность традиционной классификации, нечёткое определение статуса и границ отдельных групп говоров и пр.). В целях их решения была создана современная диалектная база данных карельского языка, включающая закодированные языковые данные, что сделало возможным применение к ним различных иерархических и итеративных методов кластеризации.
Цель: определение метрики для верификации и уточнения существующей схемы диалектного членения карельского языка на примере анализа системы восходящих дифтонгов.
Материалы исследования: оцифрованные и закодированные данные «Программ по собиранию материала для диалектологического атласа карельского языка», заполненные в 1937–1972 гг.
Результаты и научная новизна. Научная новизна заключается в применении к большим объёмам карельского диалектного материала статистических методов диалектометрии. В рамках исследования проведено пять видов кластеризации, демонстрирующих распределение вариантов восходящих дифтонгов в карельских говорах Карелии: методом полной связи (три кластеризации), центроидным иерархическим методом и методом k-средних. Результаты кластеризаций не обнаруживают существенных отличий между собой, но наилучшим образом (при сравнении визуализированных данных вручную) проявили себя методы полной связи и k-средних. Итоговая кластерная карта в целом совпала с картиной, описанной в исследованиях по карельской фонетике и диалектологии, но позволила получить более чёткое представление о границах анализируемого диалектного явления и его переходных зонах. Это доказывает правомерность применения методики для решения проблем карельской диалектологии, а также в процессе переработки диалектной классификации языка.
Ключевые слова: диалектология, лингвистическая география, диалектометрия, кластерный анализ, метод кластеризации, карельский язык, восходящие дифтонги
Благодарности: Работа И. П. Новак выполнена в рамках бюджетного финансирования КарНЦ РАН (№ 121070700122-5); Н. Б. Крижановской – за счёт гранта Российского научного фонда № 22-28-20215 «Создание речевого корпуса прибалтийско-финских языков Карелии», проводимого совместно с органами власти Республики Карелия с финансированием из Фонда венчурных инвестиций Республики Карелия (ФВИ РК).
Для цитирования: Новак И. П., Крижановская Н. Б. Система восходящих дифтонгов в говорах карельского языка Карелии: сравнение методов кластеризации // Вестник угроведения. 2022. Т. 12. № 3. С. 486–496.
Н. Б. Крижановская Институт прикладных математических исследований Карельского научного центра Российской академии наук, г. Петрозаводск, Российская Федерация, [email protected]
АННОТАЦИЯ
Введение. В последнее десятилетие в финно-угроведении набирают популярность статистические методы диалектологии. Результаты первого этапа применения методики кластеризации к материалам «Диалектологического атласа карельского языка» (1997) проявили основные проблемы карельской диалектологии (несостоятельность традиционной классификации, нечёткое определение статуса и границ отдельных групп говоров и пр.). В целях их решения была создана современная диалектная база данных карельского языка, включающая закодированные языковые данные, что сделало возможным применение к ним различных иерархических и итеративных методов кластеризации.
Цель: определение метрики для верификации и уточнения существующей схемы диалектного членения карельского языка на примере анализа системы восходящих дифтонгов.
Материалы исследования: оцифрованные и закодированные данные «Программ по собиранию материала для диалектологического атласа карельского языка», заполненные в 1937–1972 гг.
Результаты и научная новизна. Научная новизна заключается в применении к большим объёмам карельского диалектного материала статистических методов диалектометрии. В рамках исследования проведено пять видов кластеризации, демонстрирующих распределение вариантов восходящих дифтонгов в карельских говорах Карелии: методом полной связи (три кластеризации), центроидным иерархическим методом и методом k-средних. Результаты кластеризаций не обнаруживают существенных отличий между собой, но наилучшим образом (при сравнении визуализированных данных вручную) проявили себя методы полной связи и k-средних. Итоговая кластерная карта в целом совпала с картиной, описанной в исследованиях по карельской фонетике и диалектологии, но позволила получить более чёткое представление о границах анализируемого диалектного явления и его переходных зонах. Это доказывает правомерность применения методики для решения проблем карельской диалектологии, а также в процессе переработки диалектной классификации языка.
Ключевые слова: диалектология, лингвистическая география, диалектометрия, кластерный анализ, метод кластеризации, карельский язык, восходящие дифтонги
Благодарности: Работа И. П. Новак выполнена в рамках бюджетного финансирования КарНЦ РАН (№ 121070700122-5); Н. Б. Крижановской – за счёт гранта Российского научного фонда № 22-28-20215 «Создание речевого корпуса прибалтийско-финских языков Карелии», проводимого совместно с органами власти Республики Карелия с финансированием из Фонда венчурных инвестиций Республики Карелия (ФВИ РК).
Для цитирования: Новак И. П., Крижановская Н. Б. Система восходящих дифтонгов в говорах карельского языка Карелии: сравнение методов кластеризации // Вестник угроведения. 2022. Т. 12. № 3. С. 486–496.