Содержание:

отдых на западной Украине | Прогресс Гарант в Санкт-Петербурге.
Главная » Прикладная лингвистика » Квантитативная лингвистика

Квантитативная лингвистика: дешифровка текста, авторизация текста.

Статистическая обработка экспериментальных данных.

Совр. л-ка становится все более экспериментальной. Требование корректности применения статистич. процедур заставляется отбрасывать часть материала, искажая структуру объекта. Статистика изучает варьирующийся признак, напр, длину предложения: одно, два, три и т.д. слов в предложении – градации признака «длина». Лингв. признаки могут быть

  • количественные, т.е. сопоставляться с опр. мерой: число морфем в слове, высота основного тона)
  • качественные: напр, актив/пассив залога; ударность(можно задать 3 градации – ударный, безударный, полуударный), можно исследовать т. одну хар-ку – частоту встречаемости градаций этих признаков
  • ветвящиеся – с ними возникает проблема, напр, признак «ритмич. структура слова» - ветвящийся признака, потому что прежде всего это длина слова, а потом – место ударного слога.

Если мы хотим по наблюдениям над выборкой сделать какое-то заключение о генеральной совокупности, то выборка должна достаточно четко представлять генеральную совокупность. В случае количественной выборки, она должна позволять сделать какое-то заключение о генеральных параметрах с заданной точностью. Качественная достоверность выборки устанавливается, если структура выборки повторяет структуру генеральной совокупности. Когда структура известна, точнее известны факторы, влияющие на изучаемый параметр, выборку строят в соответствии с этими распределениями. Если генер. структура выборки неизвестна, то выборку строят по случайному закону, т.е. с пом. любого датчика случайных чисел.

Построение распределения необходимо для выявления его формы, напр. определения типы языка при дешифровке. Генер. совокупность в статистике – множ-во объектов, организованных не просто по изучаемому признаку, а обязательно по однородному признаку.

Дешифровка - это исследование сообщений или текстов для обнаружения информации, представленной способом, не известным исследователю. Объектами лингв. Д. являются тексты на языках каких-л. народов или записи иных знаковых систем: ноты, картографич. док-ты, матем. формулы.

Но ни изучение нуклеотидных цепей, ни мед. диагностика, ни работа детектива не являются лингв. Д-кой. Лингв. Д. вкл. в себя исследование историч. письмен и чтение тайнописи (криптограмм). В первом случае непонятность текста исследователю обусловлена разрывом традиции, во 2 – специальными усилиями, предпринятыми автором или шифровальщиком, чтобы сузить круг адресатов. В текстах, записанных шифрами и кодами, основанными на замене элементов текста другими, заранее обусловленными, сохраняются естеств. закономерности построения я.

Шифр имеет в качестве «означаемого», или номинанта, звук или элемент письменности данного языка. Напр, простейшим шифром явл. обозначение каж. буквы алфавита ее порядковым номером. обозначающее в это шифре – двузначное число, номинант – буква рус. алфавита, порядковый номер кот. обозначен этим числом: а-01, б-02…В отличие от шифра код имеет обозначаемое в прямом смысле, т.е. представляет собой условное означаемое для существующего в кодируемом языке значения. Примером может служит «офенский язык», жаргон бродячих торговцев центр. России 19-20 вв: «Обтыривай маз! Дулец-то яманный!» - говорил коробейник своему напарнику и тот понимал: «Обвешивай, приятель! Мужик-то простоват!» Этот код развился как социал. диалект рус.я. Кодированию, замене подверглись только элементы, несущие лекс. значение, а грам. и словообразовательные морфемы остались русские.

Задачи, решаемые криптографией и дешифровкой исторических систем письма, почти противоположны, и методы первой могут весьма ограниченно применяться во второй. В криптографии предполагается, что исходный, незакодированный текст написан на известном языке, причем обычно либо этот язык хорошо известен, либо круг кандидатов на эту роль из числа хорошо известных языков весьма невелик. Цель криптографии состоит в восстановлении исходного текста по зашифрованному тексту, в котором всякого рода статические распределения элементов текста могут очень сильно отличаться от соответствующих распределений элементов в исходном тексте.

Страницы:   1 | 2 | 3  Далее >>

Насадка для блендера philips zapchastki.ru. . Объявления о продаже авто Peugeot по регионам Украины.

____________

Рубрики