Автор:
Дмитрий Кузнецов (Курск, Россия)
Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа, которые позволяет дополнить структурную модель языка вероятностным компонентом. В прикладной области квантитативная лингвистика представлена прежде всего фрагментами этой модели, используемыми для лингвистического мониторинга функционирования языка, дешифровки кодированного текста, авторизации/атрибуции текста и т.п.
Шифрование – «способ сокрытия исходного смысла сообщения или другого документа, обеспечивающий искажение его первоначального содержания» [1] – занимает особое место в ряду функций прикладной лингвистики. Соответственно, там, где есть сокрытие, всегда необходимы прямо противоположные действия. Дешифровка означает «отождествление знаков исследуемого письма (текста) со словами языка, записанного, как предполагается, при помощи этих знаков или их сочетаний, совокупность которых в разнообразных комбинациях и составляет изучаемое письмо» [7].
Лингвистическая дешифровка включает в себя исследование исторических письмен и чтение тайнописи (криптограмм). В первом случае непонятность текста для исследователя обусловлена разрывом традиции, во втором — специальными усилиями, предпринятыми автором или шифровальщиком, чтобы сузить круг адресатов.
В истории развития письменности шифрованию и дешифровке уделялось огромное внимание, т. к. человечество одновременно нуждалось как в скрытии информации (шифровании), так и в её открытии (дешифровке). Для расшифровки сообщения необходимы правила и ключ шифрования – конкретное секретное состояние параметров алгоритмов. Роль лингвистов в этой области велика, т.к. механизмы декодирование информации требует знания структуры языка, принципов функционирования языковых единиц в тексте, их особенностей и другой лингвистической информации [8].
С возникновением письменности задача обеспечения секретности и подлинности передаваемых сообщений стала особенно актуальной. Поэтому именно после возникновения письменности появилось искусство тайнописи, искусство «тайно писать» - набор методов, предназначенных для секретной передачи записанных сообщений от одного человека другому [12].
Историю криптографии условно можно также разделить на 4 этапа.
-
Наивная криптография.
-
Формальная криптография
-
Научная криптография
-
Компьютерная криптография
Данные о первых способах тайнописи весьма обрывочны. Предполагается, что она была известна в древнем Египте и Вавилоне. До нашего времени дошли указания на то, что искусство секретного письма использовалось в древней Греции.
Для наивной криптографии (до нач. XVI века) характерно использование любых (обычно примитивных) способов запутывания противника относительно содержания шифруемых текстов. На начальном этапе для защиты информации использовались методы кодирования и стеганографии (передаваемый текст "растворялся" в сообщении большего размера с совершенно "посторонним" смыслом и «выводился» из него путем извлечения символов по определенным законам) которые родственны, но не тождественны криптографии.
Этап формальной криптографии (кон. XV века - нач. XX века) связан с появлением формализованных и относительно стойких к ручному криптоанализу шифров. В европейских странах это произошло в эпоху Возрождения, когда развитие науки и торговли вызвало спрос на надежные способы защиты информации. Важная роль на этом этапе принадлежит Леону Батисте Альберти, итальянскому архитектору, который одним из первых предложил многоалфавитную подстановку. Данный шифр, получивший имя дипломата XVI века Блеза Вижинера – [1,5], состоял в последовательном «сложении» букв исходного текста с ключом (процедуру можно облегчить с помощью специальной таблицы). Его работа «Трактат о шифре» считается первой научной работой по криптологии.
Несмотря на то что в те времена криптография была уделом государственных служб, сохранились примеры использования шифров учеными-астрономами для утверждения приоритета своих открытий. Астрономы использовали так называемые анаграммы — слово или словосочетание, образованное перестановкой букв другого слова или словосочетания. Например, выдающийся итальянский ученый Галилео Галилей свое открытие колец Сатурна в 1610 году зашифровал с помощью такой анаграммы: smaismrmielmepoetaleumibuvnenugttaviras. Число вариантов различных перестановок крайне велико, оно определяется числом из 35 цифр, поэтому вероятность того, что подобное сообщение будет прочитано научной общественностью верно, ничтожна мала. При правильном расшифровании получался такой текст: Altissimum planetam tergeminum observavi (Высочайшую планету тройную наблюдал). Спустя почти полвека кольца Сатурна открыл голландский ученый Христиан Гюйгенс и тоже зашифровал свою догадку анаграммой из латинских букв: aaaaaaa, ccccc, d, eeeee, g, h, iiiiiii, llll, mm, nnnnnnnnn, oooo, pp, q, s, ttttt, uuuuu. Если переставить их в нужном порядке, то получится фраза: Annulo cingitur, tenui, plano, nusquam cohaerente, ad eclipticam inclinato, что означало: “кольцом окружен тонким, плоским, нигде не прикасающимся, к эклиптике наклоненным”. Чтобы расшифровать эту криптограмму, нужно было бы сделать примерно 1060 перестановок.[10]
Наконец, последним словом в донаучной криптографии, которое обеспечили еще более высокую криптостойкосить, а также позволило автоматизировать (в смысле механизировать) процесс шифрования стали роторные криптосистемы.
Одной из первых подобных систем стала изобретенная в 1790 году Томасом Джефферсоном, будущим президентом США механическая машина. Многоалфавитная подстановка с помощью роторной машины реализуется вариацией взаимного положения вращающихся роторов, каждый из которых осуществляет «прошитую» в нем подстановку.
Компьютерная криптография (с 70-х годов XX века) обязана своим появлением вычислительным средствам с производительностью, достаточной для реализации криптосистем, обеспечивающих при большой скорости шифрования на несколько порядков более высокую криптостойкость, чем «ручные» и «механические» шифры.
Принципы дешифровки представляют интерес не только с технической или политической, но и чисто лингвистистической точки зрения. Знание принципов и алгоритмов декодирования позволили сделать величайшие открытия: прочитать и понять наскальные надписи, сакральные тексты, пергаментные и берестяные свитки. Исследование дешифровки древних текстов даёт возможность языковедам ответить на вопросы, связанные с происхождением идеи письма, возникновением первых систем письменности, их эволюцией, выявлением степени их родства и закономерностей развития. Более того, Ю.В. Кнорозовым было доказано, что «без глубоких знаний по филологии и истории культуры дешифровка в широком смысле вообще невозможна» [8].
Современная лингвистика располагает методами квантитативного анализа исследуемого материала. «Поскольку текст имеет знаковую природу и компоненты его связаны с правилами кода, в момент понимания он может быть разделён на значащие отрезки и перекодирован языковым сознанием адресата в иную систему семантических кодовых образов…» [4:81]. В задачи лингвиста прежде всего входит установление структуры текста:
- исследование знаков алфавита, морфем, словоформ и выведение правил их преобразований;
- затем построение грамматики неизвестного языка, что означает разбиение каждого блока на отдельные части и классификация их с целью выделения постоянных и переменных частей, соответствующих корневым и служебным морфемам;
- собственно процесс изучения смысла текста.
Нельзя забывать и о машинной дешифровке, с использования которой начался новый этап в развитии криптоанализа. Она подразумевает разбивку нерасчлененного текста на блоки, составление прямых и обратных словарей, выявление формальной грамматики. Однако, являясь несовершенным методом, машинная обработка используется исключительно в качестве вспомогательного средства, цель которого - получение исходных материалов для филологов, что существенно облегчает труд учёных-лингвистов. Роль языковедов, несомненно, велика, т.к. им необходимо проводить дальнейший анализ и обработку полученных данных.
Таким образом, шифрование и дешифровка, выступая в качестве одного из аспектов оптимизации когнитивной функции прикладной лингвистики, базируются на моделях лингвистического исследования, квантитативном анализе текстового материала и, соответственно, представляют большой интерес для лингвистов. В свою очередь лингвисты и лингвистическое знание являются главным условием успешного шифрования/дешифровки даже при современном техническом оснащении такого вида деятельности [8].
Литература:
1. Алферов А.П., Зубов А.Ю., Кузьмин А.С., Черемушкин А.В. Основы криптографии – М., 2000.
2. Аргановский А.В., Хади Р.А. Практическая криптография: алгоритмы и их программирование / А.В. Аргановский, Р.А. Хади – М.:СОЛОН-Пресс, 2009. 256с.
3. Баричев С.Г., Серов Р.Е. Основы современной криптографии. Электронное издание. Версия 1.3. – 2002 – 152с.
4. Боженкова Р.К., Боженкова Н.А. Русский язык и культура речи: учеб. пособие: в 3 ч. Курск, 2004. Ч. 1. 148 с.
5. Жельников В. Кpиптогpафия от папиpуса до компьютеpа. — М.: ABF, 1996. — 335 с.
6. Зубов А.Ю. Совершенные шифры. – Изд-во: Гелиос АРВ,2003 - 162с.
7. Кузьмищев В.А. Тайна жрецов майя. М.: Молодая гвардия, 1975.
8. Петрова Н.Э., Конарева А.А. О шифровании и дешифровке как когнитивном аспекте прикладной лингвистики: материалы III Международной молодежной научной конференции // Курск, 2011.
9. Пиотровский Р. Г., Бектаев К. Б., Пиотровская А. А. Математическая лингвистика. М. 2007.
10. Соболева Т. А. История шифровального дела в России. — М.: ОЛМА-ПРЕСС Образование, 2002. — 512 с.
11. http://criptograf.narod.ru
12. http://kriptografea.narod.ru
Научный руководитель:
кандидат филологических наук Попова Галина Владимировна.