Научная литература
booksshare.net -> Добавить материал -> Криптография -> Алферов А.П. -> "Основы криптографии Учебное пособие" -> 113

Основы криптографии Учебное пособие - Алферов А.П.

Алферов А.П., Зубов А.Ю., Кузьмин А.С., Черемушкин А.В. Основы криптографии Учебное пособие — М.: Гелиос АРВ, 2002. — 480 c.
ISBN 5-85438-025-0
Скачать (прямая ссылка): osnovikriptografii2005.djvu
Предыдущая << 1 .. 107 108 109 110 111 112 < 113 > 114 115 116 117 118 119 .. 126 >> Следующая


430
Открытые сообщения и их характеристики

Таблица 1. Греческий алфавит

А(а) _ . B(P) T(Y) _ A(S) Е(є) О N
альфа бетта гамма дельта эпсилон дзета
Н(л) 0(0) КО К(к) т М(ц)
эта тэта йота каппа лямбда мю
N(V) ... а© .. О(о) П(тс) р(р) Да)
ню кси омикрон пи PO сигма
I(T) Y(U) ф(ф) X(X) ТО Q(co)
тау эпсилон ... -Фи. _ хи пси омега

Код Бодо, применяемый для передачи сообщений с помощью телетайпов и телексов, использует 32-значный алфавит:

Таблица 2. Упрощенный Бодо-подобный алфавит

OOOOO 00001 00010 00011
А в с D
00100 00101 00110 00111
E F G H
01000 01001 01010 01011
I J к L
01100 01101 01110 01111
M N о P
10000 10001 10010 10011
Q R S T
10100 10101 10110 10111
и V W X
11000 11001 11010 11011
Y Z
11100 11101 11110 11111
? + ( )

431
Приложение 7

Первым идею двоичного кодирования букв алфавита использовал современник В. Шекспира Фрэнсис Бэкон. Он предложил двухбуквенное кодирование.

Таблица 3.Двухбуквенный алфавит Ф. Бэкона

А - ааааа 1,J - abaaa R - Ьаааа
В - aaaab К - abaab S - baaab
С - aaaba L - ababa T - baaba
D - aaabb M - ababb U, V - baabb
E - aabaa N - abbaa W - babaa
F - aabaa О - abbab X - babab
G - aabba P - abbba Y - babba
H - aabbb Q - abbbb Z - babbb

Цифровое кодирование букв применял упоминаемый в историческом очерке И. Тритемий.

Таблица 4. Трехзначный алфавит Тритемия

A-Ill J - 211 S-311
В- 112 К -212 Т-312
С-113 L - 213 U-313
D- 121 М-221 V - 321
E- 122 N-222 W-322
F- 123 0-223 X-323
G - 131 P - 231 Y - 331
H - 132 Q-232 Z - 332
I- 133 R-233 &-333

В вычислительной технике распространены 128-битовые и 256-битовые алфавиты, использующие представление знаков алфавита в виде 7- или 8-значных двоичных комбинаций.

432
Открытые сообщения и их характеристики

Наиболее известен код ASCII (American Standart Code for Information Interchange) — американский стандартный код информационного обмена. Приведем фрагмент этого кода.

Таблица 5. Код ASCII

Символ Восьмеричная запись Двоичная запись
А 101 01000001
В 102 01000010
С 103 01000011
D 104 01000100
E 105 01000101
F 106 01000110
1 061 00110001
2 062 00110010
3 063 00110011
4 064 00110100
& 046 00100110
056 00101110
# 043 00100011
054 00101100

В практике передачи сообщений по техническим каналам связи используется множество других кодов, основанных на двоичном кодировании.

Буквенный алфавит, в котором буквы расположены в их естественном порядке, обычно называют нормальным алфавитом. В противном случае говорят о смешанных алфавитах. В свою очередь, смешанные алфавиты делят на системати-

433
Приложение 1

чески перемешанные алфавиты и случайные алфавиты. К первым относят алфавиты, полученные из нормального на основе некоторого правила, ко вторым — алфавиты, буквы которых следуют друг за другом в хаотическом (или случайном) порядке.

Смешанные алфавиты обычно используются в качестве нижней строки подстановки, представляющей собой ключ шифра простой замены (см. гл. 5). Для запоминания ключа (это надежнее, чем хранение ключа на некотором носителе) применяется несложная процедура перемешивания алфавита, например, основанная на ключевом слове. Одним из первых такой способ построения систематически перемешанного алфавита предложил Ардженти (см. гл. 1).

Частотные характеристики текстовых сообщений

Криптоанализ любого шифра невозможен без учета особенностей текстов сообщений, подлежащих шифрованию. Глубинные закономерности текстовых сообщений исследуются в теории информации. Наиболее важной для криптографии характеристикой текстов является избыточность текста, введенная К. Шенноном. Именно избыточность открытого текста, проникающая в шифртекст, является основной слабостью шифра.

Более простыми характеристиками текстов, используемыми в криптоанализе, являются такие характеристики, как повторяемость букв, пар букв (биграмм) и вообще т-ок (т-грамм\ сочетаемость букв друг с другом, чередование гласных и согласных и некоторые другие. Такие характеристики изучаются на основе эмпирических наблюдений текстов достаточно большой длины.

Для установления статистических закономерностей проводилась большая серия экспериментов по оценке вероятно-

434
Открытые сообщения и их характеристики

стей появления в открытом тексте фиксированных w-грамм (для небольших значений т).

Суть экспериментов состоит в подсчете чисел вхождений

каждой из пт возможных w-грамм в достаточно длинных открытых текстах T = tfa..і/, составленных из букв алфавита {а/, a2,...,an}. При этом просматриваются подряд идущие т-граммы текста:

^3"*С+19 •••> ^ I-т+\^ I-т+2 * * *^/ *

Если 3(alah...al ) — число появлений /я-граммы

а, а, ...а, в тексте Г, a L — общее число подсчитанных т-

Ч 1I 1т

грамм, то опыт показывает, что при достаточно больших L частоты

*9(а. а. ...а. )

4 H 2 1т 7 /1 \

L

для данной m-граммы мало отличаются друг от друга. В силу этого относительную частоту (1) считают приближением вероятности P(ahah...aln) появления данной m-граммы в случайно выбранном месте текста (такой подход принят при статистическом определении вероятности). Например, при т = 1 хорошее приближение вероятностей появления букв достигается на текстах длинной в несколько тысяч букв.
Предыдущая << 1 .. 107 108 109 110 111 112 < 113 > 114 115 116 117 118 119 .. 126 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed