Научная литература
booksshare.net -> Добавить материал -> Криптография -> Алферов А.П. -> "Основы криптографии Учебное пособие" -> 114

Основы криптографии Учебное пособие - Алферов А.П.

Алферов А.П., Зубов А.Ю., Кузьмин А.С., Черемушкин А.В. Основы криптографии Учебное пособие — М.: Гелиос АРВ, 2002. — 480 c.
ISBN 5-85438-025-0
Скачать (прямая ссылка): osnovikriptografii2005.djvu
Предыдущая << 1 .. 108 109 110 111 112 113 < 114 > 115 116 117 118 119 120 .. 126 >> Следующая


Ниже приводится таблица частот букв (в процентах) ряда европейских языков. Данные заимствованы из книги [Ваи39] (см. табл. 6).

Некоторая разница значений частот в приводимых в различных источниках таблицах объясняется тем обстоятельством, что частоты существенно зависят не только от длины текста, но и от его характера. Так, в технических текстах редкая буква Ф может стать довольно частой в связи с частым

435
і іриложение 1

использованием таких слов, как функция, дифференциал, диффузия, козффиііиент и г. п.

Таблица 6. Частоты букв европейских языков

Буква алфавита Франц. язык Немец. язык Англ. язык Испан. язык Итал. язык
А 7,68 5,52 7,96 12,90 11,12
В 0,80 1,56 1,60 1,03 1,07
С 3,32 2,94 2,84 4,42 4,11
D 3,60 4,91 4,01 4,67 3,54
E 17,76 19,18 12,86 14,15 1К63
F 1,06 1,96 2,62 0,70 1,15
G 1,10 3,60 1,99 1,00 1,73
H 0,64 5,02 5,39 0,91 0,83
I 7,23 8,21 7,77 7,01 12,04
J 0,19 0,16 0,16 0,24 -
К - 1,33 0,41 - -
L 5,89 3,48 3,51 5,52 5,95
M 2,72 1,69 2,43 2,55 2,65
N 7,61 10,20 7,51 6,20 7,68
О 5,34 2,14 6,62 8,84 8,92
P 3,24 0,54 1,81 3,26 2,66
Q 1,34 0,01 0,17 1,55 0,48
R 6,81 7,01 6,83 6,95 6,56
S 8,23 7,07 6,62 7,64 4,81
T 7,30 5,86 9,72 4,36 7,07
и 6,05 4,22 2,48 4,00 3,09
V 1,27 0,84 1,15 0,67 1,67
W - 1,38 1,80 - -
X 0,54 - 0,17 0,07 -
Y 0,21 - 1,52 1,05 -
Z 0,07 1Д7 0,05 0,31 1,24

436
Открытые сообщения и их характеристики

Еще большие отклонения от нормы в частоте употребления отдельных букв наблюдаются в некоторых художественных произведениях, особенно в стихах. Поэтому для надежного определения средней частоты буквы желательно иметь набор различных текстов, заимствованных из различных источников. Вместе с тем, как правило, подобные отклонения незначительны, и в первом приближении ими можно пренебречь.

В связи с этим подобные таблицы, используемые в криптографии, должны составляться с учетом характера переписки.

ACEG I KMOQS UWY

Рис. 1. Частоты букв английского языка (в процентах)

Наглядное представление о частотах букв дает диаграмма встречаемости. Так, для английского языка, в соответствии с табл. 6, такая диаграмма изображена на рис. 1.

Для русского языка частоты (в порядке убывания) знаков алфавита, в котором отождествлены E с Ё, Ь с Ъ, а также име-

437
І Іриложение 1

ется знак пробела (-) между словами, приведены в следующей таблице (см. [Ягл.73]):

Таблица 7. Частоты букв русского языка

(в 32-буквенном алфавите со знаком пробела)

- О Е,Ё А
0,175 0,090 0,072 0,062
И T H С
0,062 0,053 0,053 0,045
P В Л К
0,040 0,038 0,035 0,028
M Д П У
0,026 0,025 0,023 0,021
Я Ы 3 Ь/Ь
0,018 0,016 0,016 0,014
Б Г ч И
0,014 0,013 0,012 0,010
X ж Ю ш
0,009 0,007 0,006 0,006
Ц Щ э ф
0,004 0,003 0,003 0,002

Таблица 8. 10 наиболее частых букв европейских языков

Французский язык E,S,A,N,T,I,R,U,L,0 79,9%
Немецкий язык E,N,I,S,T,A,H,D,U 77,2%
Английский язык E,T,A,I,N,R,0,S,H,D 75,3%
Испанский язык E,AO,S,l,R,N,L,D,C 78,3%
Итальянский язык I,E,A,0,N,T,R,L,S,C 79,9%

438
Открытые сообщения и их характеристики

На основании табл. 7 получаем следующую диаграмму частот (см. рис. 2).

Частоты букв русского 32-буквенного алфавита (со знаком пробела)

Б Г Е,Ё З Й Л H П С У X ЧЩЬ.ЪЮ

I

Рис. 2. Диаграмма частот букв русского языка

Имеется мнемоническое правило запоминания десяти наиболее частых букв русского алфавита. Эти буквы составляют нелепое слово СЕНОВАЛИТР. Можно также предложить аналогичный способ запоминания частых букв английского языка, например, с помощью слова TETRIS-HONDA (см. табл. 8).

Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов.

Приведем таблицы частот биграмм для русского (табл. 9) и английского языков (табл. 10) (таблицы заимствованы из книги [Fri85]). Для удобства они разбиты на четыре части по следующей схеме:

439
І Іриложение I

ЧАСТЬ 1 ЧАСТЬ 2
ЧАСТЬ 3 ЧАСТЬ 4

Хорошие таблицы &-грамм легко получить, используя тексты электронных версий многих книг, содержащихся на CD-дисках.

Для получения более точных сведений об открытых текстах можно строить и анализировать таблицы &-грамм при к> 2, однако для учебных целей вполне достаточно ограничиться биграммами. Неравновероятность к-грамм (и даже слов) тесно связана с характерной особенностью открытого текста — наличием в нем большого числа повторений отдельных фрагментов текста: корней, окончаний, суффиксов, слов и фраз. Так, для русского языка такими привычными фрагментами являются наиболее частые биграммы и триграммы:

CT, HO, EH, ТО, НА, OB, НИ, PA, ВО, КО,

СТО, ЕНО, НОВ, ТОВ, ОВО, OBA

Полезной является информация о сочетаемости букв, то есть о предпочтительных связях букв друг с другом, которую легко извлечь из таблиц частот биграмм.

Имеется в виду таблица, в которой слева и справа от каждой буквы расположены наиболее предпочтительные “соседи” (в порядке убывания частоты соответствующих биграмм). В таких таблицах обычно указывается также доля гласных и согласных букв (в процентах), предшествующих (или следующих за) данной букве.
Предыдущая << 1 .. 108 109 110 111 112 113 < 114 > 115 116 117 118 119 120 .. 126 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed