Научная литература
booksshare.net -> Добавить материал -> Физика -> Аветисян Р.Д. -> "Теоретические основы информатики" -> 46

Теоретические основы информатики - Аветисян Р.Д.

Аветисян Р.Д., Аветисян Д.О. Теоретические основы информатики — Телеком , 2003. — 170 c.
Скачать (прямая ссылка): teoriticheskieosnoviinformatiki2003.pdf
Предыдущая << 1 .. 40 41 42 43 44 45 < 46 > 47 48 49 50 51 52 .. 64 >> Следующая


А теперь сравним результаты второго и третьего экспериментов. В этих экспериментах характеристики собственно АСДП (X1 и X2) оказались одинаковыми, но значение коэффициента точности во втором эксперименте ((O1 = 0,97) оказалось больше согласованного значения ((Olr = 0,76), которое имело место в третьем эксперименте. Казалось бы, значение итоговой оценки эффективности для второго эксперимента должно было получиться выше этого значения в третьем эксперименте. На самом же деле значение коэффициента корреляции г (X1, X2, (O1) во втором эксперименте (0,34) оказалось меньше, чем в третьем (0,57).

Это обстоятельство еще раз свидетельствует о неправомочности использования значения коэффициента точности ((O1) в качестве параметра, характеризующего АСДП. При фиксированных значениях Xj и X2 значение этого параметра является лишь своего рода опосредованной оценкой поисковой среды. Что же касается коэффициента корреляции, то он характеризует качество работы АСДП и при фиксированных значениях X1 и X2 зависит от степени согласованности поисковой среды (параметр со) с характеристиками X1 и X2 собственно АСДП.

Из (5.28) легко установить, что если при конечных a, b ис параметр d стремится к бесконечности, то значение гху приближенно можно определить по формуле

Gv- /, в ^ ,=V^v (5-37)

^(а + b)(a + с)

Именно к такому результату мы пришли бы, если бы вычислили значение косинуса угла между векторами X и Y:

Cos(ArV) = ^-(5.38) \X\-\Y\

Из сопоставления формул (5.37) и (5.38) легко заметить, что в общем случае, когда значение d соизмеримо со значениями a, b и с, использование критерия (5.38), весьма популярного среди проектировщиков АСДП, нельзя признать корректным, хотя бы потому, что здесь не учитываются реальные значения величины d.

115

ГЛАВА 5 Нельзя признать корректным также использование для оценки эффективности работы АСДП в качестве критерия скалярного произведения векторов x її К, так как при рассмотрении, например, бинарных случаев величина этого критерия равна а, что,естественно, не может считаться приемлемым. Это обстоятельство следует особо подчеркнуть, так как при построении различных матричных моделей АСДП ряд авторов оперируе т обычной операцией умножения матриц, в основе которой лежит операция скалярного произведения векторов. Тем самым, хотя и неявно, но допускается грубая ошибка, что естественно ставит под сомнение адекватность этих моделей исследуемым объектам [14].

В заключение настоящего раздела отметим, что как и при рассмотрении энтропийных моделей, при рассмотрении корреляционных моделей АСДП остаются актуальными задачами их настройки, подробный анализ которых можно найти в [2].

СВЯЗЬ МЕЖДУ ПАРАМЕТРАМИ, ХАРАКТЕРИЗУЮЩИМИ ЭНТРОПИЙНУЮ И КОРРЕЛЯЦИОННУЮ МОДЕЛИ (БИНАРНЫЙ СЛУЧАЙ)

В [2] энтропийная и корреляционная модели документального поиска рассматриваются в самых общих постановках. В рамках же настоящего пособия мы в основном ограничились рассмотрением частного, бинарного случая, который характеризуется простотой реализации и получил наибольшее распространение. Бинарные случаи характеризуются еще и тем, что при их рассмотрении удается установить определенные связи между параметрами энтропийной и корреляционной моделей.

При рассмотрении энтропийной модели документального поиска применительно к бинарному случаю центральную роль играет представленная на рис. 5.2 зависимость энтропии от вероятности появления

одного из двух возможных событий

H (]>) = -P log TP -(I-P) log2( 1 - р). (5.39)

На рис. 5.2 пунктиром представлена также зависимость

R (]?) = 4р(\-р), (5.40)

которая в области 0 5S р *? 1 отличается от зависимости (5.39) лишь незначительно и поэтому может рассматриваться как некое (параболическое) приближение к функции H (ji).

.ііііш/і; luipuuujltl lV4rI4lSM -JCID»lCri~

мостью R(P) (пунктирная линия) ПРИ рассмотрении энтропийной моде-

Рис. 5.2. Замена функции К. Шеннона Н(р) (сплошная

[Iuuua^ nanafV^nu-i^^b-rMj IODIHMI

116 ли (бинарный случай) основными параметрами являются (см. формулы (3.22), (3.24), (3.27) и (3.40):

H [л] = H (р), (5.41)

W[,v/у] = XW(O)1 ) + (l-X)W(w2), (5.42)

/[л-, у I = Н[х\- Н\х / у], (5.43)

х|л, y]=l\x, y]/W|.v], (5.44)

Заменив в формулах (5.41) + (5.44) значения функции H значениями функции R с теми же аргументами и введя соответствующие обозначения, получим

R И = R (р), (5.45)

/ у] = Щсо, ) + (1- X)R(O)2), (5.46)

lR[x, у] = /?[*]-ЯГ*/у], (5.47)

KrIx, у}= IrIx, у]/ R[x\. (5.48)

Выразив в (5.45) + (5.48) значения со, С0|, со2 и X через соответствующие элементы матрицы сопряженности, получим:

R[x] = 4(a + c)(b + d)/п2, (5.49)

R[x / у] = 4(ab / (a + b) + cd / (с + d)) / п, (5.50)

lR[x, v] = 4((a + c)(b + d)-abn / (a + b)-cdn/(c + d)), (5.51)

, , _(ad-be)2__

XpLY, Vj =-. (5.52)

(a + b)(a + c)(b + d)(c + d)

Сравнивая (5.52) с (5.28), легко обнаружить, что величина х^л, у] не что иное, как квадрат коэффициента линейной корреляции. Иными словами, величина г2. = xA[.v, у], нормированая, как и х[л\ у), в интервале 0? г2. sS 1, может рассматриваться как некое приближение к этому коэффициенту, названному в разделе 5.3 коэффициентом проводимости АСДП.
Предыдущая << 1 .. 40 41 42 43 44 45 < 46 > 47 48 49 50 51 52 .. 64 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed