Научная литература
booksshare.net -> Добавить материал -> Биология -> Попов Е.М. -> "Проблема белка. Том 2: Пространственное строения белка" -> 125

Проблема белка. Том 2: Пространственное строения белка - Попов Е.М.

Попов Е.М. Проблема белка. Том 2: Пространственное строения белка — М.: Наука, 1996. — 480 c.
ISBN 5-02-001697-7
Скачать (прямая ссылка): problemabelkat21996.djvu
Предыдущая << 1 .. 119 120 121 122 123 124 < 125 > 126 127 128 129 130 131 .. 232 >> Следующая

Имеющийся в литературе материал и прежде всего многочисленные результаты одного из авторов убеждают в обратном. Ранее Бэржес и Шерага показали, что даже в гипотетическом случае — при наличии совершенного алгоритма, правильно предсказывающего для всех остатков белковой последовательности области их конформацион-ных состояний, — задача получения структуры белка, напоминающей нативную конформацию, остается тем не менее нерешенной [139].
8.2. ТОЧНОСТЬ ПРЕДСКАЗАНИЯ ВТОРИЧНЫХ СТРУКТУР
В конце 1970-х годов было проведено много исследований, посвященных различным аспектам корреляционного подхода к предсказанию вторичной структуры по аминокислотной последовательности. Однако они не внесли принципиально нового в решение обсуждаемой проблемы. Не претерпела серьезных изменений и надежность предсказательных алгоритмов, как предложенных вновь, так и сделанных ранее, модифицированных и опирающихся на значительно больший экспериментальный материал [140—157]. В этой связи интересны данные сопоставления конформационных параметров П. Чоу и Г. Фасмана [99] с параметрами, полученными таким же образом М. Левиттом из анализа приблизительно вдвое большего количества белков [153]. Исследователи обнаружили значительное различие в распределении остатков в двух наборах по их способностям образовывать и разрушать вторичные структуры. С помощью парамет-
266
ров Чоу и Фасмана и параметров Левитта были предсказаны а-спирали и Э-структуры в четырех белках и оценены коэффициенты правильности предсказания (С). Использование первого набора привело к значениям С = 0,26 для а-спирали и С = 0,29 для (3-структуры, а второго набора — соответственно 0,22 и 0,10 (С = 1,0 при совершенном предсказании и С = 0 при беспорядочном). Обращает внимание низкая достоверность результатов в обоих случаях. Таким образом, точность предсказания не возрастает от того, подвергаются ли статистической обработке сотни или тысячи остатков в белках известной структуры.
В ряде работ второй половины 1970-х и начала 1980-х годов (например, [151, 157]) для предсказания вторичных структур одновременно привлекаются все имеющиеся алгоритмы и выводы делаются на основе усредненных результатов. Однако такая процедура не может повысить достоверность предсказания, точно так же как не может возрасти, например, точность измерений при использовании не одного, а нескольких приборов, каждый из которых не удовлетворяет требуемым условиям.
Оценка точности эмпирических предсказаний вторичных структур по аминокислотным последовательностям представляет собой непростую задачу. Многие авторы корреляционных методов в этом вопросе оказываются недостаточно объективными. Так, опробирование методов часто проводится на базовом наборе белков, что, очевидно, имеет огромное значение. При использовании многих правил и большого числа эмпирических параметров для ограниченного круга объектов можно получить удовлетворительное соответствие, которое, однако, не будет отражать реальную предсказательную ценность метода. Иллюстрацией сказанному служит табл. II.4, содержащая результаты различных методов предсказания вторичной структуры аденилаткиназы, о пространственном строении которой авторы не были информированы. В результате приблизительно в половине отнесений число ошибок превышает число правильных предсказаний в 1,5—
4,0 раза.
Известно семь способов количественной оценки результативности предсказаний — показатели качества (Qi—Q7), отражающих различные стороны предлагаемых методов [157]. При отнесении остатка к одной из вторичных структур возможны следующие четыре случая: положительное (w) и отрицательное (х) правильные предсказания, недопредсказание (у) и сверхпредсказание (z). Общепринятый среди создателей алгоритмов предсказания критерий качества Q3 равен сумме долей положительных и отрицательных правильных предсказаний вторичных структур (w + х). Именно таким образом оценивали свои методы Котельчук и Шерага [71, 72], Льюис и Шерага [74, 75], Робсон и Пейн [89 - 91]. Нагано [94], Чоу и Фасман [98, 99] и др. Использование Q3 не вызвало бы возражения, если бы а-спирали, (3-структуры и (3-изгибы входили в белковые третичные структуры приблизительно в равных долях и оценка показателей качества предсказания всех видов вторичных структур делалась бы не последовательно, а одновременно.
267
В действительности же это не так. Известно, что среднее содержание спиралей в белках (не учитывая мембранных) не превышает 35%, по новейшей статистике, оно меньше 30%. Поэтому при идентификации спиралей вероятность отрицательного правильного предсказания в 2— 3 раза выше вероятности положительного правильного предсказания. Еще больший вклад в показатель качества Q3 вносят отрицательные правильные предсказания (3-структуры, среднее содержание которой в белках составляет 15—20%. Таким образом, наиболее распространенный способ оценки качества приводит к завышенным значениям Q3 и, следовательно, к переоценке эффективности корреляционных методов.
Насколько может быть далеким от реальности представление о возможностях алгоритмов предсказания, которое, вероятно, при некритическом отношении к такому показателю качества, как Q3, Г. Шульц и Р. Ширмер иллюстрируют двумя типичными примерами идентификации вторичных структур [157]. В первом примере для белка с незначительным а-спиральным содержанием не было сделано ни одного положительного правильного предсказания (w = 0) при сравнительно большой доле, что почти неизбежно в данном случае, отрицательных правильных предсказаний (например, х = 0,7). При таком, казалось бы, плачевном для использованного алгоритма результате (по существу, не получено никакой информации о структуре белка) количественная оценка его эффективности по значению Q3 получается тем не менее вполне удовлетворительной (70% достоверных предсказаний). Если же при этом сделано даже небольшое число положительных правильных предсказаний (например, W = 0,1), то показатель качества Q3 возрастает до 80%, что уже близко к оптимальному соответствию теории и эксперимента.
Предыдущая << 1 .. 119 120 121 122 123 124 < 125 > 126 127 128 129 130 131 .. 232 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed