Основы анализа сцепления

Основы анализа генетического сцепления достаточно полно изложены в работе Отта. Мы лишь суммируем здесь основные понятия анализа правдоподобия.

Предположим, что мы хотим сравнить рабочую гипотезу Н с альтернативной «нулевой» гипотезой Но. Гипотеза Н, к примеру, может утверждать, что локус ПДРФ сцеплен с заболеванием с 10%-ной частотой рекомбинаций, в то же время по гипотезе. Но сцепление может вовсе отрицаться. После сбора семейных данных мы подсчитываем две вероятности: Р – вероятность того, что наблюдаемые данные не противоречат основной гипотезе Н, когда она истинная, и Ро-вероятность того, что те же данные могли иметь место, когда верна гипотеза Но. По отношению Р / Ро можно судить о том, насколько более вероятно появление наблюдаемых данных при условии истинности Н, чем при условии истинности Но – Если это отношение превосходит какой-нибудь достаточно большой порог Т, мы отвергаем Но в пользу гипотезы Н.

По соглашению, в генетике человека предпочитают использовать десятичные логарифмы отношений вероятностей, именуемые лод-баллами. Отношения вероятностей для независимых выборок могут быть объединены путем перемножения, и, таким образом, лод-баллы, полученные по независимым выборкам, могут просто суммироваться.

При планировании анализа возникают два вопроса.

1. Порог: какой должна быть величина порога Т, чтобы снизить до приемлемой величины ошибочно отвергнуть нулевую гипотезу Н0, в случае, когда она в действительности верна?

2. Необходимая величина выборки: как велика должна быть выборка для того, чтобы можно было с большой достоверностью принять гипотезу Н в случае, когда она действительно верна?

В генетике человека принятая величина порога для единичного наблюдения сцепления соответствует отношению шансов не меньше чем 1000:1 и значению лод-балла 3,0. Этот порог не такой строгий, как может показаться. Два случайным образом выбранных локуса в геноме человека, вероятнее всего, располагаются в разных хромосомах или в разных хромосомных плечах, если речь идет об одной хромосоме. При грубой оценке имеется шансов 50:1 против сцепления. Даже если, согласно наблюдаемым данным, вероятность сцепления в 1000 раз превышает вероятность его отсутствия, тот факт, что в общем случае отсутствие сцепления в 50 раз более правдоподобно, чем его наличие, означает, что лод-балл, равный 3, соответствует истинной величине отношения шансов за сцепление только 20:1. Другими словами, при значении лод-балла, равном 3, в одном из 20 случаев может быть ложный результат. При величине лод-балла, равной 4, результат за наличие сцепления будет фиктивным в одном случае из 200.

Необходимый размер выборки может быть установлен подсчетом ожидаемого вклада каждой семьи в общую сумму лод-баллов. При заданной структуре семьи подсчитывается «ожидаемое значение лод-балла», или ELOD. Необходимо набрать достаточное количество семей, чтобы сумма ожидаемых лод-баллов значительно превысила порог, требуемый для принятия гипотезы о наличии сцепления.

Сила метода правдоподобия – в его гибкости. При наличии генных взаимодействий, к примеру, можно проверить гипотезу, согласно которой для проявления болезни необходимо наличие мутаций одновременно по обоим локусам. В случае же с генетической гетерогенностью можно проверить гипотезу о том, что для проявления заболевания достаточно мутации по любому из двух локусов. В данной ситуации это означает, что в каждой семье будет наблюдаться сцепление только с одним из двух локусов.


Также смотрите: