
Новый анализ предполагает, что «малая» длина CAG все-таки не имеет значения
Размер – это не все: новое исследование показывает, что на начало БГ влияет только большое число CAG, а не малое

Болезнь Хантингтона возникает, когда одна из двух копий гена БГ больше нормы. Роль меньшей копии была предметом многочисленных споров. Теперь новый анализ огромного набора данных показывает, что малая «длина CAG-повтора» не влияет на начало симптомов БГ.
Что такое длина повтора?
Когда в 1993 году была обнаружена генетическая аномалия, вызывающая болезнь Хантингтона, одним из наиболее заметных моментов было то, что это была не просто обычная орфографическая ошибка.

Большинство генетических заболеваний вызваны однобуквенными ошибками в нашем генетическом коде – изменяется, добавляется или удаляется всего одно химическое «основание», составляющее нашу ДНК.
Но при болезни Хантингтона изменение больше похоже на химическое «заикание». В начале гена БГ последовательность букв – CAG – повторяется несколько раз – обычно от десяти до двадцати. Команда, обнаружившая мутацию, заметила, что у всех людей с болезнью Хантингтона было необычно большое количество CAG подряд – тридцать шесть или больше в каждом случае.
У каждого есть два гена БГ
Фактически, у всех нас есть две копии гена БГ – одна унаследована от мамы, другая от папы. И достаточно всего одной расширенной копии, чтобы вызвать БГ.
Мы называем количество CAG в каждой копии гена БГ длиной CAG-повтора, и у каждого человека есть две длины CAG-повтора БГ.
У большинства людей две «нормальные» длины повтора. У большинства людей с БГ или у тех, кто собирается заболеть БГ, есть одна «нормальная» и одна расширенная длина повтора. И у очень небольшого числа людей фактически есть две расширенные длины повтора.
Размер имеет значение
Прежде чем мы углубимся в то, что здесь нового, давайте кратко рассмотрим, что не изменилось.
Вскоре после обнаружения мутации исследователи поняли, что люди, у которых БГ развивалась в молодом возрасте, как правило, имели более длинные повторы в своем большом гене БГ.
После тщательного изучения выяснилось, что большая длина повтора является основным фактором, определяющим как время начала симптомов, так и скорость их прогрессирования. Чем больше число CAG, тем раньше, вероятно, начнется заболевание.
Однако связь не была идеальной – для большинства людей длину повтора нельзя было использовать для прогнозирования времени начала симптомов. Все еще было много вариаций, которые не были связаны с большим из двух чисел CAG.
Уже много лет мы пытаемся определить, что вызывает эту вариацию. Это диета, образ жизни, лекарства или влияние генов, отличных от гена БГ? Пока мы все еще не уверены.
Малая длина повтора
«Мы вернулись к простой ситуации: большее число CAG у человека влияет на начало заболевания, а меньшее, похоже, не имеет значения».
Естественно, исследователи задавались вопросом, могут ли различия в меньшем из двух чисел CAG у человека объяснить, почему у людей с одинаковой «большой» длиной CAG симптомы могут проявляться в совершенно разном возрасте. Но когда разные команды изучали влияние малого числа CAG, они получили разные результаты.
В 2009 году голландская команда изучила данные почти тысячи пациентов, включенных в огромное исследование REGISTRY. Как и ожидалось, они обнаружили, что большая длина CAG-повтора является основным фактором, определяющим, когда у человека развиваются симптомы БГ. Ничего удивительного.
Но когда они изучили влияние меньшего числа CAG, они обнаружили нечто необычное. Для большинства людей казалось, что для мозга полезно, если меньшее число CAG было особенно малым. Но для людей с особенно высоким «большим CAG» было верно обратное – было лучше, если другое число CAG находилось на высоком конце нормы.
Итак, если большее число CAG у человека было 41, казалось, что лучше, если его другое число CAG было 12 вместо 20. Но если его большее CAG было очень высоким – скажем, 60 или 70, – то по какой-то причине казалось, что лучше, если другое число CAG было 20, а не 12.
Странно – но, по-видимому, убедительное доказательство того, что оба числа CAG важны.
Не так быстро!
Если вам трудно разобраться во всех этих малых и больших числах – расслабьтесь! Потому что благодаря новому исследованию, только что опубликованному в журнале Neurology, все стало намного проще понять.
Команда исследователей во главе с профессором Джимом Гузеллой из Массачусетской больницы общего профиля в Бостоне провела еще более масштабное исследование, в котором приняли участие более 4000 человек, объединенных из исследований REGISTRY, COHORT и PREDICT. Это новое исследование включало все данные из исследования 2009 года – и множество новых данных.
Гузелла хотел вернуться к исходной точке, поэтому он попросил свою команду подвергнуть сомнению все статистические модели, которые использовались ранее.
То, что они обнаружили, немного заумно, но довольно интересно. Когда специалисты по статистике анализируют данные, они должны делать определенные предположения, чтобы использовать математические формулы для прогнозирования. Обычно это нормально, потому что большие объемы данных, как правило, ведут себя так, как ожидается.
Но в данном случае они обнаружили, что одно из сделанных ими предположений было неверным. В частности, они поняли, что один необычный пациент – с одним очень большим числом CAG, равным 120, и одним очень малым, равным 11, – был виноват в очевидном общем эффекте малого числа CAG!
Когда они проанализировали данные снова, исключив этого единственного человека, они не обнаружили никакого эффекта малого числа CAG. Единственным фактором, влияющим на начало симптомов, была большая длина CAG-повтора.
Начиная с нуля

Обеспокоенная тем, что один человек оказал такое вводящее в заблуждение влияние на выборку из почти тысячи субъектов, команда Гузеллы приступила к разработке лучшей статистической модели для изучения своего большого набора данных, которая была бы менее подвержена влиянию отдельных экстремальных случаев.
То, что они обнаружили, было на самом деле очень обнадеживающим. Не было никакого эффекта малой длины CAG-повтора, а также никаких доказательств того, что малая и большая длины повтора могут взаимодействовать.
Даже у десяти субъектов с двумя аномально расширенными числами CAG единственным фактором, влияющим на возраст начала заболевания, было большее из двух чисел.
Итак, мы вернулись к относительно простой ситуации: большая длина CAG-повтора действительно влияет на начало заболевания, но не настолько, чтобы можно было делать прогнозы для отдельных пациентов. Между тем, малая длина повтора, похоже, вообще не имеет значения.
Неудача или прогресс?
Этот новый анализ можно рассматривать как неудачу: то, что мы думали, что знаем, больше не соответствует действительности.
Но мы смотрим на это по-другому. Мы считаем, что поиск истины о причинах БГ – это самое важное, даже если это означает подвергать сомнению наши самые основные предположения.
Фактически, предположение 2009 года о том, что малые и большие CAG-повторы взаимодействуют, было немного неудобным и оказалось довольно трудным для объяснения с точки зрения того, что мы знаем о мутантном белке хантингтине.
Итак, теперь, когда мы знаем, что малый аллель вернулся в свое первоначальное состояние безвестности, у нас на самом деле стало на одну вещь меньше, о которой стоит беспокоиться. И мы можем быть уверены, что статистика, лежащая в основе нашего понимания, является надежной.
Еще одним важным плюсом этого исследования является то, что оно дало нам новые, более надежные математические способы изучения влияния генетических различий на начало симптомов.
Поскольку проводятся масштабные исследования, сканирующие весь геном человека на предмет генов, которые могут влиять на БГ, эти методы, вероятно, окажутся весьма ценными в ближайшем будущем.
Это отличный пример того, о чем мы говорили раньше: наука носит кумулятивный характер. Каждый день мы узнаем немного больше о БГ. И каждый день мы на один день ближе к эффективному лечению.


