Исследование STRC

Day 1, evening

Без диплома генетика. Без доступа к лаборатории. Без бюджета. Только ноутбук, телефон и AI-агент (OpenClaw + Claude Opus 4.6), который реально умеет делать вещи: скачивать файлы, искать базы данных, анализировать данные, создавать сайты. Моя работа — задавать правильные вопросы. Вот именно что я спрашивал и что получал в ответ.

Я начал с генетического отчёта сына

Отчёт WES Михаила из Детской больницы Гонконга (Лаб. №: 23C7500174, декабрь 2022) содержал два варианта STRC. Один был помечен как «Патогенный» (делеция целого гена от отца, подтверждённая MLPA). Другой был помечен как «Вариант неопределённой значимости» (замена одной буквы от матери, подтверждённая секвенированием по Сэнгеру): NM_153700.2:c.4976A>C p.(Glu1659Ala). Мне нужно было выяснить: действительно ли второй вариант вреден?

Что вам нужно: генетический отчёт вашего ребёнка с точной номенклатурой варианта (название гена, нотация c., нотация p.).

Я спросил: где находится этот белок?

Я попросил Claude найти белок STRC. Он обратился к UniProt и нашёл идентификатор: Q7RTU9. Claude затем указал мне на AlphaFold, где есть предсказанная 3D-структура. Оценка достоверности (pLDDT) в позиции 1659 составила 95.69 из 100, что означает очень высокую надёжность предсказания структуры в этом месте.

Шаг A: Перейдите на uniprot.org, найдите название вашего гена, запишите идентификатор доступа UniProt

Шаг B: Перейдите на alphafold.ebi.ac.uk/entry/[ВАШ_ID], проверьте pLDDT в позиции вашего варианта

uniprot.org

Q7RTU9 · STRC_HUMAN

Стереоцилин · 1775 а.к.

Ген: STRC · Организм: Homo sapiens

alphafold.ebi.ac.uk

AF-Q7RTU9-F1 (v6)

pLDDT в позиции 1659: 95.69

Структура с очень высокой достоверностью

Я спросил: вредна ли эта мутация? (ключевое открытие)

AlphaMissense — инструмент Google DeepMind, который предсказывает, является ли мутация белка вредной. Claude загрузил файл предсказаний AlphaMissense для стереоцилина и нашёл «E1659A» (E = глутаминовая кислота, исходная аминокислота; A = аланин, вариант Михаила).

Результат: 0.9016 из 1.0 (Вероятно патогенный). Всё, что выше 0.564, считается вероятно вредным. Затем я проверил все 19 других возможных замен в позиции 1659. Каждая набрала выше 0.846. Это означает, что позиция 1659 структурно критична: любое изменение там нарушает функцию белка.

Как: Загрузите этот CSV-файл (предсказания AlphaMissense для STRC)

Затем: Откройте в Excel или Google Таблицах, найдите свой вариант (например, «E1659A»). Оценка > 0.564 = Вероятно патогенный

Для других генов: Замените Q7RTU9 на UniProt ID вашего белка в URL

AF-Q7RTU9-F1-aa-substitutions.csv (отфильтровано)

protein_variant	am_pathogenicity	am_class
E1659A	0.9016	LPath
E1659D	0.9483	LPath
E1659G	0.9191	LPath
... все 19 замен: LPath (0.846–0.999)

Я спросил: важна ли эта позиция у других видов?

Если позиция важна для белка, аминокислота в ней должна быть одинаковой у разных видов. Claude извлёк последовательности стереоцилина у 9 млекопитающих из UniProt (человек, мышь, крыса, корова, обезьяна, свинья, собака, летучая мышь, медведь) и нашёл мотив вокруг позиции 1659 у каждого.

Результат: 100% консервативности. Все 9 видов имеют глутаминовую кислоту (E) в этой позиции. Окружающий 13-остатковый мотив (PEIFTEIGTIAAG) идентичен на протяжении ~80 миллионов лет эволюции. Это доказательство PP1 Supporting по критериям ACMG.

Как: Перейдите на ортологичные последовательности UniProt

Затем: Загрузите FASTA для каждого вида, найдите уникальный мотив рядом с позицией варианта

Быстрый способ: Если аминокислота и окружающие остатки идентичны у млекопитающих, позиция консервативна

Мы попробовали стандартные инструменты (они не сработали)

Обычно генетики используют SIFT, PolyPhen-2 и CADD для проверки вариантов. Claude попробовал все три через Ensembl VEP API. Все они не вернули ничего для этого варианта.

Причина: STRC имеет почти идентичный «ген-двойник» рядом с ним на хромосоме 15 (псевдоген STRCP1), который сбивает с толку инструменты, основанные на выравнивании последовательностей. Именно поэтому AlphaMissense особенно важен для STRC: он работает с 3D-структурой белка, а не с последовательностью ДНК, поэтому псевдоген не влияет на него.

Проверьте свой: Ensembl VEP API для этого варианта (не возвращает SIFT/PolyPhen)

Примечание: Если у вашего гена нет псевдогена, SIFT/PolyPhen могут работать для вас. Сначала проверьте свой ген на NCBI

Я спросил: достаточно ли этого для реклассификации?

Руководства ACMG/AMP (Richards et al., 2015) — стандартная система, используемая генетиками для классификации вариантов. Каждое доказательство получает код и уровень силы. Я изучил правила и применил их:

PM3 (Умеренное): Вариант обнаружен в транс с известной патогенной делецией (по одной от каждого родителя, подтверждено родительским тестированием). Правила ClinGen SVI
PP3_Moderate (Умеренное): Два конкордантных вычислительных инструмента предсказывают патогенность: AlphaMissense (0.9016) + REVEL (0.65). Повышено с поддерживающего до умеренного по Pejaver et al. 2022
PM2_Supporting (Поддерживающее): Отсутствует в gnomAD (0 аллелей у 251 000+ индивидуумов)
PP1_Supporting (Поддерживающее): Позиция на 100% консервативна у 9 видов млекопитающих (см. Шаг 4)

2 умеренных + 2 поддерживающих = Вероятно патогенный. Согласно правилам комбинирования ACMG (Таблица 5), это соответствует порогу классификации «Вероятно патогенный».

Я написал в больницу

Я собрал все доказательства в официальное письмо в Лабораторию химической патологии Детской больницы Гонконга с просьбой о пересмотре реклассификации варианта с VUS на Вероятно патогенный. Я приложил данные AlphaMissense, анализ консервативности и разбор критериев ACMG. Кроме того, я создал этот сайт, чтобы доказательства были прозрачными, воспроизводимыми и доступными всем, кто изучает это дело.

Что будет дальше

Если больница примет реклассификацию, молекулярный диагноз Михаила будет подтверждён: биаллельный патогенный STRC (DFNB16). Это является предпосылкой для участия в будущих клинических испытаниях генной терапии. Двойной AAV-вирусная генная терапия уже восстановила слух у мышей с дефицитом STRC (Iranfar et al., январь 2026). Клинические испытания на людях ожидаются через 2–3 года. Михаилу будет 7–8 лет.

За пределами реклассификации

Вопросы не закончились

Реклассификация — непосредственная цель. Но когда начинаешь задавать вопросы, остановиться невозможно. Можно ли сделать ген меньше? Исправить только одну букву? А что если проверить это вычислительно, прежде чем кто-то потратит хоть доллар на лабораторию? Это не гениальные озарения. Это очевидные вопросы. Разница в том, что есть AI-агент, который реально может пойти и найти ответы.

Я спросил: может ли CRISPR исправить только эту одну букву?

Вместо замены всего гена, что если исправить только одну неправильную букву? Claude загрузил геномную последовательность вокруг варианта Михаила из Ensembl и проверил, могут ли инструменты редактирования генома стать мишенью.

Базовое редактирование (CBE/ABE): не может исправить этот вариант (трансверсия C>A выходит за их пределы). Прайм-редактирование: осуществимо. Claude нашёл подходящий PAM-сайт всего в 4 парах оснований от мутации. Прайм-редактор теоретически мог бы исправить замену одного основания, хотя этот подход ещё не тестировался на клетках внутреннего уха.

Я спросил: можно ли укоротить ген, чтобы уместить его в один вирус?

Текущая генная терапия STRC требует двух вирусов (двойной AAV), поскольку ген слишком длинный для одного. Два вируса означают меньшую эффективность: оба должны попасть в одну клетку. Claude проанализировал структуру AlphaFold и определил, что первые ~600 аминокислот имеют очень низкую структурную достоверность (pLDDT ниже 50), что предполагает отсутствие у них стабильной структуры и их потенциальную несущественность.

Если эти области удалить, оставшийся «мини-стереоцилин» (1076 а.к., 3228 пн) помещается в один AAV-вектор. Это вычислительная гипотеза. Она требует лабораторной проверки. Но прецедент существует: микро-дистрофин (удаление несущественных частей дистрофина) сейчас проходит клинические испытания Фазы 3 при мышечной дистрофии.

Я спросил: взаимодействуют ли эти белки напрямую?

Чтобы дополнительно проверить идею мини-STRC, мы направили задание на Сервер AlphaFold 3 для предсказания 3D-структуры стереоцилина в комплексе с его партнёром TMEM145 (белком, недавно открытым как необходимый для функции стереоцилина, Nature Communications 2025).

Получены первые результаты (Задание 1). ipTM = 0.47, pTM = 0.48. Низкая достоверность прямого связывания. Анализ матрицы PAE показывает наилучшие межцепочечные контакты на N-концевых остатках 174–185 (но по-прежнему слабые — 8.6 A).

Затем я направил ещё 5 заданий для систематической проверки гипотезы мини-STRC:

№	Эксперимент	Статус	Тестирует
1	Полный STRC + TMEM145	Готово (ipTM 0.47)	Базовое взаимодействие
2	Мини-STRC + TMEM145	Готово (ipTM 0.43)	N-конец несущественен (0.43 против базового 0.47)
3	Мутант STRC E1659A (соло)	В процессе	Нарушает ли мутация Михаила укладку белка?
4	Дикий тип STRC (соло)	Готово (pTM 0.63)	Базовый уровень: 16% неупорядоченных (N-конец снижает результат)
5	Мини-STRC соло	Готово (pTM 0.81)	ДА! Мини-STRC сворачивается превосходно (7% неупорядоченных)
6	N-конец соло (1–615)	Готово (pTM 0.27)	ПОДТВЕРЖДЕНО: 38% неупорядоченных, pTM 0.27
7	mini-STRC + Piezo2 CED	Submitted	Does mini-STRC interact with mechanosensitive channel?
8	NFATC1 + Calcineurin A/B	Done (ipTM 0.73)	VALIDATED: CnA-CnB ipTM 0.91, NFAT-CnA ipTM 0.72. Cascade confirmed

Job 1 · Job 3 · Job 2 · Job 4 · Job 5 · Job 6

Я написал исследователям

Я написал письма ведущим исследователям, работающим над генной терапией STRC в учреждениях США, Франции и Китая. Я поделился доказательствами реклассификации, гипотезой мини-STRC и ссылкой на этот сайт.

Я получил обнадёживающие ответы, подтверждающие обоснованность вычислительного подхода и то, что анализ был передан исследовательским группам, работающим над генной терапией STRC.

Day 3: New hypothesis

What if the therapy could dose itself?

On day three, we asked a question that changed the direction of the research: instead of a constitutive promoter that's always on, what if we used a promoter that responds to sound? Hair cells already convert sound to calcium signals. That's a built-in sensor we can hijack.

I asked: can sound itself activate the gene?

Hair cells have mechanotransduction (MET) channels that open when sound deflects their stereocilia. Ca²⁺ flows in, activating the calcineurin-NFAT signaling pathway. This pathway is well-characterized in the sonogenetics literature (Wu et al., Nature Communications 2023), where researchers used it to achieve 62-fold gene induction with zero background leakage.

We designed a construct: 6xNFAT promoter + mini-STRC. The 6xNFAT promoter is a synthetic element with 6 copies of the NFAT response element, creating a cooperative digital switch that requires sustained calcium signaling to activate. Combined with mini-STRC (from Day 2), the total construct is 3,893 bp, fitting within the 4,700 bp AAV packaging limit with 807 bp to spare.

I built a mathematical model to test it

To go beyond speculation, we built an ODE (ordinary differential equation) model of the complete signaling cascade: sound level → MET channel open probability → Ca²⁺ influx → calcineurin activation → NFAT nuclear translocation → transcription → translation → protein accumulation. Every parameter comes from peer-reviewed literature.

Result: with a realistic hearing aid schedule (16h on, 8h off), the model predicts therapeutic stereocilin levels (>15,000 molecules per OHC) in just 13 hours. In silence, the system produces only 6.8% of the target (promoter effectively OFF). The full Python code is available on GitHub for anyone to reproduce or extend.

I submitted two more AF3 jobs

To test the mechanosensitive hypothesis structurally, we submitted two new AlphaFold 3 jobs. Job 7: mini-STRC + Piezo2 CED (does stereocilin physically contact the mechanosensitive channel?). Job 8: NFATC1 + Calcineurin A/B (positive control, validates the cascade model).

Results pending. If Job 7 shows high ipTM (>0.6), it would mean stereocilin directly interacts with Piezo2, implying a feedback loop: broken STRC affects mechanosensation itself, not just structural connections.

I asked: can we deliver without surgery?

Gene therapy currently requires surgical injection into the cochlea. What if ultrasound could push the treatment through the round window membrane non-invasively? I found papers showing that microbubbles + ultrasound create temporary pores in the RWM (Shih et al. 2019: 5.2x permeability increase, full recovery in 24 hours, zero hearing damage).

I built an ODE model of the full delivery chain: ultrasound → pore formation → nanoparticle diffusion → cell uptake → protein production. Honest result: baseline parameters fall short (0.39% per session, 258 sessions needed). Optimized LNPs with ionizable lipids: 78% per session, 2 sessions total. The bottleneck is endosomal escape, not the ultrasound. The most realistic path: one-time AAV surgery, plus non-invasive LNP top-ups years later if expression fades.

How I Did This