ШІ пришвидшив пошук ліків у 10 мільйонів разів

20.04.2026 11:48

2344

Розробка нових ліків — одна з найдовших і найдорожчих процедур у науці: в середньому $2,6 млрд і 10–15 років на один препарат. Один із найбільших вузьких місць — «відсіювання» мільярдів потенційних молекул проти тисяч білків-мішеней. Тепер цей процес може пришвидшитись у мільйони разів. Як повідомляє Phys.org з посиланням на публікацію в Science, команда Яньянь Лань з Університету Цинхуа (Пекін) представила DrugCLIP — ШІ-систему, що здійснює 10 трлн перевірок пар білок–молекула за 24 години і є до 10 мільйонів разів швидшою за традиційні методи.

Що відомо коротко

: Jia Y., Gao B., Tan J. et al., Science (8 січня 2026). DOI: 10.1126/science.ads9530. Команда: Цинхуаський університет і Пекінський університет.
DrugCLIP: ШІ-фреймворк на основі контрастивного навчання (contrastive learning). Кодує кишені білків і малі молекули у спільний математичний простір і знаходить збіг через відстань між векторами — без фізичних симуляцій.
Масштаб: 500 млн молекул × 10 000 білків (≈половина «лікувального геному») = >10 трлн перевірок — за добу на 8 відеокартах A100.
Результат: >2 млн молекул-кандидатів для >20 000 ділянок зв’язування.
Підтверджено лабораторно: для транспортера норепінефрину — 15% влучань, для TRIP12 (мішень раку і аутизму, що досі не піддавалась) — 17,5% влучань.
Система і база даних відкриті безкоштовно: drug-the-whole-genome.yanyanlan.com.

Що це за явище

Традиційний «молекулярний докінг» — це комп’ютерна симуляція того, як молекула-ліки «вставляється» у тривимірний карман білка. Метод фізично реалістичний, але надзвичайно повільний і ресурсоємний: навіть суперкомп’ютери витрачають дні на перевірку мільйонів сполук проти однієї мішені.

Останні новини: Румунські скамʼянілості розкрили ще одного «качкодзьобого» динозавра

Проблема масштабу колосальна. В людському геномі понад 20 000 потенційних білків-мішеней — але лікарські сполуки знайдено лише для ~10% з них. 90% «ліківного геному» залишається terra incognita, бо існуючі методи не здатні охопити такий масштаб. Так само, як антибіотикорезистентність вимагає радикально нових підходів до пошуку протимікробних засобів, відкриття ліків у цілому потребує фундаментального прискорення.

Деталі відкриття

DrugCLIP вирішує проблему принципово інакше: замість фізичних симуляцій він перетворює білки і молекули на математичні вектори в спільному просторі. Якщо вектори «близько» — молекула, ймовірно, зв’яжеться з цим білком. Порівняння — як сучасна пошукова система: Google не «зіставляє» ваш запит з кожним текстом по черзі, а одразу знаходить близькі вектори в мільярдах документів.

Для забезпечення сумісності з передбаченими (а не тільки експериментальними) структурами білків команда розробила GenPack — генеративний модуль, що «дозаточує» кишені зв’язування в AlphaFold-структурах до достатньої деталізації. Це дозволило охопити весь масив AlphaFold-передбачень, а не лише ~17% білків, для яких є кристалографічні структури.

Що показали нові спостереження

Лабораторна валідація виявила вражаючі результати. Для транспортера норепінефрину (пов’язаний з депресією і СДУГ) DrugCLIP знайшов 15% активних сполук серед відібраних — і 12 з них зв’язувалися краще за антидепресант бупропіон. Ще важливіший результат для TRIP12 — білка, пов’язаного з раком і аутизмом, структуру якого й досі не вирішено рентгенографічно. Так само, як нові роботи відкривають приховані мішені у пухлинах, DrugCLIP знайшов перші молекули для TRIP12 — з 17,5% влучань, використовуючи лише AlphaFold-структуру.

Останні новини: Скандальний гербіцид паракват виявився не «причиною» Паркінсона

База GenomeScreenDB, що вийшла з цього скринінгу, вже перевершує ChEMBL — найбільшу наявну хімічну базу даних — за охопленням білкових мішеней.

Чому це важливо для науки

Потенціал DrugCLIP і подібних методів — це зсув парадигми у фармакології. Замість «виберемо кілька мішеней і шукатимемо ліки роками» стає можливим «просканємо весь геном за добу і побачимо картину». Це не просто прискорення: це відкриття нових просторів — ліків для «недосяжних» мішеней, нових показань для відомих молекул і, можливо, препаратів для рідкісних хвороб, де ринок занадто малий для традиційних підходів.

Усі дані й модель відкриті для вільного використання, що потенційно демократизує пошук ліків — дослідники з менш фінансованих країн отримують доступ до тих самих інструментів, що й фармацевтичні гіганти.

Цікаві факти

AlphaFold 2, розроблений DeepMind і відзначений Нобелівською премією з хімії 2024 р., передбачив структури ~200 мільйонів білків — але кишені зв’язування часто були недостатньо точними для докінгу. GenPack вперше робить ці структури придатними для масштабного скринінгу. Джерело: AlphaFold Protein Structure Database.
Лише ~3 000 з 20 000 потенційних білкових мішеней людини мають схвалені FDA ліки. Це означає, що 85% потенційних мішеней залишаються без ліків — не тому що вони нецікаві, а тому що пошук займав занадто довго. Джерело: Nature Reviews Drug Discovery, 2023.
Традиційний молекулярний докінг перевіряє ~100 молекул за годину на одну мішень. DrugCLIP робить 500 млн на добу проти 10 000 мішеней одночасно — різниця порівнянна з тим, як замінити пішу прогулянку зі Землі до Місяця на ракетний переліт. Джерело: Science, 2026.
Середня вартість розробки одного нового препарату оцінюється в $2,6 млрд, і 90% молекул-кандидатів провалюються при клінічних випробуваннях — переважно через те, що молекула не зв’язується так, як очікувалось. Методи на кшталт DrugCLIP спрямовані знизити цей відсоток ще на ранньому етапі. Джерело: JAMA, 2022.

Останні новини: Телескоп на Землі розгледів людей біля Місяця з рекордної відстані

FAQ

Чи може DrugCLIP замінити лабораторні дослідження? Ні — і автори це підкреслюють. DrugCLIP найкраще підходить для звуження простору кандидатів: він відсіює мільярди неперспективних молекул і виділяє найімовірніші. Подальша детальна валідація, уточнення поз зв’язування і лабораторні тести залишаються необхідними.

Що таке «контрастивне навчання» в контексті DrugCLIP? Це метод машинного навчання, де модель тренується розпізнавати «схожі» та «несхожі» пари. DrugCLIP навчається на мільйонах відомих пар «білок–лікарська молекула», щоб розуміти, які векторні представлення відповідають реальному зв’язуванню — і потім застосовує це для пошуку нових пар.

Чи доступний DrugCLIP для українських дослідників? Так — система і база GenomeScreenDB повністю відкриті за адресою drug-the-whole-genome.yanyanlan.com. Для роботи достатньо стандартного дослідницького комп’ютера.

За 24 години DrugCLIP виконав більше 10 трлн перевірок пар білок–молекула. Для порівняння: якби один хімік-дослідник перевіряв по одній парі на секунду без перерв — йому знадобилось би 316 000 років, щоб виконати ту саму роботу. А фармацевтична галузь витрачала десятиліття і мільярди доларів, щоб охопити лише невелику частину цього простору — і все одно пропускала 90% потенційних мішеней.

ШІ пришвидшив пошук ліків у 10 мільйонів разів з’явилася спочатку на Цікавості.

cikavosti.com

Собача «провідна лапа» відкриває приховані риси характеру

Скандальний гербіцид паракват виявився не «причиною» Паркінсона

Телескоп на Землі розгледів людей біля Місяця з рекордної відстані

Астронавт з протезом ноги може мати перевагу в космосі

Венера вдень «зникне» за Місяцем і стане яскравішою за нього

Археологи знайшли в печі в Німеччині ймовірну людську жертву