8 maja 2025 r. zespół z Centre for Genomic Regulation w Barcelonie opublikował w czasopiśmie Cell artykuł wykazujący, że system sztucznej inteligencji potrafi projektować krótkie, syntetyczne sekwencje regulatorowe DNA, które działają jako specyficzne dla danego typu komórek przełączniki wewnątrz zdrowych komórek ssaków. Niecały rok później oddzielna grupa z Rice University ogłosiła w Nature uzupełniający postęp – platformę eksperymentalną o nazwie CLASSIC, która mapuje miliony kompletnych obwodów genetycznych na wyniki komórkowe i przekazuje te pomiary do modeli uczenia maszynowego, aby mogły one przewidywać funkcje w ogromnej, nietestowanej dotąd przestrzeni projektowej. Razem te prace wyznaczają gwałtowną zmianę: algorytmiczna wyobraźnia sekwencji DNA przenosi się z przykładów teoretycznych do rzeczywistych cząsteczek, które niezawodnie zmieniają aktywność genów w żywych komórkach, a grupy przemysłowe i decydenci ścigają się, aby dostosować produkcję i nadzór do tych zmian.
Nowa klasa syntetycznych enhancerów
Artykuł w Cell autorstwa grupy z Barcelony opisuje generatywną SI przeszkoloną na masowych pomiarach tego, jak krótkie fragmenty DNA – enhancery (wzmacniacze) – wpływają na ekspresję genów podczas rozwoju komórek krwi. Enhancery to niekodujące odcinki DNA, które przyciągają czynniki transkrypcyjne i określają, kiedy oraz gdzie geny ulegają ekspresji. Zespół CRG zsyntetyzował ponad 64 000 wariantów zaprojektowanych do testowania kombinacji i układów motywów wiążących dla dziesiątek czynników transkrypcyjnych, a następnie zmierzył ich aktywność na wielu etapach hematopoezy. Na podstawie tych danych model nauczył się reguł projektowania i zaproponował sekwencje, które nigdy nie istniały w naturze, ale zachowywały się zgodnie z przeznaczeniem po wprowadzeniu do pierwotnych mysich komórek progenitorowych krwi: niektóre działały jako stopniowalne regulatory, inne wykazywały niemal binarny charakter włącz/wyłącz, a wiele z nich wykazało uderzającą specyficzność względem typu komórki.
Masowe biblioteki i mapowanie obwodów genetycznych za pomocą CLASSIC
CLASSIC ujawniło dwie praktyczne lekcje dla projektantów. Po pierwsze, obwody często nie są problemami o jednym rozwiązaniu – wiele różnych projektów może osiągnąć ten sam wynik – co daje inżynierom elastyczność w balansowaniu między wytrzymałością, siłą a kosztem zasobów. Po drugie, części o średniej sile często przewyższają najbardziej ekstremalne komponenty; innymi słowy, biologia ma własne „strefy Złotowłosej”. Co najważniejsze, cały proces został zweryfikowany poprzez syntezę i testowanie przewidzianych projektów: dziesiątki obwodów wybranych przez SI pokrywały się z odczytami laboratoryjnymi, co pokazuje, że modele mogą uogólniać wiedzę poza swoje zbiory treningowe, gdy zbiory te są duże i starannie zmierzone.
Od projektów in silico do żywych komórek
Oba kierunki badań kładą nacisk na ściśle powiązaną pętlę projektowania, budowania i testowania (design-build-test). W Barcelonie SI proponuje krótkie sekwencje enhancerów; badacze syntetyzują te fragmenty o długości 250 zasad, pakują je w nośniki i wprowadzają do żywych komórek ssaków, aby odczytać aktywność w różnych stanach komórkowych. W Houston i współpracujących laboratoriach strategia CLASSIC tworzy biblioteki kompletnych obwodów, odczytuje wyniki w tysiącach lub milionach komórek i przekazuje te rezultaty z powrotem do modelu ML, który rekomenduje kolejną rundę kandydatów.
Praktycznym rezultatem jest szybkość i kreatywność. Tam, gdzie klasyczna inżynieria genetyczna wymagała iteracyjnego debugowania i intuicji eksperckiej przez całe miesiące, SI wraz z masowo równoległymi pomiarami pozwala zespołom badać przestrzenie kombinatoryczne na skalę, która wcześniej była niemożliwa. Przyspiesza to odkrywanie funkcjonalnych przełączników DNA dla promotorów terapeutycznych, kaset ekspresyjnych ograniczonych do konkretnych linii komórkowych oraz bardziej złożonych bramek logicznych w komórkach.
Produkcja z prędkością SI: synteza bezkomórkowa i łańcuchy dostaw
Projektowanie wyprzedza podaż, jeśli synteza i produkcja nie nadążą. Grupy przemysłowe i niektóre startupy już się dostosowują: procesy bezkomórkowej syntezy DNA – które składają liniowe matryce gotowe do IVT bez klonowania w bakteriach – eliminują źródła zanieczyszczeń (endotoksyny, DNA gospodarza) i unikają problemów z rekombinacją, które sprawiają, że długie homopolimery, takie jak kodowane ogony poli(A), są niestabilne w plazmidach. Zalety te mają znaczenie dla cykli SI, ponieważ modele iterują szybko i wymagają wielu różnych, spersonalizowanych matryc w krótkim czasie.
Matryce bezkomórkowe redukują również zmienność długości ogona poli(A) i integralności sekwencji na dalszych etapach, poprawiając powtarzalność produktów transkrypcji in vitro. Gdy SI proponuje setki lub tysiące kandydatów na sekwencje, szybki, przyjazny automatyzacji łańcuch dostaw dostarczający syntezę, kontrolę jakości (QC) i matryce IVT staje się wąskim gardłem – a to oznacza, że firmy, producenci kontraktowi i akademickie placówki badawcze przebudowują swoje zaplecze wokół podejść bezkomórkowych, aby dorównać tempu obliczeń.
Zastosowania, ograniczenia i wczesne limity
Istnieją jednak realne ograniczenia. Genom regulatorowy jest ogromny i zależny od kontekstu: badanie CRG objęło tylko podzbiór czynników transkrypcyjnych i stanów komórkowych, a demonstracje Rice CLASSIC przeprowadzono na modelowych liniach komórkowych w celu potwierdzenia koncepcji. Przeniesienie sekwencji, która działa na szalce, w bezpieczny, trwały i skuteczny środek terapeutyczny u ludzi będzie wymagało rozległej walidacji przedklinicznej. Modele najlepiej uogólniają wiedzę, gdy dane treningowe odzwierciedlają kontekst docelowy; luki w zbiorach treningowych pozostają głównym źródłem niepowodzeń.
Ryzyko, zarządzanie i nadzór ludzki
Szybkie projektowanie i tania synteza rodzą pytania o bezpieczeństwo i zarządzanie, z którymi społeczność biologii syntetycznej zmaga się od lat. Przegląd w npj Biomedical Innovations ujął to jako problem konwergencji: SI obniża próg technologiczny dla złożonej bioinżynierii, podczas gdy zautomatyzowane laboratoria i tania synteza skalują możliwości i dystrybucję. To połączenie zwiększa zarówno korzystną dostępność, jak i ryzyko podwójnego zastosowania.
Z ostatnich komentarzy i prac nad polityką wyłaniają się trzy priorytety zarządzania. Po pierwsze, wyjaśnialność i ścieżki audytu dla modeli i procesów projektowych: nieprzejrzyste rekomendacje typu „czarna skrzynka” są trudniejsze do oceny pod kątem trybów awarii lub nadużyć. Po drugie, mechanizmy kontrolne z udziałem człowieka (human-in-the-loop) w punktach decyzyjnych – poddanie każdej sekwencji przeznaczonej do wprowadzenia do systemów biologicznych przeglądowi eksperckiemu i badaniom funkcjonalnym. Po trzecie, środki w łańcuchu dostaw i standardy przesiewowe sekwencji w celu wykrywania projektów, które mogłyby umożliwić szkodliwe funkcje, nawet jeśli są one nowatorskie. Krajowe wysiłki na rzecz rozszerzenia skanowania syntezy kwasów nukleinowych świadczą o wadze, jaką politycy przykładają obecnie do tych technologii.
Nauka rozwija się szybko i na razie rozważna ścieżka łączy entuzjazm dla możliwości SI z celowymi, przejrzystymi praktykami mającymi na celu ograniczenie ryzyka, dokumentowanie pochodzenia i zachowanie ludzkiego osądu tam, gdzie ma on największe znaczenie.
Źródła
- Cell (artykuł badawczy o syntetycznych enhancerach projektowanych przez SI)
- Nature (artykuł badawczy: platforma CLASSIC do wysokoprzepustowego mapowania obwodów genetycznych)
- npj Biomedical Innovations (analiza konwergencji SI i biologii syntetycznej)
- Centre for Genomic Regulation (CRG), Barcelona
- Rice University Synthetic Biology Institute
- Pompeu Fabra University (UPF)
Comments
No comments yet. Be the first!