"Stvaranje uistinu potpune sekvence ljudskog genoma predstavlja nevjerojatno znanstveno dostignuće, pružajući prvi sveobuhvatan pogled na naš model DNK", izjavio je Eric Green, direktor američkog Nacionalnog instituta za istraživanje ljudskog genoma (NHGRI) za Reuters nakon što je časopis Science nedavno objavio da je konzorcij znanstvenika u potpunosti "pročitao" čitavi ljudski genom.
Iako je 2003. godine međunarodni tim znanstvenika otkrio ono što se tada smatralo potpunim slijedom ljudskog genoma, gotovo osam posto "sadržaja" nije bilo u potpunosti dešifrirano, uglavnom zato što su se ti dijelovi sastojali od učestalo ponavljajućih dijelova DNK koje je bilo teško spojiti s ostatkom. Znanstvenici su sada popunili te praznine nudeći tako nove mogućnosti u potrazi za tajnama mutacija koje uzrokuju bolesti i genskih varijacija kod osam milijardi ljudi na svijetu.
Čitava verzija ljudskog genoma sastoji se od 3.055 milijardi parova nukleotida, jedinica od kojih su izgrađeni kromosomi i naši geni, te 19.969 gena koji kodiraju proteine. Od tih gena, istraživači su kroz ovaj projekt identificirali gotovo 3000 novih. Većina njih je vjerojatno utišana, ali 115 gena je možda još uvijek aktivno. Znanstvenici su također uočili gotovo dva milijuna dodatnih genskih varijanti, od kojih su 622 bile prisutne u medicinski važnim genima.
Prof. dr. sc. Kristian Vlahoviček voditelj je grupe za bioinformatiku i računalnu biologiju Zavoda za molekularnu biologiju na Biološkom odsjeku Prirodoslovno-matematičkog fakulteta Sveučilišta u Zagrebu. Dobitnik je stipendije Europske organizacije za molekularnu biologiju u okviru programa za mlade znanstvenike i posljednjih 20 godina vodi međunarodno prepoznatu istraživačku skupinu u Hrvatskoj. Usavršavao se na različitim međunarodnim pozicijama, uključujući deset godina rada u Međunarodnom centru za genetičko inženjerstvo u Trstu i četiri godine kao gostujući profesor na Sveučilištu u Oslu. Njegova grupa za bioinformatiku razvija računalne alate i koristi se tehnikama strojnog učenja za rješavanje otvorenih pitanja u razvojnoj genomici i metagenomici.
Profesore Vlahoviček, vijest o ljudskom genomu objavljena je prvog travnja, nekima je zvučala kao prvoaprilska šala...
- Nije šala (smijeh). Od 2003. kad smo imali prvu gotovu verziju genoma čovjeka prošlo je skoro dvadeset godina i tek sad možemo stvarno reći da je genom pročitan od početka do kraja, da je sekvenca svakog kromosoma poznata u cijelosti.
Što je genom i zašto je važno znati njegove sastavne dijelove?
- Genom je cjelokupna genetička informacija sadržana u nekom organizmu, skup svih gena i ostale informacije zapisane u našoj DNA, u 46 kromosoma kod ljudi, od kojih su dva spolna. Tako nam se prenosi nasljedna informacija od pojedinog roditelja. Imamo dva para kromosoma i dvije različite kopije genetičke informacije. S obzirom na to kakvu smo genetičku informaciju naslijedili od roditelja, miješanjem različitih gena naš organizam postaje takav kakav je. Slični smo roditeljima, ali smo ipak svoji.
Što sve sadrži mapa genoma?
- Mapa genoma je genetički zapis, a pročitani genom znači da smo cjelokupni slijed nukleotida, slova A, C, G i T, u DNA koja se nalazi u našim kromosomima pročitali slovo po slovo. Sada napokon znamo slijed svih slova koje čine naš genom, uzduž cijele naše genetičke informacije. Taj slijed svih nukleotida je jedna jako debela knjiga.
Dobili smo dakle ogromnu bazu podataka koja objašnjava strukturu ljudskog života?
- Da, riječ je o ogromnim podacima. Jedna kopija genetičke informacije čovjeka, a imamo ih dvije u našim stanicama, sadrži oko tri milijarde slova. Kad bi ste ta slova napisali fontom od 12 točaka jedno do drugog, dobili biste niz slova dugačak oko 850 kilometara, otprilike udaljenost od Splita do Frankfurta. Nekoliko desetaka gusto, gusto pisanih telefonskih imenika. Nama znanstvenicima koji istražujemo genome, sam taj poredak slova ne znači puno dok ga nismo mapirali, odnosno opisali gdje se u tim milijardama slova nalaze mjesta koja nose određena svojstva, od boje očiju do osnovnih metaboličkih funkcija u našim stanicama. Sve je to negdje zapisano, ali tu informaciju na toj cesti od Splita do Frankfurta treba locirati i onda ju možemo uspoređivati između različitih ljudi i, eventualno, ostalih organizama. Vidjeti što se s njom događa kod onih koji imaju neki poremećaj, genetički uvjetovanu bolest, ili možemo jednostavno vidjeti kako su se neke naše osnovne biološke funkcije mijenjale tijekom evolucije.
Nakon 2003. ostalo je nepročitano oko osam posto ljudskog genoma. Zašto je to tada bilo nemoguće pročitati i koji su dijelovi genoma sada pročitani?
- Osam posto je uglavnom bilo u takozvanim visoko ponavljajućim DNA. Ako zamislimo svaki naš kromosom u obliku leptirića, imamo u njima dva karakteristična mjesta. Takozvane centromere, tamo gdje se kraci kromosoma međusobno spajaju, i telomere, na vrhovima kromosomskih krakova. Ta spojna mjesta i krajevi su prepuni visoko ponavljajuće DNA. To su kratki nizovi od nekoliko desetaka, ili stotina slova koji se uzastopno ponavljaju nekoliko stotina ili tisuća puta. Tehnologija kojom smo čitali tu genetičku informaciju 2003. nije bila dovoljno dobra i precizna da bismo mogli odrediti točno koliko takvih ponavljanja ima. Svaki kromosom je praktički imao slijepu pjegu u centromernom dijelu i na telomerama. Razvojem tehnologije sekvenciranja koja je zadnjih dvadeset godina više nego eksponencijalno eksplodirala i napreduje brže nego što napreduje informatička tehnologija, te su nam neuhvatljive sekvence postale dostupne. Znanost je u tih 20 godina razvila metode kojima može pročitati dulje sekvence i jednostavno premostiti ove visoko ponavljajuće regije. Ponavljanja od nekoliko tisuća puta, duga i do milijun nukleotida, sada se mogu pročitati u jednom komadu i time sasvim jednoznačno odrediti njihov točan slijed. Genom čovjeka iz 2003. godine čitan je i sastavljan iz puno kraćih sljedova, od oko 500 slova, pa stoga neki dijelovi jednostavno nisu mogli biti dobro pročitani i sastavljeni u neprekinutu cjelinu. Možete si zamisliti kakav je poduhvat bio sastavljati tri milijarde dugi niz iz gomile malih dijelova slagalice, duljine 500 slova! Pronaći gdje se ti komadići međusobno preklapaju, i kao da slažete domino, povezati ih u neprekinuti niz. U ovom poslu nezaobilazna su bila upravo računala koja su i omogućila uspjeh cijelog projekta sekvenciranja genoma čovjeka na prijelazu tisućljeća.
Rezultati istraživanje objavljeni su pod pokroviteljstvom Nacionalnog instituta za istraživanje ljudskog genoma (NHGRI), dijela Američkog nacionalnog instituta za zdravlje. Jeste li možda vi ili netko od hrvatskih znanstvenika ili institucija sudjelovali u tom znanstvenom konzorciju?
- Takva istraživanja, kao i mnoga druga istraživanja koja se tiču genoma čovjeka, multidisciplinarna su, multinacionalna i interkontinentalna. U takvim istraživanjima sudjeluje jako puno partnera. U ovom je istraživanju sudjelovalo oko 90 znanstvenika, uključujući i tvrtke koje razvijaju tehnologiju samog sekvenciranja, upravo zato što je za ovaj projekt trebalo upotrijebiti posebnu tehnologiju čitanja dugih nizova da bi se pročitali ti zadnji, najteži i najkompliciraniji dijelovi.
Zanimljivo, u originalnom radu sam pročitao da je u tom projektu sudjelovao i jedan naš mladi kolega, Ivan Sović, koji radi upravo za jednu od tih kompanija koja je svojom tehnologijom omogućila završetak čitanja našeg genoma. Čestitam Ivanu i svim ostalim kolegama i ovim putem, to je izuzetno veliki uspjeh i veliki posao.
U općoj povijesti znanstvenih otkrića i znanstvenih dosega, gdje biste svrstali "otključavanje" ljudskog genoma?
- U do sada pročitanom genomu (92 posto) dobili smo informaciju od nekih 60 tisuća gena koje posjedujemo kao ljudi. Ovih dodatnih 8 posto otkrilo nam je još oko 3000 gena, odnosno oko pet posto nove informacije. Od toga je nekoliko gena zanimljivo zato jer su jedinstveni za čovjeka, nisu pronađeni ni u jednom drugom organizmu. Ovo je svakako projekt koji je genetičku informaciju čovjeka konsolidirao i napravio od nje najkvalitetniju i najpouzdaniju moguću bazu za daljnja istraživanja. Naravno, ne može se mjeriti s poduhvatom sekvenciranja onih prvih 92 posto genoma koji su napravljeni doista svjetskim naporom jer se u to vrijeme uz puno slabiju tehnološku opremljenost čitavo čovječanstvo ujedinilo u naporu da pročita genom čovjeka. Međutim, ovaj projekt definitivno predstavlja izuzetno važan korak jer napokon stavlja točku na i u naporu da se pročita baš svako mjesto u ljudskom genomu. Smatrajte ovo jednim doista značajnim miljokazom - napokon smo pročitali čitav genom od početka do kraja.
Hoće li informacija o genomu biti svima dostupna ili će ostati u "vlasništvu" istraživačkih tvrtki koje su razvile alate za sekvenciranje?
- Ono što je općenito jako dobro kod genetičkih informacija je da ništa od toga nije sakriveno i da su te informacije već sada svima dostupne. Čim je ta genetička informacija pročitana, čim su znanstvenici nezavisnom provjerom potvrdili da je ovaj posao odrađen korektno, ona je objavljena na standardnim mjestima na kojima se objavljuju takve informacije. Postoji ih nekoliko u svijetu i među važnijima su Nacionalni centar za biotehnološku informaciju iz SAD-a (NCBI) i Europski molekularni laboratoriji (EMBL-EBI). To su sve potpuno javno dostupne informacije kojima svi znanstvenici, ali i bilo tko drugi, mogu pristupiti i slobodno ih koristiti.
Američki znanstvenici su rekli da će pročitani genom osnažiti studije genetičkih bolesti. Koja je praktični doseg ovakvog otkrića, hoćemo li ubrzo imati pametne lijekove za sve bolesti?
- Mi smo na tim stazama već mogli raditi i jesmo radili od prve sekvence genoma čovjeka. Znali smo tridesetak tisuća gena, znali smo i otkrivali u međuvremenu koja svojstva i funkcije ti geni nose, kako su regulirani, odnosno kako ljudska stanica koristi tu informaciju zapisanu u genima, a onda i što se događa ako je ta informacija promijenjena, primjerice u nekim bolestima. Neka od istraživanja već su i dovela do prvih pametnih lijekova u tretiranju tumora ili popravku nekih rijetkih, genetički uvjetovanih bolesti. Dodatna informacija koju nam donosi ovaj projekt je, uz ispravak nekih netočno pročitanih dijelova, izuzetno važna za ona stanja koja se tiču velikih kromosomskih poremećaja, jer se upravo takvi poremećaju često povezuju s kromosomskim centromerama i telomerama koje su sad u potpunosti pročitane. Imamo i informaciju o dodatnih 3000 gena koji donose i nove istraživačke teme u otkrivanju čemu ti geni služe i kako rade, jesu li i kako povezani s bolestima. Mi definitivno nećemo sutra imati neki novi pametni lijek koji se tiče tih 3000 gena, ali ćemo svakako moći pouzdanije i bolje shvatiti kompleksne procese u stanicama i gene koji su za njih odgovorni.
Hoće li poznavanje mape genoma pomoći produljenju životnog vijeka?
- Ovdje malo ulazimo u zonu znanstvene fantastike, jer upravo zbog toga što su biološki procesi izuzetno kompleksni ne možemo baš uvijek uspostaviti jasnu vezu između točno pročitanih slova i životnog vijeka. To je apsolutno nemoguće. Na životni vijek utječe okoliš i jako puno drugih faktora koji proizlaze iz međusobne povezanosti okoliša, naslijeđenih gena i novih mutacija u genima koje su nastale tijekom životnog vijeka svakog od nas, i to samo u nekim stanicama. Sve to skupa znači da ne možete reći, na primjer, ovdje imate slovo A, a nemate C, vi ćete živjeti 10 godina duže, a ja 10 godina kraće. Ono što ćemo moći sve pouzdanije utvrditi jest sklonost prema nekim bolestima ili stanjima i takav podatak sve uspješnije upotrebljavati u ranoj dijagnostici i prevenciji.
Što mapa genoma znači za biotehnološku industriju? Hoće li istraživački centri promijeniti prioritete?
- Prioriteti definitivno nisu promijenjeni. Sada radimo sa čišćom i preciznijom polaznom informacijom. U okviru medicinske primjene genetičke dijagnostike sad možemo pouzdanije reći na kojem mjestu imamo određenu promjenu i što ona može imati kao posljedicu. Ako smo neku promjenu već ustanovili, sada možemo točnije reći gdje se ta promjena desila jer neka mjesta prije nisu bila dobro ni pročitana ni dobro sastavljena. Dijagnostika će nam se dakle definitivno poboljšati. Smjer je ostao isti, još uvijek je tu jako puno podataka koje treba proći, jako puno informacija za istražiti. Vidjeti kad se ti geni uključuju i isključuju, u kojim stanicama u kojem vremenu, zašto nastaju tumori, zašto nastaju neke metaboličke bolesti... Ali sada imamo bolju osnovu da sve to možemo kvalitetnije istražiti.
Mogućnost intervencija čovjeka u prirodnu strukturu genoma budi mnoga etička pitanja o tzv. genetskom programiranju čovjeka. Ima li osnova za takve strahove?
- Ne puno. Općenito taj proces genetičkog programiranja također uvelike spada u sferu znanstvene fantastike. Mnogi biološki procesi nemaju tako jasnu vezu između ulaza i izlaza, kao što se pojednostavljeno prikazuje. Uglavnom nije moguće promijeniti nekoliko slova u DNA da bi time uspješno mijenjali neka važna ljudska svojstva ili osobine. Nije postignut toliki napredak da nam se otvorila mogućnost genetičkog programiranja ili dizajna ljudskih osobina. To je jedan sasvim drugi i puno kompleksniji problem od ovog. No katalog, referentni materijal iz kojeg čitamo, iz kojeg postavljamo hipoteze, iz kojeg izvodimo daljnja istraživanja, sada je puno bolji i kvalitetniji.
Kako će vam poznavanje cijele mapa genoma pomoći u svakodnevnom poslu?
- Moja grupa na PMF-u bavi se tzv. računalnom biologijom. To je spoj molekularne biologije, genomike i informacijske tehnologije. Mi u našim istraživanjima koristimo statističke metode, metode strojnog učenja, pišemo računalne programe kako bismo analizirali genetičku informaciju koja je pročitana tehnologijama sekvenciranja. Mi smo, ono što se u žargonu kaže, suhi laboratorij. Na našim stolovima su računala a ne pipete i mi računalnim analizama pokušavamo izvući znanje iz informacije koje nam pružaju eksperimentalni projekti, pogotovo oni koji stvaraju jako puno podataka. Što je prikupljena eksperimentalna informacija čišća i pouzdanija to mi statistički možemo izvući bolje zaključke. Računalna biologija je disciplina koja se snažno razvila u zadnjih tridesetak godina, upravo je omogućila prvo sastavljanje genoma, uključujući i genom čovjeka. Strelovitim razvojem tehnologije sekvenciranja, i mogućnošću znanstvenika da brzo i jeftino prikupe ogromne količine bioloških podataka, upravo njihova računalna analiza postaje usko grlo procesa spoznaje. Sada za gotovo sva istraživanja u biologiji morate imati kvalitetne ljude koji znaju i biologiju i računarstvo i statistiku i strojno učenje da biste iz velikih pokusa mogli izvući kvalitetno znanje. I to je upravo ono što mi radimo.
Hoće li pročitani genom pomoći razumijevanju nastanka života na Zemlji?
- To su dalekosežnija pitanja od dosega ovoga projekta. Naravno da nam je to svima krajnji cilj, i do toga odgovora će proći još dosta vremena. No jedno je sigurno – ako nam je informacija koju istražujemo loša i nepotpuna, onda ćemo biti manje sigurni o zaključku koji se iz te informacije izvlači. I obratno, ako nam je polazni podatak dobar i kvalitetan, a upravo je ovim projektom to postignuto, onda će nam i zaključci biti bolji i kvalitetniji. Ma kakvi ti zaključci bili: odnose li se na porijeklo života, na razvoj bolesti, na to kako funkcionira živi svijet.
Znači li to da će i priča o umjetnom uzgoju ljudskih organa dobiti novu dinamiku?
- Ta dva koncepta su međusobno jako udaljena, između toga je čitava jedna šuma svakakvih događaja. Kako naše stanice obrađuju i koriste informaciju iz gena da bi stvarale organe i sustave, mi još uvijek ne znamo. To je kao da u jednoj vrećici dobijete sve dijelove sata, a ja vas pitam kako se na tom satu podešavaju sekunde. Teško ćete mi moći odgovoriti prije nego u potpunosti shvatite kako svi dijelovi satnog mehanizma čine cjelinu, a zatim i kako ta cjelina obavlja svoju funkciju. Dakle, još uvijek ne znamo odgovoriti na neka biološka pitanja jer postoji puno međukoraka koje treba razumjeti da bismo razumjeli kako ta naša kompleksna biologija radi. Ali, isto kao i sa satom – ako niste dobili sve njegove dijelove, onda ćete puno teže ili nikako doći do spoznaje kako se mijenjaju sekunde na tom satu.
Sada smo skupili sve lego kockice na jednom mjestu i sad trebamo vidjeti kako se te lego kockice slažu u biološku cjelinu, kako se stvaraju organi, kako se stvaraju živa bića, kako nastaje ljudski organizam... Još je ogroman posao pred nama, mnogi znanstvenici na tome aktivno rade i to je definitivno predmet zanimanja mnogih istraživačkih skupina u svijetu..