Azərbaycan  AzərbaycanDeutschland  DeutschlandLietuva  LietuvaMalta  Maltaශ්‍රී ලංකාව  ශ්‍රී ලංකාවTürkmenistan  TürkmenistanTürkiyə  TürkiyəУкраина  Украина
Pagalba
www.datawiki.lt-lt.nina.az
  • Pradžia

Šį straipsnį ar jo skyrių reikėtų peržiūrėti Būtina ištaisyti gramatines klaidas patikrinti rašybą skyrybą stilių ir pan

DNR sekoskaita

  • Pagrindinis puslapis
  • DNR sekoskaita
DNR sekoskaita
www.datawiki.lt-lt.nina.azhttps://www.datawiki.lt-lt.nina.az
   Šį straipsnį ar jo skyrių reikėtų peržiūrėti.
Būtina ištaisyti gramatines klaidas, patikrinti rašybą, skyrybą, stilių ir pan.
Ištaisę pastebėtas klaidas, ištrinkite šį pranešimą.
   Šį puslapį ar jo dalį reikia sutvarkyti pagal Vikipedijos standartus – vidinės nuorodos, šaltiniai, kategorijos
Jei galite, sutvarkykite.

DNR sekoskaita (taip pat vadinama DNR sekvenavimu) – metodų visuma, skirta DNR molekulių sekų nustatymui.

DNR sekoskaitai pagrindą padėjo tyrimai. Pirmieji sekoskaitos metodai pasirodė apie 1970 m.

Naujos kartos sekoskaita

Naujos kartos sekoskaita arba didelio našumo sekoskaita – terminas, apibūdinantis daugelį modernių DNR sekoskaitos technologijų, kurios revoliucionizavo genomikos ir molekulinės biologijos tyrimus, nes mokslininkams leido nuskaityti didelius kiekius DNR ar RNR sekų daug greičiau ir pigiau, nei anksčiau naudota . Dauguma šių naujųjų technologijų yra paremtos sekoskaita sintezės metu (SSM), kai tiksli yra nustatoma DNR polimerazei vykdant naujos grandinės sintezę pagal šabloninę tiriamo mėginio grandinę. DNR seka nustatoma įjungiant fluoroforais modifikuotus nukleotidus arba detektuojant metu atsiskyrusius šalutinius reakcijos produktus: vandenilio jonus ar molekules. Naujos kartos sekoskaitą nuo anksčiau naudotų sekų nustatymo metodų labiausiai išskiria didelis paralelizmas (vienu metu vykdoma milijonai sekoskaitos reakcijų) ir automatizavimas, kuriuo kartu siekiama visus procesus (bibliotekos paruošimą, kloninį padauginimą ir SSM ir kt.) sujungti viename sekoskaitos įrenginyje.

Lietuvoje naujos kartos sekoskaitos įranga jau sėkmingai naudojama:

  • „Thermo Fisher Scientific Baltics“ mokslinių tyrimų centre (Illumina MiSeq, IonTorrent PGM, Roche GS Junior);
  • Vilniaus universiteto ligoninės Santaros klinikose (Illumina MiSeq, IonTorrent PGM, ABI Solid);
  • Vilniaus universiteto Gamtos mokslų fakultete (Roche GS Junior).

Naujos kartos sekoskaitos, kaip ir bet kuriuo kitu didelio našumo metodu sugeneruotuose, duomenyse yra gausu technologinių ir biologinių veiksnių sukeltų tendencingumų (angl. bias). Šie tendencingumai gali smarkiai neigiamai įtakoti detalią duomenų analizę, todėl labai svarbu žinoti, kaip jų išvengti ar pašalinti. Tik kai tendencingumai yra tiksliai identifikuojami ir patikimai pakoreguojami, duomenys gali tapti reikšmingu moksliniu ar klinikiniu įrankiu. Tendencingumų apstu visose NKS stadijose: signalo apdorojimo, bazių priskyrimo, nuskaitymų lygiavimo ir tolimesnės analizės žingsniuose. Juos dažniausiai sukeliantys veiksniai yra DNR fragmentacijoje, bibliotekų paruošime, padauginime ir sekoskaitos procese naudojami fermentai, neefektyviai blokuojančiomis ir aptikimo žymėmis modifikuoti dNTP, netobuli detekcijos įrenginiai bei analizės algoritmai. Didžiąją dalį visų NKS tendencingumų galima suskirstyti į dvi grupes:

  • perdengimų tendencingumas – nukrypimas nuo visam genomui (egzomui, kt.) tolygaus nuskaitymų skaičiaus;
  • klaidų dažnio tendencingumas (angl. bias in base-call error rates) – nukrypimas nuo visam genomui tolygaus bazių neatitikimo, insecijų ir delecijų dažnio.

Signalo apdorojimas

Signalo apdorojimas – procesas, kurio metu tikslinis signalas atskiriamas nuo foninio signalo. Šis pirminis žingsnis, dėl savo technologinio sudėtingumo įtakoja visą tolesnę analizės eigą ir yra pirminė klaidų dažnio didėjimo sekoskaitos eigoje tendencingumo priežastis. Iššūkius su kuriais susiduriama signalo apdorojimo metu vaizdžiai galima atskleisti IonTorrent sekoskaitos pavyzdžiu (1 pav.). Vykstant sekoskaitai sintezės metu, matuojamas srovės pokytis mikrograndyno šulinėliuose, kai į DNR grandinę įjungus nukleotidą atsiskiria vandenilio jonas. Nustatomas srovės pokytis yra ypatingai mažas ir jį labai įtakoja tėkmėse (angl. flows) naudojamų reagentų neefektyvus pašalinimas, bei ne 100 % efektyvumu vykstanti DNR sintezė, dėl ko kyla fazinis triukšmas, kuris kiekviename sekoskaitos cikle vis stiprėja.

Bazių priskyrimas

Bazių priskyrimas (angl. base calling) – tai procesas, kurio metu apdoroto signalo kreivėms priskiriamos nukleotidinės bazės (fizinio signalo vertimas į DNR seką) ir įvertinamas kiekvienos jų priskyrimo tikslumas, kuris apibūdinamas Phred kokybės įverčiu (taip pat vadinamas quality ar Q įverčiu), kuris dažniausiai būna nuo 10 iki 50. Phred įvertis (Q) apskaičiuojamas pagal formulę Q=-10log10P, kur P yra klaidingo priskyrimo tikimybė (pavyzdžiui Phred įvertis = 10, parodo, kad netinkamo bazės priskyrimo tikimybė yra 1 iš 10, o tai reiškia, kad bazių priskyrimo tikslumas siekia 90%). Q30 ilga laiką buvo laikomas etaloniniu kokybės rodikliu naujos kartos sekoskaitoje, bet nuolat tobulėjant „šlapiajai“ laboratorinei daliai ir duomenų analizės algoritmams, šiuo metu jau pasiekiamas ir >Q40 dydis. Bazių priskyrimas yra kertinis sekoskaitos procese, nes nuo jo stipriai priklauso sekoskaitos duomenų tikslumas. Tobulinami bazių priskyrimo algoritmai sumažina didelį perdengimų skaičiaus poreikį, o tuo pačiu ir sekoskaitos kainą. Bazių priskyrimui, be standartinių sekoskaitos gamintojų siūlomų algoritmų, yra kuriama ir daug kitų, kurie turėtų pagerinti bazių priskyrimo tikslumą ir jiems reikėtų mažesnių skaičiavimo pajėgumų. Tai sudėtingas procesas, kuriame turi būti atsižvelgiama į daugelį kenkiančių efektų (2 pav.), tokių kaip:

  • Nevienalyčiai spiečiai (angl. clusters) – vienoje Illumina sekoskaitos celės vietoje yra padaugintas dviejų ar daugiau skirtingų DNR molekulių mišinys, kuris lemia sulietą signalą. IonTorrent sekoskaitoje šis efektas kyla dėl nevienalyte DNR padengtų sferinių dalelių (angl. Ion Sphere particles).
  • Fazinis triukšmas – dažnai pasitaiko, jog ne prie visų spiečiuje ar ant sferinės dalėlės kloniškai padaugintų DNR grandinių sekoskaitos ciklo metu įjungiamas naujas nukleotidas, ar dėl reagentų netobulumo (pvz., neefektyviai užblokuoti nukleotidai Illumina sekoskaitoje) įjungiamas daugiau nei vienas nukleotidas. Taip atsiranda vadinamieji pofaziniai (atsiliekantys) ir priešfaziniai (pirmaujantys) efektai, kurie kaupiasi sekoskaitos eigoje ir vis labiau iškraipo signalą.
  • Signalo sumišimas (angl. cross-talk, būdingas fluorescentinėmis žymėmis paremtoje sekoskaitoje) – optinės detekcijos apribojimų sukuriamas neigiamas efektas, atsirandantis, nes 4 įjungiamų nukleotidų fluoroforų emisijos spektrai dalinai persikloja.
  • Signalo nykimas (angl. signal decay) – antrinis efektas, atsirandantis dėl signalo sumišimo (angl cross-talk) taisymo paeiliui nuskaitant pasikartojančius dinukleotidus.
  • Kt.

Daugelio šių efektų indėlis sekoskaitos tikslumui yra tendencingas, t. y. jis priklauso nuo sekvenuojamos DNR sudėties ir didėja sekoskaitos eigoje, todėl sekoskaitos tikslumas mažėja didėjant sekoskaitos ciklui (3 pav.).

Bazių priskyrimo algoritmų kokybei stebėti generuojami grafikai, kuriuose demonstruojama Q įverčių koreliacija su empiriniais Q įverčiais bei empirinių Q įverčių priklausomybės nuo sekoskaitos ciklo/nuskaityto fragmento pozicijos grafikai (4 pav.).

Nuskaitymų analizė

Surikiavus milijonus NKS nuskaitymų (angl. read allignment), prasideda duomenų analizės žingsniai, tokie kaip genomo surinkimas (angl. genome assembly) ar surinktų skirtingų fragmentų kiekybinis įvertinimas, kuriuose ir atsiskleidžia perdengimo tendencingumo daroma žala. Perdengimo tolygumas yra ypač svarbus RNR sekoskaitoje (RNA-Seq), chromosomų imunoprecipitacijos sekoskaitoje (ChIP-Seq) ar kopijų skaičiaus nustatymui dedikuotuose sekoskaitos eksperimentuose, kur reikalingas tikslus kiekybinis įvertinimas. NKS generuojami duomenys smarkiai nukrypsta nuo teorinio tolygaus nuskaitymų pasiskirstymo. Ypač dideliu tendencingumu pasižymi GC turtingų sekų, kurios sudaro ir daugybę žmogaus genome esančių promotorių, sekoskaita (5 pav.). Prastai perdengtose genomų srityse tampa sudėtinga nustatyti VNP (angl. SNP), taip pat šios sritys yra kritiškos De novo genomų surinkimui, nes gaunama tik daug trumpų sąrankų (angl. contig). Literatūroje plačiai aprašomi GC sudėties, sudėtingų sričių, genų ilgio (RNR sekoskaita) bei nuo DNR fragmentacijos ar sekoskaitos sistemai specifinių adapterių ligavimo priklausantys NKS tendencingumai bei būdai jiems stebėti ir išvengti.

GC tendencingumas

Ryškiausias perdengimo tendencingumas stebimas GC ar AT ekstremaliai turtingose genomų srityse, palindrominėse sekose ar invertuotuose pasikartojimuose. Prie šio tendencingumo atsiradimo gali prisidėti „šlapiosios“ stadijos: DNR fragmentacija, adapterių ligavimas, bibliotekų padauginimas PGR metodu, kloninis šabloninių molekulių (angl. template) padauginimas tilteliniu (Illumina) ar padauginimo emulsijose (IonTorrent) būdu bei sekoskaita sintezės metu; ar sekoskaitos duomenų apdirbimo kompiuterinės stadijos: signalo apdorojimo ir bazių priskyrimo.

Paprasčiausias būdas įvertinti genomo perdengimo tendencingumus yra grafikas, vaizduojantis kintančios GC sudėties sričių (dažniausiai bendru susitarimu pasirenkamas 100 bazių srities ilgis (kitaip – lango dydis)) santykinį perdengimą (6 pav.). Yra rekomenduojama lango dydį pasirinkti lygų vidutiniam sekvenuojamų fragmentų ilgiui ir naudoti slenkantį per pusę vidutinio fragmentų ilgio langą. Ši rekomendacija nėra visiems priimtina, nes sukelia sunkumų lyginant duomenis tarpusavyje ir įveda galimybę manipuliuoti duomenimis. Santykinis perdengimas, tai tam tikros srities perdengimas padalintas iš vidutinio viso genomo perdengimo. Netendencingų sekoskaitos rezultatų neįtakoja fragmentų GC sudėtis ir todėl GC tendencingumų grafike ties vienetu gaunama tiesi santykinio perdengimo linija. Kadangi gamtoje nepasitaiko organizmų, kurių genomų GC sudėtis būtų pasiskirsčiusi per visą intervalą, tai sekoskaitos GC tendencingumas dažnai įvertinamas nuskaitant 3 genomus: vieną labai AT turtingą (pvz. Plasmodium falciparum 19%GC ar Staphylococcus aureus 33% GC), neutralią (Escherichia coli 51% GC) ir GC turtingą (Rhodobacter sphaeroides 69%GC, Rhodopseudomonas palustris 65%GC). Visi GC tendencingumui įvertinti naudojami mikroorganizmai turi turėti kokybiškai paruoštus prilyginamuosius genomus (angl. reference genome).

Perdengimo tendencingumui įvertinti Ross et al. siūlo sekoskaitos duomenyse analizuoti 6 skirtingus empiriškai parinktus motyvus (7 pav.):

  1. GC≤10%. 200 bazių ilgio regionas, kurio vidurinių 100 bazių GC sudėtis ≤10%.
  2. GC≥75%. 200 bazių ilgio regionas, kurio vidurinių 100 bazių GC sudėtis ≥10%.
  3. GC≥85%. 200 bazių ilgio regionas, kurio vidurinių 100 bazių GC sudėtis ≥85%.
  4. (AT)15. 130 bazių ilgio regionas, kurio vidurinės 30 bazių yra pasikartojantys AT dinukleotidai.
  5. G|C≥80%, 130 bazių regionas, kurio vidurinės 30 bazių yra 80% G arba 80% C (ilgi G ar C homopolimerai).
  6. „Blogųjų“ žmogaus promotorių regionai. Tai 1000 promotorių sekų, pasižyminčių aukšta GC sudėtimi ir žemu santykiniu perdengimu, nustatytų analizuojant žmogaus genomo sekoskaitos duomenis.

4 ir 5 motyvai pasirinkti išanalizavus, jog daugiausia trūkių genomų sujungimuose yra būtent dėl šių sudėtingų sekų.

Genomo GC sudėtis atskleidžia ne tik perdengimų tendencingumą, bet ir klaidų tendencingumą (8 pav.). Pastebimi nedideli bazių neatitikimo (klaidingų bazių) padidėjimai GC ir AT turtingose srityse gali būti įtakojami „šlapiosios“ eksperimentinės dalies, nes yra parodyta, jog DNR polimerazių tikslumas ekstremaliose sekose gali skirtis iki dešimties kartų.

Perdengimo tendencingumą galima įvertinti ir skaitine reikšme. Tokiu atveju sekvenuojamas genomas padalinamas į langus, kurių dydis lygus vidutiniam fragmentų ilgiui. Kiekvienas tokių langų atidedamas išsibarstymo grafike (9 pav.), atsižvelgiant į jo normalizuotą perdengimą. Mažiausių kvadratų metodu gautos tiesės nuolinkio koeficientas (angl. slope) ir nusako GC tendencingumą.

NKS, dėl didelio našumo ir mažos kainos tapo pagrindiniu De novo genomų surinkimo įrankiu. Dėl NKS tendencingumų, o labiausiai GC tendencingumo, De novo genomų surinkimas neretai tampa iššūkiu, nes žemo perdengimo regionai surinkimo algoritmų gali būti interpretuojami kaip sekoskaitos klaidų rezultatas ir sekos išmetamos iš analizės, o dideliu santykiniu perdengimu pasižymintys regionai gali būti interpretuojami kaip pasikartojantys elementai. Dėl neigiamų tendencingumų efektų genomai surenkami labiau fragmentuotai ir mažiau tiksliai. Pastebima, kad net ypač dideli genomų perdengimai negali kompensuoti įvairių tendencingumų įtakos.

Chen Y et al. pademonstravo būda, kuriuo, panaudojant kompiuterines simuliacijas, galima įvertinti GC tendencingumo įtaką De novo genomų surinkimui, stebint genomo surinkimo baigtinumo statistinį matą – N50. Šis matas parodo, kokio ilgio yra trumpiausia sąranka (angl. contig), kai 50% visų genomo bazių yra to ar ilgesnio ilgio sąrankose. Surinkimai buvo simuliuojami naudojant 100 bazių ilgio nuskaitymus ir vidutinį padengimo gylį nuo 50 iki 2000 kartų. Naudojant visas aštuonias autorių pasirinktas surinkimo programas (angl. assemblers) stebima, kad stiprus teigiamas GC tendencingumas reikšmingai sumažina N50 dydį (10 pav.). GC tendencingumas gali būti kompensuojamas didesniu perdengimu, o didžiausias kompensavimas stebimas perdengimą padidinus nuo 50 iki 100X. Šie rezultatai demonstruoja, kad genomo surinkimui, kai nėra stebimas GC tendencingumas, pilnai užtenka 50X perdengimo, o didesnis perdengimas surinkimo baigtinumo nepadidina. Esant stipriam GC tendencingumui, optimalus dažniausiai yra 100X perdengimas, bet net su juo nėra pasiekiami tokie N50 dydžiai, kurie gaunami, kai genomas perdengiamas 50X nesant GC tendencingumo.

DNR fragmentavimo tendencingumas

Didesni ar mažesni DNR fragmentavimo tendencingumai stebimi naudojant plačiai taikomus NKS fermentinius (DNazės, transpozazės, restrikcijos endonukleazių mišiniai) ir mechaninius (sonifikacija, nebulizacija, hidrodinaminis skaldymas ir kt.) DNR fragmentavimo metodus. Šie tendencingumai gali sumažinti tam tikrų genomo sričių padengimus, nes DNR jose, dėl nepalankios bazinės sudėties, bus suskaldyta į sekoskaitos sistemai per ilgus ar per trumpus fragmentus, kurie iš analizės bus pašalinti. Fragmentavimo tendencingumus paprasta stebėti sekų vizualizacijos įrankiais (pLogo, bLogo, kt.) generuojamuose grafikuose. Grafikų generavime naudojamos nuskaitymų pradžios ir galo pozicijos prilygintos prie šabloninio (angl. reference) genomo (11 pav.).

Sekoskaitos sistemai specifinių adapterių ligavimo tendencingumas

Pats populiariausias NK sekoskaitos sistemai specifinių DNR adaptorinių sekų pridėjimo būdas išlieka ligavimas. Adapteriai dažniausiai liguojami AT lipniais ar bukais galais. Yra pastebėta, kad buko ligavimo tendencingumas yra daug mažesnis už AT ligavimo tendencingumą (12 pav.), bet, kadangi DNR ligavimo tendencingumas yra pakankamai mažas palyginti su kitais sekoskaitos tendencingumais, todėl yra svarbus tik tais atvejais, kai dirbama su mažais sekų perdengimais. Ligavimo tendencingumą (taip pat ir DNR fragmentavimo tendencingumą) stebėti patogu grafikuose, kuriuose išreikštas kiekvieno nukleotido pasikartojimo dažnis nuskaitymų pradžioje ir gale (dažniausiai pateikiamos ne ilgesnės nei 10 bazių sritys, kurios, manoma, gali kontaktuoti su fermentu ir įtakoti reakcijos eigą).

Labai reikšmingas ligavimo tendencingumas yra stebimas ruošiant sekoskaitai mažų RNR (sRNR) bibliotekas. Prie sRNR adapteriai liguojami panaudojant RNR ligazes, kurios rodo tendencingumą ne RNR sekai, o adapterių ir sRNR antrinei struktūrai (13 pav.). Ligavimas efektyviausias tada, kai po reakcijos gauta RNR sudaro stabilias antrines struktūras. Sorefan K. et al. NKS būdu nuskaitė bibliotekoms ruošti ekvimoliariniais kiekiais panaudotas degeneruotos sekos trumpas RNR ir gautus kiekybinius rezultatus palyginęs su bioinformatiniais metodais nustatyta nuskaitytų RNR antrinių struktūrų minimalia laisvąja energija (MLE), pastebėjo ryškią koreliaciją tarp sekų dažnio NKS ir MLE reikšmės.

Dėl RNR ligavimo tendencingumo NKS duomenis reikia atsargiai naudoti sRNR kiekybiniam įvertinimui. Tikimasi, jog pašalinus RNR ligavimo tendencingumą, NKS būdu bus galima atrasti daug naujų mažųjų RNR.

Šaltiniai

  1. Chen Y et al. Effects of GC bias in next-generation-sequencing data on de novo genomes assembly. PLoSONE. 2013;8(4): e6856.
  2. Das S and Vikalo H. Base calling for high-throughput shortread sequencing: dynamic programming solutions. BMC Bioinformatics. 2013;14:129.
  3. Green B et al. Insertion site preference of Mu, Tn5, and Tn7 transposons. Mobile DNA. 2012:3:3.
  4. Ledergerber C and Dessimoz C. Base-calling for next-generation sequencing platforms. Brief. Bioinform. 2011;12:489-497.
  5. Renauld G et al. freeIbis: an efficient basecaller with calibrated quality scores for Illumina sequencers. Bioinformatics. 2013;29(9):1208-9.
  6. Ross et al. Characterizing and measuring bias in sequencing data. Genome Biology 2013;14:R51. Archyvuota kopija 2014-01-25 iš Wayback Machine projekto.
  7. Seguin-Orlando et al. Ligation bias in Illumina next-generation DNA libraries: implications for sequencing ancient genomes. PLoSONE. 2013;8(10): e78575.
  8. Sorefan K et al. Reducing ligation bias of small RNAs in libraries for next generation sequencing. Silence 2012;3(4).
  9. Taub MA et al. Bias detection and correction in RNA-Sequencing data. BMC Bioinformatics 2011;12(290).
  10. Taub MA et al. Overcoming bias and systematic errors in next generation sequencing data. Genome medicine 2010;2(87).
  11. Zhuang F et al. Structural bias in T4 RNA ligase-mediated 3’-adapter ligation. Nucleic acids research 2012;40(7): e54.
  1. „Ray Wu Faculty Profile“. Cornell University. Suarchyvuotas originalas 2009-03-04.

Autorius: www.NiNa.Az

Išleidimo data: 18 Lie, 2025 / 12:20

vikipedija, wiki, lietuvos, knyga, knygos, biblioteka, straipsnis, skaityti, atsisiųsti, nemokamai atsisiųsti, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, pictu, mobilusis, porn, telefonas, android, iOS, apple, mobile telefl, samsung, iPhone, xiomi, xiaomi, redmi, pornografija, honor, oppo, Nokia, Sonya, mi, pc, web, kompiuteris, Informacija apie DNR sekoskaita, Kas yra DNR sekoskaita? Ką reiškia DNR sekoskaita?

Sį straipsnį ar jo skyriu reiketu perziureti Butina istaisyti gramatines klaidas patikrinti rasyba skyryba stiliu ir pan Istaise pastebetas klaidas istrinkite sį pranesima Sį puslapį ar jo dalį reikia sutvarkyti pagal Vikipedijos standartus vidines nuorodos saltiniai kategorijos Jei galite sutvarkykite DNR sekoskaita taip pat vadinama DNR sekvenavimu metodu visuma skirta DNR molekuliu seku nustatymui DNR sekoskaitai pagrinda padejo tyrimai Pirmieji sekoskaitos metodai pasirode apie 1970 m Naujos kartos sekoskaita1 pav Signalo apdorojimas IonTorrent sekoskaitos metu Ties 1600 ms į DNR grandine įjungtas dNTP sukelia įtampos suolį zr raudona kreive kairiajame paveiksle kuris yra ypatingai mazas palyginti su veliau vykstanciais įtampos kaita sukelianciais technologiniais procesais Tikslinis signalas isryskinamas zr desinįjį paveiksla is jo atemus fonines įtampos reiksmes gautas gretimuose DNR neuzpildytuose mikrograndyno sulineliuose zr juoda bruksnine kreive kairiajame paveiksliuke 3 pav Kokybes kritimas nuskaitytuose fragmentuose Grafike vaizduojama Q įvercio priklausomybe nuo pozicijos nuskaitytuose fragmentuose grafikas sugeneruotas FastQC programa 4 pav Baziu priskyrimo algoritmu palyginamieji grafikai Kaireje Illumina sekoskaitai naudojami baziu priskyrimo algoritmai ir ju Q įverciu koreliacija su empiriniais Q įverciais Bustard standartinis Illumina sekoskaitos baziu priskyrimo algoritmas Ibis viena geriausiu standartinio Bustard alternatyvu Desineje baziu priskyrimo klaidu daznio priklausomybe nuo sekoskaitos ciklo Klaidu daznį sekoskaitos eigoje labiausiai įtakoja fazinis triuksmas kuris tendencingai akumuliuojasi sekoskaitos eigoje Iliustracijos is Ledergerber et al 2011 ir Das et al 2013 5 pav Zmogaus NCS1 geno sekoskaita Del tendencingumo net labai dideliu vidutiniu perdengimu siuo atveju 200X pasizyminciuose sekoskaitos duomenyse lieka visiskai nepadengtu biologiskai svarbiu sriciu Iliustracija is Ross et al 2013 6 pav Grafikai GC tendencingumui stebeti Vizualiausi duomenys gaunami analizuojant skirtingos GC sudeties genomu sekoskaitos duomenis Siuo budu lengva palyginti skirtingu sekoskaitos sistemu GC tendencingumus taip pat populiaru lyginti skirtingus biblioteku paruosimo ar sekoskaitos protokolus Iliustracija is Ross et al 2013 7 pav Empiriskai parinkti motyvai sekoskaitos perdengimo tendencingumams stebeti Zmogaus genomo dydis pateiktas neįskaiciuojant lytiniu chromosomu Iliustracija is Ross et al 2013 8 pav Klaidu daznio priklausomybe nuo nuskaitomu fragmentu GC sudeties Is siu grafiku matome kad klaidu daznio GC sudetis beveik neįtakoja IonTorrent sekoskaitoje Iliustracija is Ross et al 2013 9 pav Grafikai GC tendencingumui stebeti Grafikuose parodyti sekoskaitos rezultatai pasizymintys neigiamu kairysis teigiamu desinysis GC tendencingumais ir nedemonstruojantys jokio GC tendencingumo vidurinysis Iliustracija is Chen Y et al 2013 10 pav Genomo surinkimo baigtinumo priklausomybe nuo perdengimo GC tendencingumo įtaka De novo genomu surinkimui nesant GC tendencingumo melyna linija ir esant stipriam teigiamam tieses nuolinkio koeficientas 3 6 GC tendencingumui rozine linija Duomenys gauti naudojant astuonias populiarias trumpiems nuskaitymams taikomas surinkimo programas Iliustracija is Chen Y et al 2013 11 pav Seku tendencingumo vizualizacijos Transpozazes naudojamos NGS biblioteku fragmentavime transpozonus į skirtingas fragmentuojamos DNR sekas įjungia skirtingu dazniu Seku vizualizacijose pateikiami MuA ir Tn5 transpozonu įjungimo tendencingumai Iliustracija is Green et al 2012 12 pav Seku tendencingumo vizualizacijos santykiniai baziu sudeties grafikai Grafikuose galima pastebeti jog AT ligavimo tendencingumas AT library yra didesnis nei buko ligavimo BE library Jei nebutu jokio ligavimo tendencingumo tai nuskaitymu galuose visu skirtingu nukleotidu santykis butu vienodas po 0 25 Iliustracija is Seguin Orlando et al 2013 13 pav Spejama miR 29b struktura kai prie jos priliguojami standartiniai Illumina adapteriai ir galimos miR 29b strukturos kai liguojami modifikuoti adapteriai su degeneruotais galais Del degeneruotu galu tam tikri adapteriai su miR 29b gali sudaryti stabilias energetiskai naudingas strukturas ir del to nebus pametami is NK sekoskaitos Iliustracija is Sorefan et al 2012 Naujos kartos sekoskaita arba didelio nasumo sekoskaita terminas apibudinantis daugelį moderniu DNR sekoskaitos technologiju kurios revoliucionizavo genomikos ir molekulines biologijos tyrimus nes mokslininkams leido nuskaityti didelius kiekius DNR ar RNR seku daug greiciau ir pigiau nei anksciau naudota Dauguma siu naujuju technologiju yra paremtos sekoskaita sintezes metu SSM kai tiksli yra nustatoma DNR polimerazei vykdant naujos grandines sinteze pagal sablonine tiriamo meginio grandine DNR seka nustatoma įjungiant fluoroforais modifikuotus nukleotidus arba detektuojant metu atsiskyrusius salutinius reakcijos produktus vandenilio jonus ar molekules Naujos kartos sekoskaita nuo anksciau naudotu seku nustatymo metodu labiausiai isskiria didelis paralelizmas vienu metu vykdoma milijonai sekoskaitos reakciju ir automatizavimas kuriuo kartu siekiama visus procesus bibliotekos paruosima kloninį padauginima ir SSM ir kt sujungti viename sekoskaitos įrenginyje Lietuvoje naujos kartos sekoskaitos įranga jau sekmingai naudojama Thermo Fisher Scientific Baltics moksliniu tyrimu centre Illumina MiSeq IonTorrent PGM Roche GS Junior Vilniaus universiteto ligonines Santaros klinikose Illumina MiSeq IonTorrent PGM ABI Solid Vilniaus universiteto Gamtos mokslu fakultete Roche GS Junior Naujos kartos sekoskaitos kaip ir bet kuriuo kitu didelio nasumo metodu sugeneruotuose duomenyse yra gausu technologiniu ir biologiniu veiksniu sukeltu tendencingumu angl bias Sie tendencingumai gali smarkiai neigiamai įtakoti detalia duomenu analize todel labai svarbu zinoti kaip ju isvengti ar pasalinti Tik kai tendencingumai yra tiksliai identifikuojami ir patikimai pakoreguojami duomenys gali tapti reiksmingu moksliniu ar klinikiniu įrankiu Tendencingumu apstu visose NKS stadijose signalo apdorojimo baziu priskyrimo nuskaitymu lygiavimo ir tolimesnes analizes zingsniuose Juos dazniausiai sukeliantys veiksniai yra DNR fragmentacijoje biblioteku paruosime padauginime ir sekoskaitos procese naudojami fermentai neefektyviai blokuojanciomis ir aptikimo zymemis modifikuoti dNTP netobuli detekcijos įrenginiai bei analizes algoritmai Didziaja dalį visu NKS tendencingumu galima suskirstyti į dvi grupes perdengimu tendencingumas nukrypimas nuo visam genomui egzomui kt tolygaus nuskaitymu skaiciaus klaidu daznio tendencingumas angl bias in base call error rates nukrypimas nuo visam genomui tolygaus baziu neatitikimo inseciju ir deleciju daznio Signalo apdorojimas Signalo apdorojimas procesas kurio metu tikslinis signalas atskiriamas nuo foninio signalo Sis pirminis zingsnis del savo technologinio sudetingumo įtakoja visa tolesne analizes eiga ir yra pirmine klaidu daznio didejimo sekoskaitos eigoje tendencingumo priezastis Issukius su kuriais susiduriama signalo apdorojimo metu vaizdziai galima atskleisti IonTorrent sekoskaitos pavyzdziu 1 pav Vykstant sekoskaitai sintezes metu matuojamas sroves pokytis mikrograndyno sulineliuose kai į DNR grandine įjungus nukleotida atsiskiria vandenilio jonas Nustatomas sroves pokytis yra ypatingai mazas ir jį labai įtakoja tekmese angl flows naudojamu reagentu neefektyvus pasalinimas bei ne 100 efektyvumu vykstanti DNR sinteze del ko kyla fazinis triuksmas kuris kiekviename sekoskaitos cikle vis stipreja Baziu priskyrimasBaziu priskyrimas angl base calling tai procesas kurio metu apdoroto signalo kreivems priskiriamos nukleotidines bazes fizinio signalo vertimas į DNR seka ir įvertinamas kiekvienos ju priskyrimo tikslumas kuris apibudinamas Phred kokybes įverciu taip pat vadinamas quality ar Q įverciu kuris dazniausiai buna nuo 10 iki 50 Phred įvertis Q apskaiciuojamas pagal formule Q 10log10P kur P yra klaidingo priskyrimo tikimybe pavyzdziui Phred įvertis 10 parodo kad netinkamo bazes priskyrimo tikimybe yra 1 is 10 o tai reiskia kad baziu priskyrimo tikslumas siekia 90 Q30 ilga laika buvo laikomas etaloniniu kokybes rodikliu naujos kartos sekoskaitoje bet nuolat tobulejant slapiajai laboratorinei daliai ir duomenu analizes algoritmams siuo metu jau pasiekiamas ir gt Q40 dydis Baziu priskyrimas yra kertinis sekoskaitos procese nes nuo jo stipriai priklauso sekoskaitos duomenu tikslumas Tobulinami baziu priskyrimo algoritmai sumazina didelį perdengimu skaiciaus poreikį o tuo paciu ir sekoskaitos kaina Baziu priskyrimui be standartiniu sekoskaitos gamintoju siulomu algoritmu yra kuriama ir daug kitu kurie turetu pagerinti baziu priskyrimo tiksluma ir jiems reiketu mazesniu skaiciavimo pajegumu Tai sudetingas procesas kuriame turi buti atsizvelgiama į daugelį kenkianciu efektu 2 pav tokiu kaip Nevienalyciai spieciai angl clusters vienoje Illumina sekoskaitos celes vietoje yra padaugintas dvieju ar daugiau skirtingu DNR molekuliu misinys kuris lemia sulieta signala IonTorrent sekoskaitoje sis efektas kyla del nevienalyte DNR padengtu sferiniu daleliu angl Ion Sphere particles Fazinis triuksmas daznai pasitaiko jog ne prie visu spieciuje ar ant sferines daleles kloniskai padaugintu DNR grandiniu sekoskaitos ciklo metu įjungiamas naujas nukleotidas ar del reagentu netobulumo pvz neefektyviai uzblokuoti nukleotidai Illumina sekoskaitoje įjungiamas daugiau nei vienas nukleotidas Taip atsiranda vadinamieji pofaziniai atsiliekantys ir priesfaziniai pirmaujantys efektai kurie kaupiasi sekoskaitos eigoje ir vis labiau iskraipo signala Signalo sumisimas angl cross talk budingas fluorescentinemis zymemis paremtoje sekoskaitoje optines detekcijos apribojimu sukuriamas neigiamas efektas atsirandantis nes 4 įjungiamu nukleotidu fluoroforu emisijos spektrai dalinai persikloja Signalo nykimas angl signal decay antrinis efektas atsirandantis del signalo sumisimo angl cross talk taisymo paeiliui nuskaitant pasikartojancius dinukleotidus Kt Daugelio siu efektu indelis sekoskaitos tikslumui yra tendencingas t y jis priklauso nuo sekvenuojamos DNR sudeties ir dideja sekoskaitos eigoje todel sekoskaitos tikslumas mazeja didejant sekoskaitos ciklui 3 pav Baziu priskyrimo algoritmu kokybei stebeti generuojami grafikai kuriuose demonstruojama Q įverciu koreliacija su empiriniais Q įverciais bei empiriniu Q įverciu priklausomybes nuo sekoskaitos ciklo nuskaityto fragmento pozicijos grafikai 4 pav Nuskaitymu analizeSurikiavus milijonus NKS nuskaitymu angl read allignment prasideda duomenu analizes zingsniai tokie kaip genomo surinkimas angl genome assembly ar surinktu skirtingu fragmentu kiekybinis įvertinimas kuriuose ir atsiskleidzia perdengimo tendencingumo daroma zala Perdengimo tolygumas yra ypac svarbus RNR sekoskaitoje RNA Seq chromosomu imunoprecipitacijos sekoskaitoje ChIP Seq ar kopiju skaiciaus nustatymui dedikuotuose sekoskaitos eksperimentuose kur reikalingas tikslus kiekybinis įvertinimas NKS generuojami duomenys smarkiai nukrypsta nuo teorinio tolygaus nuskaitymu pasiskirstymo Ypac dideliu tendencingumu pasizymi GC turtingu seku kurios sudaro ir daugybe zmogaus genome esanciu promotoriu sekoskaita 5 pav Prastai perdengtose genomu srityse tampa sudetinga nustatyti VNP angl SNP taip pat sios sritys yra kritiskos De novo genomu surinkimui nes gaunama tik daug trumpu saranku angl contig Literaturoje placiai aprasomi GC sudeties sudetingu sriciu genu ilgio RNR sekoskaita bei nuo DNR fragmentacijos ar sekoskaitos sistemai specifiniu adapteriu ligavimo priklausantys NKS tendencingumai bei budai jiems stebeti ir isvengti GC tendencingumas Ryskiausias perdengimo tendencingumas stebimas GC ar AT ekstremaliai turtingose genomu srityse palindrominese sekose ar invertuotuose pasikartojimuose Prie sio tendencingumo atsiradimo gali prisideti slapiosios stadijos DNR fragmentacija adapteriu ligavimas biblioteku padauginimas PGR metodu kloninis sabloniniu molekuliu angl template padauginimas tilteliniu Illumina ar padauginimo emulsijose IonTorrent budu bei sekoskaita sintezes metu ar sekoskaitos duomenu apdirbimo kompiuterines stadijos signalo apdorojimo ir baziu priskyrimo Paprasciausias budas įvertinti genomo perdengimo tendencingumus yra grafikas vaizduojantis kintancios GC sudeties sriciu dazniausiai bendru susitarimu pasirenkamas 100 baziu srities ilgis kitaip lango dydis santykinį perdengima 6 pav Yra rekomenduojama lango dydį pasirinkti lygu vidutiniam sekvenuojamu fragmentu ilgiui ir naudoti slenkantį per puse vidutinio fragmentu ilgio langa Si rekomendacija nera visiems priimtina nes sukelia sunkumu lyginant duomenis tarpusavyje ir įveda galimybe manipuliuoti duomenimis Santykinis perdengimas tai tam tikros srities perdengimas padalintas is vidutinio viso genomo perdengimo Netendencingu sekoskaitos rezultatu neįtakoja fragmentu GC sudetis ir todel GC tendencingumu grafike ties vienetu gaunama tiesi santykinio perdengimo linija Kadangi gamtoje nepasitaiko organizmu kuriu genomu GC sudetis butu pasiskirsciusi per visa intervala tai sekoskaitos GC tendencingumas daznai įvertinamas nuskaitant 3 genomus viena labai AT turtinga pvz Plasmodium falciparum 19 GC ar Staphylococcus aureus 33 GC neutralia Escherichia coli 51 GC ir GC turtinga Rhodobacter sphaeroides 69 GC Rhodopseudomonas palustris 65 GC Visi GC tendencingumui įvertinti naudojami mikroorganizmai turi tureti kokybiskai paruostus prilyginamuosius genomus angl reference genome Perdengimo tendencingumui įvertinti Ross et al siulo sekoskaitos duomenyse analizuoti 6 skirtingus empiriskai parinktus motyvus 7 pav GC 10 200 baziu ilgio regionas kurio viduriniu 100 baziu GC sudetis 10 GC 75 200 baziu ilgio regionas kurio viduriniu 100 baziu GC sudetis 10 GC 85 200 baziu ilgio regionas kurio viduriniu 100 baziu GC sudetis 85 AT 15 130 baziu ilgio regionas kurio vidurines 30 baziu yra pasikartojantys AT dinukleotidai G C 80 130 baziu regionas kurio vidurines 30 baziu yra 80 G arba 80 C ilgi G ar C homopolimerai Bloguju zmogaus promotoriu regionai Tai 1000 promotoriu seku pasizyminciu auksta GC sudetimi ir zemu santykiniu perdengimu nustatytu analizuojant zmogaus genomo sekoskaitos duomenis 4 ir 5 motyvai pasirinkti isanalizavus jog daugiausia trukiu genomu sujungimuose yra butent del siu sudetingu seku Genomo GC sudetis atskleidzia ne tik perdengimu tendencinguma bet ir klaidu tendencinguma 8 pav Pastebimi nedideli baziu neatitikimo klaidingu baziu padidejimai GC ir AT turtingose srityse gali buti įtakojami slapiosios eksperimentines dalies nes yra parodyta jog DNR polimeraziu tikslumas ekstremaliose sekose gali skirtis iki desimties kartu Perdengimo tendencinguma galima įvertinti ir skaitine reiksme Tokiu atveju sekvenuojamas genomas padalinamas į langus kuriu dydis lygus vidutiniam fragmentu ilgiui Kiekvienas tokiu langu atidedamas issibarstymo grafike 9 pav atsizvelgiant į jo normalizuota perdengima Maziausiu kvadratu metodu gautos tieses nuolinkio koeficientas angl slope ir nusako GC tendencinguma NKS del didelio nasumo ir mazos kainos tapo pagrindiniu De novo genomu surinkimo įrankiu Del NKS tendencingumu o labiausiai GC tendencingumo De novo genomu surinkimas neretai tampa issukiu nes zemo perdengimo regionai surinkimo algoritmu gali buti interpretuojami kaip sekoskaitos klaidu rezultatas ir sekos ismetamos is analizes o dideliu santykiniu perdengimu pasizymintys regionai gali buti interpretuojami kaip pasikartojantys elementai Del neigiamu tendencingumu efektu genomai surenkami labiau fragmentuotai ir maziau tiksliai Pastebima kad net ypac dideli genomu perdengimai negali kompensuoti įvairiu tendencingumu įtakos Chen Y et al pademonstravo buda kuriuo panaudojant kompiuterines simuliacijas galima įvertinti GC tendencingumo įtaka De novo genomu surinkimui stebint genomo surinkimo baigtinumo statistinį mata N50 Sis matas parodo kokio ilgio yra trumpiausia saranka angl contig kai 50 visu genomo baziu yra to ar ilgesnio ilgio sarankose Surinkimai buvo simuliuojami naudojant 100 baziu ilgio nuskaitymus ir vidutinį padengimo gylį nuo 50 iki 2000 kartu Naudojant visas astuonias autoriu pasirinktas surinkimo programas angl assemblers stebima kad stiprus teigiamas GC tendencingumas reiksmingai sumazina N50 dydį 10 pav GC tendencingumas gali buti kompensuojamas didesniu perdengimu o didziausias kompensavimas stebimas perdengima padidinus nuo 50 iki 100X Sie rezultatai demonstruoja kad genomo surinkimui kai nera stebimas GC tendencingumas pilnai uztenka 50X perdengimo o didesnis perdengimas surinkimo baigtinumo nepadidina Esant stipriam GC tendencingumui optimalus dazniausiai yra 100X perdengimas bet net su juo nera pasiekiami tokie N50 dydziai kurie gaunami kai genomas perdengiamas 50X nesant GC tendencingumo DNR fragmentavimo tendencingumas Didesni ar mazesni DNR fragmentavimo tendencingumai stebimi naudojant placiai taikomus NKS fermentinius DNazes transpozazes restrikcijos endonukleaziu misiniai ir mechaninius sonifikacija nebulizacija hidrodinaminis skaldymas ir kt DNR fragmentavimo metodus Sie tendencingumai gali sumazinti tam tikru genomo sriciu padengimus nes DNR jose del nepalankios bazines sudeties bus suskaldyta į sekoskaitos sistemai per ilgus ar per trumpus fragmentus kurie is analizes bus pasalinti Fragmentavimo tendencingumus paprasta stebeti seku vizualizacijos įrankiais pLogo bLogo kt generuojamuose grafikuose Grafiku generavime naudojamos nuskaitymu pradzios ir galo pozicijos prilygintos prie sabloninio angl reference genomo 11 pav Sekoskaitos sistemai specifiniu adapteriu ligavimo tendencingumas Pats populiariausias NK sekoskaitos sistemai specifiniu DNR adaptoriniu seku pridejimo budas islieka ligavimas Adapteriai dazniausiai liguojami AT lipniais ar bukais galais Yra pastebeta kad buko ligavimo tendencingumas yra daug mazesnis uz AT ligavimo tendencinguma 12 pav bet kadangi DNR ligavimo tendencingumas yra pakankamai mazas palyginti su kitais sekoskaitos tendencingumais todel yra svarbus tik tais atvejais kai dirbama su mazais seku perdengimais Ligavimo tendencinguma taip pat ir DNR fragmentavimo tendencinguma stebeti patogu grafikuose kuriuose isreikstas kiekvieno nukleotido pasikartojimo daznis nuskaitymu pradzioje ir gale dazniausiai pateikiamos ne ilgesnes nei 10 baziu sritys kurios manoma gali kontaktuoti su fermentu ir įtakoti reakcijos eiga Labai reiksmingas ligavimo tendencingumas yra stebimas ruosiant sekoskaitai mazu RNR sRNR bibliotekas Prie sRNR adapteriai liguojami panaudojant RNR ligazes kurios rodo tendencinguma ne RNR sekai o adapteriu ir sRNR antrinei strukturai 13 pav Ligavimas efektyviausias tada kai po reakcijos gauta RNR sudaro stabilias antrines strukturas Sorefan K et al NKS budu nuskaite bibliotekoms ruosti ekvimoliariniais kiekiais panaudotas degeneruotos sekos trumpas RNR ir gautus kiekybinius rezultatus palygines su bioinformatiniais metodais nustatyta nuskaitytu RNR antriniu strukturu minimalia laisvaja energija MLE pastebejo ryskia koreliacija tarp seku daznio NKS ir MLE reiksmes Del RNR ligavimo tendencingumo NKS duomenis reikia atsargiai naudoti sRNR kiekybiniam įvertinimui Tikimasi jog pasalinus RNR ligavimo tendencinguma NKS budu bus galima atrasti daug nauju mazuju RNR SaltiniaiChen Y et al Effects of GC bias in next generation sequencing data on de novo genomes assembly PLoSONE 2013 8 4 e6856 Das S and Vikalo H Base calling for high throughput shortread sequencing dynamic programming solutions BMC Bioinformatics 2013 14 129 Green B et al Insertion site preference of Mu Tn5 and Tn7 transposons Mobile DNA 2012 3 3 Ledergerber C and Dessimoz C Base calling for next generation sequencing platforms Brief Bioinform 2011 12 489 497 Renauld G et al freeIbis an efficient basecaller with calibrated quality scores for Illumina sequencers Bioinformatics 2013 29 9 1208 9 Ross et al Characterizing and measuring bias in sequencing data Genome Biology 2013 14 R51 Archyvuota kopija 2014 01 25 is Wayback Machine projekto Seguin Orlando et al Ligation bias in Illumina next generation DNA libraries implications for sequencing ancient genomes PLoSONE 2013 8 10 e78575 Sorefan K et al Reducing ligation bias of small RNAs in libraries for next generation sequencing Silence 2012 3 4 Taub MA et al Bias detection and correction in RNA Sequencing data BMC Bioinformatics 2011 12 290 Taub MA et al Overcoming bias and systematic errors in next generation sequencing data Genome medicine 2010 2 87 Zhuang F et al Structural bias in T4 RNA ligase mediated 3 adapter ligation Nucleic acids research 2012 40 7 e54 Ray Wu Faculty Profile Cornell University Suarchyvuotas originalas 2009 03 04

Naujausi straipsniai
  • Liepa 19, 2025

    Lieplaukės GS

  • Liepa 19, 2025

    Liepkalnio geležinkelio viadukas

  • Liepa 19, 2025

    Liciškėnai

  • Liepa 19, 2025

    Lichtenšteino pilis

  • Liepa 19, 2025

    Libijos Arabų Džamahirijos ginkluotosios pajėgos

www.NiNa.Az - Studija

    Susisiekite
    Kalbos
    Susisiekite su mumis
    DMCA Sitemap
    © 2019 nina.az - Visos teisės saugomos.
    Autorių teisės: Dadash Mammadov
    Nemokama svetainė, kurioje galima dalytis duomenimis ir failais iš viso pasaulio.
    Viršuje