Mirna digger: en omfattande pipeline för genomomfattande roman mirna mining | vetenskapliga rapporter

Mirna digger: en omfattande pipeline för genomomfattande roman mirna mining | vetenskapliga rapporter

Anonim

ämnen

  • Bioinformatik
  • programvara

Abstrakt

MicroRNA (miRNA) är viktiga regulatorer för genuttryck. De senaste framstegen inom teknik med hög genomströmningssekvensering (HTS) har i hög grad underlättat storskalig detektion av miRNA. En grundlig upptäckt av nya miRNA från tillgängliga HTS-datauppsättningar förblir emellertid en stor utmaning. I denna studie observerade vi att Dicer-medierade klyvningsställen för bearbetning av miRNA-prekursorerna kunde kartläggas med användning av degradomsekvenseringsdata i både djur och växter. I detta avseende utvecklades ett nytt verktyg, miRNA Digger, för systematisk upptäckt av miRNA-kandidater genom genombredd screening av klyvningssignaler baserade på degradomsekvensdata. För att testa dess känslighet och tillförlitlighet applicerades miRNA Digger för att upptäcka miRNA från fyra organ av Arabidopsis . Resultaten avslöjade att en majoritet av redan kända mogna miRNA tillsammans med deras miRNA * uttryckt i dessa fyra organ framgångsrikt återhämtades. Noterbart upptäcktes totalt 30 nya miRNA-miRNA * -par som inte har registrerats i miRBase av miRNA Digger. Efter målförutsägelse och degradomsekvensbestämd databasvalidering identifierades elva miRNA-målinteraktioner som involverade sex av de nya miRNA: erna. Sammantaget kan miRNA Digger tillämpas för känslig detektion av nya miRNA: er och den kan fritt laddas ner från //www.bioinfolab.cn/miRNA_Digger/index.html.

Introduktion

MicroRNA (miRNA) är en klass av små (18–25 nt långa) icke-kodande RNA (ncRNA) som fungerar som negativa regulatorer i genuttryck. Tidigare studier visade att regulatoriska aktiviteter för miRNA kunde involveras i många biologiska processer, såsom organutveckling 1, 2, metabolism 3, immunsvar 4 och tumörgenes 5, 6 . Vissa miRNA visade också stor potential att vara biomarkörer för specifika sjukdomar 7, 8 . Förutom mekanistiska studier på redan kända miRNA, blir upptäckten av nya miRNA: er en viktig uppgift och ett hett forskningsämne för en grundlig förståelse av miRNA-världen.

Med utvecklingen av HTS-tekniker med hög genomströmning har ett antal bioinformatikverktyg utvecklats för systematisk upptäckt av nya miRNA baserade på olika principer 9, inklusive miRNA-biogenesmekanismen 10, 11, 12, homologin från kända miRNA 13, 14, 15, energifördelningsmönstret och Random Forest-algoritmen 16 . Även om var och en av dessa tillvägagångssätt har sin egen förtjänst och användbarhet, inkluderades flera verktyg för jämförelse av prestanda för att ge värdefull information för val av det ideala verktyget för att möta olika forskningsbehov 9 . Emellertid utmanas noggrann detektion och kvantifiering av dessa tillgängliga verktyg av komplexa egenskaper hos miRNA: er och deras föregångare 17, inklusive förekomsten av miRNA-varianter (kallad isomRs), de sekundära strukturerna för miRNA-prekursorerna 9 och den Dicer-medierade behandlingen av miRNA-föregångarna 18, 19 . Därför förblir grundligt förutsägelse och identifiering av miRNA: er, särskilt för de nya miRNA: erna, från den enorma poolen av HTS-data en utmaning för följande funktionella studier på miRNA.

Degradome-sekvensering är ett allmänt använt förhållningssätt för direkt och global identifiering av miRNA-medierade målspjälkning 20, 21, 22 . De miRNA-medierade klyvningsplatserna kan kartläggas med användning av degradom-signaturer 20, och ett omvänt ramverk för ny växt-miRNA-detektion har utvecklats i vårt tidigare arbete, baserat på den degradom-stödda miRNA-klyvningsplatsen och den mycket komplementära miRNA och målen. i växter 22 . Intressant nog har flera nya rapporter visat att en del av nedbrytningssignaturerna kan kartläggas till ändarna av miRNA- och / eller miRNA * -kodningsplatserna på miRNA-prekursorerna. Således spekulerades det att dessa degradome signaturer kan vara bevis för Dicer-medierad bearbetning av miRNA-prekursorerna 20, 23 . Ingen ytterligare undersökning genomfördes dock. I vårt tidigare arbete har kartläggning av degradome signaturer på växtgenomen avslöjat massiva klyvningssignaler 22 . Spännande visade sig att en del av degradom-signaturerna lokaliserades på de kända miRNA-föregångarna. Även om flera miRNA: er indikerades att reglera sina egna föregångare genom klyvningar 24, kunde det inte förklara förekomsten av nedbrytningssignaturer som är mappade till ändarna av miRNA- och / eller miRNA * -kodningsplatserna på föregångarna. Ytterligare undersökningar avslöjade att ett stort antal degradome signaturer på de nyligen identifierade miRNA-prekursorerna i Arabidopsis resulterade från DCL1 (Dicer-liknande 1) -medierade klyvningar, vilket tyder på att behandlingen av miRNA-prekursorer kunde stöds av degradome signaturer 25 . I detta avseende kan degradome sekvenseringsdata användas för systematisk identifiering av DCL1-beroende miRNA och miRNA * loci på deras föregångare i växter. I synnerhet, eftersom miRNA-miRNA * -duplexen frisätts genom Dicer-medierad bearbetning av miRNA-prekursorer i djur 26, kan miRNA och miRNA * loci också stöds av degradome signaturer teoretiskt. I detta scenario kan de degradombaserade bevisen på Dicer-medierade klyvningar öka tillförlitligheten för systematisk detektion av nya miRNA-loki i både djur och växter.

I denna studie inkluderades miRNA-föregångarna till Mus musculus och Arabidopsis thaliana registrerade i miRBase (frisättning 21) för degradombaserad skanning av Dicer-medierade klyvningssignaler. Vi demonstrerade att Dicer-medierad bearbetning av miRNA-miRNA * -duplex kan stöds väl av degradome signaturer. Baserat på resultaten utvecklades en allmänt tillgänglig mjukvara, miRNA Digger, för att genomiskt upptäcka nya miRNA / miRNA * loci på specifika prekursorer i växter och djur. För att demonstrera dess känslighet och tillförlitlighet applicerades miRNA Digger för identifiering av redan kända och nya miRNA från olika vävnader i Arabidopsis .

Resultat

Kända miRNA / miRNA * loci stöds väl av degradome signaturer producerade under Dicer-medierad behandling av miRNA-prekursorer

MiRNA-biogenes börjar med transkription av ett primärt miRNA (pri-miRNA). Hos djur igenkänns och beskärs pri-miRNA av RNase III-enzym Drosha för att producera pre-miRNA (prekursor miRNA), och vidare bearbetas av ett annat RNase III-enzym, Dicer, för att generera ett miRNA-miRNA * -duplex med 2-nt 3 ′ överhäng. I växter utförs denna process av ett enda RNase III-enzym, Dicer-liknande 1 (DCL1) 26 . Efter bearbetning bryts en sträng (miRNA *) av den korta duplexen vanligtvis ned medan den mogna miRNA-strängen införlivas i RISC (RNA-inducerat tystnadskomplex) för att utöva regleringsfunktioner 27 .

Enligt det tidigare arbetet stöttades tusentals DCL1-beroende små RNA (sRNA) loci på sina föregångare av degradome signaturer i Arabidopsis 25 . Vi ansåg att under behandlingen av miRNA-prekursorerna skar Dicer pri-miRNA vid 5 ′ och 3 ′-ändarna av miRNA och miRNA *, och släppte bearbetningsmellanprodukter som kunde detekteras genom degradome-sekvensering. Med ett annat ord kan duplex loci miRNA-miRNA * inom motsvarande föregångare stöds av degradome signaturer.

För att testa denna hypotes rekryterades de kända mogna miRNA: erna och deras motsvarande pre-miRNA av Mus musculus och Arabidopsis thaliana (miRBase release 21). Vi utnyttjade datamängderna för degradome-sekvensbestämning från tidigare studier, inklusive GSM561025, GSM561026, GSM561027, GSM561028, GSM561029 och GSM561030 av Mus musculus [hämtad från GEO (Gene Expression Omnibus); //www.ncbi.nlm. .edu / at_pare /) 28 . Degradom-datauppsättningarna förbehandlades såsom beskrivs i "Material och metoder", och degradom-taggarna kartlades på pre-miRNA: erna av Mus musculus respektive Arabidopsis thaliana för extraktion av de degradombaserade klyvningsbevis (se detaljer i "Material" och metoder ”). När de Dicer-medierade klyvningarna lokaliseras vid 5 'eller 3' ändar av miRNA och miRNA * på motsvarande föregångare, kunde de degradom-stödda Dicer klyvningsplatserna detekteras genom att kartlägga degradom-taggarna till pre-miRNA. Därför sökte vi efter miRNA / miRNA * loci med degradome signaturer kartlade vid antingen 5 ′ eller 3 ′ ändar som ansågs vara de Dicer-medierade beskärningsplatserna.

Resultaten avslöjade att 66 miRNA-miRNA * duplex loci inklusive 123 kända mogna miRNA i Mus musculus , motsvarande 96, 1% av kända miRNA från de 69 motsvarande prekursorerna som innehåller detekterbara degradomeignaturer, var väl stöttade av degradome signaturer som mestadels låg vid 5 ′ Slutet av miRNA / miRNA * (Fig. 1 A, kompletterande tabell S1). Såsom visas i fig. 1C och kompletterande tabell S1, visade sig 140 miRNA-miRNA * duplex loci inklusive 150 kända mogna miRNA, motsvarande 74, 3% av kända miRNA från 182 miRNA-prekursorer som innehåller detekterbara degradom-signaturer, som stöds av degradome signaturer främst belägen vid 5'-änden av miRNA också i Arabidopsis . Emellertid visade sig en fraktion av degradomeignaturer kompensera från 5'- eller 3'-ändarna av miRNA-miRNA * -duplex med 1 till 3 nt (fig. IB, D). Detta fenomen kan orsakas av Dicer-medierad alternativ beskärning av pre-miRNA 17 . Sammantaget visade ovanstående resultat att en stor del av miRNA / miRNA * -lägena kunde stödjas väl av degradome signaturerna.

Frekvensen för degradesignaturer inträffade vid olika ändar ① (5 ′ slutet av miRNA), ② (3 ′ slutet av miRNA), ③ (5 ′ slutet av miRNA *) och ④ (3 ′ slutet av miRNA *) (markerat med rött pilar) av utvunna kända miRNA inom motsvarande föregångare i Mus musculus ( A ) och Arabidopsis ( C ) uppskattades och var närvarande i figurerna. Om två eller flera nedbrytningssignaturer detekterades lokaliserande vid 5 ′ / 3 ′-ändar av en känd miRNA-miRNA * -duplex, ansågs dessa klyvningsställen ha lika fördelning när upptäckten av denna miRNA-miRNA * -duplex. Frekvensen för nedbrytningssignaturer inträffade vid migrationsställena för 5 ′ / 3 ′-ändar av kända miRNA-miRNA * -duplexer på deras pre-miRNA i Mus musculus ( B ) och Arabidopsis ( D ) utvärderades och profilerades. Varje ände av duplexen inställdes som klyvningsplats "0", och migrationsplatserna belägna vid dess uppströms är inställda som −1, −2 och −3, och nedströms är inställda som + 1, + 2 och +3.

Bild i full storlek

Översikt över miRNA Digger-pipeline

Baserat på ovanstående observation utvecklade vi miRNA Digger, en mjukvara för genomomfattande gruvdrift av nya miRNA-miRNA * loci i djur och växter, genom att använda de degradom-stödda Dicer-beskärningsplatserna som "guidepost". En översikt över miRNA Digger-algoritmen visas i fig. 2. Kortfattat börjar miRNA Digger från skanningen av degradom-signaturerna på både sens- och antisense-strängar i de genomiska sekvenserna. Sedan extraherar den potentiella miRNA-prekursorer baserade på degradome signaturer följt av sekundär strukturprognos. Endast de miRNA-föregångskandidaterna med hårnålliknande strukturer behålls. Sedan mappas kortläsningarna av sRNA från HTS-datauppsättningar på dessa kandidater för att identifiera miRNA-miRNA * -duplexen. AGO-anrikningsanalys, ett valfritt filtreringssteg, tillhandahålls för att extrahera AGO-associerade miRNA. Slutligen rapporterar miRNA Digger de kända och nya miRNA-miRNA * -duplexen och motsvarande pre-miRNA.

Bild i full storlek

Mer detaljer, indelar miRDigger initialt de genomiska sekvenserna i 10 000 nt-fragment med överlappningar av 500 nt. Degradom-taggarna kartläggs på 10 000 nt-fragmenten för att erhålla degradom-signaturerna (se "Extraktion av degradom-signaturerna" i "Material och metoder") och deras positioner på genomet. Två pre-miRNA-kandidater med (30 + L) nt i längd kommer att erhållas baserat på en enda potentiell klyvningsplats (fig. 2). De sekundära strukturerna för varje pre-miRNA-kandidater förutsagdes med användning av RNAfold. Baserat på förutsägelserna behåller miRNA Digger de pre-miRNA-kandidater som innehåller klassiska stam-loop-strukturer (se "RNAfold-baserad sekundär strukturidentifiering" i "Material och metoder").

Baserat på biogenesmodellen för miRNA kan beskärning av en föregångare av Dicer resultera i produktionen av en miRNA och en miRNA * 26 . Och små variationer på Dicer-igenkänningsplatserna på miRNA-prekursorer kan resultera i generering av miRNA-centrerade isomiR-kluster tillsammans med miRNA * -centrerade isomiR * -kluster 22 . I detta avseende behåller miRNA Digger potentiella pre-miRNA som innehåller detekterbara miRNA-miRNA * duplex (se "Screen of potential pre-miRNAs" in "Material and Methods").

Det är välkänt att miRNA utövar sin reglerande funktion genom att införliva i AGO-associerade RISC: er. Flera nya rapporter har emellertid avslöjat att ett betydande antal AGO-associerade miRNA * har biologiska reglerande roller 20, 22, 29 . Därför rekommenderas det valfria steget "AGO-anrikningsanalys" starkt om de AGO-associerade sRNA HTS-datauppsättningarna är tillgängliga. Således behåller miRNA Digger miRNA-miRNA * duplex som innehåller AGO-anrikat miRNA (*), vilket kan ge forskare värdefulla tips för ytterligare undersökningar.

Slutligen skickar miRNA Digger ut en rapport som innehåller information om de pre-miRNA-kodande loci på genomet (som kan användas som deras ursprungliga identitet), de degradome signaturerna loci på pre-miRNA: er, sekvenserna och läsberäkningarna (i RPM) av miRNA och miRNA * s, miRNA-miRNA * duplexen lokaliseras inom motsvarande pre-miRNA, och sekvenserna och de sekundära strukturerna av pre-miRNA. Om en miRNA (*) -sekvens har registrerats i miRBase kommer dess namn att matas ut samtidigt.

Mjukvarupaketet miRNA Digger finns på //www.bioinfolab.cn/miRNA_Digger/index.html. Dessutom har den flera hjälpprogram för dataförbehandling. SRNA HTS-datauppsättningar och degradome sekvenseringsdatasatser bör förbehandlas med alternativet "HTS Data Process" (se "förbehandling av sekvenseringsdata med hög kapacitet" i "Material och metoder") innan de kan användas för nya miRNA-miRNA * duplexgrävning. Den nedladdade kromosomsekvensfilen bör separeras i flera filer med alternativet "Kromosomprocess" (varje fil innehåller en kromosomsekvens i fasta-format). Alternativet "miRBase Update" länkar till miRBase-databasen, som kan användas för att ladda ner den senaste versionen av registrerade mogna miRNA och pre-miRNA av olika arter. MiRNA Digger är designad för Windows System (Vista, Win7 eller avancerade versioner). Eftersom den degradombaserade skanningen av klyvningssignaler är en tidskrävande uppgift, kan flera veckor krävas för att skanna en enda kromosom. För att minska den totala driftstiden är således miRNA Digger utformad för att köra flera algoritmer parallellt. Om dessutom de löpande uppgifterna tyvärr bryts under en speciell situation, kan miRNA Digger fortsätta de oavslutade uppgifterna när de startas om.

Fallstudie: upptäckt av nya miRNA från olika vävnader av Arabidopsis

För att uppskatta känsligheten för miRNA Digger användes den vidare för upptäckt av miRNA-miRNA * -duplex från åtta tidigare rapporterade sRNA HTS-datauppsättningar av Arabidopsis . Sedan rekryterades alla de förutsagda nya miRNA: erna och miRNA *: erna för identifiering av miRNA-målinteraktioner.

SRNA HTS-datauppsättningarna från blommorna (sex veckor gamla växter av vildtyp, GSM707678; AGO1-associerat sRNA, GSM707682), bladen (fyra veckor gamla växter av vildtyp, GSM707679; AGO1-associerat sRNA, GSM707683), rötterna (fyra veckor gamla växter av vildtyp, GSM707680; AGO1-associerat sRNA, GSM707684) och plantorna (plantor av vildtyp, GSM707681; AGO1-associerat sRNA, GSM707685) från Arabidopsis bidrog av Wang et al. 30 . De genomiska DNA-sekvenserna för Arabidopsis hämtades från Arabidopsis Information Resource (TAIR, release 10). Åtta nedbrytande datauppsättningar (AxIDT_raw, AxIRP_raw, AxSRP_raw, Col_raw, ein5l_raw, TWF_summary och Tx4F_summary) hämtades från PARE (//mpss.udel.edu/at_pare/) 28 . Datasätten för sRNA HTS och degradome-sekvensering förbehandlades med användning av "HTS Data Process" -alternativet, och de genomiska DNA-sekvenserna (kromosom 1 till kromosom 5) förbehandlades med hjälp av alternativet "Kromosomprocess". Sedan importerades alla förbehandlade datamängder till miRNA Digger. Som ett resultat identifierades 76 av 176, 74 av 153, 71 av 132 och 74 av 183 kända miRNA-miRNA * -duplexer från respektive blommor, löv, rötter och plantor (fig. 3 och kompletterande) tabell S2). Det indikerar att en stor del av de uttryckta miRNA-miRNA * -duplexen kunde upptäckas av miRNA Digger. Observera att även om dessa sRNA HTS-datauppsättningar har intensivt bryts ut för miRNA 30, 31, 32 miRNA Digger fortfarande upptäckt 24, 25, 21 och 22 nya miRNA-miRNA * duplex i blommor, löv, rötter respektive plantor (Fig. 4, kompletterande tabell S3 och kompletterande figur S1).

Det totala antalet uttryckta kända miRNA-miRNA * -duplex i olika vävnader av Arabidopsis visades i blå kolumner och antalet återvunna miRNA-miRNA * -duplex med miRNA Digger visades i orange gula kolumner.

Bild i full storlek

De degradom-stödda nya miRNA-1 / miRNA-1 * loci inom motsvarande pre-miRNA visades i panel A. MiRNA-1-sekvenserna markerades med röd linje, miRNA-1 * markerades med blå linje, och degradome-signaturlokorna markerades med pilar. Uttrycksnivån för miRNA-1 / miRNA-1 * i olika vävnader listades i panel B. Den degradome sekvenseringsdatabaserade valideringen av miRNA-målinteraktioner visades i panel C, där två bibliotek med degradome sekvenseringsdatabibliotek (TWF_summary och Tx4F_summary) rekryterades för T-plot-profilering (a till f). Måltranskriptens ID: n listades på toppen. Y- axlarna mätte de normaliserade avläsningarna (i RMP, läs per miljon) av degradesignalerna, och x- axlarna representerade positionen för klyvningssignalerna på måltranskripterna. Bindningsställena för miRNA-1 på dess måltranskript betecknades med grå horisontella linjer, och de dominerande klyvningssignalerna markerades med svarta pilar.

Bild i full storlek

Alla miRNAs och miRNA * från dessa nyupptäckta miRNA-miRNA * -duplex rekryterades för målförutsägelse med hjälp av miRU-algoritm 33 och följdes sedan av degradom-baserad identifiering av miRNA- målinteraktioner 20, 22 . Som ett resultat validerades 11 nya miRNA-målinteraktioner som involverade sex nya miRNA (tabell 1 och kompletterande figur S2).

Full storlek bord

Bland dem visade sig att miRNA-1 riktade sig till en RNA-processeringsfaktor 2 (RPF2) -gen (AT1G62670.1), tre PPR- gener (AT1G62860.1, AT1G62910.1 och AT5G16640.1) och två TPR- gener (AT1G62930.1 och AT1G63130.1). RPF2-proteinet har avslöjats innefattande i generering av en distinkt 5'-terminus av transkript av underenhet 9 i NADH DEHYDROGENASE-komplexet (nad9), och RPF2 bestämmer också effektiviteten för 5'-ändbildning av mRNA för underenhet 3 i CYTOCHROME C OXIDASE (cox3), i Arabidopsis 34 . TRP- och PPR-proteinerna är vida spridda på Arabidopsis och reglerar RNA-mognad, dessutom anses TPR-proteinerna också fungera i protein-proteininteraktion 35 . miRNA-2 detekterades inriktning på en Argonaute 2 (AGO2) kodande gen, AT1G31280.1, som har avslöjats spelar en viktig roll i antibakteriella immunsvar i Arabidopsis av Jin och hans lagkamrater 36, 37 .

miRNA-3 detekterades för att rikta in en mRNA-begränsande enzymfamiljeproteinkodande gen, AT3G09100.1. Eukaryota mRNA-begränsande enzymer är bifunktionella och bär både RNA-trifosfatas (RTPas) och guanylyltransferas (GTase) aktiviteter, vilket är väsentligt för genuttryck 38, 39 .

Den transponerbara elementgenen AT5G33223.1, som bidrar till växtgen- och genomutvecklingen 40, befanns vara reglerad av miRNA-4. miRNA-5 reglerar en MKK9-gen som har avslöjats fungerar som en negativ regulator av det abiotiska stressresponset i Arabidopsis . miRNA-6 visade sig vara målgener (AT3G54990.1, AT4G36920.1, AT5G04275.1, AT5G60120.1 och AT5G60120.2) involverade i växtutveckling, AT3G54990.1 och AT4G36920.1 kodande integras-DNA-bindande superfamiljeproteinprotein, som har avslöjats kan reglera utvecklingen av växtutvecklingscykeln 41 . miR172b (AT5G04275.1) kontrollerar övergången till autotrofisk utveckling av Arabidopsis 42 . Målen för tidig aktivering taggad (EAT) 2, AT5G60120.1 och AT5G60120.2 har avslöjats involverat i blomning och förändring av fenotyp av Arabidopsis 43 .

Ovanstående resultat indikerade att miRNA Digger framgångsrikt kunde återhämta de kända miRNA-miRNA * duplexen och motsvarande pre-miRNA med rimlig känslighet (52–61%). För det andra, genom att rekrytera HTS-datauppsättningar, kunde miRNA Digger utföra genombredd genomsökning för att söka efter de nya miRNA-miRNA * -duplexen. Slutligen, även om de använda datauppsättningarna redan har utvunnits specifikt för miRNA 22, 30, förutspår miRNA Digger fortfarande 30 nya miRNA-miRNA * -duplexer, och sex av dem identifierades för att spela viktiga reglerande funktioner i Arabidopsis . Därför är miRNA Digger ett känsligt och tillförlitligt verktyg för genomomfattande förutsägelse av nya miRNA-miRNA * -duplexer.

miRDeep är en populär mjukvara för miRNA-detektion baserad på den biologiska modellen för Dicer-medierad behandling av miRNA-prekursorerna 44 . miRPlant är ett växtspecifikt verktyg för upptäckt av miRNA baserat på den liknande algoritmen 45 . För att testa funktionaliteten hos miRNA Digger, jämförde vi alla miRNA som upptäckts av miRNA Digger från blommorna i Arabidopsis (tilläggstabell S2a och S3a) med de rapporterade av miRDeep och miRPlant med ett extra AGO1-anrikningsfiltersteg (tilläggstabell) S4 och S5). Som resultat återvanns 76, 74 och 54 kända miRNA-miRNA * -par, resp. MiRNA Digger, miRDeep respektive miRPlant. Emellertid återhämtades endast 26 kända par med alla tre verktygen, och 38 kända par utvanns specifikt av miRNA Digger (fig. 5A). Resultaten indikerade att miRNA Digger presenterade en annan känslighet och specificitet för miRNA-detektering genom att förlita sig på algoritmen för att hitta degradom-stödda Dicer-klyvningsplatser. Dessutom upptäcktes 24, 38 och 14 nya miRNA-miRNA * -par också av miRNA Digger, miRDeep respektive miRPlant. Men inga miRNA-kandidater upptäcktes av alla dessa tre verktyg (Fig. 5B).

Antalet avslöjade kända ( A ) och nya ( B ) miRNA-miRNA * -par av miRNA Digger, miRDeep och miRPlant profilerades med venndiagram.

Bild i full storlek

Diskussion

Olika bioinformatikverktyg har utvecklats för systematisk upptäckt av nya miRNA, men dessa tillgängliga verktyg verkade varierande känslighet och specificitet vid miRNA-detektion bland olika arter 9, 44 . I den här studien föreslog vi en ny algoritm för detektion av miRNA-miRNA * -duplex från sRNA HTS-data baserat på genomisk bred skanning av degradom-stödda Dicer / DCL1-beskärningsplatser på genom av djur / växter. Även om liknande med miRNA Digger som, miRDeep och miRPlant upptäcker miRNA baserat på processmekanismen för miRNA-föregångare av Dicer, är de helt beroende av sRNA HTS-datauppsättningarna. Men vår metod har fördelen att hitta bevis på Dicer-medierad klyvning på miRNA-prekursorer, vilket minskar störningen av andra icke-Dicer-bearbetade sRNA och ger en annan känslighet och specificitet för upptäckten av miRNA. Därför är algoritmen för miRNA Digger ett bra komplement av de tidigare algoritmerna med avseende på att gräva miRNA-gener från tillgängliga sRNA HTS-data. Eftersom det dessutom är första gången att de degradom-stödda Dicer-klyvningsplatserna skannades rapporterade integrerade i kärnhjärtat i en algoritm för detektering av miRNA, tror vi att jämfört med de tidigare rapporterade algoritmerna kan miRNA Digger upptäcka miRNA-miRNA * duplexer mer säkert med dessa ytterligare kriterier.

Känsligheten för miRNA Digger bestäms också av tillgängligheten och djupet av degradom-sekvenseringsdata och sRNA HTS-data. Därför är miRNA Digger databasstödd, och framstegen inom området för nästa generations sekvensering kommer i hög grad att bidra till effektiviteten hos miRNA Digger. Eftersom tillämpningen av degradom-sekvenseringsteknologi fokuserade på valideringen av miRNA- målinteraktion tidigare 20, 21, 22, 23, 24, utvidgade konstruktionen och tillämpningen av miRNA Digger för miRNA-gruvdrift dess applikationsområde avsevärt.

Ytterligare förbättringar av miRNA Digger kommer att utföras i vårt framtida arbete inklusive förbättring av graden av degradom-baserade klyvningssignaler genom att integreras med andra algoritmer för att reducera hela behandlingstiden för upptäckt av miRNA. Dessutom är miRNA Digger utformad endast för genomsökning i denna studie, ytterligare förbättringar gör det möjligt att mata in uttryckt sekvenstagg (EST) för analys, när ingen genomsekvensering är tillgänglig.

Slutsats

Vi utvecklade ett nytt verktyg, miRNA Digger, för miRNA-upptäckt från olika prover av djur och växter, baserat på bevisen på att Dicer / DCL1-beskärningsplatserna på pre-miRNA kan stödjas väl av degradome signaturerna. miRNA Digger testades och visade sig kunna både återhämta majoriteten av kända miRNA-miRNA * duplex som finns i heterogena prover, och rapportera nya miRNA med stort förtroende, vilket indikerar att miRNA Digger kan användas i stor utsträckning för nya miRNA-upptäckt och undersökning av gen regleringsmekanism i både djur och växter.

anslutningar

Genuttryck Omnibus

  • //www.ncbi.nlm.nih.gov/geo/

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.