Analys av brödvete genom med hjälp av sekvensering av helgenom hagelgevär | natur

Analys av brödvete genom med hjälp av sekvensering av helgenom hagelgevär | natur

Anonim

ämnen

  • DNA-sekvensering
  • Växtgenetik

Abstrakt

Brödvete ( Triticum aestivum ) är en globalt viktig gröda och står för 20 procent av de kalorier som konsumeras av människor. Stora ansträngningar pågår över hela världen för att öka veteproduktionen genom att utvidga den genetiska mångfalden och analysera viktiga egenskaper, och genomiska resurser kan påskynda framstegen. Men hittills har brödvete-genomets mycket stora storlek och polyploida komplexitet varit betydande hinder för genomanalys. Här rapporterar vi sekvenseringen av det stora, 17-gigabas-paret, hexaploid genomet med 454 pyrosekvensering, och jämförelse av detta med sekvenserna av diploida förfäder- och förfädergenom. Vi identifierade mellan 94 000 och 96 000 gener och tilldelade två tredjedelar till de tre komponentgenerna (A, B och D) hexaploidvete. Syntenikartor med hög upplösning identifierade många små störningar i bevarad genordning. Vi visar att hexaploidgenomet är mycket dynamiskt, med betydande förlust av genfamiljemedlemmar på polyploidisering och domesticering och ett överflöd av genfragment. Flera klasser av gener som är involverade i energiskörd, metabolism och tillväxt hör till utvidgade genfamiljer som kan vara förknippade med grödsproduktivitet. Våra analyser, i kombination med identifiering av omfattande genetisk variation, ger en resurs för att påskynda genupptäckten och förbättra denna stora gröda.

Huvudsaklig

Med en global produktion på 681 miljoner ton 2011 1 står brödvete för 20% av de kalorier som konsumeras av människor 2 och är en viktig källa till protein, vitaminer och mineraler. Det härstammade från hybridisering mellan odlat tetraploid emmervete (AABB, Triticum dicoccoides ) och diploid getgräs (DD, Aegilops tauschii ) för cirka 8 000 år sedan 3 . Brödveteodling och odling har varit direkt förknippad med spridningen av jordbruk och bosatta samhällen, och det är nu en av de mest odlade grödorna på grund av dess höga avkastning och närings- och bearbetningskvaliteter. De tre diploida avkommande genomerna, AA från Triticum urartu , BB från en art som är okänd men som kan vara av sektionen Sitopsis (till vilken Aegilops speltoides tillhör) och DD från Ae. tauschii , strålade från en vanlig Triticeae-förfader mellan 2, 5 och 4, 5 miljoner år sedan, och AABB-tetraploider uppstod för mindre än 0, 5 miljoner år sedan 4, 5 . Nukleotidmångfalden i AABB- och DD-genomerna reduceras väsentligt jämfört med förfäderpopulationer, vilket indikerar en flaskhals för mångfalden vid övergången till odlade linjer 6 .

Grasgenom visar omfattande långsiktigt bevarande av genordning 7, 8, 9 . Ändå är de mycket dynamiska på grund av aktiviteterna med upprepningar som bidrar till enorm variation i genomstorlek 10, förändringar i lokal genordning och pseudogenbildning, särskilt i större genom såsom majs 11 och vete 12 . Från analys av BAC-konti på kromosom 3B beräknades 17-gigabas-paret (Gb) genom att vara sammansatt av cirka 80% upprepningar, främst retroelement, med en gentäthet mellan 1 per 87 kilobaspar och 1 per 184 kilobaspar 13 . Trots både den väsentliga kunskapen som har uppnåtts om vete genomet från dessa studier och den viktiga vikten av vete grödan, har en omfattande genomomfattande analys av genhalten ännu inte genomförts på grund av dess stora storlek, upprepade innehåll och polyploidkomplexitet.

Vi har analyserat en lågtäckande, långläst (454) hagelgevärsekvens av hexaploidvete genom genom gensekvenser från olika gräs. Från detta skapade vi sammansättningar av vete gener i ett ortologt genfamiljeram, använde diploida vete släktingar för att klassificera homeologa förhållanden och definierade en genombredd katalog med enstaka nukleotidpolymorfismer (SNP) i A-, B- och D-genomen. Dessa analyser ger en grund för genetisk och genomisk analys av denna nyckelgröda.

Sekvensanalys

Vetesorten Chinese Spring (CS42) valdes för sekvensering på grund av dess breda användning i genomstudier 14, 15 . Renat kärn-DNA sekvensbestämdes med användning av Roche 454-pyrosquencing-teknik (GS FLX Titanium och GS FLX + -plattformar) för att generera 85 Gb sekvens (220 miljoner läsningar), motsvarande ungefär femfaldig täckning på basis av en uppskattad genomstorlek på 17 Gb. Kompletterande tabell 1 visar att 79% av läsarna hade matchningar till Triticeae Repeat Sequence Database, och de flesta träffade retrotransposoner, i överensstämmelse med tidigare studier 13 . För att identifiera A-, B- och D-genom-härledda genenheter i hexaploidsekvenserna, använde vi Illumina-sekvenssamlingar av Triticum monococcum , relaterade till A-genom-donorn, Ae. speltoides komplementära DNA (cDNA) -enheter och 454 sekvenser från D-genomgivaren Ae. respektive tauschii . SOLiD-plattformen användes för att generera ytterligare sekvenser av CS42 och tre kommersiella vetesorter för att öka noggrannheten för homeolog SNP-identifiering. Datauppsättningar sammanfattas i tabell 1 och kompletterande tabell 2, och SNP-identifieringsmetoder beskrivs i kompletterande information, avsnitt 5.2.

Full storlek bord

Sekvensmontering

En ortolog gruppsamling (kompletterande tabell 3) skapades genom klustering av 454 läsningar genom sekvenslikhet med ortologa gräsgen-sekvenser och separat montering av klusterna med hög stringens med användning av Newbler (Supplerande information, avsnitt 2). De ortologa generna härrörde från ris 16, sorghum 8, Brachypodium 9 och korn i full längd med cDNA genom OrthoMCL 17- klustering. Detta genererade 20 496 ortologa grupper (kompletterande tabell 4 och kompletterande figur 1). Genmodellen med högsta likhet med vete (benämnd den ortologa grupprepresentanten (OGR)) valdes från varje ortolog grupp genom stringent BLASTX-jämförelse med en genomsamling med låg kopia-nummer (LCG) framställd genom att filtrera ut repetitiva sekvenser och sammansätta de återstående sekvenser med lågt kopieringsnummer de novo (kompletterande tabell 3). Föreningarna beskrivs i tabell 2. Nästan 90% av de metaboliska generna i Arabidopsis matchade OGR och 20 051 OGR matchade 92% av offentligt tillgängliga vete i full längd cDNA 18 och 78, 7% av den skörde uppsättningen av vete cDNA-enheter (kompletterande fig 2), vilket indikerar att de representerar nästan alla vetegener.

Full storlek bord

Vi optimerade parametrar för vete-genmontering med användning av MetaSim 19 för att generera simulerad femfaldig 454 läsning från det allotetraploida majsgenomet och från en triplicerad risgenuppsättning, med introduktionen av sekvensvariation (Kompletterande information, avsnitt 2.7). Liknande täckningsgrader över OGRs sågs för de simulerade datamängderna och vete 454 avläsningar (fig. 1a). Risläsningar följde samma djupfördelning som vetet läser (fig. Ib), vilket antyder att de är en rimlig representation av hexaploidsekvenser. Majsläsningar täckte sina OGR: er till ett mediandjup av cirka fem, i överensstämmelse med femfaldigt täckning.

Image

a, täckning av OGR: er med repeterad maskerad vete 454-sekvensläsning (svart linje), vete-LCG (svart streckad linje) och den ortologa gruppsammansättningen (blå linje), tillsammans med risgener (röd linje) och majs simulerade läsningar (grön linje ). b, Mediantäckningsdjup över proteinkodande regioner av OGR: er (aminoterminal = 0; karboxiterminal = 100). Färgkodningen är densamma som i en, förutom att simulerad hexaploidavläsning från ris (röd linje) användes. c, Distribution av vete-genkopieringsnummer från den ortologa gruppsamlingen.

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Simulerad majs och triplicerade ris 454 läsningar användes för att optimera monteringsparametrarna. Församling vid 99% minsta sekvensidentitet (mi) med 40-bp överlappningslängd förutsagda genfamiljestorlekar mest exakt (kompletterande figurerna 3-6). Vete 454 avläsningar förbehandlades (tilläggstabell 5) och monterades med användning av 99% mi (kompletterande tabeller 6 och 7) för att skapa den ortologa gruppaggregatet. Figur Ib visar att täckningsdjupet för den ortologa gruppsamlingen följde ett liknande mönster som majs, i överensstämmelse med flera genkopior. Däremot antydde LCG-församlingens låga djup att antalet genfamiljer kollapsades. Antalet veteenheter för varje OGR beräknades för att bestämma genkopieringsnummer (kompletterande tabell 7). Figur 1c visar att de flesta OGR: er hade mellan en och fem distinkta vete-genenheter, med en topp på två gener.

A, B och Ae. tauschii (D) genom 13, 20, 21 har uppskattats innehålla ungefär 28 000, 38 000 respektive 36 000 gener. Vi uppskattade antalet gener i hexaploidvete genomet till mellan 94 000 och 96 000 (Kompletterande information, avsnitt 2.10). Detta överensstämmer rimligt med uppskattningar baserade på vete-kromosomsekvenser 13 . Jämförelse av vår transkriptomsamling (kompletterande information, avsnitt 2.8 och 2.9) och vete-skörd med vete OGR: er visade att 76% respektive 65% uttrycktes under de villkor som användes för RNA-isolering. Liknande resultat hittades i korn 22, ris 16 och majs 23, vilket indikerar att aggregaten är bona fide vete gener.

Vi definierade den övergripande omfattningen av genbevarande mellan vete och det mest besläktade sekvenserade pooidgräset, Brachypodium distachyon 9, 24 . Spår 1 i fig. 2 visar att det finns en hög grad av överlappning mellan genuppsättningarna av Brachypodium och vete, men med regioner med lägre konservering, till exempel på Brachypodium- kromosomerna 1 och 4. Synteniska kartor över Brachypodium- genomet och A- B- och D-kromosomgrupper skapades genom att integrera hög-densitetsvete EST-baserade markörer 25 med Brachypodium- gener (fig. 2, spår 5, 6 respektive 7). Kompletterande figur 7 visar A-, B- och D-genommarkörerna separat. Synteniska justeringar kunde lätt identifieras och överensstämde med de förutsagda huvudmönstren 9, 26 . Vi identifierade många insertioner och / eller translokationer av block av gener inom de övergripande konserverade mönstren av genordning, inklusive den stora omarrangemanget på kromosom 4A som visas på Brachypodium kromosom 1 (ref. 20). Lägre markördensitet på D-genomet är tydligt i spår 7. Den genetiska kartan med högre upplösning identifierade en ny syntenisk anpassning av Triticeae-grupp 5 till Brachypodium kromosom 3-gener.

Image

Den inre cirkeln representerar genordning på de fem Brachypodium- kromosomerna (Bd1 – Bd5). Spår 1 illustrerar bevarande mellan vete 454 avläsningar och Brachypodium gener, visade som ett fönster av gener som finns i vete. Spår 2–4 visar SNP-densitet (medelantalet SNP per gen i ett fönster med 20 gener) i A (spår 2), B (spår 3) och D (spår 4) genom av vete. Spår 5–7 visar vete-synteny med Brachypodium för A (spår 5), B (spår 6) och D (spår 7) genom. Genetiska markörer 25 (visas i mörkare färger) är färgkodade av vete-kromosom. Avstånd mellan markörer fylls i för att visa synteny (ljusare färger).

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Genomförändring i polyploid vete

Vi bestämde påverkan av polyploidy på genhalten i hexaploidvete genom att definiera storleken på genfamiljer i hexaploidvete och diploidförfäder Ae. tauschii från kopietalet gener för varje OGR, som sedan parades med genfamiljstorleken för OGR i sekvenserade diploidgräs (Kompletterande information, avsnitt 2.6). Den genomsnittliga familjestorleken var 1, 4 medlemmar. Kompletterande fig. 8 visar förhållanden mellan vete och diploid ortolog genfamilj över hela skalan av ortolog genfamiljestorlekar. Detta tillvägagångssätt rekonstruerade genfamiljestorlekar i simulerade majs och "hexaploid" risgenom (fig 3a, b), även om större genfamiljestorlekar tenderade att underskattas. Figur 3c, d visar förhållandena mellan Ae. gener av tauschii och vete. Genfamiljer med en medlem i hexaploidvete och Ae. tauschii bibehölls i samma utsträckning som de som sågs i sekvenserade diploida gräs, i överensstämmelse med Southern blot-analyser av enkelkopierade gener 27 . Med användning av D-genomet som en diploidreferens beräknade vi Triticeae hexaploid / diploid-genstorleksförhållandet till att vara mellan 2, 5: 1 och 2, 7: 1, härrörande från det geometriska medelvärdet (2, 5: 1) och sluttningarna för den blå linjen och röd linje (2.7: 1) i fig. 3e. Jämförelse av detta med det förväntade hexaploid / diploid-förhållandet 3: 1 indikerar förlusten mellan 10 000 och 16 000 gener i hexaploidvete jämfört med de tre diploida föräldrarna (kompletterande information, avsnitt 2.10). Detta överensstämmer med tidigare studier av genförlust i nyligen syntetiserade vetepolyploider 28 och erosionen av den genetiska mångfalden under vetehemning 6 .

Image

Lådorna och visporna innehåller 50% respektive 90% av de ortologa gruppmonteringsgenerna. Rutfärgerna anger antalet gener i diploida genfamiljer av olika storlekar. De svarta linjerna representerar förväntade genfamiljestorlekar, och de röda linjerna visar genfamiljestorlekarna bestämda från den ortologa gruppsamlingen, härledda genom polynomregression. Endast genfamiljer med upp till tio medlemmar visas. a, Majsgenfamiljestorlekar förutsagda från ortolog sammansättning av simulerade 454 läsningar. b, Rice-genfamiljestorlekar förutsagda från ortolog sammansättning av simulerade 454 läsningar härrörande från triplicerade risgener. c, Aegilops tauschii- genfamiljestorlekar erhållna från ortolog sammansättning av upprepade maskade 454 läsningar. Expanderade genfamiljer visas som gröna prickar. d, Vetgenfamiljestorlekar i den ortologa gruppsamlingen. e, sammanslagning av vete och Ae. tauschii genkopieringsnummer. Den svarta linjen visar respektive förväntade genkopieringsnummer för vete och Ae. tauschii . Den röda linjen visar regressionspassningen för vete, och den blå linjen visar regressionspassningen för Ae. tauschii . Den grå zonen mellan dessa linjer uppskattar omfattningen av genförlust i hexaploidvete. För varje familjestorlek representerar de vänstra lådorna hexaploidvete och de högra lådorna representerar Ae. tauschii .

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Trots denna övergripande trend med minskning av genfamiljestorlek identifierades genfamiljer med färre eller fler medlemmar än väntat i Ae. tauschii och hexaploidvete, såsom visas av gröna prickar (fler medlemmar) och bruna prickar (färre medlemmar) i fig. 3c ( Ae. tauschii ) och fig. 3d (hexaploidvete). Kompletterande tabeller 10–12 visar de över- och underrepresenterade funktionella kategorierna av protein. De flesta av de överrepresenterade kategorierna i utvidgade genfamiljer är vanliga för vete och Ae. tauschii : dessa inkluderar ribosomproteiner, komponenter i fotosystem II, lagringsproteiner, transposonrelaterade proteiner, cytokrom P450, NB-ARC-domänproteiner involverade i försvarssvar, proteiner relaterade till pollenallergener och F-boxproteiner. Fem av de elva familjerna som kodade vätejontransmembrantransportörer var betydligt fler i Ae. tauschii än i vete. Analys av genfamiljer (kompletterande figur 9) visade att de kodar för olika subenheter av ATPaser. Vi spekulerar i att de kan tillhandahålla protongradienter för att stödja Na + -uteslutning i Ae. tauschii 29 och ackumulering av mineraler i andra Aegilops- arter 30 .

Pseudogenanalys

Flera klasser av växt-DNA-transposoner 31, 32 och retroelement 33 skapar och förstärker genfragment, stör gener och skapar pseudogener, som kan påverka genuttryck genom epigenetiska mekanismer 34 . Vi identifierade en uppsättning av nästan 233 000 genfragment som mappades till samma regioner i deras OGR: er, och bildade "staplar" som var tillräckligt divergerande för att inte kunna samlas i deras kognata genenheter (Fig. 4a). Två klasser identifierades: de som innehöll Pfam-domäner och de som var i linje med icke-Pfam-domäner för OGR: er. Nästan 30% av OGR: erna hade associerade genfragment (kompletterande tabell 13) som oftast täckte mellan 5 och 15% av OGR-längden (fig. 4b). Fig. 4c visar att justeringsidentiteterna för genfragment mot deras OGR: er var väsentligt lägre än identiteten för kognatregioner inom vetegenenheter. Kompletterande figur 10 visar fördelningen av staplar längs generna och förhållandet mellan icke-synonyma och synonyma substitutioner ( Ka / Ks ) längs generna. Pfam-domäner som finns i staplar berikades för zink-fingermotiv i mutatortransponeringar (kompletterande tabell 14), i överensstämmelse med deras roll i pseudogenbildningen 31 . F-box-, proteinkinas- och NB-ARC-domäner, som finns i de snabbast utvecklande genfamiljerna i växter 9, 35, är också överrepresenterade .

Image

a, Visualisering av en OGR och tillhörande vete-sekvenser. Det översta spåret visar träffarprofilen för kartlagda 454 läsningar. De nedre spåren visar underenheter av tre vetegener och en staplad region av genfragment. Läsdjupet representeras av värmekartan. b, täckning av OGR genom Pfam-innehållande genfragment och pseudogener. De blå och röda linjerna representerar staplar med respektive utan proteindomäner. c . Proteinidentitet mellan underenheter som bildar staplar av genfragment. De blå och röda linjerna representerar staplar med respektive utan proteindomäner och den svarta linjen representerar underenheter som bildar gener.

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Fastställande av homologa förhållanden mellan genenheter

Vi klassificerade genenheter som A-, B- eller D-genom härledda enligt sekvenslikhet med Illumina-sekvenssamlingar från T. monococcum , cDNA-enheter från Ae. speltoides respektive 454 läsningar från Ae. tauschii genom att tillämpa en stödvektor för maskininlärningsmetod (kompletterande avsnitt 5, kompletterande figur 11 och 12, och kompletterande tabeller 15–18). Kompletterande figur 13 visar att 66% av genenheterna klassificerades med hög total precision (> 70%) och återkallade till A-genomet (28, 3%), B-genomet (29, 2%) och D-genomet (33, 8%). De övriga 9% av klassificerade enheter har stoppkodoner. De andra 34% med låg klassificeringssannolikhet kommer sannolikt att vara mycket lika homeologer. Jämförelse med en undergrupp av A-, B- och D-genom SNP: er bekräftade 72% av A-genom-klassificeringar och 85% av D-genom-klassificeringar (fig. 2 och kompletterande tabell 19). Diskriminering av förmodade B-genomgener var endast ∼ 60%, möjligen på grund av användningen av cDNA-sekvenser för klassificering när de flesta av de informativa sekvenspolymorfismerna är introniska, och till osäkerhet om B-genomets 5 härkomst. Uppsättningen av 132 552 SNP tilldelade A-, B- och D-genomen visas med hjälp av Brachypodium som en mall i spår 2–4 i fig. 2.

Det fanns inga signifikanta skillnader mellan respektive distribution av GO Slim molekylära funktionskategorier i A-, B- och D-generna (kompletterande figur 14), vilket indikerar att det vid denna nivå av funktionell kategorisering inte finns någon partisk genförlust 36 i någon av genomerna . Icke desto mindre visade analys av GO Slim-termer förknippade med stoppkodoner i A-, B- och D-genenheter att det fanns en stark tendens att behålla funktionella kopior av gener som kodar transkriptionsfaktorer i alla tre genomerna (kompletterande fig 15), liknande det föredragna bibehållande av dessa gener i Arabidopsis genomduplikationer 37 . Detta indikerar att genomspecifika transkriptionsnätverk tenderar att upprätthållas i vete.

Slutsatser

Med användning av helgenom 454-sekvensering samlade vi gensekvenser som representerade en väsentligen fullständig genuppsättning, och ett betydande antal tilldelades A-, B- eller D-genomet. Även om enheterna är fragmenterade bildar de ett kraftfullt ramverk för att identifiera gener, påskynda ytterligare genomsekvensering och underlätta analyser av genomskala. Identifieringen av över 132 000 SNP i A-, B- och D-gener underlättar analys av kvantitativa drag loci och associeringsstudier av egenskaper. Jämförelse med sekvenserna av diploida föräldrar och släktingar visade uttalade minskningar i storleken på stora genfamiljer i vete trots den relativt nyligen bildade hexaploiden (fig. 3e), i överensstämmelse med analyser i mindre skala 28, 38 . Graden av genförlust i hexaploidvete jämfört med majs 36 och Brassica rapa 39 är betydligt mindre, möjligen till följd av dess relativt nyare ursprung och frånvaron av intergenom rekombination 40 . Icke desto mindre kan genförlust i vete vara snabbt, vilket visas i den nyligen skapade allopolyploid Tragopogon miscellus 41 . De flesta funktionella klasser uppvisar lika genförlust i de tre genomerna, men familjer med transkriptionsfaktorer visade en tydlig tendens att behållas som funktionella gener i alla tre genomerna. Dessa kan upprätthålla transkriptionella nätverk i varje genom och bidra till icke-additiv genuttryck 42 och genomplasticitet. Till skillnad från den totala förlusten av genfamiljemedlemmar har flera klasser av genfamiljer med förutsagda roller i försvar, näringsinnehåll, energimetabolism och tillväxt ökat storlekar i Triticeae-linjen, eventuellt till följd av urval under domestisering.

Stora ansträngningar pågår för att förbättra veteproduktiviteten genom att öka den genetiska mångfalden i avelsmaterial och genom genetisk analys av egenskaper 43 . De genomiska resurserna som vi har utvecklat lovar att påskynda framstegen genom att underlätta identifieringen av användbar variation i gener från vete-landras och avkommande arter och genom att tillhandahålla genomiska landmärken för att vägleda valet av avkom. Analys av komplexa polygena egenskaper som avkastning och näringseffektivitet kommer också att påskyndas, vilket bidrar till en hållbar ökning av vetextillverkningen.

Metoder Sammanfattning

En enda frö härstamningslinje av den kinesiska våren T. aestivum landrace sekvenserades, eftersom den används allmänt för cytogenetisk analys 44 och fysisk kartläggning 15 . Triticum monococcum anslutning 4342-96 är en gemenskapsstandardlinje för att rikta in inducerade lokala skador i genom, fysisk kartläggning och genetisk analys; och Ae. tauschii ssp strangulata anslutning AL8 / 78, som används för fysisk och genetisk kartläggning, sekvensbestämdes med 454-teknik.

Sekvens för T. aestivum- vete-genenheten genererades med användning av Roche 454-pyrosquencing på GS FLX Titanium och GS FLX + -plattformarna. Ytterligare sekvensläsningsuppsättningar för T. aestivum , T. monococcum och Ae. tauschii genererades med användning av tre plattformar, Illumina, 454 och SOLiD, för att analysera homeologa sekvenser och SNP: er (en lista över alla datamängder finns i kompletterande tabell 2). Ortologa grupper skapades från ris, sorghum och B. distachyon- genomsekvenser och korn i full längd cDNA-sekvenser. Vetgenenheterna namngavs enligt deras OGR och identifierades med en sju-siffrig identifierare och deras förutsagda genom (till exempel Traes_Bradi1g12345_0000001_D och Traes_Sb3g33333_6543210_A). Gen- och cDNA-enheter kan sökas i MIPS Wheat Genome Database (//mips.helmholtz-muenchen.de/plant/wheat/uk454survey/index.jsp). All sekvensdata har deponerats i offentligt tillgängliga databaser, beskrivna i tilläggsinformation. Sekvenssamlingar, annoterade gensekvenser och deras förhållanden finns tillgängliga för nedladdning från European Bioinformatics Institute (//www.ebi.ac.uk) och för visning i en syntenbaserad Ensembl-genombläsare. Annoterade gensekvenser och deras förhållanden kan ses i en Brachypodium- syntenbaserad Ensembl-genom-webbläsare (//plants.ensembl.org/brachypodium_distachyon).

anslutningar

Primära anslutningar

Europeiska nukleotidarkivet

  • PRJEB568

Insättningar av data

Sekvenssamlingar har skickats till European Nucleotide Archive under projektanslutningsnummer PRJEB568.

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

    Denna fil innehåller kompletterande text och data 1-5, kompletterande tabeller 1-9, 13, 15-19 (se separata filer för kompletterande tabeller 10, 11, 12, 14), kompletterande figurer 1-6, 8-15 (se separat fil för kompletterande figur 7) och ytterligare referenser.

  2. 2.

    Kompletterande figur 7

    Denna figur visar de separata kartorna över genetiska markörer på A-, B- och D-genomen.

Excel-filer

  1. 1.

    Kompletterande tabell 10

    Denna tabell innehåller de över- och underrepresenterade GO-termerna för expanderade och sammandragna vetefamiljer.

  2. 2.

    Kompletterande tabell 11

    Denna tabell innehåller de över- och underrepresenterade Pfam-termerna för expanderade och sammandragna vete-genfamiljer.

  3. 3.

    Kompletterande tabell 12

    Denna tabell innehåller de över- och underrepresenterade GO- och Pfam-termerna för utvidgad Ae. tauschii genfamiljer.

  4. 4.

    Kompletterande tabell 14

    Denna tabell visar Pfam-domänerna i genfragment.

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.