Metatranscriptomic analyser av klorofototrofer av en mikrobiell matta med varm vår | isme journal

Metatranscriptomic analyser av klorofototrofer av en mikrobiell matta med varm vår | isme journal

Anonim

ämnen

  • ekofysiologi
  • Mikrobiell ekologi
  • Fotosyntes
  • transkriptomik

Abstrakt

Den fototrofiska mikrobiella mattsamhället av Mushroom Spring, en alkalisk kiselhaltig varm källa i Yellowstone National Park, studerades med metatranscriptomic metoder. RNA extraherades från mattprover samlade vid fyra tidpunkter under ljus-till-mörka och mörka-till-ljus-övergångar i en diel-cykel, och dessa RNA-prover analyserades med både pyrosekvenser och SOLiD-teknologier. Pyrosquencing användes för att bedöma samhällets sammansättning, vilket visade att ∼ 84% av rRNA härstammade från medlemmar i fyra riken Cyanobacteria, Chloroflexi, Chlorobi och Acidobacteria . Transkription av fotosyntesrelaterade gener visade slutgiltigt den fototrofiska naturen hos två nyupptäckta populationer; dessa organismer, som upptäcktes genom metagenomik, är för närvarande odlade och tidigare ej beskrivna medlemmar av Chloroflexi och Chlorobi. Datauppsättningar producerade genom SOLiD-sekvensering av komplementärt DNA gav> 100-faldigt större sekvensstäckning Det mycket större sekvenseringsdjupet tillät transkript att detekteras från 15 000 gener och kunde användas för att visa statistiskt signifikant differentiell transkription av tusentals gener. Temporära skillnader för transkriptionsmönster in situ för fotosyntesrelaterade gener antydde att de sex typerna av klorofotrofer i mattorna kan använda olika strategier för att maximera deras solenergiinsamling, användning och tillväxt. På grundval av både temporärt mönster och transkriptionsöverskott detekterades även skillnader mellan uttryck i gen-uttrycket för två populationer av den syrgasiska fotosyntesgilden. Denna studie visade att när gemenskapsrelevanta genomer och metagenomer finns tillgängliga, kan SOLiD-sekvenseringsteknologi användas för metatranscriptomiska analyser, och resultaten antydde att denna metod potentiellt kan avslöja ny insikt i ekofysiologin i denna mikrobiella samhällsmodell.

Introduktion

De klorofotrofiska mikrobiella mattorna av alkaliska kiselhaltiga varma källor i Yellowstone National Park har tjänat i decennier som modellsystem för att förstå sammansättningen, strukturen och funktionen hos mikrobiella samhällen (Brock, 1978; Ward et al., 1998, 2002, 2006, 2011; Ward och Castenholz, 2000; Klatt et al., 2011). Medlemmar av kungariket Cyanobacteria (mestadels Synechococcus spp.) Och Chloroflexi (familj Chloroflexales ; filamentösa anoxygeniska fototrofer (FAPs), mestadels Roseiflexus och Chloroflexus spp.) (Pierson och Castenholz, 1974; van der Meer et al., 2010; Ward et al., 2010; Ward et al. ., 2011) är de dominerande organismerna i dessa matsamhällen (tabell 1). Odling och DNA-sekvenseringsmetoder har producerat fullständiga eller nästan fullständiga konsensusgenomsekvenser för flera klorofotrofiska organismer som förekommer i dessa mattor, inklusive Synechococcus spp. stammar A och B ′, som är nära släktingar till ursprungsbefolkningar som samverkar i 60 ° C-mattan (Ferris och Ward, 1997; Allewalt et al., 2006; Bhaya et al., 2007); Roseiflexus sp. stam RS-1 (van der Meer et al., 2010; Bryant et al., 2011); och Chloroflexus aurantiacus- stammar Y-400-fl och 396-1 (Madigan och Brock, 1977; Bryant et al., 2011). Tillämpningen av metagenomiska metoder i kombination med traditionella mikrobiella odlingsmetoder ledde nyligen till identifiering av en tidigare okänd klorfototrof, Candidatus Chloracidobacterium thermophilum, från kungariket Acidobacteria som en ytterligare medlem av dessa mattor (Bryant et al., 2007). Genomen för denna organisme har också nyligen avslutats (Bryant et al., 2011; AM Garcia Costas, Z Liu, LP Tomsho, SC Schuster, DM Ward och DA Bryant, under förberedelse). Som dokumenterat i det bifogade dokumentet (Klatt et al., 2011) och i tidigare studier (Bryant et al., 2007) föreslog metagenomiska analyser dessutom att det finns andra klorfototrofiska medlemmar i denna grupp, som tidigare inte hade beskrivits och för närvarande är okultiverade organismer från kungariket Chloroflexi och Chlorobi (tabell 1). Sammantaget var tillgängligheten av dessa genom instrumentala för att analysera metagenomer från dessa matsamhällen (Klatt et al., 2011).

Full storlek bord

Att förstå transkription och dess reglering i naturliga mikrobiella samhällen har varit ett spännande, men tekniskt utmanande mål, främst på grund av den breda biologiska mångfalden i de flesta sådana samhällen och de inneboende svårigheterna med att arbeta med RNA. Microarrays (Parro et al., 2007) och kloning av slumpmässigt amplifierade komplementära DNA (cDNA) (Poretsky et al., 2005) har framgångsrikt tillämpats på metatranscriptomic studier. På grund av den senaste utvecklingen inom sekvenseringstekniker har metatranscriptomiska analyser med intensiv RNA-sekvensering nyligen framkommit som ett mycket kraftfullare tillvägagångssätt för studien av gentranskription i mikrobiella samhällen. Dessutom finns det ingen förutsättning för att erhålla genomsekvenser som krävs för mikroarrayanalyser, och sådana tillvägagångssätt kan snabbt generera enorma mängder information. Flera banbrytande studier som använder pyrosquencing-teknik på marina och markmikrobiella samhällen (Frias-Lopez et al., 2008; Urich et al., 2008; Gilbert et al., 2008) har inte bara visat genomförbarheten av en sådan metod, utan har också visade sina fördelar med att definiera samhällsstruktur (Urich et al., 2008) och dess kraft i att identifiera mRNA: er av kända eller nya gener (Gilbert et al., 2008). Flera studier (Gilbert et al., 2008; Hewson et al., 2009; Poretsky et al., 2009) jämförde metatranscriptomer erhållna under olika miljöförhållanden, och dessa studier kunde upptäcka differentiell genuttryck. Jämfört med antalet gener som förekom i ett mikrobiellt samhälle (åtminstone tiotusentals, om inte miljoner), var antalet mRNA-sekvenser som genererades i ovannämnda pyrosekvensstudier (från 5000 till 160 000) inte tillräckligt för att tillhandahålla tillfredsställande täckning eller dra slutsatsen om statistiskt meningsfulla transkriptionsmönster under olika förhållanden för de flesta gener som förekommer i medlemmarna i en komplex gemenskap. Därför har tidigare studier huvudsakligen fokuserat på de mest dominerande medlemmarna i ett givet mikrobiellt samhälle, och jämförelser av transkriptionsbeteenden hos olika fylogenetiska och fysiologiska grupper inom samma samhälle har ännu inte beskrivits. Därför var ett av huvudmålen för denna studie att testa genomförbarheten att använda så kallade Next-Generation (NextGen) sekvenseringsmetoder i metatranscriptomic studier.

I en kompletterande studie till Klatt et al. (2011) jämfördes två olika tillvägagångssätt för transkriptionsprofilering av den klorofototrofiska mikrobiella mattmiljön i Mushroom Spring. I det första tillvägagångssättet utfördes pyrosquencing (Roche GS FLX, 454 Life Sciences, Branford, CT, USA) av cDNA producerade från RNA extraherade från matprover uppsamlade vid 60 ° C under fyra olika tidpunkter i en dielcykel. Prover samlades från övergångsperioder mellan ljus till mörk och mörk till ljus, eftersom dessa har visat sig vara viktiga tider för förändringar i matfysiologi och metabolism, såsom förändringar i anoxygenisk fotosyntes (van der Meer et al., 2005 ) och kvävefixering (Steunou et al., 2006, 2008). ∼ 225-bp-sekvenserna erhållna genom detta tillvägagångssätt gav primärt information om sammansättningen av samhället baserat på stabila (det vill säga rRNA) -sekvenser. I ett andra tillvägagångssätt, och som en pilotstudie för att bestämma genomförbarheten av att använda NextGen-sekvensering för att genomföra en fullständig timcykel-metatranscriptomisk analys, genomfördes omfattande SOLiD-3 (Applied Biosystems, Carlsbad, CA, USA) med användning av cDNA producerade från samma fyra RNA-prover som användes i pyrosekvensanalysen. Efter silikofiltrering för att avlägsna stabila rRNA-sekvenser, tillhandahöll detta tillvägagångssätt 50-bp-sekvenser härrörande från uttryckta sekvenser (det vill säga mRNA: er) som gav detaljerad information om de globala transkriptionsmönstren för dominerande medlemmar i mattmiljön. Kombinationen av dessa två tillvägagångssätt validerade och förfinade slutsatser om mattkompositionen härrörande från metagenomiska analyser (Klatt et al., 2011) och reproducerade exakt tidigare observationer beträffande uttrycket av Synechococcus spp. gener för fotosyntes och kvävefixering (Steunou et al., 2006, 2008). Denna studie visade vidare att, om lämpliga referensgenomsekvenser eller omfattande metagenomiska data finns tillgängliga, kan NextGen-sekvensering användas för att erhålla enastående insikter om fysiologiska egenskaper in situ för community-medlemmar, utifrån transkriptionsprofiler.

resultat och diskussion

Pyrosequencing och kompositionanalys av mikrobiella mattprover

Tabell 2 sammanfattar de data som erhölls genom pyrosquencing av cDNA härrörande från de fototrofiska mikrobiella mattprover som samlats in vid fyra olika tidpunkter i en enda dielcykel från Mushroom Spring. Det totala antalet sekvenser sträckte sig från 59 283 för provet som samlats vid solnedgången (2100 timmar) till 128 208 för provet som samlats upp i morgonperioden med svagt ljus (0640 timmar) innan mattan utsattes för fullt solljus. Som förväntat härleddes de flesta sekvenser från rRNA, som stod för 88, 9–94, 4% av de totala sekvenserna. Procentandelen sekvenser som kan tilldelas som mRNA skilde sig åt för de fyra proverna. Procentandelen mRNA-sekvenser var lägst (2, 4%) strax före soluppgången (0515 timmar) och var högst (8, 1%) när mattan var helt upplyst (0840 timmar). Procentandelen sekvenser som inte identifierades som rRNA eller mRNA var väsentligen konstant i de fyra proverna med 2, 4–3, 0%.

Full storlek bord

Figur 1 sammanfattar rike-nivåskompositionen för sekvenserna som identifierades som rRNA (både stor underenhet och liten underenhet). Dessa data visar att ∼ 84% av rRNA-sekvenserna härstammade från medlemmar av endast fyra riken: Chloroflexi (∼ 40%), Cyanobacteria (∼ 27%), Chlorobi (∼ 11%) och Acidobacteria (∼ 6%). De återstående sekvenserna (16%) tilldelade som rRNA distribuerades i stor utsträckning över domänbakterierna (kompletterande figur S1). Inga sekvenser erhållna från det övre mattskiktet kunde definitivt tilldelas medlemmar i domänet Archaea. I överenskommelse med Klatt et al. (2011) tilldelades de näst vanligaste sekvenserna till kungadömen Firmicutes and Bacteriodetes , som representerade mindre än 2% av rRNA-sekvenserna. Sammantaget fördelades de bästa matchningarna till dessa återstående sekvenser över hundratals olika bakteriesekvensposter. Som man kan se i figur 1 observerades endast små skillnader i procentuella sammansättningsvärden för proverna som samlats in vid fyra olika tidpunkter under övergångsperioderna mellan ljus till mörk och mörk till ljus. Även om mat Synechococcus spp. visar fototaxis (Ramsing et al., 1997) och medlemmar av Chloroflexi har visat det mest dramatiska beviset för vertikal rörlighet i fältstudier (Boomer et al., 2000), rörelserna hos sådana organismer är relativt långsamma. Det tog 24 timmar att skygga mattan för att observera "puffar" av filament som migrerade till ytan i Octopus Spring (Boomer et al., 2000). Det är osannolikt att de små skillnaderna i sekvenssammansättning kommer att uppstå på grund av organismernas rörelser uppåt eller nedåt mellan de övre 2 mm och djupare mattskikten (inte provtagna) under dielcykeln. Det är emellertid möjligt att vissa av dessa skillnader återspeglar mindre variationer i cellernas rRNA-innehåll som en funktion av tiden på dagen. Antagande att cellerna i alla prover lyserades med lika effektivitet i alla prover, är det mer troligt att dessa skillnader bara återspeglar den lilla sammansättningsvariationen hos mattan på de närliggande, men uppenbarligen något olika provtagningsplatserna. Hur som helst var sammansättningen av rRNA-sekvenserna som utvanns från mattan på kungariketnivån var väsentligen konstant över dielcykeln inom det smala temperaturområdet (61–64 ° C) och den lokala regionen av mattan som samlades in. Dessa observationer gör det möjligt att jämföra proverna för att analysera förändringar i transkript som en funktion av dielcykeln.

Image

Konungariket-nivå sammansättning av mattgemenskapen baserat på rRNA-sekvenser. Endast RNA-sekvenser genererade genom pyrosekvensering analyserades. Data som visas här är summan av de inriktade sekvenserna för den stora underenheten och små underenhetens rRNA-sekvenser.

Bild i full storlek

Slutsatsen att mattans övre fotiska lager mestadels består av organismer från fyra kungarike överensstämmer med resultaten från metagenomiska analyser (Klatt et al., 2011). Baserat på rekrytering av sekvenser till relevanta referensgenom antydde metagenomiska analyser av hög- och lågtemperaturmetagenomer från Mushroom Springs att Cyanobacteria , Chloroflexi , Acidobacteria och Chlorobi stod för cirka 41, 7, 32, 1, 7, 6 respektive 3, 4% av sekvenserna. (Klatt et al., 2011). Flera faktorer kan vara ansvariga för de observerade mängdskillnaderna utifrån metagenomiska kontra metatranscriptomiska data. Först är dessa metoder inte kvantitativa och mycket lite är känt om det relativa cellinnehållet i DNA, RNA och proteiner i organismerna som innefattar mattan. För det andra samlades proverna inte från samma matplats, och dessutom samlades proverna vid olika tider på året (mitten av sommaren kontra senhösten). Dessa skillnader kunde ha påverkat procentandelen metaboliskt aktiva celler, vilket i sin tur skulle påverka utbytet av DNA och rRNA. Slutligen, även om Synechococcus spp. celler är mycket större i volym än de hos medlemmarna i Chloroflexi i mattan, de exakta effekterna av dessa skillnader på DNA och ribosominnehåll per cell är okända. Av alla dessa skäl kan den exakta sammansättningen av mattan inte exakt bestämmas med någon av metoderna.

På grund av den mångfald som medlemmarna i de fyra stora kungariket uppvisar , särskilt Chloroflexi och Acidobacteria , som inkluderar fototrofer och icke-fototrofer (Ward et al., 2009; Bryant et al., 2011), fördjupade analyser av 16S rRNA sekvenser av dessa riken var nödvändiga. Dessa analyser utfördes med användning av referenssekvenser med tydligare taxonomiska tillhörigheter och med högre upplösningskraft för att skilja mellan liknande sekvensinställningar (se kompletterande information för detaljer). Figur 2 visar resultaten från en sådan analys för kungariket Chloroflexi för sekvenserna härledda från provet samlat vid solnedgången (2100 timmar). Majoriteten (83, 5%) av sekvenserna i denna analys tilldelades Roseiflexus spp. och 6, 3% av sekvenserna tilldelades Chloroflexus spp. Roseiflexus sp. RS-1 och Chloroflexus sp. 396–1 var de närmast sekvenserade representanterna från dessa två släkter. Sekvenser härrörande från nära släktingar till den aeroba kemo-organotrofen, Thermomicrobium roseum , som rapporterades vara närvarande i liknande mattsystem i Yellowstone (Wu et al., 2009; Klatt et al., 2011), detekterades också, även om mycket låg nivå (0, 3%). Såsom visas i figur 2a tilldelades cirka 10% av de återstående sekvenserna till tre olika familjer, huvudsakligen Anaerolineaceae . För att undersöka den fylogenetiska tillhörigheten av dessa återstående sekvenser mer detaljerat användes 16S rRNA-sekvensen för en ny, oklassificerad medlem av Chloroflexi från matten-metagenomet som ytterligare referens. Figur 2b visar att nästan alla återstående sekvenser som inte tilldelats Roseiflexus spp. eller Chloroflexus spp. tilldelades denna tillagda sekvens härrörande från metagenomen (Klatt et al., 2011). Således stod denna oklassificerade medlem av Chloroflexi och dess nära släktingar troligen för ∼ 10% av Chloroflexi eller ∼ 4% av de totala rRNA-sekvenserna. På grundval av analyser av metagenomen från Mushroom och Octopus Springs, Klatt et al. (2011) har funnit starka bevis på att denna stora mängd, oklassificerad och okultiverad Chloroflexi- befolkning (närmast, men fortfarande avlägset relaterad till medlemmar i klassen Anaerolineae ) är mycket troligt att vara en tidigare okänd klorofotrof. Detta är i överensstämmelse med iakttagelsen att alla andra populationer med hög mängd i detta matgemenskap också är klorfototrofer.

Image

Djupgående sammansättningsanalyser av Chloroflexi 16S rRNA-sekvenser baserade på den högupplösta Chloroflexi 16S rRNA-databasen ( a ) och efter tillsats av partiell 16S rRNA-sekvens för den förmodligen fototrofiska, för närvarande okultiverade kloroflexi- populationen / kluster / ställningar från Mushroom Spring ( b ) i ett prov (solnedgång). Endast RNA-sekvenser genererade genom pyrosekvensering analyserades. Storleken på cirklarna är proportionella mot de relativa mängderna av rRNA-sekvenser tilldelade en viss taxon. Figur genererad av MEGAN (Huson et al., 2007) (absolut poängavbrott = 71, relativ avgränsning = 0% av bästa träff).

Bild i full storlek

Såsom visas i kompletterande figur S2 och enligt bedömningen av sekvensens likhetsfördelning av 16S rRNA-sekvenserna härledda från solnedgångsprovet, medlemmar av släktet Synechococcus spp. svarade för 99, 3% av rRNA-sekvenserna tilldelade riket Cyanobacteria (kompletterande figur S2A), och inte överraskande, de tidigare karakteriserade, mat-härledda Synechococcus sp. stam A och Synechococcus sp. stam B represented representerade bäst dessa sekvenser (Bhaya et al., 2007). Eftersom ingen mattapresentant från kungariket Chlorobi ännu inte har odlats eller fått sitt genom helt sekvensbestämt, var situationen för denna taxon mer komplex. Bland välkarakteriserade Chlorobiales- stammar är den närmaste släktingen till den Chlorobiales- liknande mattpopulationen Chp. thalassium (Gibson et al., 1984). Cirka 45% av rRNA-sekvenserna tilldelades detta släkte, och de återstående sekvenserna tilldelade Chlorobiales distribuerades i stor utsträckning över de andra tre släkten inkluderade i analysen (kompletterande figur S2B). Men när 16S-rRNA-sekvenserna för klorobialespopulationen utvanns från matmetagenomet och användes i en liknande analys, tilldelades alla de klorobialesliknande rRNA-sekvenserna till denna enstaka sekvenstyp (kompletterande figur S2C). Candidatus C. thermophilum stod för 99, 8% av sekvenserna tilldelade riket Acidobacteria (kompletterande figur S2D). Samma djupanalys utfördes på alla prover, och resultaten för alla fyra proverna var likartade (data visas inte för de andra tre proverna). Sammantaget antydde data om rRNA-sekvensen att organismerna som tillhör riket Chloroflexi är betydligt mer fylogenetiskt heterogena än de som är anslutna till Cyanobacteria , Chlorobi och Acidobacteria . Ännu viktigare är kända organismer som är förknippade med dessa fyra riken, som tillsammans svarade för ∼ 84% av de rRNA-sekvenser som upptäckts från matsamhället, eller är mycket troligt klorfototrofer.

Pyrosequencing och mRNA-analys av mikrobiella mattprover

Fig. 3a visar en kompositionsanalys av mRNA-sekvenserna härledda från pyrosekvensering. Dessa data har jämförts med det genomsnittliga procentuella sammansättningsvärdet för varje större taxon baserat på rRNA, som härleddes från uppgifterna i figur 1. För vart och ett av de huvudsakliga riken, den högsta andelen mRNA-sekvenser tilldelade genom jämförelse med referensmetagenomet för de fyra proverna var jämförbara med deras genomsnittliga procentkomposition baserat på rRNA-sekvenserna. Procentandelen sekvenser identifierade som mRNA men tilldelade kategorin "Andra" var genomgående högre än det genomsnittliga rRNA-innehållet. Det främsta skälet bakom denna observation var den ofullständiga identifieringen av sekvenser för de sju huvudsakliga klorfototrofa populationerna i referensmetagenomet. Små ställningar i metagenomet tilldelades som "andra" (se kompletterande material för mer kompletterande information) eftersom det är mycket svårt att tilldela dem till en fylogen grupp med stort förtroende. Många av dessa små ställningar tillhör förmodligen de sju huvudpopulationerna. Till exempel innehåller några av dessa ställningar fragment av mycket uttryckta gener, såsom fotosyntetiska reaktionscentra och kvävegener. En annan observation var att procentsatserna av kloroflexi- mRNA-sekvenser var högre än den genomsnittliga rRNA-procenten för detta rike, medan det motsatta var sant för Cyanobacteria . Detta förväntas eftersom Chloroflexi- populationerna har större genom (mer än 4000 gener vardera) än Synechococcus spp. (∼ 2800 gener vardera). (Tabell 3) Även om förhållandet mellan mRNA-sekvensöverskott och genomstorlekar förmodligen inte är linjärt, är det troligt att celler med större genom har fler mRNA-sekvenser än celler med mindre genom när båda jämförs under liknande metaboliska aktivitetsnivåer.

Image

Sammansättning av mRNA-sekvenser på kungariketnivå (endast huvudorganismer) i båda datauppsättningarna, pyrosekvenser ( a ) och SOLiD-3 ( b ) jämfört med respektive genomsnittliga rRNA-sekvensprocent. Medel ± sd visas för rRNA-sekvensprocent för alla fyra prover. mRNA-sekvenser av sju dominerande fototrofiska fylogenetiska grupper och funktionella guilder räknas. Procentsatser beräknades baserat på totala mRNA-sekvenser i linje med referensmetagenom.

Bild i full storlek

Full storlek bord

Efter noggrant övervägande av de faktorer som beskrivs ovan observerades ändå stora förändringar i mRNA-procentsatserna mellan olika tidpunkter för två av de fyra riken. De mRNA som tilldelades Cyanobacteria var signifikant mindre rikliga än deras genomsnittliga rRNA-innehåll vid solnedgången och före gryningen, men mRNA-nivåerna för Cyanobacteria ökade dramatiskt när mattan var helt upplyst på morgonen. Sekvenserna identifierade som mRNA från Acidobacteria var högst vid solnedgången och i högintensivt ljus på morgonen men var signifikant lägre i de andra två proverna. Procenthalterna av mRNA-sekvenser dikterades ofta av uttrycksmönster för de mest uttryckta generna. Genen med flest mRNA-sekvenser stod vanligtvis för 5–10% av mRNA-sekvenserna tilldelade en viss taxon och stod ibland för upp till 25% av mRNA-sekvenserna i ett enda prov. För alla klorfototroferna i samhället var gener relaterade till fotosyntes, speciellt gener som kodar för polypeptider för reaktionscentrum, konsekvent vid eller nära toppen av listorna över gener med de flesta mRNA-sekvenser (kompletterande tabell 1). Således återspeglade förändringen i procentandelarna av mRNA-sekvenser av Cyanobacteria och Acidobacteria hur deras fotosyntesrelaterade gener regleras och uttrycks (se vidare diskussion nedan).

Det totala antalet sekvenser tilldelade specifika kodningssekvenser (det vill säga härledda från mRNA: er) i pyrosekvenseringsmetoden var ganska låga (∼ 3000–9000; tabell 2), särskilt i förhållande till antalet gener som kollektivt kodades i referensgenomen av de sju stora taxorna (> 20 000; tabell 3). Även om täckningen och upplösningskraften för de data som erhölls genom detta tillvägagångssätt var uppenbarligen begränsade, var det fortfarande möjligt att identifiera statistiskt meningsfulla förändringar i genuttryck över de fyra tidpunkterna och dra meningsfulla slutsatser från några få uttryckta gener. Till exempel visades det tidigare att nifH- och nifD- generna som kodar kvävgas i Synechococcus spp. populationer i detta mattsystem, uppvisade maximala transkriptionnivåer vid solnedgången och en sekundär ökning i transkriptionnivåer under perioden med låg ljus tidigt på morgonen (Steunou et al., 2008). Detta var tydligt tydligt i uttrycksmönstret för Synechococcus spp. nifH- och nifD- gener detekteras i denna analys (figur 4). MRNA-överflödet för nif- generna var högst i solnedgångsprovet, var motsvarande låga i provet före gryningen och på morgonen med högt ljus och visade en mindre men ändå signifikant ökning i provet med svagt ljus på morgonen. Även om dessa data hjälpte till att validera cDNA-sekvenseringsmetoden för transkriptionsprofilering, fick det låga antalet totala mRNA-sekvenser oss att utforska NextGen-sekvensering av cDNA med hjälp av SOLiD-3-metod för att bestämma om denna metod skulle kunna användas för att bedöma globala transkriptionsmönster i medlemmar i matsamhället.

Image

Relativa transkript-överflöd av två Synechococcus spp. kvävegener i två olika datamängder. Antal mRNA-sekvenser tilldelade Synechococcus sp. stam A-liknande och Synechococcus sp. stam B′-liknande nifH- och nifD- gener eller partiella gener summerades, normaliserades och jämfördes.

Bild i full storlek

SOLiD-3 sekvensering och transkription av fotosyntesgener

Tabell 4 sammanfattar data erhållna från sekvensering av cDNA-prover framställda från samma fyra RNA-prover som beskrivits ovan, men med användning av SOLiD-3-metoden. Sammantaget erhölls cirka 10–12 miljoner sekvenser för vart och ett av de fyra cDNA-proverna. Uppenbarligen, på grund av den stora mängden sekvensinformation, blev det BLAST-baserade tillvägagångssättet som användes för de data som genererades från pyrosquencing beräkningsmässigt ohållbart och istället användes BWA: s snabba justeringsverktyg (Li och Durbin, 2009). 50-bp-sekvenserna som mappats till rRNA-databaser var utan tvekan mycket mindre informativt fylogenetiskt än deras ∼ 225-bp motsvarigheter genererade genom pyrosekvensering. RRNA-sekvenserna erhållna från SOLiD-3-data analyserades således inte ytterligare och kommer inte att diskuteras vidare här. Simuleringar utförda enligt metoden enligt Richter et al. (2008) visade att den övre gränsen för unika kartläggningsfel, när man tillåter tre till fem felpar för 50 bp-sekvenser, var ∼ 0, 007 och 3, 12% för icke-unikt kartlagda sekvenser (kompletterande material och kompletterande tabell S3). Dessa är uppskattade övre gränser eftersom de simulerade uppgifterna inkluderar rRNA-sekvenser och andra repetitionssekvenser (till exempel införingssekvenser, transposaser och andra upprepade sekvenser) som faktiskt togs bort (eller inte räknades) med transkriptmappningsproceduren som användes i denna studie.

Full storlek bord

Även om sekvenserna i SOLiD-datauppsättningar var olika i längd än de i pyrosekvenserande datauppsättningar och var inriktade med användning av olika programvaror, var resultaten i allmänhet mycket lika på flera sätt. Sammantaget kan 2, 9–10, 0% av cDNA-sekvenserna (det vill säga 318 205 till 1 057 433 totala cDNA-sekvenser) kartläggas till kodningssekvenser i referensmetagenomerna. För några få sekvenser var det inte möjligt att kartlägga dessa sekvenser unikt till en enda gen (till exempel för vissa transkript som kodar medlemmar i psbA- multigenfamiljen som finns i Synechococcus spp.). Relativt få fall förekom av denna typ, och i allmänhet störde dessa få fall inte den globala tolkningen av resultaten. I likhet med de resultat som erhölls genom pyrosekvensering (tabell 2), var de sekvenser som tilldelades som mRNA: er låg i överflöd i pre-dawn-provet och var högst i överflöd i morgonprovet erhållet efter att mattan fick fullt solljus. Figur 3b visar kompositionerna av mRNA-sekvenser bland fyra riken. Jämfört med pyrosquenceringsresultaten i figur 3a var det mycket uppenbart att mönstret för förändringar av mRNA-sekvenser för varje rike över de fyra tidpunkterna var nästan identiska, även om vissa skillnader i de faktiska procentsatserna observerades. Till exempel var procenttalet av klorobi och Acidobacteria mRNA-sekvenser konsekvent högre i SOLiD-datauppsättningar än i pyrosekvenserande datauppsättningar. Dessa skillnader kan ha uppstått från olika förspänningar i sekvensamplifieringsförfaranden, eftersom biblioteken bereddes med användning av olika kit som föreskrevs av tillverkarna av de två plattformarna. Dessa förspänningar skulle emellertid inte påverka genuttrycksmönstren bland fyra tidpunkter som härleds från dessa två datamängder, eftersom förspänningarna bör vara konsekvent närvarande inom varje plattform bland de fyra olika tidpunktpunkterna. Uttrycksmönstren för gener härledda från de två datamängderna var verkligen mycket lika. Såsom visas i figur 4 producerade SOLiD-3 och pyrosquencing-metoderna väsentligen identiska expressionsmönster för nifH och nifD , och som nämnts ovan matchar detta mönster också det som erhölls genom omvänd transkription-PCR (Steunou et al., 2008). För 55 gener som detekterades som signifikant reglerade gener i pyrosquencerande datamängderna (tabell 3) jämfördes de normaliserade expressionsmönstren för de två datamängderna för att bestämma hur väl de två datamängderna var korrelerade. Korrelationskoefficienterna för 49 av de 55 generna var 0, 8 eller högre för de två uttrycksprofilerna. Dessa observationer fastställde konsistensen och trovärdigheten för båda datamängderna och validerade de använda analysmetoderna.

Det var också uppenbart att SOLID-3-datauppsättningarna var överlägsna när det gällde insikt i genreglering. Som ett resultat av det mycket större sekvenseringsdjupet till en liknande kostnad (> 100-faldigt större sekvenseringsdjup) tillät SOLiD-3-data transkript att detekteras för mer än 90% av de> 20 000 generna i referensdatauppsättningen. Vidare möjliggjorde upplösningskraften som resulterade från det stora antalet mRNA-sekvenser för varje gen statistiskt meningsfulla jämförelser för ett mycket större antal gener. SOLiD-3-sekvenseringsmetoden upptäckte transkript för 19 192 gener, varav nästan hälften (9107, 47%) uttrycktes differentiellt på ett statistiskt meningsfullt sätt (tabell 3).

Eftersom mattmiljömedlemmarna som visade högsta överflöd var klorfototrofer, analyserades fotosyntesgen först. Fotosyntetiska reaktionscentrumgener, som tentativt har tilldelats genom fylogenetiska analyser till de oklassificerade och okulturerade Anaerolineae- liknande medlemmarna i Chloroflexi (kompletterande information), var bland de toppgener med mest omfattande mRNA-sekvenser (kompletterande tabell S1). Detta antyder att dessa gener har en viktig roll i de biologiska processerna i denna population, och därmed ger ytterligare mycket starkt stöd för hypotesen att denna population representerar en tidigare oidentifierad och odlad klorfototrof. Detta är också fallet för romanen Chlorobiales spp . Även om det tidigare förväntades bli en klorfototrof eftersom alla andra kända Chlorobiales spp. är fotolithoautotrofer (Bryant et al., 2011), den senaste upptäckten av en icke-fototrofisk medlem av Chlorobi , Ignavibacterium-albumet (Iino et al., 2009), gjorde detta antagande tveksamt. Dessa fynd om dess fotosyntesgener som transkriberas starkt tyder på att Chlorobiales spp. i mattan är klorofotrofer.

Figur 5 visar expressionsmönstren för generna som kodar underenheterna för fotokemiska typ-1 eller typ-2-reaktionscentra för sex viktiga klorofotrofer (tabell 1) i mattgemenskapen (för denna analys skilde vi inte här mellan A-liknande och B′-liknande Synechococcus spp. -Sekvenser; tabell 1). I överensstämmelse med klorfototrofiska livsstilar för organismerna som tillhörde dessa fyra riken, var i båda fallen generna som kodade för reaktionscentra antingen de mest uttryckta eller bland gruppen av de mest uttryckta generna (kompletterande tabell S1). För Synechococcus spp. Var mRNA-nivåerna för psaA , som kodar för en av de två stora kärnenheterna i fotosystemet I-reaktionscentret (Grotjohann och Fromme, 2005), lägst i provet före gryningen men steg mycket brant som ljuset intensiteten ökade på morgonen. Sammantaget ökade transkriptionsflödet för psaA mer än 50 gånger på morgonen, och liknande ökningar observerades för andra psa- gener, liksom psb- generna som kodar underenheter i fotosystem II (data visas inte; Steunou et al., 2008) . Däremot minskade transkriptionsöverskottet för fotosyntetiska reaktionscentrumgener för alla anoxygeniska fototrofer när mattan var helt upplyst. Transkriptionsmönstren för pscA- generna, som kodar underenheter av typ-1-reaktionscentra för Candidatus C. thermophilum och de Chlorobiales- liknande populationerna i mattan (Bryant et al., 2007), var mycket lika. För dessa två organismer var pscA- transkripten vanligast vid solnedgången och var minst rikliga när mattan var helt upplyst på morgonen. Transkriptionsmönster för pufM- , pufL- och pufC- generna, associerade med typ-2-reaktionscentra för tre olika kloroflexi- populationer, var inkonsekventa, men transkriptionsnivåerna för dessa gener tycktes minska när ljusintensiteten ökade på morgonen. Eftersom förändringarna i transkriptionsnivåerna för dessa gener i Chloroflexi var små (∼ tvåfaldiga förändringar) för de tidpunkter som togs in, är vi för närvarande osäkra på om dessa skillnader återspeglar verkliga förändringar i transkriptnivåer eller bara statistisk variation (figur 5).

Image

Relativa transkript-mängder av fotosyntetiska reaktionscentrumgener av sex olika fototrofer. De relativa transkriptionsförhållandena av de indikerade fotosyntetiska reaktionscentrumgenerna med de flesta tilldelade mRNA-sekvenserna (endast SOLiD-datauppsättning) planeras för sex olika fototrofer. Syne, Synechococcus sp. stam A och B ′; Cab, Candidatus Chloracidobacterium thermophilum; GSB, en klorobialespopulation ; Rosei, Roseiflexus sp .; Chlor, Chloroflexus sp .; Anaer, roman Anaerolineae- liknande Chloroflexi- befolkning.

Bild i full storlek

Med den uppenbara varning som transkriptionsmönster uppenbarligen inte nödvändigtvis korrelerar med proteinnivåer och enzymaktivitetsmönster, innebär dessa skillnader i transkriptionsmönster för reaktionscentrumproteiner ändå starkt att organismerna som tillhör de viktigaste taxorna i mattorna troligen använder olika strategier för ljus fångst och användning (tabell 1). Eftersom det är osannolikt att de specifika absorptionsegenskaperna för enskilda celler i mattan ändras mycket under dielcykeln antyder de observerade skillnaderna i transkription av de olika klorfototroferna att det är avlägsnande av hämmande faktorer (till exempel syre) eller tillgängligheten av krävs begränsande näringsämnen för fotoheterotrofer (till exempel organiska syror eller aminosyror) som slutligen styr när transkription av en given population kommer att vara maximal. Således måste den specifika ljusskörningsstrategin för varje typ av organismer vara att tillhandahålla en adekvat energiförsörjning när ljusintensiteten inte nödvändigtvis är maximal. Detta kan förklara varför klorosomer, med deras mycket stora antal kromoforer och låga energikostnader för produktion (Bryant och Frigaard, 2006), är de föredragna antennkomplexen för de flesta anoxygeniska fototrofer i mattorna.

Biogenesen av den fotosyntetiska apparaten kräver celler att syntetisera klorofyller och / eller bakterioklorofyll utöver de proteiner som binder dessa protesgrupper. Figur 6 sammanfattar sekvensresultaten för biosyntesgener för bakterioklorofyll, vars expressionsmönster var statistiskt meningsfulla i de fyra huvudsakliga taxorna. Mönstret för expression av klorofyllbiosyntesgenerna för Synechococcus spp. var mycket lik expressionsmönstret för psaA (figur 5) och andra psa- och psb- gener. Transkriptnivåerna ökade mycket kraftigt när ljusintensiteten ökade på morgonen. För Roseiflexus spp. uttrycket av gener för bakterioklorofyll en biosyntes var högst vid solnedgången och lägst på morgonen när mattan fick fullt solljus. Detta mönster överensstämde med transkript involverade i bakterioklorofyllbiosyntes från Chloroflexus spp. och den nya Anaerolineae- liknande befolkningen också, och var generellt lik den för uttryck av reaktionscentrumgen pufM förutom att pufM- transkription var lägre vid solnedgången (jämför figurerna 5 och 6). Detta mönster överensstämmer med den kända fysiologin hos karakteriserade Chloroflexi- stammar, som är fakultativt fototrofiska. Biosyntesen av bakterioklorofyll och komponenter i den fotosyntetiska apparaten undertrycks starkt av syre i Chloroflexus aurantiacus (Bryant et al., 2011). Transkriptionsmönstren för biosyntesgenen för bakterioklorofyll för populationerna av Candidatus C. thermophilum och mattan Chlorobiales spp. var väsentligen identiska (figur 6). Avskrifterna var höga vid solnedgången, minskade över natten och steg kraftigt igen på morgonen och var på de högsta nivåerna när mattan fick fullt solljus (figur 6). För organismer som tillhör dessa två populationer ökade transkriptionsnivåer för gener som kodar för enzymer av bakterioklorofyllbiosyntes när mattan var fullständigt upplyst, medan transkriptnivåerna för reaktionscentra minskade. Intressant nog producerar båda dessa typer av organismer klorosomer som antennstrukturer med lätt skörd (Bryant och Frigaard, 2006; Bryant et al., 2007), och det är möjligt att syntesen av reaktionscentra (beroende på bakterioklorofyll a och klorofyll, och maximalt vid solnedgången) och klorosomer, som är beroende av biosyntes av bakterioklorofyll c (Bryant och Frigaard, 2006; Gomez Maqueo Chew och Bryant, 2007), kan förekomma vid olika tidpunkter på dagen.

Image

Relativa transkriptionsöverskott för bakterioklorofyllsyntesgener av sex olika fototrofer. Medel ± sem visas här för alla bakterioklorofyllsyntesgener av sex olika fototrofer, vars expressionsnivåer är statistiskt olika ( P <0, 001) mellan minst ett par prov. Syne, Synechococcus sp. stam A och B ′; Cab, Candidatus Chloracidobacterium thermophilum; GSB, en klorobialespopulation ; Rosei, Roseiflexus sp .; Chlor, Chloroflexus sp .; Anaer, roman Anaerolineae- liknande Chloroflexi- befolkning.

Bild i full storlek

För att studera intra-guild genuttryck för A-liknande och B′-liknande Synechococcus spp. transkriptioner, identifierade vi först par av ortologa gener (blastp, ömsesidig bästa träff), för vilka transkriptioner var både detekterbara och tydligt tilldelbara till en eller annan genotyp. Data undersöktes sedan för att identifiera exempel genom att transkriptionsnivåer för de två populationerna (i) skilde sig i överflöd på ett statistiskt signifikant sätt ( t- test, P <0, 05); eller (ii) hade olika uttrycksmönster (korrelationskoefficient <0). Exempel på båda typerna kan ses i tilläggstabellen S2. Exempelvis var transkript för gener som kodade för flera chaperoner mycket lägre i överflöd i A-liknande än i B′-liknande populationer. Dessutom var transkript av flera gener för kinonbiosyntes och de för en glykolatoxidas-subenhet och glyceratkinas mer omfattande i B-liknande än i A-liknande populationer. Det temporära transkriptionsmönstret för flera av dessa gener skilde sig också (kompletterande tabell S2, till exempel sensorhistidinkinas och Fe / S-subenheten för glykolatoxidas). Skillnader i både överflödet och det temporala uttrycksmönstret observerades också för sensoriska kinaser och responsregulatorer, vilket antydde att hela reguloner kan uttryckas differentiellt inom medlemmar i dessa två populationer. Dessa exempel illustrerar att väsentliga transkriptionella skillnader, som förmodligen återspeglar metabola och fysiologiska skillnader, inträffar med de A-liknande och B like-liknande Synechococcus- populationerna inom guildet av syrgasfototrofer.

Slutsatser

Uppgifterna som visas här visade att pyrosekvensering och SOLiD-3-sekvensering av cDNA-prover tillhandahöll komplementär information om kompositionen och fysiologin / metabolismen hos de fototrofiska mikrobiella mattorna av alkaliska kiselhaltiga varma källor. De längre sekvenserna härrörande från pyrosquencing (225 bp) gav detaljerad information om sammansättningen av mikrobiell mattsamhälle. Dessa data visade tydligt att den fototrofiska mattsamhället huvudsakligen består av klorfototrofiska organismer härrörande från fyra riken: kloroflexi , cyanobakterier , klorobi och syrabakterier . Analysen av rRNA-sekvenser gav mer bevis för närvaron av en tidigare okänd, oklassificerad och okulturerad och djupt grenande klorfototrof medlem av Chloroflexi i mattan. Skillnader inom guilden i uttrycksmönstret observerades för syrgasfotosyntesgildet, vilket tyder på att med den nuvarande metoden är förmågan att urskilja ursprunget till transkript på en högre nivå av fylogenetisk upplösning än klusteranalys av metagenomiska enheter (Klatt et al., 2011). Analysen av mRNA-sekvenser visade vidare genomförbarheten och noggrannheten för metatranscriptomics med SOLiD NextGen-sekvensering för första gången. Även om endast fyra tidpunkter analyserades här föreslog denna studie att de olika fototrofiska populationerna i mattan uppvisar temporära skillnader i deras transkriptionsmönster (tabell 1). På grund av förmågan att uppnå dramatiskt större sekvenseringsdjup till en rimlig kostnad, kan SOLiD-3-sekvensering ge oöverträffade detaljer angående de globala, diel-transkriptionsmönstren som förekommer för organismerna i denna mikrobiella mattsamhälle. Prover har samlats in och sekvensering har avslutats för en fullständig timme-analys av dieltranskriptionsmönstret för detta klorfototrofiska mattsamhälle. Beskrivningen av dessa globala diel-transkriptionsmönster, som kommer att ge nya insikter i detta samhällets fysiologi in situ , kommer att presenteras någon annanstans.

anslutningar

GenBank / EMBL / DDBJ

  • SRA018112

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

    Kompletterande information åtföljs av uppsatsen på webbplatsen ISME Journal (//www.nature.com/ismej)