Snabb genomväxling av en atoxigen stam av aspergillus carbonarius | vetenskapliga rapporter

Snabb genomväxling av en atoxigen stam av aspergillus carbonarius | vetenskapliga rapporter

Anonim

ämnen

  • Svampgenomik
  • Genregleringsnätverk

Abstrakt

I mikroorganismer har Ion Torrent-sekvenseringsteknologi visat sig vara användbart vid helgenom-sekvensering av bakterien genom (5 Mbp). I vår studie använde vi för första gången denna teknik för att utföra en resekventeringsmetod i ett helt svampgenom (36 Mbp), en icke-ochratoxin A-producerande stam av Aspergillus carbonarius . Ochratoxin A (OTA) är ett potent nefrotoxin som främst finns i spannmål och deras produkter, men det förekommer också i en mängd vanliga livsmedel och drycker. På grund av det faktum att denna stam inte producerar OTA, fokuserade vi några av de bioinformatiska analyserna i gener som är involverade i OTA-biosyntes, med användning av ett referensgenom för en OTA-producerande stam av samma art. Denna studie avslöjade att det i den atoxigena stammen finns en hög ansamling av nonsens- och missense-mutationer i flera gener. Det är viktigt att en tvåfaldig ökning av genmutationsförhållandet observerades i PKS- och NRPS-kodande gener som föreslås vara involverade i OTA-biosyntes.

Introduktion

Ochratoxin A (OTA) är ett potent nefrotoxin som främst finns i spannmål och deras produkter, men det förekommer också i en mängd vanliga livsmedel och drycker som choklad, torkad frukt, kaffe eller vin. Detta mycotoxin produceras av flera arter av Penicillium och Aspergillus, bland vilka Aspergillus carbonarius är den huvudansvariga källan till detta mycotoxin i vin, druvor och torkad vinstockfrukter från de viktigaste vinodlingsområdena över hela världen 1 .

Den biosyntetiska vägen för andra mykotoxiner har belysts, eftersom det är fallet med aflatoxinbiosyntetisk genkluster av Aspergillus flavus , som till stor del är ansvarig för aflatoxinkontaminering av jordbruksgrödor 2 . Men lite är känt om generna involverade i OTA-biosyntes. OTA består av en polyketid-härledd klorerad dihydrometyl-isokoumarin kopplad till fenylalanin. Olika polyketidsyntas (PKS) som kodar gener involverade i OTA-biosyntes har identifierats i olika ochratoxin A-producerande arter 3, 4, 5, 6, 7 . Hittills har endast en PKS-gen involverad i de initiala stegen i OTA-biosyntetiska vägen och en nonribosomal peptidsyntetasgen (NRPS) -gen varit relaterad till detta biosyntetiska genkluster i A. carbonarius 8, 9 . Nyligen har genomsekvensen för en OTA-producentstam av A. carbonarius ITEM 5010 (Acv3) genererats av det amerikanska energidepartementets Joint Genome Institute med användning av 454 och Sanger-sekvenseringsteknologierna (//jgi.doe.gov/carbonarius /) 10 . Liknar många andra ascomycetes hittills sekvenserade, A. carbonarius genom innehåller ett stort antal PKS- och NRPS-kodande gener. Dessa gener kodar för komplexa och multifunktionella proteiner involverade i biosyntesen av de flesta av de svampa sekundära metaboliterna. Sekvenseringsteknik kan underlätta studien av de genetiska biosyntetiska vägarna för viktiga mykotoxiner, såsom OTA. Ion Torrent-sekvenseringsteknologi har visat sig vara användbar vid helgenom-sekvensbestämning av små storlekar genom, upp till 5 Mbp, såsom vissa bakterienom 11, 12 .

I den här studien använde vi för första gången Ion Torrent-tekniken för att åstadkomma jämlikhet genom en mögel genom, en atoxigen vild stam av A. carbonarius med en genomstorlek på cirka 36 Mbp, med referensgenomet Acv3 av en toxigen A. carbonarius- stam. Förutom detta huvudmål, och på grund av det faktum att denna stam inte producerar OTA, fokuserade vi några av de bioinformatiska analyserna i gener involverade i OTA-biosyntes.

Resultat

Detektion av OTA-produktionen i de studerade A. carbonarius- stammarna

Aspergillus carbonarius- stammar växte i CYA-medium vid 15 ° C, 25 ° C och 30 ° C. Båda stammarna uppvisade god tillväxt med korrekt sporulering som bildar typiska svarta kolonier (figur S1). Emellertid kunde den icke-OTA-producerande stammen (A-2160) inte producera OTA vid dessa temperaturer efter 7 eller 15 dagars inkubation. Tvärtom, A. carbonarius ITEM 5010 producerade OTA i detekterbara nivåer vid de tre testade inkubationstemperaturerna. Denna stam producerade högre mängder OTA vid 15 ° C efter 15 dagars inkubation än i resten av testade temperaturer och inkubationstider. Figur 1 visar några utvalda kromatogram av svampstammarna som analyserades i denna studie med HPLC. Extrakt av A. carbonarius ITEM 5010 (figur 1a) presenterade en klar topp med samma retentionstid för OTA (4, 7 minuter). Extrakten av A. carbonarius A-2160 (figur Ib) visade inga signaler vid samma retentionstid för OTA.

Image

Valda kromatogram av svampextrakt analyserade med HPLC kopplat till en fluorescensdetektor av (a) den OTA-producerande stammen av A. carbonarius ITEM 5010 (OTA-retentionstid: 4.701 min) och (b) den atoxigena stammen av A. carbonarius A-2160, efter inkubering vid 15 ° C i 7 dagar på Czapek-jästextrakt Agar.

Bild i full storlek

Förhandsstudie

De allmänna utväxlingsgenomdata för den atoxigena stammen A-2160 av A. carbonarius sammanfattas i tabell 1. En enda jon-torrentkörning utfördes för att åstadkomma ekvivalenter genom genom denna stam. Totalt 3 1568699 läsningar sekvenserades för totalt 547, 56 Mbp. Anpassningen av läsarna till Acv3 visade att mer än 84% av det icke-repetitiva referensgenomet täcktes med ett genomsnittligt djup på ~ 12 ×.

Full storlek bord

Jämförelserna mellan de flera och unika kartläsningarna visade att de två stammarna delar cirka 3 Mb repetitiva regioner och som har en likhet högre än 97, 2%. De borttagningar som samlats i den atoxigena stammen av A. carbonarius uppsammades till ~ 1 Mbp och den totala storleken på de icke-mappade läsarna var ~ 39 Mb (7, 75% av läsningarna producerade av Ion Torrent-körningen). Anpassningen mellan avläsningarna producerade från den atoxigena stammen och Acv3 användes för att studera variationen mellan de två stammarna och för att lyfta fram de genomiska skillnaderna som kan förklara fenotypen hos den atoxigena stammen.

Polymorfismanalyser med en nukleotid och deletionsinsättning

Alla unikt kartlade regioner användes för att utföra en specifik polymorfism med en nukleotid (SNP) och polymorfismer för deletionsinsättning (DIP). Totalt har 52661 högkvalitativa SNP och 7567 högkvalitativa DIP identifierats. På grund av den homozygota naturen hos det sekvensbestämda genomet har alla heterozygota mutationer kasserats. SNP: s och DIP av hög kvalitet har använts för att utföra en mutationsbrytning enligt informationen om genanteckningen av referensgenomet Acv3. Tabell 2 visar närvaron av 7183 missense, 88 nonsense och 528 frameshift-mutationer. Missense-mutationerna påverkar 3880 gener. Totalt har 43 genontologier (GO) -familjer mer än 5% av muterade gener (figur 2 och kompletterande tabell S1).

Full storlek bord

Image

I Y-axeln finns procentandelen gen som respekterar det totala antalet gener och i X-axeln de berikade familjerna.

Bild i full storlek

Kopiera nummervariansanalys

Med hjälp av en läsningsdjupstrategi på den multipla mappinriktningen identifierades flera kopieringsnummervariationer (CNV) -regioner. Analysen visade att det inte fanns några signifikanta duplicerade regioner men det fanns 55 raderade regioner (kompletterande tabell S2) innehållande 291 gener som faller i 60 GO-klasser (kompletterande tabell S3). Av detta har kinasregulatoraktivitet (26, 57), serintyp karboxypeptidasaktivitet (10, 63) och metallklusterbindande (7, 97) klasser en hög anrikningsnivå. Flera små ställningar i referensgenomet Acv3 resulterade helt bort.

PKS och NRPS kodande genanalyser

Totalt 24 NRPS-gener och 25 PKS-gener hämtades med en metod baserad på Blast, Inteproscan och AntiSmash. För båda familjerna kombinerades ett fylogen tillvägagångssätt med SNP: er, DIP: er och CNV: s analyser för att extrahera kompletterande information om dessa två genfamiljer (fig. 3 och 4). Många NRPS- och PKS-gener hade mutationer och en NRPS-gen (estExt_fgenesh2_pg.C_3_t20159) och en PKS-gen (estExt_Genemark1.C_50656) raderades i den atoxigena stammen.

Image

Bild i full storlek

Image

Bild i full storlek

Genom att använda SNP: s information beräknade vi genmutationsförhållandet (GMR) för hela uppsättningen gener och vi jämförde den med GMR från NRPS- och PKS-genfamiljerna. Den globala GMR var 1, 1 (1 SNP vardera 909 bp) medan GMR för NRPS och PKS var 2, 2 (1 SNP var 454 bp) respektive 1, 6 (1 SNP var 625 bp). Dessutom visade den fylogeniska analysen av de två genfamiljerna att den närmaste genen (estExt_fgenesh2_pg.C_2_t10203) till den funktionella NRPS-genen som beskrivs av Gallo et al. 8 (estExt_Genemark1.C_120304: PI 132610) var den mest muterade genen i genomet med 201 muterade nukleotider (figur 3).

För att bekräfta några av dessa mutationer med PCR-tekniker fokuserade vi vår studie i en NRPS-gen (PI 132610) och en PKS-gen (PI 173482) som har rapporterats vara involverad i OTA-biosyntetiska vägen för A. carbonarius 8, 9 . I NRPS-genen estExt_Genemark1.C_120304 (PI 132610) såg vi deletioner i promotorn och i exon 2. För att bekräfta dessa deletioner designade vi primrarparna NRPS1F / NRPS1R respektive NRPS2F / NRPS2R. Med grundpar NRPS1F / NRPS1R och NRPS2F / NRPS2R erhölls fragment om 640 bp respektive 671 bp. Sekvenser erhållna jämfördes med dem från Acv3-referensgenomet och inga skillnader observerades.

I PKS-genen estExt_Genewise1Plus.C_120511 (PI 173482) observerade vi 24 SNP. Bland dessa visades 7 att producera missense-mutationer. Dessutom identifierades borttagningar i det första exonet och i mitten av exonet 7 (figur 5). SNP: s position i genen jämfördes med positionerna för de förutsagda proteindomänerna för att visualisera deras möjliga effekter. 15 SNP: er påverkade 6 av de 9 domänerna (figur 6). För att bekräfta dessa borttagningar designade vi primrarpar PKS1F / PKS1R respektive PKS2F / PKS2R. Med grundparet PKS1F / PKS1R erhölls ett fragment av 437 bp. När sekvensen jämfördes med Acv3 visade sekvensen för den atoxigena stammen insättningar (14 bp) och substitutioner (7 övergångar och 2 transversioner). Med grundparet PKS2F / PKS2R erhölls ett fragment av 480 bp och visade 2 övergångar och 2 transversioner i exon 7 jämfört med sekvensen för den toxigena stammen Acv3.

Image

Den här figuren visar PKS-lokuset extraherat från ställningen_12, där det är beläget, som en grön pil. Riktningen för pilen visar att genen ligger på minussträngen i genomet. Siffrorna ovanför pilen indikerar koordinaterna för locus med avseende på ställningen. Raden "Konsensus" visar att positionerna inte var någon skillnad mellan referensgenomet och läsarna kunde detekteras i grått, SNP: erna i svart och raderingar som smala grå linjer. Siffrorna ovanför raden ”Konsensus” hänvisar till koordinaterna med avseende på genen. Raden "Täckning" visar ett histogram med fördelningen av läsarna längs genkroppen, skalan är från 0 till 19 läsningar. Raden "Varianter: Contig 2" visar positionerna för SNP: erna mellan referensgenomet och läsarna som gula sexhörningar. Raden "Täckning: Contig 2" visar positionen för borttagningarna som upptäckts av täckningsmetoden som blå former. Den nedre delen av figuren visar läsarna som är mappade på PKS. Läser delar som är lika med referensen visas i grått, medan SNP: er och InDels visas i svart. Röda rutor visar positionerna för sekvenseringsfärger.

Bild i full storlek

Image

Olika domäner representeras med olika former och färger, med det relativa namnet som rapporteras. Ospolade regioner representeras av en grå linje. De identifierade SNP: er som påverkar aminosyror belägna i de förutsagda domänerna rapporteras som röda märken.

Bild i full storlek

Diskussion

Trots att en stor mängd data produceras med de novo genomes-projekten är den genuina utmaningen hittills att bestämma de genetiska skillnaderna mellan individer och förstå deras förhållanden till fenotypiska skillnader inom arter. En möjlig metod är att identifiera de relativt små förändringarna mellan ett genom och en referenssekvens. Många sekvenseringstekniker har utvecklats för att utväxla projekt, men få av dem är lämpliga för att studera variation mellan individer eller arter. Vanligtvis är sequencers som producerar små läsningar med ett högt täckningsdjup och kan sekvensera med en par-end-teknik ett bra val att utföra resekventeringsstudier. Tyvärr är kostnaderna för dessa experiment ofta inte överkomliga av små forskningsgrupper. Andra billiga och tillgängliga sequencers finns tillgängliga på marknaden och kan användas för detta ändamål.

I den aktuella studien använde vi för första gången ett enda hagelgevär av 318 Ion Torrent-chipet för att utföra en jämförelse mellan referensgenomet Acv3 och en atoxigen vild stam av samma art. Vi försökte belysa specifika gener som är involverade i OTA-biosyntes och jämföra referensgenomet för en OTA-producerande stam av A carbonarius (Acv3) mot ett icke sekvenserat genom av en icke OTA-producerande vild stam av samma art. Tidigare arbete med Acv3 avslöjade att genomet kodar för minst 24 förmodade NRPS och 21 PKS som kodar gener 8, 9 . I vår studie hämtades totalt 24 NRPS-gener och 25 PKS-gener. Vi upptäckte också att i den atoxigena stammen fanns en hög ansamling av nonsens- och missense-mutationer i flera gener såsom PKS och NRPS-kodande gener. Den höga mutationsgraden för dessa gener kan förklara bristen på produktion av OTA av den atoxigena stammen.

OTA härstammar från den biosyntetiska vägen för svamp-polyketid. Huvuddelar av OTA-molekylen är en isokoumarindel och aminosyran fenylalanin. Emellertid förstås den molekylära basen för OTA-biosyntesen dåligt. Strukturen för OTA antyder en biosyntetisk väg inkluderande olika enzymatiska steg. Förutom biosyntes av fenylalanin krävs andra enzymatiska aktiviteter i OTA-vägen, såsom en PKS för syntes av polyketid-dihydroisocoumarin, ett klorerande enzym, ett metylas, ett esteras och en NRPS för ligering av fenylalanin till dihydroisocoumarin. Hittills har bara några OTA-relaterade PKS-gener upptäckts i OTA-producerande arter som Aspergillus ochraceus 3, Aspergillus westerdijkiae 6, Penicillium nordicum 4, Penicillium verrucosum 7, Aspergillus niger 13 och A. carbonarius 9 .

Numera är lite känt om generna involverade i OTA-biosyntesen av A. carbonarius, som är en konsekvent OTA-producerande art. På senare tid har dock några vilda icke-OTA-producerande stammar av A. carbonarius upptäckts 14 och några icke-kromatoxigena mutanta stammar har erhållits både genom inaktivering av gener som kodar för en NRPS 8 och en PKS 9 i en OTA-producerande stam av vild typ av A. carbonarius , som ger intressanta nya insikter i den biosyntetiska vägen för detta mykotoxin. Även om inga skillnader observerades i sekvenserna av denna NRPS-gen, hittades flera SNP i PKS-genen hos den atoxigena stammen. Båda generna 8, 9 har beskrivits vara involverade i OTA-biosyntetiska vägen för A. carbonarius . Förändringar detekterade i PKS-genen kan påverka proteinets funktion och kan vara ansvariga för atoxigenicitet i den icke OTA-producerande stammen av A. carbonarius .

Med våra resultat visar vi att Ion Torrent-tekniken kan vara ett bra alternativ till dyrare och att tack vare en specifik bioinformatik-pipeline är det möjligt att utvinna användbar information. Det verkar tydligt att den känsliga punkten är att utveckla ett specifikt arbetsflöde inte bara för att hantera och filtrera data för att uppnå en hög kvalitet på resultaten utan också att dra nytta av enskilda körningar för att analysera de strukturella variationerna mellan två genom 15, 16 . I det här fallet utvecklades en hemmagjord pipeline för att uppnå höga standarder för variationskallande med hjälp av de nyaste publicerade algoritmerna samt specifika bioinformatikmetoder. För SNP: er och DIP: er som ringer modifierade vi vår pipeline, SUPERW ( S antyder U nified P air- E nd R ead W orkflow), för att arbeta med läsningar i en ände. Eftersom det inte var möjligt att använda en parläsad metod utfördes SV: erna genom att använda en kopieringsnummervariation, baserad på skillnaderna i täckningsdjupet.

För att bidra till att belysa det lite kända OTA-biosyntetiska genklusteret av A. carbonarius , planerar vi att undersöka rollen för mutationerna som upptäcks i PKS- och NRPS-kodande gener i denna studie. I samma riktning planerar vi också ytterligare metabolomiska studier av både toxigena och atoxigena stammar.

Sammanfattningsvis avslöjade en djup inriktad metod baserad på en jämförande genomisk studie att det i den atoxigena stammen finns en hög ansamling av nonsens- och missense-mutationer i flera gener. Det är viktigt att en tvåfaldig ökning av GMR observerades i PKS- och NRPS-kodande gener och gav således intressanta ledtrådar om deras roll i OTA-biosyntetiska väg.

metoder

OTA-upptäckt av produktionsförmåga

OTA-produktion bekräftades med användning av en tidigare beskrivet HPLC-screeningmetod för högtrycksvätskekromatografi (17LC) utformad i vårt laboratorium. Stammarna A-1796 (vänligen tillhandahålls av P. Battilani som W-201 (= ITEM 5010) och A-2160 (= CECT 20837) från vår svampsamling inokulerades första trepunkterna på Czapek-jästextrakt Agar (CYA) och inkuberades vid 15, 25 och 30 ° C. Efter 7 och 15 dagars inkubation vid varje analyserad temperatur och från varje stam avlägsnades tre agarproppar från olika punkter i kolonin och extraherades med 0, 5 ml metanol. Extrakten filtrerades och hölls vid 4 ° C tills deras analys. Två replikat för varje analys och inkubationstillstånd som analyserades användes. Detektionsgränsen för extraktionsförfarandet och HPLC-tekniken var 0, 02 ng OTA, och kvantifieringsgränsen för HPLC-tekniken med extraktionsförfarandet var 0, 01 ng. μg / g för detta mykotoxin.

DNA-beredning och gensekvensanalys

Den icke-OTA-producerande stammen av A. carbonarius A-2160 odlades på maltekstraktbuljongmedium i mörkret vid 25 ° C under 48 timmar. Mycelium utvanns och maldes i fint pulver med användning av en mortel och stöt efter kort kväve djupfrysning. DNA-extraktion utfördes med användning av fenol-kloroform enligt det protokoll som beskrivs av Bragulat et al. 18 och behandlades med RNas för att bryta ned RNA. Primrar för partiell förstärkning av NRPS estExt_Genemark1.C_120304 (PI 132610) och PKS estExt_Genewise1Plus.C_120511 (PI 173482) designades med Primer3 tool 19 . Primers NRPS1F (5′ – TTTCCCCTACTTCGTGCCAC-3 ′) och NRPS1R (5′-CTAGAACCCCGTGCCCTTTT-3 ′) och NRPS2CC-5 (5′-GTGGTTGTGTCTCCGGATGT-3 ′) och NRPSAT 3CC i promotorn och i exon 2 av NRPS estExt_Genemark1.C_120304 (PI 132610) gen, respektive. Primers PKS1F (5′-GACAAGGGTGGTGAGGATGG-3 ′) och PKS1R (5′- CATTGTGCTGGACTTTGGGCC-3 ′) och PKS2F (5′-CAACTTCCTCCTGACCGCAT-3 ′) och PKS2RG (5GAC) i det första exonet och i mitten av exon 7 av PKS estExt_Genewise1Plus.C_120511 (PI 173482) gen, respektive. PCR-produkterna renades med MultiScreen-filterplattor (Millipore, Barcelona, ​​Spanien) enligt tillverkarens protokoll. Den renade produkten användes som en mall för sekvensering. Big-Dye Terminator v3.1 Cycle Sequencing kit (Applied Biosystems) och primrar NRPS1F / R, NRPS2F / R, PKS1F / R och PKS2F / R användes för sekvensering enligt specifikation av tillverkaren. En Applied Biosystems 3730 sequenser användes för att erhålla DNA-sekvenserna. Sekvensinställningar utfördes med användning av programvaran Clustal X v2.0.12 20 .

DNA-genom Ion Torrent-sekvensering

Fragment DNA-bibliotekskonstruktion utfördes med användning av Ion Xpress Plus Fragment Library Kit (Life Technologies). 100 ng genomiskt DNA användes för enzymatisk skjuvning och ligering av Ion Torrent ™ -adaptrar enligt tillverkarens instruktioner. Fragment av 330 bp valdes med 2% agarosgelelektrofores med användning av E-Gel iBase ™ Power System och E-Gel Safe Imager ™ (Invitrogen, Life Technologies). Kvaliteten och kvantiteten hos det genomiska DNA-biblioteket bedömdes genom att analysera dem i High Sensitivity DNA-chip i 2100 Bioanalyzer (Agilent). Mallförberedelse för sekvensering gjordes i Ion OneTouch ™ 2-systemet av Ion OneTouch 200 Template Kit v2 (Life Technologies) enligt tillverkarens anvisningar.

Sekvensering utfördes på Ion Torrent Personal Genome Machine (PGM) -plattformen med användning av Ion PGM 200 Sequencing Kit och ett Ion 318-chip (Life Technologies).

Helt svampgenomutjämning

Vårt arbetsflöde delades upp i tre steg. Filtrerings- och kartläggningssteget som används som inmatning av råavläsningarna som produceras av en NGS-sekvenserare och med användning av anpassade användarparametrar, filtrerar automatiskt råavläsningarna och skapar en ny delkvalitet av hög kvalitet som är lämplig för kartläggningsanalyser 21 . Efter filtreringssteget mappades alla prover mot Acv3-referensgenomet med användning av bwa mem-algoritmerna 22 . För variationen som kallar de mappade bamfilerna och referensgenomet är inmatningsfilen i det tredje steget i pipeline där användaren kan välja att extrahera små variationer (SNP och DIP), stora variationer (raderingar, inversioner och duplikationer) eller båda 23 . Mer än 3E106 jon torrent råavläsningar med en maximal längd av 328 bp användes i resekventeringsexperimentet. Filter- och trimningsprocessen gjord med en hemmagjord pipeline baserad på cutadapt-verktyget 24 kasserade endast 0, 1% av hela läsuppsättningen och minskade läslängden vid 262 bp (minsta läslängd 20 bp). Inriktningsprocessen genomfördes på referensgenomet Acv3 sammansatt av 963 ställningar för en total storlek på 36 Mb. Avläsningarna kartlades på Acv3 med bwa-mem-algoritmen 22 . Cirka 2, 8 miljoner läsningar kartlades på referensgenomet, vilket lämnade 0, 3 miljoner obemannade läsningar. Cirka 2, 3 miljoner kartlade unikt (kompletterande tabell S4). Två justeringsfiler skapades för att utföra SNP: er och DIP-samtal och CNV-analys. Den första justeringen skapades endast med de unika mappade läsningarna och den andra med alla de kartlagda läsningarna för studierna. Båda justeringarna filtrerades för kartläggningskvalitet och PCR-duplikat avlägsnades. I de två kartläggningsexperimentet är medelstäckningen 12, 29 × respektive 11, 36 × och den icke-mappade regionstorleken är 6 Mb och 3, 5 Mb vilket markerar att referensgenomet Acv3 består av ~ 3 Mb repetitiva regioner.

SNP: er och DIP: er som ringer

Samtalet utfördes med samtools 25 på den unika mappade inriktningen och resulterande SNP: er och DIP: er filtrerades och kommenterades med SnpSift 26 . Alla homozygota SNP: er> 4 och DIP med ett djup> 6 och en samtools kvalitet> 30 användes för vidare analys. SNP och DIPs annotering och brytning utfördes med SNPeff 27 med skapandet av en anpassad SNPeff-databas med Acv3 och anpassad parameter för svampgenomen. Som referensgenmodell användes gff3-filen i referensgenomet Acv3.

CNV-analys

CNV-analys utfördes med cnvnator 28 med användning av den multipla mappade inriktningen. För varje ställning extraherades CNV-regionerna med en binstorlek på 1 Kb, filtrerades för p-värde <0, 05, dupliceringsnivå <50% och delades upp i raderade eller duplicerade regioner i enlighet med täckningen av kopieringsnummervarierade regioner (tabell S5) . Med koordinaterna för CNV: s lista över duplicerade eller raderade gener skapades.

NRPS och PKS gener identifiering

För att identifiera NRPS- och PKS-generna i A. carbonarius användes proteinsekvenserna för PKS estExt_Genewise1Plus.C_120511 och NRPS estExt_Genemark1.C_120304 för en BLASTp-sökning. De resulterande generna filtrerades med användning av AntiSmash och Interproscan identifiering av domänkomposition. Endast NRPS-generna som visade samma domänkomposition för estExt_Genemark1.C_120304, dvs AMP-bindande (PF00501), PP-bindning (PF00550), Kondensation (PF00668), användes för ytterligare analyser. På liknande sätt är det bara PKS-generna som visar samma domänkomposition för estExt_Genewise1Plus.C_120511, dvs Ketoacyl-synt_C (PF02801), Acyl_transf_1 (PF00698), PS-DH (PF14765), Methyltransf_12 (PF08242), ADH08 (PF08) PP-bindande (PF00550) användes för ytterligare analyser. De identifierade NRPS- och PKS-generna listas i tilläggstabellen S6. Domänkomposition för PKS estExt_Genewise1Plus.C_120511 (PI 173482) -proteinet förutses med användning av SMART (//smart.embl-heidelberg.de/) och letade efter tidigare homologer och PFAM-domäner. Diagrammet över proteinet och de påverkande SNP: erna utfördes med Expasy MyDomains (//prosite.expasy.org/mydomains).

Molekylär fylogenetisk analys

Filogenhistorier för NRPS och PKS slogs ut inom Phylogeny.fr-miljön (//www.phylogeny.fr/ webcite ). Varje proteingrupp var i linje med MUSCLE. Rekonstruktion med maximal sannolikhetsfilogeni användes med WAG- och WAG + I + G + F-modeller för NRPS respektive PKS. Konsensusträdet från bootstrap slogs ut från 100 repliker. De fylogenetiska träden visualiserades med FigTree 1.3.1.

Genantologianalys

Gene Onthology-analysen har utförts med Blast2Go v 2.6.6 29 med hjälp av standardalternativet och standardnoteringsrörledningen. Resultaten användes i REVIGO 30 för att rengöra GO-resultaten, skapa ett icke-redundant dataset och markera de mer representativa GO-kategorierna.

Ytterligare information

Anslutningskoder : Genomfördelning av information om A. carbonarius A-2160 har deponerats i European Nucleotide Archive (ENA) under anslutningen PRJEB6789.

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.