Saliv- och pellikelproteom: en datamininganalys | vetenskapliga rapporter

Saliv- och pellikelproteom: en datamininganalys | vetenskapliga rapporter

Anonim

ämnen

  • Data mining
  • Molekylär medicin

Abstrakt

Vi siktade på att heltäckande jämföra två fackformade orala proteomer, spott och tandpellikelproteom. Systematisk granskning och datamining användes för att erhålla de fysikalisk-kemiska, strukturella, funktionella och interaktionella egenskaperna för 1 515 salivhalt och 60 identifierade pellikelproteiner. Spott- och pellikelproteiner skilde sig inte signifikant i deras alifatiska index, hydrofati, instabilitetsindex eller isoelektriska punkt. Pellikelproteiner var signifikant mer laddade vid lågt och högt pH och var signifikant mindre (10–20 kDa) än salivproteiner. Proteinstruktur och lösningsmedel tillgänglig molekylär yta skilde sig inte signifikant. Proteiner i pellikeln var mer fosforylerade och glykosylerade än salivproteiner. Jonbindning och enzymatiska aktiviteter skilde sig också signifikant. Protein-protein-ligand-interaktionsnätverk förlitade sig på få viktiga proteiner. De identifierade skillnaderna mellan saliv- och pellikelproteiner kan leda proteomavdelning och resultera i specialiserad funktionalitet. Nyckelproteiner kan vara potentiella mål för diagnostisk eller terapeutisk tillämpning.

Introduktion

Munhålan innefattar hundratals proteiner med ett stort antal biologiska funktioner som immunförsvar och biofilmhomeostas, näringsämnes sönderdelning och remineralisering av hårda tandvävnader 1, 2 . Dessa proteiner kännetecknas av molekylärdrag, som abstrakt uttrycks av poäng som alifatiskt index, hydrofati, instabilitetsindex, nettoladdning och isoelektrisk punkt. På liknande sätt har proteiner unika aminosyrasekvenser som påverkar deras struktur, funktion, bindningsförmåga, funktionalisering via glykosylering och fosforylering samt interaktion med andra proteiner, ligander eller bakterier 3 . För att förstå organisationen och funktionen av en proteom och identifiera möjliga mål för medicinsk diagnostik eller terapi, måste de individuella egenskaperna och den resulterande relevansen av ett protein i en specifik miljö undersökas 4, 5 . En sådan djupare förståelse av alla proteiner i en proteom skulle möjliggöra identifiering av möjliga fysikalisk-kemiska, strukturella eller funktionella mönster, vilket kan underlätta en djupare förståelse av den lokala proteinbiologin och hjälpa till att översätta erhållna fynd till andra proteomer 4, 6 .

I munhålan finns det faktiskt inte en utan ett antal proteomer. Beträffande tandhårda vävnader är två proteomer relevanta; salivproteomet och den förvärvade emaljpellikelproteomen. Båda har beskrivits i ett antal studier 7, 8, 9 . Medan salivproteomet är av hög komplexitet och reglerar lösliga signalmolekyler eller joner såväl som det orala försvaret via antikroppar, är pellikelproteomet mindre och fungerar som substratskydd, smörjmedel och regulator för tandhårda mineralhostostas i hård vävnad, samtidigt som den presenterar bindande motiv för bakterieytreceptorer och därigenom möjliggör kolonisering av tänder av bakterier 10, 11, 12 .

Det är inte förvånande att pellikelproteomet utgör en underpopulation av salivproteomet. Den lokala och förmodligen funktionella avdelningen av båda proteomerna är för närvarande inte helt förstås 13 . Därför syftade den aktuella studien till att få insikt i proteinegenskaperna som leder till denna fackdelning och därmed möjliggöra identifiering av funktionella skillnader och mönster på protein- och proteomnivå med möjlig relevans för klinisk eller translationell tillämpning. Med tanke på att enstaka studier vanligtvis inte kan tillåta fullständig statistisk utforskning av ett större antal egenskaper och dessutom lider av begränsad tillförlitlighet togs en systematisk granskning och datamining.

Resultat

Granska resultaten

Vår systematiska översikt identifierade 43 artiklar som rapporterade proteomiska data om salivproteiner och 11 artiklar om den förvärvade emaljpellikeln. Inkluderade studier indexerade ett medelvärde av 630 (26/6 830) (medelvärde [min / max]) proteiner för saliv och 85 (17/223) proteiner för pellikeln. Det resulterande preliminära datasettet inkluderade totalt 5 228 proteiner (4 833 som finns unikt i saliv, 81 unikt hittade i pellikeln, 281 hittade i båda) (Fig. 1a). Majoriteten av proteinerna rapporterades endast en eller två gånger (fig. Ib). Med användning av tre oberoende experimentella identifikationer som stringensavstängning för inkludering, förblev totalt 1 515 proteiner i salivproteomet och 60 i pellikelproteomet (30, 2% av de ursprungligen identifierade proteinerna; 30, 8% i saliv och 16, 6% i pellikelproteom) (Fig. 1c, kompletterande tabell 1). Alla proteiner i pellikelproteomet rapporterades också i salivproteomet. Den genomsnittliga överlappningen av proteiner rapporterade genom olika studier var 10, 8% (0, 0 / 84, 2%) (medelvärde [min / max]) för saliv och 24, 9% (0, 0 / 62, 3%) för pellikeln (Fig. 1d).

(a) Det preliminära datasettet inkluderade alla extraherade proteiner, med dålig överlappning mellan saliv (blå) och pellikelproteiner (gul) (denna överlappning borde vara mycket högre med tanke på att pellikelproteiner stammar från saliv). (b) Andel proteiner identifierade n-gånger i pellikeln (vit) eller saliv (grå). Majoriteten av proteinerna i båda proteomerna rapporterades endast en eller två gånger. Den prickade röda linjen indikerar den tillämpade stränghetsavstängningen för inkludering i den slutliga databasen. (c) Efter tillämpning av avgränsningen av tre oberoende experimentella identifikationer inkluderade den slutliga databasen 1 575 proteiner. I denna uppsättning rapporterades också alla pellikelproteiner (gula) för saliv (blå). (d) En värmekarta visar den relativa överensstämmelsen mellan proteiner som rapporterats i olika studier (dvs procenten av proteiner som identifierats i en jämfört med den andra studien efter applicering av avstängningen). Antalet ursprungligen rapporterade proteiner (före avskärning) visas i det övre stapeldiagrammet och andelen proteiner som ingår i den slutliga databasen (per ursprungligt antal rapporterade proteiner) visas i stapeldiagrammet till höger. För att demonstrera effekten av avstängningstillämpning visas relativ överensstämmelse mellan rapporterade pellikelproteiner innan appliceringen av avstängningen i inkorgen. P: Pellicle, S: Saliva, S-Pho: fosforylerade salivproteiner, S-Gly: Glykosylerade salivproteiner.

Bild i full storlek

Den resulterande databasen validerades mot proteomdata rapporterade för spottkörtlarna (huvudkällan för orala proteiner), som registrerades av två oberoende globala dataressurser med användning av immunohistologisk 14 och masspektrometrisk identifiering 15 . Vi bekräftade att 87, 1% av de inkluderade proteinerna har rapporterats där minst en gång, men endast 49, 8% av de uteslutna proteinerna (kompletterande figur 1). Dessutom hittade vi inte indikation för möjlig selektionsförspänning via molekylvikt eller experimentell signalintensitet (kompletterande figur 2).

Fysikokemiska proteomegenskaper

För att få djupare inblick i de specifika egenskaperna hos båda proteomerna bedömde vi först de fysikalisk-kemiska proteinegenskaperna som alifatiskt index, hydrofati, instabilitetsindex, nettoladdning och isoelektrisk punkt. Vi fann inga signifikanta skillnader (p> 0, 2605; Mann-Whitney-U-test) mellan salivproteiner och pellikeln för de undersökta egenskaperna (fig. 2a).

(a) Kartplotterna representerar median (ruta: 25: e / 75: e percentiler, visp: minimi / maximalt) fysikalisk-kemiska egenskaper hos pellikelproteinerna (vit) och saliv (grå) proteiner. Ingen statistiskt signifikant skillnad mellan båda proteomerna hittades. (b) Medel nettoladdning (± 95% Cl) för båda proteomerna vid olika pH. Pellikelproteiner (vit, prickad konfidenssträng) visade en högre positiv nettoladdning under sura förhållanden (pH 10, 5). Den röda linjen indikerar de beräknade p-värdena för varje pH. (c – e) Analys av molekylvikt och längd på proteinkedjor i pellikel (vit) och saliv (grå) proteiner. Pellikelproteiner var signifikant mindre än salivproteiner. Huvudfraktionen av pellikelproteiner var mindre än 30 kDa eller kortare än 300 aminosyror. Stora proteiner (> 100 kDa /> 900 aminosyror) hittades oftare i saliv. Statistisk jämförelse av proteomer utfördes med användning av Mann-Whitney-U-test: * p <0, 01, ** p <0, 001.

Bild i full storlek

Eftersom den orala miljön utsätts för fysiologiskt varierande pH-värden beräknade vi nettoladdningen för varje protein per proteom vid inkrementella pH-steg mellan pH 1 och 14. Vi fann signifikanta skillnader mellan de två proteomerna (Fig. 2b) med pellikel proteiner som har en högre genomsnittlig nettoladdning under extrema pH-förhållanden än salivproteiner (pH 1, 00–4, 25: p = 0, 0015; pH 9, 50–14, 00: p = 0, 0033).

Därefter undersökte vi proteinstorleken i båda proteomerna. I allmänhet var pellikelproteiner betydligt mindre och lättare (p = 0, 0009 för molekylvikt, p = 0, 0042 för molekylär längd) än salivproteiner. Medan hälften av proteinerna i pellikeln var mindre än 30 kDa, hittades större proteiner (> 100 kDa) nästan uteslutande i salivproteomet (Fig. 2c – e).

Analys av aminosyradistribution och proteinstrukturer

Aminosyradistributionen skilde sig signifikant mellan båda proteomerna, varvid Histidine, Isoleucine, Proline och Arginine var underrepresenterade i pellikeln (p <0, 01, fig. 3a, b).

(a) Fyra aminosyror (Arg, His, Ile, Pro) uttrycktes signifikant mer eller mindre i pellikeln (vit) än i saliven (grå). (b) Genomsnittliga vikförändringar (log2) för uttryck av aminosyra i pellikeln jämfört med saliv. Proteiner i pellikeln inkluderade Gln, Gly, Tyr, Asn, Cys och Phe oftare än salivproteiner, medan expressionsfrekvensen för alla andra aminosyror var lägre i pellicle än salivproteiner. (c) Sammanfattning av den förutsagda exponeringen för aminosyror i proteiner i pellikeln (vit) och saliv (grå). En signifikant skillnad hittades endast för Asp. (d) Den förutsagda exponeringen av aminosyror var högre i pellikeln än salivproteiner för alla utom fem aminosyror (Ser, Glu, Ala, Val, Leu). (e) Kombinerade resultat (medelvärde ± 95% Cl [log2]) avslöjade inte en enda aminosyra som både uttrycktes på olika sätt och på olika sätt. Mann-Whitney-U-test applicerades för statistisk jämförelse: * p <0, 01, ** p <0, 001, *** p <0, 0001; aa = aminosyra.

Bild i full storlek

Lösningsmedlets molekylära yteksponering av de specifika aminosyraresterna skilde sig signifikant för asparagin (p <0, 0001) (fig. 3c, d). Sexton aminosyror exponerades proportionellt i pellikeln jämfört med saliv (med Cystein, fenylalanin och Tryptophan som den mest överexponerade), medan dessa skillnader inte nådde statistisk betydelse (p> 0, 02). Fyra aminosyror (Leucine, Valine, Alanine och Glutamine) utsattes för återigen, utan statistisk signifikans. Vid bedömningen av kombinationen av aminosyradistribution och exponering fanns det ingen enstaka aminosyra som skilde sig mycket i inte en utan båda egenskaperna i pellikeln mot saliv (fig 3e).

Vi undersökte vidare den sekundära strukturen för pellikel- och salivproteiner. I ett första tillvägagångssätt beräknades den relativa mängden alfa-helices, beta-strängar och spiralstrukturer, vilket avslöjade inga signifikanta skillnader mellan de två proteomerna (Fig. 4a; p> 0.5003). De flesta proteiner i båda proteomerna uppvisade ett dominerande strukturellt motiv eller en rådande spiralstruktur (Fig. 4b). Den totala tillgängliga lösningsmedelsmolekylära ytan var mycket jämförbar mellan salivproteiner och pellikelproteiner (fig. 4c). Cirka 30% av resterna exponerades och 30% begravdes på insidan av molekylerna.

( a ) Typiska strukturer som alfa-helices, beta-ark och spolar förutsågs inte signifikant olika för båda proteomer (pellicle: vit; saliv: grå). ( b ) Pellikeln inkluderade fler proteiner med en nästan spiralstruktur, men inga proteiner bestående endast alfa-helices. Sammantaget var salivproteiner mer organiserade. Kategorier: “spiralformig / tråd / spole” => 90% av aminosyrorna förutsägs vara organiserade i detta motiv; "Huvudsakligen spiralformad / huvudsakligen tråd / majorly spiral" = 50–90% förutspås inkluderas i dessa motiv; "Blandat" = <50% av aminosyrorna tillhör en typ av sekundärstrukturmotiv. ( c ) Frekvensen för exponerade eller begravda aminosyror skilde sig inte heller signifikant (pellikel: vit; saliv: grå). ( d ) Båda proteomerna (pellikel: vit; saliv: grå) hade jämförbar fördelning av molekylformer. En poäng på 1 indikerar en perfekt sfärisk form, högre poäng indikerar mer sträckta former. AU = godtyckliga enheter ( e ) Organisation av kvartär struktur var mer komplex för salivproteiner. Pellikeln inkluderade fler proteiner med färre upprepningar och underenheter. Spottproteiner är ofta organiserade i större komplex av upp till 14 underenheter och 12 upprepningar. Statistisk jämförelse av proteomer utfördes med användning av Mann-Whitney-U-test.

Bild i full storlek

Vi erhöll vidare tredimensionell data om proteiner och beräknade en formpoäng för varje molekyl, där en poäng av en återspeglar en exakt rund molekyl, medan högre poäng representerar mer sträckta former. Det fanns ingen signifikant skillnad i formfördelning mellan båda proteomerna (p = 0, 202; Fig. 4d).

Slutligen bedömde vi de kvartära proteinstrukturerna och grupperade tillgängliga tredimensionella strukturer (fig. 4e). Pellikelproteiner bestod av färre underenheter arrangerade i färre upprepningar än salivproteiner, vilket är i enlighet med att pellikelproteiner i allmänhet är mindre.

Funktionalitet och interaktioner

Modifiering efter översättning genom fosforylering och glykosylering (fig. 5a) var signifikant vanligare i pellikel än salivproteiner (p <0, 0001). Bindning av metalljoner visade olika mönster i pellikel än salivproteiner, medan dessa skillnader förblev statistiskt icke-signifikanta (p = 0, 4056; Fig. 5b). Detaljerad analys visade högre bindningsförmåga för järn och koppar i pellikel än salivproteiner, medan kalcium- och magnesiumbindning var vanligare i saliv än pellikelproteiner. Bindning av mangan, kalium och kobolt begränsades endast till salivproteiner, medan bindning till zink rapporterades för 30% av metallbindande proteiner i båda datauppsättningarna (fig. 5c).

(a) Proteiner i pellikeln (vit) fosforylerades och glykosylerades (p <0, 0001). (b, c) Potentialen att binda till metaller skilde sig åt mellan båda proteomerna. Bindning av kobolt, kalium och mangan var begränsad till salivproteiner (grå). (d, e) Andel proteiner med enzymatisk funktion. Spottproteomet (grått) inkluderade alla sex huvudsakliga enzymklasser. Pellikel (vita) enzymfunktioner var begränsade till oxidoreduktaser, transferaser, hydrolaser och lyaser. (f) Analysanrikning av genontologi avslöjar funktionella skillnader mellan proteinet i pellikeln och saliven. Proteinerna i pellikeln berikades för enzymreglerande funktioner och inkluderade en högre potential att binda till andra proteiner (p = 0, 0016). Proteinräkningar per kategori representeras av grå staplar, den röda linjen indikerar beräknade p-värden för varje ontologi. Mann-Whitney-U-testet arkiverades för statistisk jämförelse.

Bild i full storlek

Eftersom de flesta av dessa joner fungerar som enzymatiska samfaktorer undersökte vi hur ofta olika enzymklasser hittades i varje proteom (Fig. 5d). 35% av salivproteinerna uppvisade en enzymatisk aktivitet, medan i pellikeln var denna andel 23% (p = 0, 0535). Clustering för de huvudsakliga enzymklasserna fann ett jämförbart innehåll av oxidoreduktaser, transferaser och hydrolaser i båda proteomerna. Däremot inkluderade pellikeln fler lyaser, medan isomeraser och ligaser var begränsade till salivproteomen (fig. 5e). Funktioner för dessa salivspecifika enzymer inkluderade cis-trans-isomeraser (EC 5.2.xx), intramolekylära oxidoreduktaser (EC 5.3.xx), intramolekylära transferaser (EC 5.4.xx), enzymer som bildar kol-syrebindningar (EC 6.1.xx), kol-svavelbindningar (EC 6.2.xx) eller kol-kvävebindningar (EC 6.3.xx).

Vi jämförde annotationer av genontologi (GO) för båda proteomerna för att dechiffrera skillnader i funktionalitet (Fig. 5f). Jämfört med salivproteomen inkluderade pellikelproteomet signifikant mer anrikade funktioner för enzymaktivering och hämning i kombination med potentialen att binda proteinstrukturer (p = 0, 0016). Den starkaste anrikningen hittades för aktivitet av endopeptidashämmare av cystein-typ, medan mer än 40 proteiner kommenterades som proteinbindemedel.

Protein-protein-interaktioner (PPI) i båda proteomerna extraherades från nyligen publicerade datasätt 16, 17, 18, 19, vilket resulterade i 21 058 poster. Av dessa togs 8 907 duplikat bort och 538 självinteraktioner utesluts för bättre visualisering, vilket gav en slutlig uppsättning av 11 613 protein-protein-interaktioner (mellan totalt 1 273 proteiner). Den resulterande PPI-analysen inkluderade 88, 3% av proteinerna i pellikeln och 80, 5% av salivproteinerna; för de återstående proteinerna hade inga interaktioner rapporterats. Dessutom förutsågs 243 interaktioner med icke-pellikulära icke-salivära ligander, vilket gav 1 918 ytterligare interaktioner (Fig. 6a).

(a) Översikt av interaktomen som representerar 1220 salivproteiner (orange), 53 pellikelproteiner (blå) och 223 ligander (grön). Protein-proteininteraktioner extraherades från litteraturen och ligandinteraktioner förutspådde. (b – d) Majoriteten av proteiner och ligander visade 1–5 eller 5–10 interaktioner.

Bild i full storlek

Interkonnektivitet var liknande mellan proteomer med ett medelvärde av 16 (1/264) (medelvärde [min / max]) och 12 (1/184) interaktioner per protein i saliv respektive pellikelproteom (Fig. 6b – d). När vi undersökte hela pellikelinteraktomet (fig. 7) fann vi 732 interaktioner (5, 4% av alla identifierade interaktioner), 405 av dem med salivproteiner (26, 7% av alla salivproteiner) och 48 med potentiella ligander (11, 5% av alla ligander) ). De fem mest anslutna proteinerna (> 50 interaktioner) i pellikeln var Serumalbumin, Annexin A1, alfa-enolas, glyceraldehyd-3-fosfatdehydrogenas och 14–3–3 protein zeta / delta. De vanligaste observerade liganderna var kalcium, N-acetylglukosamin och järn. I överensstämmelse med resultaten från GO-anrikningsanalysen innehöll de oftast samverkande proteinerna enzymatiska reglerande funktioner, enzymatisk aktivitet och proteinbindande potential.

De 53 proteinerna i pellikeln (blå) interagerar med 405 salivproteiner (orange) och 28 ligander (grön). Interaktomen domineras starkt av 5 proteiner (markerade med proteinnamn), som visar> 50 interaktioner vardera. Interaktioner extraherade från externa källor är mörkgrå, förutsagda protein-ligandinteraktioner visas med röda linjer. Varje protein specificeras med dess gen-ID. Ligand ID är baserade på Protein Data Bank ligandförkortningar (www.rcsb.org). En högupplöst version av denna siffra finns i online-tillägget. ALBU = Serumalbumin, ANXA1 = Annexin Al, ENOA = alfa-enolas, G3P = glyceraldehyd-3-fosfatdehydrogenas, 1433Z = 14-3-3 protein zeta / delta.

Bild i full storlek

Diskussion

Generering och jämförelse av data om proteinsekvenser förbättrar avsevärt förståelsen för vävnadsspecifik proteinfunktion i hälsa och sjukdom 20 . Att koppla olika datasätt till varandra och tillämpa en rad bioinformatiska analysverktyg gör det möjligt att generera en tillförlitlig och giltig databas och flytta från ren molekylär beskrivning av enstaka proteiner till systembiologi och identifiering av viktiga proteiner för möjliga medicinska tillämpningar 21, 22 . Exempelvis kombinerades data från olika förvar och källor för att definiera kärnproteinerna i den humana proteomen, med GO-annotering som användes för att identifiera signaleringssekvenser för protein (re) lokalisering och molekylär organisation 15, 23, 24 . På liknande sätt utvärderades biomarkörer för graviditetsassocierade avvikelser genom att använda en sådan datamining och jämförelse-metod 25, liksom den humana spermieproteomen 26 . Med tanke på den biologiska, men också medicinska relevansen och potentialen hos mänskligt saliv 27, behövdes också en omfattande och strukturerad analys av saliv- och pellikelproteom.

Föreliggande studie använde ett sådant tillvägagångssätt och kombinerade en systematisk översyn med bioinformatiska analyser. Vi hittade specifika skillnader mellan pellikel och salivproteiner, men bekräftade också att proteomer var ganska lika i många aspekter (som man kan förvänta sig med tanke på att pellikelproteom utgör en undergrupp av salivproteomet).

Förvånansvärt skilde sig proteomerna inte signifikant med avseende på deras fysikalisk-kemiska egenskaper, molekylära organisation eller lösningsmedel tillgängliga yta; den enda skillnaden i detta avseende var molekylärstorleksfördelning, varvid pellikelproteiner var betydligt mindre och kortare. Det senare kan vara, eftersom rekrytering av salivproteiner till emaljytan är en selektiv process 12, 13 som påverkas av proteinets vikt och form 4 . Denna selektivitet kan ökas genom ytterligare post-translationell modifiering och processreglering (till exempel genom fosforylering av Serine, vilket ökar proteinbindningsstyrkan till hydroxyapatit 28 ). Vi observerade högre grad av fosforylering (och glykosylering) i vår analys som stödjer den nämnda selektiva regleringen av molekylär affinitet till tandemaljen.

Detta fynd kan vara relevant för potentiella terapeutiska tillämpningar. Dessutom uppvisade pellikelproteinerna en högre nettoladdning under extrema pH-förhållanden, vilket leder till en högre buffertkapacitet i mycket sura (och även mycket alkaliska) milier. Detta ökar den joniska interaktionsstyrkan hos proteiner som binder till hydroxyapatitytor och skyddar emaljen mot sura attacker 4 . Salivproteiner behöver inte tillhandahålla en sådan effektiv buffring eftersom detta upprätthålls av lösliga joner i saliven. Däremot behöver salivproteiner skydd mot okontrollerad denaturering och minskad affinitet till orala ytor, vilket båda förmodligen realiseras av proteiner som är större i saliven (än pellikeln).

Dessutom fann vi att pellikelproteomet inkluderade signifikant fler enzymer än salivproteomet, med högre enzymatisk aktivitet för lyaser och isomeraser och högre hämmande funktion för proteaser i pellikeln. Pellikelns funktionalitet bibehålls sannolikt genom enzymatisk aktivitet inklusive tvärbindning och aminosyrasidokedja-modifikationer, medan destruktiva mekanismer via proteaser / peptidaser reduceras 3, 29, 30 . De beskrivna sidokedjemodifikationerna med socker- eller fosfatrester kan tjäna som dominerande underlag under pellikelmognad. Den mest berikade molekylfunktionen, endopeptidasinhibitoraktivitet av cystein-typ, stöder också detta scenario: Endopeptidaser är viktiga enzymer för nedbrytning av proteiner hos däggdjur 31 . I ett växande proteinhaltigt skikt är denna funktion motproduktiv; enzyminhibitoraktivitet kan således behövas för att manifestera en stabil och funktionell pellikel.

Förutom molekylstorleken och enzymatiska skillnader kan skillnadspotentialen att binda till andra proteiner bidra till pellikelns funktionalitet. En hög tvärbindningspotential har avslöjats för pellikelproteiner, med> 75% som har potentialen att binda andra proteiner. Denna specifika funktion hjälper till att bygga strukturerade och funktionella proteinlager, men hjälper också till att organisera tandbiofilm 11 . Sådana protein-proteinkomplex kan vidare tjäna som ett anti-erosivt skydd av emaljen 2, 32 . Vi identifierade fem proteiner som interagerar med> 50 saliv- och / eller pellikelproteiner och som representerar 59% av alla upptäckta PPI: alfa-enolas och glyceralaldehyd-3-fosfatdehydrogenas är välkända enzymer i glykolys och fungerar som obligatoriska proteiner i metabolism i många vävnader och kroppsvätskor. Vår analys identifierade också serumalbumin och Annexin A1 som viktiga nav i pellikelinteraktomen, båda är relevanta för att binda olika joner (vilket kan underlätta tandhårvävnads remineralisering). Det mest interagerande proteinet var 14–3–3 zeta / delta, som har identifierats som multi-adapterprotein implicerat i reglering av allmänna och specialiserade signalvägar genom att binda och modulera aktiviteten hos bindningspartnern. Alla fem proteinerna är relevanta mål för diagnostiska applikationer 7, 33, 34 men kan också vara relevanta terapeutiskt, t.ex. för tandhantering av biofilm. Inriktning på dessa eller andra specifika proteindomäner via administration av specifikt modifierade, probiotiska bakterier med hög affinitet till dessa strukturer kan vara genomförbart. En annan terapeutisk tillämpning kan vara att modifiera och förbättra pellikelstrukturen och funktionen mot anti-bakteriell eller anti-biofilm vidhäftningsegenskaper. I allmänhet kan den identifierade specifika strukturen och funktionaliteten hos pellikeln jämfört med saliven vara användbar för att utforma selektiva farmaceutiska läkemedel. medan en mer specifik analys av både proteomer i hälsa och sjukdom sannolikt kommer att vara användbar för att identifiera biomarkörer för individualiserad prognos och behandlingsbeslut 9, 35 .

Masspektrometri-baserad proteinidentifiering har blivit guldstandarden för proteomanalyser 35, men är benägen för tekniska och interindividuella variationer, vilket påverkar reproducerbarheten mellan laboratorierna 36, 37 . Föreliggande studie visade att publicerade datasätt från enstaka studier om saliv- och pellikelproteom var begränsade. Genom att kombinera flera datasätt i en omfattande databas efter systematisk granskning och använda ett strikt avgränsningskriterium ökade detta avtal betydligt och gav en reproducerbar grund för undersökningen av proteomer. Den härledda aminosyradistributionen bekräftas med tillgängliga experimentella data 38, 39, 40, 41, vilket bekräftar att vårt analytiska tillvägagångssätt att vara giltigt.

Denna studie har ett antal begränsningar. Först ökade den tillämpade stränghetsavbrytningen pålitligheten för den konstruerade databasen, men är benägen för informationsförlust och minskad känslighet. Detta reducerade också antalet inkluderade proteiner, särskilt i pellikelproteomet, vilket resulterade i begränsad statistisk effekt för många jämförelser. Statistisk icke-betydelse bör således inte förväxlas med biologisk icke-skillnad. För det andra var denna studie inte deduktiv, det vill säga hypotest, utan utforskande. Metoden för datamining är benägen för falsk-positiva fynd, varför vi fastställde en strängare nivå av betydelse och redogör för den möjliga alfa-inflationen. För det tredje består den etablerade salivproteomen säkert proteiner som härstammar från blod, serum, epitelia och mikroorganismer, varav de flesta inte utsöndras av salivkörtlarna 33, 34 . Att inkludera dessa proteiner var motiverat med tanke på att det resulterande hela salivet är den verkliga fysiologiska kroppsvätskan. För det fjärde kommer både biologisk interindividuell varians och tekniska aspekter som provsamlingsmetod och tid att påverka den resulterande uppsättningen proteiner som identifierats i varje studie 42 . I linje med detta kommer post-translationella modifieringar att variera mellan experimentella förhållanden. I silikoanalyser är analyser användbara för att undersöka hur olika miljöförhållanden teoretiskt kan påverka proteinmodifiering, struktur och funktionalitet. Hög genomströmningsdata behövs för att säkerställa mer konkret information om någon extern reglering av aminosyramodifieringar eller eventuella tvärsamtal mellan aminosyror och proteiner.

Framtida studier bör syfta till att kombinera de producerade proteomiska uppgifterna med de från salivära mikrobiella metabolomstudier 43, 44 . Att förstå interaktionen mellan humana och bakteriella (ytproteiner) proteiner såväl som lösliga metaboliter hjälper till att identifiera kritiska steg i pellikeltillväxt, biofilmmognad och patogen förändring av den orala miljön. Dessutom kan relevanta bindande motiv eller känsliga tidsramar för potentiella terapeutiska ingrepp avslöjas.

Sammanfattningsvis undersökte denna studie skillnaderna mellan proteiner i den förvärvade emaljpellikeln och salivproteiner. Vi tillhandahöll en omfattande dataresurs för båda proteomer baserade på experimentella data och utförde, såvitt vi känner till, den första funktionella analysen av båda proteinsatserna för att identifiera specifika molekylära eller funktionella funktioner, som kan tjäna som potentiella mål för diagnostiska eller terapeutiska tillämpningar.

Material och metoder

Litteratursökning

Den systematiska litteratursökningen på proteomiska data utfördes i februari 2015. Vi inkluderade observationsstudier som rapporterade om minst 15 olika proteiner identifierade med masspektrometri i hel ostimulerad saliv och / eller tandpellikel härrörde från hel ostimulerad saliv hos friska människor. Endast artiklar publicerade 2000 eller senare övervägs, eftersom den beskrivna typen av studier sannolikt inte hade publicerats tidigare. Endast referensgranskade publikationer beaktades. Inga språk- eller kvalitetsbegränsningar tillämpades. Utfallsparametern rapporterades proteiner.

Vi sökte Medline via PubMed, Embase via DIMDI, Google Scholar och opengrey.eu med de söktermer som anges i tilläggsfigur. 3. Hänvisningar till identifierade fulltexter screenades och korsreferenserades och befintliga recensioner av kombinerade proteindata utvärderades. Vi planerade att kontakta studieförfattare vid behov för att få fulltexter eller datasätt.

En granskare (HS) visade alla titlar för att inkludera fulltexter. En andra granskare (MW) omskärmade databaser för potentiella misslyckanden för att öka känsligheten. Fulltexter utvärderades sedan oberoende av båda granskarna efter deduplicering. Studier ingick i överenskommelse, ingen oenighet mellan granskarna inträffade.

Databasgenerering och validering

Identifierade protein-ID extraherades oberoende av två granskare (HS, MW). Endast granskade poster i Uniprot-databasen (Uniprot release 2014_11) inkluderades. David verktygslåda (David Bioinformatics Resources 6.7) 45 användes för att konvertera International Protein Index (IPI) till Uniprot ID. Icke-humana proteiner baserade på Uniprot-anteckningar avlägsnades. Rapporterade Uniprot-ID: er uppdaterades manuellt till den senaste utgåvan av databasen av en granskare (HS) och den resulterande databasen kontrollerades igen för ovannämnda ID-kriterier av en andra granskare (FS), som bekräftade den konstruerade databasen.

För att ge en robust och pålitlig databas inställdes ett stringensavbrott för inkludering i den slutliga databasen, inklusive endast proteiner med minst tre oberoende experimentella identifikationer. Validering av den slutliga databasen utfördes genom att jämföra inkluderade och uteslutna proteiner med de som identifierats genom studier av salivkörtlarproteomet (eftersom salivkörtlarna är den viktigaste källan för både saliv- och pellikelproteiner). Spottkörtelproteiner identifierades med användning av Human Protein Atlas (version 13 med användning av Ensembl version 75.37) 14 och databasresurser för Proteomics 15 . Vi kontrollerade också för någon indikation på selektionsförspänning via molekylvikt och rapporterad signalintensitet enligt masspektrometriska identifikationer 15 .

Jämförelse av proteomer

Protein / genanteckningar erhölls från Uniprot (Uniprot release 2014_11). Slutliga datasätt för saliv och pellikel finns tillgängliga i artikelens kompletterande material. För att erhålla de beskrivna proteinegenskaperna användes följande online-resurser: RaptorX Webserver 46, 47, EMBOSS iep Webserver 48, Netsurfp prediction tool 49, CAMP Database 50, Periodic Table of Protein Complexes 51 and GO miner 52 . Vi behövde använda en rad bioinformatikverktyg eftersom inget enda verktyg tillåter en omfattande analys av alla relevanta parametrar. En sammanfattning av de erhållna resultaten inklusive datum för begäran, detaljerade inställningar och länk till webbservern finns i den kompletterande informationen (tilläggsflik 2). Tillgängliga tredimensionella data för proteinerna erhölls från Protein Data Bank (PDB) 53 och användes för att beräkna den beskrivna formen poäng.

Protein-protein-interaktioner erhölls från nyligen publicerade masspektrometri-studier 16, 17, 18, 19 . Protein-ligand-interaktioner förutsagdes baserat på RaptorX-ligandbindningsförutsägelsen 46 . Interaktioner med prediktionsresultat> 30 övervägs, vilket är i linje med rekommendationerna från utvecklarna (notera att vi minskade den rekommenderade tröskeln från 40 till 30 för att öka känsligheten i vår analys) 46, 47 .

För validering, en delmängd av dessa ligander (inklusive adenosinmonofosfat, adenosintrifosfat, kalcium, flavinadeninduukototid, järn, flavinmononukleotiode, guanosintrifosfat, kalium, magnesium, mangan, nikotinaminde-adenin-dinukleotid, nikotinamid-adinotinidinuidin-adininidin -nitrofenol, tiamindifosfat och zink, vilket representerade 26, 97% [n = 518] av alla förutsagda ligandinteraktioner) jämfördes med tillgängliga bindningsdata från Uniprot. För 22, 78% av de förutsagda interaktionerna hittade vi experimentella bevis i Uniprot-datalagret. Alla interaktioner planerades med Cytoscape 2.8.2.

Statistisk jämförelse av proteomer utfördes med användning av Mann-Whitney-U-test eller Fishers exakta test. Betydelsens nivå justerades för multipla tester med användning av Bonferroni-korrigering.

ytterligare information

Hur man citerar den här artikeln : Schweigel, H. et al . Saliv- och pellikelproteom: En datamininganalys. Sci. Rep. 6, 38882; doi: 10.1038 / srep38882 (2016).

Förlagets anmärkning: Springer Nature förblir neutral när det gäller jurisdiktionskrav i publicerade kartor och institutionella anslutningar.

Kompletterande information

Word-dokument

  1. 1.

    Kompletterande information

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.