Genomgenomfattande poolningssätt identifierar spata5 som ett nytt känslighetsplats för alopecia areata | europeisk tidskrift för mänsklig genetik

Genomgenomfattande poolningssätt identifierar spata5 som ett nytt känslighetsplats för alopecia areata | europeisk tidskrift för mänsklig genetik

Anonim

Abstrakt

Alopecia areata (AA) är en vanlig håravfallsstörning, som tros vara en vävnadsspecifik autoimmun sjukdom. Tidigare forskning har identifierat några AA-känslighetsgener, varav de flesta är inblandade i autoimmunitet. För att identifiera nya genetiska varianter och ytterligare klargöra den genetiska grunden för AA, utförde vi en genomomfattande associeringsstudie med strategin för poolad DNA-genotypning (729 fall, 656 kontroller). Den starkaste föreningen var för varianter i HLA-regionen, vilket bekräftar giltigheten av poolstrategin. De utvalda topp 61 enkel-nukleotidpolymorfismerna (SNP) analyserades i ett oberoende replikationsprov (454 fall, 1364 kontroller). Endast en SNP utanför HLA-regionen (rs304650) visade signifikant samband. Denna SNP analyserades sedan i ett andra oberoende replikationsprov (537 fall, 657 kontroller). Fyndet replikerades inte på en signifikant nivå utan visade samma tendens. En kombinerad analys av de två replikationsproven utfördes sedan och SNP rs304650 visade signifikant samband med P = 3, 43 × 10 −4 (ELLER = 1, 24 (1, 10–1, 39)). Denna SNP kartlägger till en intronisk region av SPATA5-genen (spermatogenesassocierad protein 5) på kromosom 4. Resultaten antyder därför att SPATA5- lokuset är ett nytt känslighetslokus för AA.

Introduktion

Alopecia areata (AA) är en vanlig håravfallssjukdom som drabbar ungefär 1-2% av befolkningen. Det påverkar båda könen och alla åldersgrupper. 1 Berörda individer med en icke-ärr, omskriven håravfall, som har en plötslig början och en återkommande kurs. Hårbotten är den mest drabbade platsen, även om alla hårbärande områden i huden kan vara inblandade. Avsnitt av håravfall börjar vanligtvis med isolerade hårfria lappar. Dessa sträcker sig centrifugalt och kan sammanfalla. AA är indelat i tre huvudsakliga kliniska typer baserat på graden av håravfall och påverkade platser: (i) lappig AA; (ii) AA-totalis, som påverkar hela hårbotten; och (iii) AA universalis, som påverkar hela kroppen. Individer med AA kan uppleva fullständig remission, en kronisk kurs eller progression mot AA totalis eller AA universalis. Familial AA förekommer också, och återfallsrisker på 5–6% har rapporterats för barn till drabbade individer. 2, 3 Familialitetsmönstret och en begränsad tvillingstudie, som rapporterar en konkordansgrad hos monozygotiska tvillingar på 55%, 3 antyder att flera genetiska faktorer och miljöfaktorer är involverade i patologin hos AA. Ändå förblir etiopatogenesen av AA dåligt förstått. En hypotes är att AA är en vävnadsspecifik autoimmun sjukdom i hårsäcken. 4 Detta stöds av rapporter om associering mellan AA och specifika HLA-alleler. 5, 6, 7, 8 Associering har också rapporterats mellan AA och W620- varianten av PTPN22- genen (proteintyrosinfosfatas, nonreceptor typ 22), som har varit inblandad i flera autoimmuna störningar. 9, 10 Hittills har endast en systematisk genomomfattande kopplingsstudie av AA genomförts hos människor. Detta identifierade fyra känslighetsplatser på kromosomer 6, 10, 16 respektive 18. 11 Familialitetsmönstret och en begränsad tvillingstudie som rapporterar en konkordansgrad hos monocygotiska tvillingar på 55%.

För att identifiera nya genetiska varianter och därmed ytterligare klargöra den genetiska grunden för AA, utförde vi en genombreddsassociation (GWA) -studie i 729 AA-fall och 656 kontroller, med hjälp av strategin för poolad DNA-genotypning. De topp 61 enkla nukleotidpolymorfismerna (SNP: er) valdes för individuell genotypning i det initiala provet av poolingsmetoden i syfte att bekräfta. Vi analyserade ytterligare dessa SNP i ett oberoende replikationsprov. Det bästa associeringsresultatet analyserades sedan i ett andra oberoende replikationsprov. Den starkaste föreningen hittades för varianter i HLA- regionen. Dessa resultat bekräftar således giltigheten av den poolbaserade metoden för DNA-genotypning. Borderline-betydelse hittades för rs304650 i SPATA5-genen (spermatogenes-associerad protein 5), som därför kan representera en ny känslighetsgenlokus för AA.

Under de sista stadierna av denna studie publicerades en GWA-studie av ett AA-prov från USA av Petukhova et al. 12 Detta identifierade åtta genloki för AA, varav de flesta är inblandade i autoimmunitet. Även om SPATA5 inte var bland dessa loci, rapporterades sex SNP: er i SPATA5 , av alla som visar bevis för kopplingsjämvikelse med rs304650, med en P- värde <10 −4 .

Material och metoder

DNA-prover

Analyserna involverade 1720 individer med AA (fall) och 2677 kontroller. För fall var inkluderingskriteriet en dermatolog-tilldelad diagnos av AA. Patienter med Downs syndrom eller Turners syndrom utesluts. Fallen rekryterades från: (i) polikliniker i Belgien (universitetssjukhus i Antwerpen och Gent) och Tyskland (universitetssjukhus i München, Münster, Düsseldorf, Berlin, Bonn, Gießen, Hamburg och Mannheim); (ii) en privat dermatologipraxis (Wesseling, Tyskland); och (iii) AA-självhjälpsgrupper (Tyskland, Nederländerna). Alla fall frågades om de hade en positiv familjehistoria med AA eller inte. Detta definierades som en historia av åtminstone en första- eller andra-graders släkting med någon form av störningen. Kontrollerna hämtades från den allmänna befolkningen och screenades därför inte specifikt för frånvaron av AA. De var friska icke-relaterade blodgivare från universitetssjukhuset i Bonn ( n = 1313) eller deltagare i en av tre befolkningsbaserade epidemiologiska studier: (1) PopGen 13 ( n = 490); (2) KORA 14 ( n = 490); och (3) HNR 15 ( n = 384). Alla fall och kontroller var av centraleuropeiskt ursprung. Etiskt godkännande erhölls från respektive etiska kommittéer, och alla deltagare gav skriftligt informerat samtycke innan blodprovtagning. DNA från patienter och blodgivare extraherades från perifera blod leukocyter. Detta uppnåddes genom saltning med mättad NaCl-lösning enligt standardmetoder eller genom användning av en kemagisk magnetisk separationsmodul I (Chemagen, Baesweiler, Tyskland) i enlighet med tillverkarens instruktioner. DNA lagrades i flytande kväve tills användning. För kontrollerna från de tre populationsbaserade epidemiologiska studierna togs genotyperna från tidigare genererade GWA-datauppsättningar. PopGen- och KORA-datauppsättningarna genererades inom det tyska National Genome Research Network för att fungera som en nationell forskningsresurs. HNR-datauppsättningen genererades som en del av ett samarbete för att generera en uppsättning universella kontroller för genetiska studier.

DNA-sammanslagning

DNA-proverna av 729 AA-fall och 656 blodgivarkontroller valdes slumpmässigt. Dessa prover användes sedan för att generera en kontrollpool och två AA-fallpooler. Det första AA-fallet bestod av DNA från alla 729 AA-fall (inklusive de 224 AA-fallen med en positiv familjehistoria). Det andra AA-fallet bestod endast av DNA från "positiv familjehistoria" AA-patienter ( n = 224). För att säkerställa lika stora mängder DNA i varje pool underkastades varje individuellt DNA-prov en serie utspädningssteg (över 100 ng / μl till 20 ng / μl och sedan till en slutlig koncentration av 10 ng / μl ). Varje DNA-prov kvantifierades med användning av en NanoDrop-anordning (PEQLAB Biotechnologie GmbH, Erlangen, Tyskland) och justerades till ± 10% av den erforderliga koncentrationen. För 10 ng / μl utspädning användes ett bredare intervall av −60 till + 80% för att återspegla mätfelet för NanoDrop-enheten vid låga DNA-koncentrationer. Ekvimolära mängder av varje DNA-prov (100 ng) pipetterades manuellt i ett stort rör för att bilda poolen. Varje pool koncentrerades sedan till 60 ng / mL med användning av Microcon YM-100 centrifugalfilterapparat (Millipore GmbH, Schwalbach, Tyskland), och återplanterades sedan med NanoDrop-anordningen.

Genotypning av det sammanslagna DNA- och dataanalys

Illumina Sentrix HumanHap550v3 genotypning BeadChips användes. Dessa innehåller mer än 550 000 taggar SNP (Illumina Inc., San Diego, CA, USA). För att undvika variationer mellan experiment, genotypades varje pool på fem chips i enlighet med tillverkarens rekommendationer för enskilda prover. SNP-allelfrekvenser uppskattades med användning av data från BeadArray Reader-avbildning (Illumina Inc.) och Illuminas genotypnings-programvara Bead Studio 2.0 (Illumina Inc.). Tre analyser utfördes på basis av uppskattningarna av allelfrekvens erhållna från genotypningsförsöket: (i) 729 fall mot 656 kontroller; (ii) 224 fall med en positiv familjehistoria kontra 656 kontroller; och (iii) en glidfönsteranalys med användning av datauppsättningen av 729 fall mot 656 kontroller, i enlighet med rekommendationer som beskrivs på annat håll. 16

För varje replikat utfördes följande tillnärmning av allelfrekvenser i fall och kontroller på grundval av rådata: f i = Xraw / (Xraw + Yraw), där Xraw och Yraw är intensiteten hos de två färgämnena (Cy5 och Cy3 ) användes för att genotypa SNP på Illumina-plattformen, och i är replikatnumret. Den erhållna allelfrekvensen beräknades sedan i genomsnitt över antalet replikat för varje pool f = (f 1 +

.

+ f M ) / M (där M är antalet replikat) och korrigeras för ojämn amplifiering med användning av formeln f korrigerad = f / ( f + k · (1- f )). 17 För varje SNP uppskattades korrigeringsfaktorn k med hjälp av HapMap CEPH-data (//hapmap.ncbi.nlm.nih.gov/) och formeln k = ( f c on - f con · f CEPH ) / ( f _ CEPH - f con · f CEPH ), där f cont är allelfrekvensen i kontroller erhållna från poolningsexperimentet, och f CEPH är allelfrekvensen beräknad från HapMap CEPH-data.

Korrigeringsfaktorn k användes som kvalitetskontrollåtgärd, eftersom den ger en indikation på hur nära de uppskattade allelfrekvenserna i kontrollerna är de som finns i CEPH-data. SNP utesluts från ytterligare analys när k var> 4 eller <0, 25.

Variationskoefficienten användes också som ett kvalitetskontrollmål för varje SNP i varje pool. Detta beräknades med användning av formeln sqrt (var e ) / f , där var e är den experimentella variansen uppskattad från replikatdata. Detta indikerar hur nära SNP är till replikaten, med hänsyn till allelfrekvenser och antalet replikat per pool. SNP utesluts från ytterligare analys när variationskoefficienten var> 1 (övre gränsen för 95% konfidensintervall) i åtminstone i en av de tre poolerna (dvs. fall, kontroller, familjefall).

För de återstående 487 932 SNP: erna utfördes associeringsanalyser för att jämföra 729 fall och 224 familjefall med 656 kontroller. Modifierad Z- statistik användes, såsom beskrivits av Abraham et al. 18 Dessa tar hänsyn till både den experimentella variationen (se ovan) och provtagningsvariansen.

En signalbehandlingsanalyssteknik användes för att tolka resultaten från fall-kontrollföreningsanalysen. Detta möjliggör detektering av genetisk associering med sjukdom, med hänsyn till betydelsen av flera efterföljande genetiska markörer i ett skjutfönster. Moskvina et al 17 har beskrivit ett teoretiskt tillvägagångssätt för att beräkna sannolikheten för att åtminstone ett falskt larm flaggas av detektionsstatistiken under Null-hypotesen om ingen signal (associering). 14 Detta motsvarar sannolikheten för typ I-fel när man tar hänsyn till antalet jämförelser i fönstret och ger därmed en 'genombrett fönsterbaserad' signifikansnivå. 19

SNP-val, bekräftelse av poolresultat och oberoende replikering

Ett antal SNP valdes för att bekräfta sammanslagningsresultaten på en individuell genotypningsnivå. Ett replikationssteg utfördes i två oberoende fall-kontrollprover (för en översikt, se figur 1). Följande SNP: er valdes från de tre poolningsbaserade analyserna: (i) de 50 bästa SNP: erna från analysen '729 fall mot 656 kontroller'; (ii) de 20 bästa SNP: erna från analysen "224 fall med en positiv familjehistoria mot 656 kontroller"; och (iii) de 35 bästa SNP: er från "skjutfönsteranalysen". Alla utvalda SNP: er hade visat P- värden på <1 × 10 −4 i respektive poolningsanalys. Eftersom SNP från den tidigare kända HLA-regionen var mycket överrepresenterade, var alla utom tre av dessa SNP uteslutna. De tre återstående HLA SNP: er, rs3115553 (chr. 6: 32 353 805 bp), rs9275141 (chr. 6: 32 759 095 bp) och rs9275572 (chr. 6: 32 786 977 bp) valdes, eftersom de var de bästa fynd i HLA-regionen i "glidfönsteranalysen". Dessa användes som positiva kontroller i efterföljande analyser. Tyvärr misslyckades rs9275141 under analysen av Sequenom iPlex-reaktionen (Sequenom GmbH, Hamburg, Tyskland). Det ersattes därför av den näst bästa SNP i HLA-regionen från "glidfönsteranalysen", rs9268528 (chr. 6: 32 491 086 bp). Genom att utesluta andra SNP från HLA-regionen och SNP som visas i mer än en av analyserna (dubbel och tripplar), var det möjligt att reducera SNP-uppsättningen för bekräftelse- och replikationssteget (steg 2) från 105 till 61 SNP. Individuell genotypning utfördes på Illumina-plattformen. För DNA-proverna från HNR-, KORA- och Popgen-kontrollerna ( n = 1364) användes HumanHap550v3-genotyping BeadChips (Illumina Inc.). För alla andra DNA-prover användes Sequenoms Compact MALDI-ToF Mass Array-system och iPLEX Gold-reagens (Sequenom GmbH) i multiplexreaktioner. Primersekvenser och Sequenoms standardanalysvillkor är tillgängliga på begäran. Alla primrar kontrollerades av MALDI-ToF. Av kvalitetsskäl krävdes en framgångsgrad på minst 95% för alla analyserade SNP: er. En samtalshastighet på 95% krävdes för vart och ett av de prover som användes i bekräftelses- och replikationsstegen. I bekräftelsesteget (steg 2) misslyckades DNA-prover från åtta AA-fall och 11 kontroller att uppfylla kvalitetskriterierna och utesluts från analysen, och således kvarstod 721 AA-fall och 645 kontroller för analyserna. I det oberoende replikationssteget (steg 2) misslyckades fyra DNA-fallprover att uppfylla kvalitetskriterierna, och således återstod 450 fall och 1 364 kontroller för analyserna. Av de 61 utvalda SNP: erna var SNP: er (rs12493901, rs30117, rs41515, rs4777450, rs7246435 och rs9520256) tekniska fel och fem SNP: er (rs10123149, 11098149, rs6700586, rs7099812 och rs to not to the erforderlig samtalshastighet på ≥95% i ett eller flera av bekräftelses- och / eller replikationsproven. SNP rs7334982 var inte biallelic i de aktuella proverna och utesluts därför från ytterligare analys. Således återstod en uppsättning av 49 SNP för ytterligare analys.

Image

Övergripande arbetsflöde. Studien genomfördes i tre steg: ( a ) poolbaserade analyser med användning av tre olika tillvägagångssätt (I) alla fall mot alla kontroller, (II) fall "positiv familjehistoria" vs alla kontroller och (III) en glidfönsteranalys; ( b ) bekräftelse av utvalda bästa poolningsbaserade fynd genom individuell genotypning i tidigare samlade fall- och kontrollprover; ( c ) oberoende replikering och uppföljningsanalyser i ytterligare prover av fall och kontroller.

Bild i full storlek

Statistiska analyser av individuella genotypningsdata

FAMHAP-mjukvarupaketet 20 användes för associerings- och haplotypanalyser. Armitage-trendtestet användes för analyserna av en enda markör. 21 Alla SNP: er uppfyllde följande kvalitetskriterier: mindre allelfrekvens> 1%, P HWE i fall> 0, 001 och P HWE i kontroller> 0, 05. De resulterande P- värdena korrigerades för multipla tester i enlighet med antalet SNP som framgångsrikt analyserades på den individuella genotypningsnivån ( n = 49).

Uttrycksanalyser

Vi använde den främre primern 5′-CCTTCAAACCGACGCATACT-3 ′ och den bakre primern 5′-GCAGCCCACTCTTCTCTTGA-3 ′ för att analysera uttrycket av SPATA5 i mänskliga hårsäckar och hudprover (förväntad produktstorlek: 197 bp). Eftersom SPATA5- uttryck har bevisats i mänsklig njure och lunga (//www.genecards.org/cgi-bin/carddisp.pl?gene=SPATA5&search=SPATA5) inkluderades dessa vävnader som positiva kontroller. Totalt RNA extraherades från mänskliga hårsäckar och hud med användning av RNeasy Micro Kit (Qiagen, Hilden, Tyskland), och enkelsträngigt cDNA syntetiserades från totalt 400 ng RNA med användning av Super Script III First Strand Synthesis System (Invitrogen, Karlsruhe, Tyskland). Enkeltsträngigt cDNA från njur och lunga erhölls från den mänskliga multipla vävnaden cDNA-panel I (LOT Nr. 6060248; Clontech, Takara Bio Europe / Clontech, Saint-Germain-en-Laye, Frankrike). En negativ omvänd transkriptionsreaktion (inget enzym) inkluderades som en negativ kontroll (figur 2).

Image

Uttrycksanalys av mRNA hos SPATA5 . SPATA5 visade sig uttrycka i människors hårsäck, hud, njure och lunga (prover visade från vänster till höger). Den sista körfältet visar en negativ kontroll.

Bild i full storlek

Resultat

Steg 1: Poolbaserad strategi

Den genombredda poolningsbaserade metoden involverade tre DNA-pooler: (1) 729 AA-fall (inklusive de 224 fallen med en positiv familjehistoria), (2) 224 AA-fall med en positiv familjehistoria och (3) 656 kontroller . Varje pool genotypades på fem replikat av Illumina Sentrix HumanHap550v3 genotypning BeadChip. Pool 1 analyserades framgångsrikt i alla fem replikaten. Pool 2 analyserades framgångsrikt i fyra replikat. Två av de fem kontrollchiperna utesluts efter kvalitetskontrollfiltrering.

Kvalitetskontrollåtgärder och allelfrekvenser uppskattades för alla 504 931 SNP. De kvalitetskontrollåtgärder som användes var: (i) variationskoefficienten för varje SNP i varje pool, vilket återspeglade hur nära SNP var replikerna med beaktande av allelfrekvenser och antalet replikat per pool; och (ii) korrigeringsfaktor k som en indikator på närheten av allelfrekvensuppskattningarna i kontrollpoolen till allelfrekvenserna i CEPH-provet från HapMap (för detaljer se avsnittet Material och metoder).

Markörer utesluts om variationskoefficienten var> 1 i minst en av tre DNA-pooler, eller om korrigeringsfaktorn k var> 4 eller <0, 25. De återstående 487 932 SNP: erna korrigerades för k , och SNP: er med mindre allelfrekvenser på <5% i kontrollerna filtrerades ut. De återstående 468 389 SNP testades med avseende på associering med användning av modifierad Z- statistik. 18 Separata jämförelser med kontroller gjordes för fall och familjär fall. Resultaten från fall-kontrolljämförelsen analyserades ytterligare i ett skjutfönster. De bästa markörerna från de övre regionerna identifierade med glidfönsteranalysen 19 valdes för replikering. Således utfördes tre olika analyser: (I) 729 AA-fall kontra 656 kontroller; (II) 224 AA-fall med en positiv familjehistoria kontra 656 kontroller; och (III) en glidfönsteranalys (figur 1). Dessa analyser identifierade 31 SNP med P- värden <5 × 10 −7 (kompletterande tabell 1), vilket resulterade i totalt 18 SNP efter uteslutning av duplikat och triplikat. Av dessa 18 SNP: er lokaliserades 8 SNP: er i HLA-regionen och 10 SNP: er lokaliserades någon annanstans i genomet. Den bästa SNP av alla tre analyserna var rs9952976 (chr. 18: 42 561 717 bp), som hade en P- värde av 6, 48 × 10 −14 i analyserna I och III (kompletterande tabell 1). Den bästa SNP i analys II var rs9275572, som är lokaliserat i HLA-regionen ( P = 1, 87 × 10 −8 ). Denna SNP var också den bästa HLA – SNP i analyserna I ( P = 1, 00 × 10 −11 ) och III ( P = 5, 67 × 10 −12 ; kompletterande tabell 1). När de bästa SNP: erna från varje analys beaktades (se urvalskriterierna i avsnittet Material och metoder), tre SNP: er (rs9275141 (chr. 6: 32 759 095 bp); rs9275572 (chr. 6: 32 786 977 bp) och rs9952976 ( chr. 18: 42 561 717 bp)) uppträdde i alla tre analyserna. Två av dessa SNP: er (rs9275141 och rs9275572) är lokaliserade i HLA-regionen (kompletterande tabell 1).

Steg 2: Individuell bekräftelse och oberoende replikering

De 50 bästa SNP: erna från analys I, de 20 bästa SNP: erna från analys II och de 35 bästa SNP: erna från analys III valdes för ytterligare analys (figur 1). Elimineringen av duplikat och triplikat resulterade i totalt 61 SNP: er (se avsnitt om material och metoder och tilläggstabell 1). För att bekräfta associeringsresultaten för de 61 utvalda SNP: erna i poolingsmetoden, utfördes individuell genotypning i det tidigare poolade upptäcktsprovet av 729 AA-fall och 656 kontroller. Ett oberoende replikationssteg involverade 454 AA-fall och 1364 kontroller. Efter kvalitetskontroll återstod 49 SNP för analys (se avsnitt om material och metoder). Med undantag av fem SNP: er, bekräftade denna analys poolningsresultaten på en nominell nivå av betydelse, och visade således giltigheten av DNA-poolingsmetoden. Den starkaste föreningen hittades för de tre HLA – SNP: er (rs3115553, rs9268528 och rs9275572). SNP rs9275572 visade den starkaste föreningen med P = 2, 50 × 10 −10 (ELLER = 1, 65 (1, 41-1, 94); tabell 1). Dessa var de enda SNP som tål korrektion för flera tester med den tidigare föreslagna tröskeln för P = 5 × 10 −7 . 22 De återstående SNP: erna kunde inte visa stark förening. Det bästa förhållandet att hitta utanför HLA-regionen var för rs2110597 (chr. 12: 12 832 280 bp) med P = 1, 42 × 10 −5 (ELLER = 1, 44 (1, 22-1688)). Den bästa upptäckten från den poolbaserade analysen, rs9952976 (chr. 18: 42 561 717 bp), visade endast gränsöverskridande betydelse på nivån för individuell genotypning, med P = 0, 034 (OR = 1, 20 (1, 01–1, 43)). Detta var ett av de svagaste associeringsresultaten i detta bekräftelsesteg (tabell 1).

Full storlek bord

I det oberoende replikationssteget hittades åter den starkaste föreningen för de tre HLA-SNP: erna. SNP rs9275572 var den mest starkt associerade SNP ( P = 7, 94 × 10 −11 ; OR = 1, 71 (1, 46–2, 01)). Tjugosju SNP: er visade samma riskalleler som i upptäcktsprovet. Endast en SNP utanför HLA-regionen (rs304650; chr. 4: 124 303 368 bp) visade signifikant samband ( P- värde av 0, 001; OR = 1, 31 (1, 12–1, 53)). Efter Bonferroni-korrigering för antalet testade SNP: er ( n = 49) förblev endast de tre HLA-SNP: erna och rs304650 ( P = 0, 049) signifikanta (tabell 1).

Steg 3: Uppföljningsanalys av toppresultatet

Ett andra oberoende prov av 537 fall och 657 kontroller användes sedan för att undersöka associeringsfyndet för rs304650 vidare (figur 1). Genotypning av rs304650 misslyckades i ett fall och två kontroller, och således återstod 536 fall och 655 kontroller. I denna analys kunde rs304650 inte replikeras på en signifikant nivå ( P = 0, 127; tabell 2). Men riskallelen förblev densamma. En kombinerad analys utfördes därför med användning av alla AA-fall och kontroller från de oberoende replikations- och uppföljningsstegen (totalt 985 fall och 2014-kontroller har framgångsrikt genotypats för denna SNP; data visade inte). Här visade rs304650 starkare associering, med P = 3, 43 × 10 −4 (ELLER = 1, 24 (1, 10–1, 39)). Efter att ha kombinerat alla fall och kontroller erhöll vi en P- värde av 1, 58 × 10 −5 ; ELLER = 1, 23 (1, 12–1, 35). Intressant nog observerades SPATA5- uttryck i hårsäckar och hud, vilket bekräftar vikten av denna gen i termer av hårbiologi (figur 2).

Full storlek bord

Diskussion

Föreliggande GWA-studie av AA är den första som använde poolat DNA. Analysen utfördes i flera steg för att undvika de höga kostnaderna för att utföra en GWA-studie i stora enskilda prover. Genotypning av DNA-pooler utfördes på 15 Illumina HumanHap550-matriser av patienter och kontroller. En begränsning av poolningsstudier i jämförelse med individuella genotypningsmetoder är att allelfrekvenser är uppskattningar härrörande från DNA-pooler, som i sig är inexakta. Med tanke på detta och det faktum att de allmänt använda kvalitetskontrollåtgärderna inte kan tillämpas, användes det poolbaserade tillvägagångssättet som upptäcktssteget (steg 1; figur 1). I det andra steget bekräftades de översta SNP: erna med användning av individuell genotypning av tidigare samlade fall och kontrollprover och replikerades genom individuell genotypning i ett oberoende prov av fall och kontroller (steg 2; figur 1). I det tredje steget följdes det bästa SNP upp i ett ytterligare oberoende replikationsprov (figur 1).

Det huvudsakliga histokompatibilitetskomplexet på kromosom 6p21.3 identifierades som en viktig riskplats för AA. Tidigare forskning från vår grupp och andra har inneburit olika HLA-alleler när det gäller AA-känslighet. De bästa replikerade resultaten har varit för alleler från DRB1 och DQB1 loci. 5, 6, 8, 23, 24 De nuvarande mycket signifikanta fynden för varianter i HLA-regionen visar att den poolbaserade strategin är ett giltigt alternativ till individuell genotypning vid komplexa störningar. 25 Även om de poolningsbaserade resultaten för HLA-lokuset inte följdes upp systematiskt (steg 1), genotypades de bästa tre varianterna från glidfönsteranalysen i upptäckten och oberoende replikationsprover för att bekräfta de initiala poolningsbaserade resultaten (steg 2 ). Som förväntat bekräftades alla tre varianter på den individuella genotypningsnivån och nådde genomomfattande P- värden. Detta var också fallet i det oberoende replikationssteget. Detta indikerar att DNA-samlingsmetoden pålitligt kan upptäcka SNP: er som har visat genomomfattande betydelse i associeringsstudier. Vidare upptäcker poolning mycket signifikanta resultat, och det är därför mycket osannolikt att några gener utöver HLA-regionen är mer signifikanta. Men vår strategi innebär en risk för falskt negativa fynd när det gäller mindre genetiska effekter. DNA-pooling lägger till extra experimentfel (t.ex. pipettering för poolkonstruktion) till allelfrekvensmätningen som direkt påverkar kraften för att detektera små effektstorlekar. 26 Dessutom genomfördes endast 61 topp hits från GWA-studiesteget i enskilda prover, där den stora majoriteten av nominellt signifikant associerade markörer har uteslutits från de efterföljande analyserna. Dessa är de två mest troliga förklaringarna till varför den aktuella studien kan ha missat tidigare rapporterade associeringsresultat. 12 Pålitlig detektion av gener med mindre effekter kräver därför större provstorlekar och individuell genotypning.

Den enda andra SNP som uppnådde experimentomfattande betydelse i den kombinerade analysen var rs304650 i SPATA5- genen på kromosom 4q27-q28. Gemensam analys av replikationsproven som användes i steg 2 och 3, som inkluderade totalt 985 fall och 2014-kontroller, som framgångsrikt var genotypade för detta SNP, avslöjade en signifikant samband mellan denna variant och AA, med en P- värde på 3, 43 × 10 −4 (OR = 1.24 (1.10–1.39)). En gemensam analys av alla undersökta prover avslöjade en signifikant samband mellan denna variant och AA, med en P- värde på 1, 58 × 10 −5 (OR = 1, 23 (1, 12–1, 35)). SNP rs304650 kartar till en intronisk region i SPATA5- transkriptet. I skrivande stund är de funktionella aspekterna av detta protein okända. En studie identifierade emellertid SPATA2 , en annan medlem av den spermatogenesassocierade proteinfamiljen, som en känslighetsgen för autoimmun störning psoriasis. 27

Intressant, även om SPATA5 inte var bland de åtta loci med genombredd betydelse som rapporterats av Petukhova et al , 12 rapporterade författarna sex SNP: er i SPATA5 , med en P- värde <10 −4 i deras kompletterande material. Även om det inte är särskilt starkt finns det bevis för LD mellan rs304650 och Petukova et al 12 SNP: er (mellan r2 = 0, 29 för rs11735364 och r2 = 0, 46 för rs2201997). Även om detta kan ses som stödjande bevis krävs en mer detaljerad upparbetning av regionen i mycket stora prover för att möjliggöra mer definitiva slutsatser. Det är också intressant att SPATA5- genen är belägen endast 320 kb distalt till rs7682241, en genombredd signifikant markör i studien av Petukhova et al , 12, vilket starkt antyder involvering av IL2 / IL21-genlokuset . Data från CEU HapMap-provet visar emellertid att rs304650 inte är i LD med de bästa varianterna av IL2 / IL21-genlokuset . Därför förmedlar de två lokerna troligen sin risk oberoende av varandra. Det är emellertid teoretiskt möjligt att den verkliga kausalvarianten för AA kan vara en funktionell variant som är i måttlig LD till de varianter som rapporterats i båda analyserna och som ligger mellan IL2 / IL21 och SPATA5- regionerna.

Kompletterande information

Word-dokument

  1. 1.

    Kompletterande information

    Kompletterande information åtföljer uppsatsen på webbplatsen European Journal of Human Genetics (//www.nature.com/ejhg)