En sällsynt funktionell hjärtbeskyddande apoc3-variant har ökat i frekvens i distinkta populationsisolat | naturkommunikation

En sällsynt funktionell hjärtbeskyddande apoc3-variant har ökat i frekvens i distinkta populationsisolat | naturkommunikation

Anonim

ämnen

  • Hjärt-kärlsjukdomar
  • Sällsynta varianter

Abstrakt

Isolerade populationer kan stärka identifieringen av sällsynta variationer som är förknippade med komplexa egenskaper genom nästa generations föreningsstudier, men generaliserbarheten hos sådana fynd förblir okänd. Här genotypar vi 1 267 individer från en grekisk befolkning isolerar på Illumina HumanExome Beadchip, på jakt efter funktionella kodningsvarianter associerade med lipidsegenskaper. Vi finner genomomfattande signifikant bevis för samband mellan R19X, en funktionell variant i APOC3 , med ökat lipoprotein med hög täthet och minskade triglyceridnivåer. Cirka 3, 8% av individerna är heterozygota för denna kardioskyddande variant, som tidigare ansågs vara privat för Amish-grundarnas befolkning. R19X är sällsynt (<0, 05% frekvens) i utvidgade europeiska populationer. Den ökade frekvensen av R19X möjliggör upptäckt av denna lipiddragsignal med genombredd betydelse i en liten provstorlek. Detta arbete exemplifierar värdet av isolerade populationer för att framgångsrikt upptäcka överförbara sällsynta variantföreningar av hög medicinsk relevans.

Introduktion

Den ökande bördan av hjärt- och metabolismsjukdomar har växande hälsoekonomi och samhällseffekter. Blodlipidnivåer är mätbara index som är starkt associerade med endpoints för kardiometabolisk sjukdom. Genetiska föreningsstudier har under de senaste åren avsevärt förbättrat vår förståelse för faktorer som ligger bakom egenskaper med hög klinisk betydelse, såsom kroppsmassaindex, lipidnivåer och blodtryck. Befolkningsisolat har föreslagits som användbara verktyg i genetiska associeringsstudier för komplexa egenskaper, eftersom de kännetecknas av reducerad fenotypisk, miljömässig och genetisk heterogenitet 1 . Dessutom kan isolerade populationer ge nästa generations föreningsstudier med fokus på sällsynt variation 2, eftersom dragassocierade alleler kan ha drivit till högre frekvens. Men generaliserbarheten hos nya föreningar som identifierats i befolkningsisolat har varit föremål för debatt. Varianter som är privata för isolatet kan vara mycket relevanta för den specifika befolkningen men av begränsad överförbarhet till andra populationer. Till exempel ansågs en null APOC3- variant, R19X, vara förknippad med högdensitetslipoprotein (HDL) och triglyceridnivåer i Amish som befolkningsspecifik eftersom den inte detekterades i icke-Amish individer av europeisk härkomst som tillgängliga data vid tiden 3 .

Det finns växande empiriska bevis på att lågfrekventa och sällsynta varianter har en viktig roll i komplexa mänskliga fenotyper. Illumina HumanExome Beadchip har utvecklats som ett kostnadseffektivt verktyg för att studera rollen som exoniska varianter och har framgångsrikt använts för identifiering av nya lokaler som påverkar insulinbehandling och utsöndring 4 .

För att identifiera potentiellt funktionella kodningsvarianter förknippade med kardiometaboliska relaterade egenskaper utför vi exome chipgenotypning av 1 267 individer från ett grekiskt befolkningsisolat som härstammar från Anogia och de omgivande byarna Mylopotamos på Kreta (HELIC (Hellenic Isolated Cohorts)) MANOLIS (Minoan Isolates) -studie, //www.helic.org). Mylopotamos byarnas invånare visar anekdotiskt hög livslängd. Även om Cretans har låg dödlighet från hjärt-kärlsjukdom 5, är deras serumlipider jämförbara med Nordeuropeiska 6, 7 .

Vi finner genomomfattande signifikanta bevis för samband mellan R19X, en funktionell variant i APOC3 , och ökad HDL och minskade triglyceridnivåer. R19X är sällsynt (<0, 05% frekvens) i utvidgade europeiska populationer, medan frekvensen har ökat till 1, 9% i MANOLIS, vilket möjliggör upptäckt av denna lipiddragssignal med genombredd betydelse i en liten provstorlek. Våra fynd behandlar dessutom generaliserbarheten hos föreningar som upptäckts i befolkningsisolat, eftersom denna hjärtskyddande variant tidigare ansågs vara privat för Amish-grundarnas befolkning.

Resultat

Exome chip-bred förening analys

I en analys av HDL-nivåer med användning av exome chip-data hos 1 256 individer från MANOLIS-studien (kompletterande tabell S1), hittar vi genomomfattande signifikant bevis för associering med vanliga frekvens positiva kontrollvarianter i CETP (till exempel rs1532624, P = 1.1 × 10 −11, sannolikhetsförhållandestest), det väletablerade HDL-associerade lokuset som har samlats robust bevis för associering mellan flera populationer (Fig. 1; Kompletterande Fig. S1; Tabell 1) 8, 9, 10, 11, 12 . Trots den lilla provstorleken hittar vi också genombrett signifikant bevis för associering med en funktionell variant i APOC3 (rs76353203, R19X, P = 4, 6 × 10 −9, sannolikhetsförhållandestest), vilket förklarar 2, 9% av dragvariansen (tabell 2; Fig. 2). Den starkaste R19X-variantföreningen är med minskade triglyceridnivåer ( P = 1, 1 × 10 −11, sannolikhetsförhållandestest) och förklarar 3, 9% av dragvarians (tabell 2; fig. 2). Denna tydliga hjärtskyddande effekt återkapituleras i den starka föreningen med hög HDL som en dikotomiserad egenskap definierad som> 60 mg dl −1 (ref. 13) ( P = 4, 3 × 10 −10 ; Tabell 2, sannolikhetsförhållandestest). Vi observerar en trend för att den mindre allelfrekvensen (MAF) ska öka med åldern (tilläggsfigur S2). Det fanns inga bevis för associering av R19X med C-reaktivt protein (CRP) -nivåer, antropometriska, glykemiska egenskaper och blodtryck och ingen dämpning av signalen observerades vid konditionering av rökningsstatus (tabell 2; kompletterande tabell S2). Det enskilda nukleotidproteinet (SNP) som ledde till den ursprungliga R19X-upptäckten i Amish 3 är beläget i DSCAML1- genen (rs10892151) och var starkt korrelerat med R19X i den grundarepopulationen ( D '= 1, r2 = 0, 85). I MANOLIS-kohorten konstaterar vi att de två varianterna är dåligt korrelerade ( r 2 = 0, 001), medan endast tre av de möjliga fyra haplotyperna observeras ( D ′ = 1, på grund av låg allelfrekvens).

Genomfattande statistiska associeringsbevis för HDL i MANOLIS. P- värden genereras från sannolikhetsförhållandestestet, beräknat med GEMMA-programvaran.

Bild i full storlek

Full storlek bord

Full storlek bord

Y -axen visar de otransformerade HDL ( a ) nivåerna (mmol l −1 ) respektive de naturliga logaritmtransformerade triglyceridnivåerna (mmol l −1 ). HDL P = 4, 65 × 10 −9 och triglycerider P = 1, 10 × 10 −11 . P- värden genereras från sannolikhetsförhållandestestet, beräknat med GEMMA-programvaran.

Bild i full storlek

T-allelen, som är den härledda allelen, ändrar en argininrest till ett stoppkodon i exon 2 av alla tre kodande transkript av APOC3- genen. Införandet av ett för tidigt stoppkodon vid denna position innebär att mRNA-transkripten sannolikt kommer att bli föremål för icke-sinnessmedierat förfall och inte kommer att översättas.

R19X-frekvens- och haplotypanalys

R19X har en frekvens på 1, 9% i MANOLIS-kohorten, men är mycket sällsynt (0, 035% frekvens; T: 3, C: 8585) i 4 924 europeiska härkomstutkomster från NHLBI-data (Exome Variant Server, NHLBI, // evs). gs.washington.edu/EVS/ (öppnas februari 2013)) och finns inte i 1 000 Genome Project-data 14 . R19X-mindre allelen bärs av 4 av 3 621 helgenom sekvenserade individer i UK10K-studien (//www.uk10k.org) (MAF = 0, 05%). Individer med R19X-varianten tenderar inte att vara nära besläktade i MANOLIS, med 97, 3% av bärpar som har ≤10% av alleler identiska med nedstigningen exome array-bred (kompletterande tabell S3).

Åldern för R19X-varianten i den allmänna europeiska befolkningen beräknas till 3.0KYA (95% CI 0–9.0KYA) 15, vilket stödjer idén att denna variant var närvarande i en låg frekvens i Europa innan detta kretiska isolat fastställdes. För att testa detta undersökte vi lokala haplotyper från UK10K och konstaterade att de fyra kromosomerna med T (stopp) -elelerna delar samma ~ 700 kb haplotyp (~ 200 kb-stopp- ~ 500 kb) som vi kan förvänta oss med tanke på frekvensen för allelen och dess ålder uppskattad utifrån denna frekvens. MANOLIS-bärarna delar också alla samma ~ 400 kb nedströms haplotyp, som matchar ~ 400 kb av ~ 500 kb UK10K-haplotyp, och vissa delar hela regionen. Vi undersökte också Amish T-bärarens haplotypdata och fann att Amish också delar nästan samma haplotyp (181 kb-stop-390 kb) (Kompletterande bild S3). Dessa fynd tyder på att R19X har ett enskilt nyligen ursprung i Europa som föregår upprättandet av MANOLIS- och Amish-isolaten, och att det har stigit till en relativt hög frekvens i de två isolaten på grund av genetisk drift.

För att undersöka mönster för delning av haplotyp runt R19X bredare i MANOLIS-kohorten, identifierade vi sträckor av maximal haplotypidentitet längs kromosom 11 mellan par av prover med användning av en anpassning av den långväga fasalgoritmen enligt Kong et al . 16 Som förväntat från en isolerad population är delningen av haplotyp omfattande, så att medianstorleken för maximal haplotypidentitet runt ett slumpmässigt provat kromosomalt läge är 14, 8 Mb (15, 3 cM). Emellertid runt R19X är delning av haplotyp inte mer omfattande än någon annanstans på kromosomen, och den är inte heller större bland bärare än icke-bärare (Kolmogorov – Smirnov-test P = 0, 8; Kompletterande Fig. S4). Dessutom finns det inga bevis för kryptisk relateradhet, understruktur eller för någon utökad korrelation mellan genetisk bakgrund och bärarstatus (kompletterande fig. S5), eftersom överskottsrelationer avtar exponentiellt bort från riskplatsen som förväntat. Runt R19X uppskattas profilen för maximal haplotypidentitet väl av en modell där den gemensamma förfäder till den genealogiska närmaste grannen inträffade i genomsnitt för 4, 1 generationer sedan. Detta ger en nedre gräns för mutationens ålder vid c. För 100 år sedan antas en generationstid på 25 år. Intressant nog hittar vi runt andra varianter av samma frekvens större nivåer av kryptisk relateradhet (Kompletterande Fig. S6), vilket tyder på att dessa vanligtvis är nyare.

APOC3- variantassociationer med lipiddrag

Funktionella kodningsmutationer i APOC3- lokuset har tidigare varit implicerade i flera egenskaper relaterade till triglycerider och HDL-kolesterolnivåer Asn), hos en turkisk patient. J. Lipid. Res. 35, 1431–1440 (1994). "Href = / Articles / ncomms3872 # ref17 aria-label =" Reference 17 "data-track = klick data-track-label = länk> 17, 18, Lys), associerad med måttlig hypertriglyceridemi i ett stort släkte av mexikanskt ursprung. J. Lipid. Res. 38, 1833–1840 (1997). " href = / Articles / ncomms3872 # ref19 aria-label = "Referens 19" data-track = klick data-track-label = länk> 19, 20, 21 . Varianter i promotorn av denna gen har också associerats med hypertriglyceridemi 22, 23, förändringar som svar på insulinreglering 24, 25 och i fallet med rs2542052, med låga serum APOC3-nivåer och livslängd 26 . Vi hittar inga bevis för samband mellan rs2542052 och HDL-nivå i MANOLIS-kohorten ( P = 0, 76, sannolikhetsförhållandestest).

En storskalig metaanalys av genomomfattande föreningsstudier över ~ 100 000 individer har också identifierat robusta samband mellan en vanlig frekvensvariant (rs964184) 51, 5 kb uppströms APOC3- och HDL- och triglyceridnivåer 12 . Vi hittar lite bevis för lika ojämlikhet mellan rs964184 och R19X ( r 2 = 0, 01, D = 0, 34) i MANOLIS-kohorten (tilläggstabell S4), vilket indikerar att dessa är två distinkta signaler inom samma lokus. Detta stöds ytterligare av villkorad analys (kompletterande tabell S5).

Diskussion

I denna studie undersöker vi ett nyligen karakteriserat befolkningsisolat från Kreta i Grekland. Våra resultat i det grekiska isolatet visar användningen av exome-arrayen i upptäckten av lågfrekventa variantassociationer i drag av medicinsk relevans. Vi finner att R19X är förknippat med ökad HDL och minskade triglyceridnivåer med genombredd betydelse. Detta arbete ger insikter i den alleliska arkitekturen hos APOC3- lokuset, i vilket vanliga varianter också har visat sig vara förknippade med lipiddrag genom genomomfattande föreningsstudie (till exempel Teslovich et al . 12 ) och belyser de dramatiska maktvinsterna som kan fås genom att studera befolkningsisolat. Den funktionella sällsynta varianten R19X har ökat i frekvens till ~ 2% i denna population, vilket möjliggör upptäckt av denna lipiddragsignal med genombredd betydelse i en liten provstorlek. Den motsvarande provstorleken som behövs för att uppnå 80% effekt för att upptäcka den observerade effektstorleken i en utbredd europeisk befolkning skulle vara 67 000. Våra fynd behandlar dessutom generaliserbarheten hos föreningar som upptäckts i befolkningsisolat både på genen och på variantnivå. R19X-varianten har också ökat i frekvens och visar associering med HDL i Amish grundarpopulation 3 . En sammanfattande statistikbaserad metaanalys över MANOLIS- och Amish 3- befolkningsisolaten för R19X leder till ett kombinerat P- värde på 8, 1 × 10 −32, uppnådd med en total provstorlek på ~ 2 700. APOC3 R19X utgör enligt vår kunskap det första kända exemplet på en kliniskt viktig variant som tidigare antogs vara privat för en befolkning men som faktiskt har drivit i frekvens i två oberoende befolkningsisolat och är starkt associerad med drag av hög klinisk relevans. Nästa generations föreningsstudier på jakt efter lågfrekventa och sällsynta varianter som är förknippade med komplex sjukdom kan starkt stöds av studien av befolkningsisolat.

metoder

Anogia befolkningens historia

Anogia är en geografiskt isolerad bergig by på ön Kreta, Grekland (befolkningsstorlek 4 000). Det ligger vid berget Idi och är en del av kommunen Mylopotamos, som inkluderar ytterligare isolerade byar. Namnet Anogia betyder 'övre jorden' och avser höjden där byn ligger (740 m). Invånarna i Anogia visar karakteristiska kretensiska beslutsamhet, stor stolthet över deras land och upprätthåller gamla traditioner. 1593 var bosättningen 911 medborgare. Anogia är historiskt känt för sina invånares motstånd mot erövrare. Byn har byggts tre gånger, eftersom den brändes två gånger av turkarna (1822 och 1866) och en gång av tyskarna (1944). Den lokala dialekten påverkas fortfarande starkt av det forntida doriska språket.

HELIC kohortkollektion

HELIC-MANOLIS-samlingen fokuserar på Anogia och de omgivande byarna Mylopotamos. Rekrytering av detta befolkningsbaserade urval genomfördes främst vid byens medicinska centra. Alla individer var äldre än 17 år och måste ha minst en förälder från Mylopotamos-området. Studien inkluderar biologiskt provsamling för DNA-extraktion och laboratoriebaserade blodmätningar och intervjubaserad frågeformulär. Fenotyperna som samlas in inkluderar antropometriska och biometriska mätningar, kliniska utvärderingsdata, biokemiska och hematologiska profiler, självrapporterad medicinsk historia, demografisk, socioekonomisk och livsstilsinformation. Biokemiska mätningar erhölls med användning av enzymatiska kolorimetriska analyser och inkluderade glukos (hexokinasmetod), totalt kolesterol (kolesteroloxidas - fenolaminofenazonmetod), HDL-kolesterol, triglycerider (glycerol-3-fosfatoxidas-fenolaminofenazon) och järn. Insulin och ferritin mättes via kemiluminescens och CRP genom en immunoturbidimetrisk metod. Lipoprotein (LDL) -kolesterolnivåer med låg densitet beräknades enligt Friedewald-ekvation 27 . Studien godkändes av Harokopio University Bioethics Committee, och informerat samtycke erhölls från mänskliga ämnen.

Genotypning och QC

Prover genotypades med hjälp av Infinium HumanExome och genotyper kallades med användning av Illumina Genome Studio Gencall följt av zCall 28 . Vi genomförde en iscensatt kvalitetskontroll (QC) -strategi; kortfattat utförde vi ett initialt förfilter på GenCalled-data exklusive prover och varianter som hade samtalshastighet <90%. Vi genomförde ett pre-zCall-prov QC, exklusive prover som hade <98% samtalshastighet eller som var heterozygositetsutbyten baserade på fördelningen vid två olika MAF-trösklar (MAF 99%, MAF> 5%, Hardy Weinberg Equilibrium (HWE) < 0, 00001). Efter zCall utförde vi variant QC med användning av genCalled-genotyper (samtalshastighet <95%, HWE P <0, 0001, klusterseparationsscore <0, 4). Exempel QC utfördes sedan på zCall-data exklusive prover som var etnicitetsutgångar eller duplikat, som hade en samtalshastighet <99%, eller som var heterozygositetsutbyten, utförda vid två olika MAF-trösklar (MAF <1% och MAF ≥1% ). Vi uteslutte varianter med en zCall-samtalstakt <99%. Vi använde ett slutligt QC-steg som undersöker igen de multidimensionella skalningsresultaten, MAF 100-varianter. Vi använde också ett sista HWE-steg exklusive varianter med HWE P <0, 0001. Totalt 1 267 prover och 61 638 varianter som inte var monomorfa passerade QC (kompletterande tabell S1).

Egenskapstransformationer och analys

Egenskaperna ansågs vara outliers om de var fem standardavvikelser från medelvärdet och togs bort från analysen. Dessutom utesluts LDL-värden för individer med triglyceridnivåer> 400 mg dl1. Alla fenotyper analyserades direkt, bortsett från triglycerider, insulin, CRP och ferritin, som normaliserades med användning av den naturliga logaritmtransformationen. Åldern var omvänd normaliserad. En individ ansågs ha hög HDL om HDL var över eller lika med 60 mg dl −1, medan låg HDL definierades som HDL <40 mg dl −1 . Vi utförde analys av traitassociation med GEMMA 29 som innehåller en släktmatris för att redovisa besläktningen mellan individer. P- värden producerades med användning av sannolikhetsförhållandestestet. Släktmatrisen genererades med användning av exome array genotypdata. För HDL och triglycerider utförde vi en trevägs metaanalys med Fishers metod över MANOLIS-data och resultaten rapporterade av Pollin et al . 3 (809 Amish-individer från Old Order från Heredity and Phenotyp Intervention Heart Study och 698 Amish-individer från Amish Family Calcification Study).

Haplotypanalys för att uppskatta variantens ålder

Fyra individer i UK10K-datauppsättningen har var och en stoppallel vid R19X. Vi extraherade 1 Mb haplotyper på varje sida av varianten från dessa individer såväl som från 20 andra slumpmässigt utvalda individer från den brittiska datauppsättningen med endast de platser som överlappade med MANOLIS-datauppsättningen. De delade samma ~ 700 kb haplotype (~ 200 kb-stop- ~ 500 kb) som vi kan förvänta oss med tanke på frekvensen av allelen och dess ålder uppskattad från denna frekvens (3, 0 KYA, 95% CI 0–9, 0 KYA). Vi konstruerade sedan haplotyper för de 48 kromosomerna med stoppallelen i MANOLIS på samma sätt. En viktig slutsats från förfädernas haplotyp (står för 99/3 740 haplotyper (2, 6%) hos 99/1 870 individer (5, 3%) av Amish-kohorten) med 53 SNP från Illumina HumanExome Beadchip-data jämfördes med den delade haplotypen mellan UK10K och MANOLIS. Fyrtiofem SNP: er delades mellan de tre datamängderna. Amish-haplotypen delar minst 571 kb (181 kb-stop-390 kb, 116, 520, 527–117, 091, 609) med HELIC och UK10K-haplotyperna. Det finns inga SNP: er i Amish-data mellan 116.973.929 och 117.100.594 där HELIC-UK10K delade haplotypen slutar, och nästa SNP som finns i Amish-data visar att haplotypen skiljer sig från UK10K-haplotypen. Den delade haplotypen mellan Amish och HELIC-UK10K kan sträcka sig något längre än 117, 091, 609.

Identifiering av maximal delning av haplotyp

För att identifiera sträckor av utökad haplotypdelning mellan individer använde vi en modifiering av den långa avståndsfasningsmetoden enligt Kong et al. 16 Kortfattat identifierar vi för varje målindivid ett par andra individer från provet som surrogatföräldrar, så att målindividens genotyp är förenlig med Mendelian överföring från pseudo-föräldrarna. Vi möjliggör en låg nivå av genotypningsfel (här 1%) och rekombination (här proportionell mot den finskala HapMap-genetiska kartan 30, så att mellan alla par av SNP: er kan en av pseudo-föräldrarna ändras). Vi hittar den mest troliga föräldresparvägen med Viterbi-algoritmen och rekonstruerar delade haplotyplängder. Informellt sett kan algoritmen ses som att man försöker hitta, för var och en av en individs två kromosomer, de andra proverna som innehåller släktmässiga närmaste grannar. I isolerade populationer kan metoden användas för att detektera kryptisk relateradhet och stratifiering i ett prov. Analysen var begränsad till de med låga nivåer av relateradhet (

<0, 2; 754 individer av vilka 32 är bärare för riskvarianten; resultaten liknar med

<0, 1).

Ytterligare information

Hur man citerar den här artikeln: Tachmazidou, I. et al. En sällsynt funktionell hjärtskyddande APOC3- variant har ökat i frekvens i distinkta populationsisolat. Nat. Commun. 4: 2872 doi: 10.1038 / ncomms3872 (2013).

Anslutningskoder: HELIC-MANOLIS-studiens genotypdata har deponerats i European Genome-fenome Archive (EGA) under anslutningskoden EGAS00001000630. UK10K-sekvensdata har deponerats till EGA under anslutningskoderna EGAS00001000108 och EGAS00001000090.

anslutningar

GenBank / EMBL / DDBJ

  • EGAS00001000090
  • EGAS00001000108
  • EGAS00001000630

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

    Kompletterande figurer S1-S6, kompletterande tabeller S1-S5 och kompletterande anmärkning 1

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.