Den genomiska grunden för anpassningar av tid på cirkadisk tid och cirkulär tid i en midge | natur

Den genomiska grunden för anpassningar av tid på cirkadisk tid och cirkulär tid i en midge | natur

Anonim

ämnen

  • Cirkadisk reglering
  • Ekologisk genetik
  • Evolutionsgenetik
  • Genome

Abstrakt

Organismer använder endogena klockor för att förutse regelbundna miljöcykler, till exempel dagar och tidvatten. Naturliga varianter som resulterar i olika tidsbestämda beteenden eller fysiologi, känd som kronotyper hos människor, har inte kännetecknats väl på molekylnivå. Vi sekvenserade genomet Clunio marinus , en marin midge vars reproduktion är tidsbestämd av circadian och circalunar klockor. Spetsar från olika platser visar stamspecifika genetiska timinganpassningar. Vi undersökte genetisk variation i fem C. marinus- stammar från olika platser och kartlade kvantitativa drag loci för circalunar och circadian kronotyper. Regionen som är mest starkt associerad med cirkadiska kronotyper genererar stammspecifika skillnader i överflödet av kalcium / kalmodulinberoende kinas II.1 (CaMKII.1) splitsvarianter. Eftersom ekvivalenta varianter visade sig förändra CaMKII-aktivitet i Drosophila melanogaster , och C. marinus ( Cma ) - CaMKII.1 ökar den transkriptionella aktiviteten för dimer från de cirkadiska proteinerna Cma- CLOCK och Cma- CYCLE, föreslår vi att modulering av alternativ skarvning är en mekanism för naturlig anpassning i cirkadisk timing.

Huvudsaklig

Runt den nya eller fullmånen, under några specifika timmar kring lågvatten, dyker upp miljontals icke-bitande kämpar av arten C. marinus från havet för att utföra sin nyansdans. Vuxna lever i bara några timmar, under vilka de parar sig och ägglossar. De måste därför komma synkront och - med tanke på att embryonalv, larv och valputveckling äger rum i havet - i en tid då de mest extrema tidvattnen på ett tillförlitligt sätt utsätter larvets livsmiljö. De lägsta lågvatten förekommer förutsägbart under specifika dagar i månmånaden vid en viss tid på dagen. Följaktligen är vuxenuppkomst i C. marinus under kontroll av circalunar och circadian klockor 1, 2 . Det är anmärkningsvärt att även om de lägsta lågvatten återkommer alltid vid en given plats skiljer sig deras tidpunkt mellan geografiska platser 3 . Följaktligen visar C. marinus- stammar från olika platser (Utvidgad data, Fig. 1a) lokal anpassning i dygns- och cirkulära uppkomsttider (Utvidgad data, Fig. 1b, c). Korsningar mellan Jean- och Por-stammarna visade att skillnaderna i cirkadisk och circalunar timing är genetiskt bestämda 4, 5 och förklaras till stor del av två cirkadiska och två circalunar kvantitativa drag loci (QTL) 6 .

Studier av tidsvariation eller kronotyper hos djur och människor har ofta fokuserat på kandidatgener från den cirkadiska transkription – translationella oscillatorn. I D. melanogaster är polymorfismer i kärncirkadianklockperioden, tidlösa och kryptokrom förknippade med adaptiva skillnader i temperaturkompensering 7, fotosvar på dygnsklockan 8 och uppkomstrytmerna 9 . Medan dessa studier ger insikter om utvecklingen av kända døgnklockmolekyler, är genomöverbredda föreningsstudier 10, 11 och andra framåtriktade genetiska tillvägagångssätt (granskade i ref. 12) nödvändiga för att ge en omfattande, opartisk bedömning av naturlig tidsvariation, exempel underliggande mänskliga sömnfasstörningar. Medan den mänskliga kronotypens adaptiva natur förblir oklar, representerar kronotyperna för C. marinus evolutionära anpassningar till deras livsmiljö. Vår studie syftade till att identifiera den genetiska grunden för C. marinus anpassning till dess specifika ekologiska "timing nisch". Dessutom kan den genetiska dissektionen av anpassningsbara naturliga varianter av icke-cirkadiska rytmer 13, som också finns i C. marinus, ge en inträde i deras okända molekylära mekanismer.

Som utgångspunkt för dessa analyser sekvenserades, monterades, kartlades och kommenterade vi ett C. marinus referensgenom.

Clunio- genomet och QTL: er för timing

Vårt referensgenom CLUMA_1.0 av Jean-laboratoriestammen innehöll 85, 6 Mb sekvens (tabell 1), nära den tidigare flödescytometri-baserade uppskattningen av 95 Mb 6, vilket understryker att kironomider i allmänhet har små genom 14, 15, 16 . Slutmonteringen har ett ställning N50 på 1, 9 Mb. Genomfattande genotypning av en kartläggningsfamilj med restriktionsställe-associerad DNA-sekvensering tillät 92% av referenssekvensen att förankras konsekvent längs en genetisk kopplingskarta (fig. 1a och utvidgad data fig. 2), vilket förbättrar den ursprungliga kopplingskartan (kompletterande Metoder 5). Automatiserad genomanteckning resulterade i 21 672 genmodeller. Proteinlikhet och tillgängliga transkript stödjer 14 041 genmodeller (kompletterande tabell 1) inom området för genantal för D. melanogaster (15, 507) och Anopheles gambiae (13, 460). Således verkar det mycket lilla C. marinus- genomet vara komplett (tabell 1, utvidgad data fig. 3, kompletterande anmärkning 1 och kompletterande tabell 2). Referensen genom C. marinus gör kironomider till den tredje dipteran-subfamiljen med ett annoterat genom som rekonstruerats till kromosomskala (fig. 1a och utvidgade data fig. 2, 3b – f).

Full storlek bord

Image

a, De tre kopplingsgrupperna av C. marinus med referensställningar (höger) förankrade på en genetisk kopplingskarta (till vänster). Ställningar som är ordnade och orienterade, svarta staplar; inte orienterade, grå staplar; varken beställda eller orienterade, vita staplar. Grå skuggningar, stora områden som inte rekombineras. QTL: er, circadian (orange), circalunar (cyan). En circadian och circalunar QTL överlappar varandra, vilket resulterar i tre fysiska QTL-regioner (C1 / L1, C2 och L2, i lila, orange respektive cyan). b, genomisk analys av befolkningen av QTL C2. Analys av Por- och Jean-stammar (i blått respektive rött i två mellersta paneler). Topppanelen, genetisk differentiering för enstaka SNP: er (röda prickar) och i 5 kb fönster (svart linje). Andra panelen, genetisk mångfald ( θ ) i 20 kb (tunn linje) och 200 kb (tjock linje) fönster. Tredje panelen, lika ojämlikhet ( r 2 ) i 100 kb fönster. Bottenpanel, korrelationsscore (CS) för genetisk differentiering med värden för cirkadisk timing (överst), circalunar timing (mitten) och geografiskt avstånd (botten) för Vigo, Jean, Por, He och Ber-stammar. Nedre siffror, ställningar ID. För ytterligare detaljer, inklusive QTL: er C1 / L1 och L2, se Utökad data Fig. 5a, b.

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Vi utförde en grundläggande genomkarakterisering och jämförelse med andra dipteraner. Vi avgränsade de fem C. marinus- kromosomarmarna (kompletterande anmärkning 2, utvidgad data fig. 3c och kompletterande tabell 3) och homologiserade dem till D. melanogaster och A. gambiae genom synteny jämförelser (utvidgade data fig 3 och 4, kompletterande anmärkning 2 och Kompletterande tabell 3). Vi hittade också det ZW-liknande könslänkade lokuset i C. marinus 6 utanför X-kromosomhomologen (kompletterande anmärkning 2) och detekterade en förhöjd hastighet av kromosomal omarrangemang (fig. 1a, kompletterande anmärkning 3 och utvidgade data fig. 2, 3b – f, 4). Sammantaget verkar referensen genom C. marinus vara väl sammansatt.

Som nästa steg mot att identifiera den molekylära basen för cirkadiska och cirkulära timing-anpassningar i C. marinus , förfinade vi de tidigare identifierade timing-QTL-positionerna 6 baserat på de nya högdensitets-, restriktionsställ-associerade DNA-sekvenseringsmarkörerna (kompletterande tabell 4 och Kompletterande anmärkning 4) och bestämde referenssekvensen som motsvarar QTL-konfidensintervall (fig. 1, orange och cyanstänger; och kompletterande tabell 4). Inga av de kärncirkadiska klockgenerna visade sig befinna sig inom dessa QTL: er (fig. 1a). Endast timeout / tidlös2 , en tidlös homolog med en mindre roll vid omställning av dygnsklockan 17, finns inom QTL: erna.

Genetisk variation i Clunio- timingstammar

Vi sekvensbestämde sedan Por- och Jean-stammarna (Utvidgad data Fig. 1), för vilken den första QTL-analysen utfördes 6 . Två pooler med 300 fältfångade individer sekvenserades vid> 240 × täckning (kompletterande tabell 5). Kartläggning avläser mot referensgenomet identifierade 1 0010 052 enstaka nukleotidpolymorfismer (SNP), varav 72% var närvarande i både Por- och Jean-stammarna. Baserat på alla SNP: er bestämde vi genetisk differentiering ( F ST ), genetisk mångfald ( θ ) och kortdistanslänkningsjämvikt (mätt som r 2 ) (fig. 1b och utvidgade data, fig. 3c, 5a, b).

Genomfattande genetisk differentiering mellan Por- och Jean-stammarna är måttlig ( F ST = 0, 11), vilket ger en bra grund för screening av genomet för lokal timinganpassning baserad på genetisk divergens. Enligt QTL-analys förklarar de två cirkadiska QTL: erna 85% av den dagliga timingskillnaden och de två circalunar QTL: erna förklarar hela den månatliga timingskillnaden (kompletterande tabell 4 och ref. 6). Eftersom varje lokus därför har en stark effekt på tidtagningen, måste urvalet mot felanpassade alleler vara starkt och timinglägena bör vara starkt differentierade.

Inom konfidensintervallen för QTL: erna är 158 SNP: er och 106 indel (insertioner eller raderingar) starkt differentierade ( F ST ≥ 0, 8; Fig. 1b och Utvidgad data, Fig. 5; SNP: er, röda prickar i F ST- paneler, för genombrett jämförelse se kompletterande anmärkning 5). Vi sammanställde en lista över kandidatgener för cirkadiska och circalunar timing-anpassningar baserat på deras närhet till differentierade SNP: er och indlar i QTL: erna (kompletterande tabell 6). Kandidatgenerna innefattar varken kärncirkadiska klockgener ( tidlös2 / timeout , max. F ST <0, 5; medelvärde F ST = 0, 07), och berikas inte heller för någon särskild väg (genontologi-termanalys; kompletterande tabell 7).

Timing fenotyp med genotyp korrelation

Antagande att allelerna förknippade med timinganpassning troligen härstammar från stående genetisk variation (kompletterande anmärkning 5), genetisk variation vid tidpunktlokaler bör inte variera fritt mellan stammar, utan snarare stammar med liknande timing bör dela funktionellt relevanta alleler. För att identifiera sådana loci utvidgade vi den genomiska skärmen till ytterligare tre stammar: från Vigo (Vigo), Helgoland (He) och Bergen (Ber; Utvidgad data Fig. 1 och kompletterande tabeller 5, 8). Vi testade sedan alla fem sekvensbestämda stammar för korrelationer mellan genetisk differentiering ( F ST ) och tidsskillnader, eller geografiska avstånd som en nollmodell (kompletterande tabell 8).

Sammantaget korrelerades inte genomgenomfattande genetisk differentiering med circadian ( r = 0, 10, P = 0, 31) eller circalunar ( r = 0, 56, P = 0, 12) tidskillnader, utan med geografiskt avstånd ('isolering med avstånd'; r = 0, 88, P = 0, 008). Mot denna genomiska bakgrundsignal av isolering på avstånd, screenade vi genomet i 5-kb glidande fönster för toppar av korrelation mellan genetisk differentiering och timing, vilket resulterade i en korrelationsscore (Fig. 1b och Utvidgad data, Fig. 5a, b, CS-paneler, poäng som sträcker sig från 0 till 5; för mer information se Metoder). Genom att kombinera bevis från Por-versus Jean-stam F ST- skärmen (kompletterande tabell 6) med dessa mönster för korrelation mellan timing och genetisk divergens minskade kandidatgenlistan till 49 gener (kompletterande tabell 9).

Av speciell anmärkning differentierades ett enda område i cirkadisk QTL C2 (fig. Ib). I detta område höjdes lika obalans i Por-stammen signifikant (permutationstest; P = 0, 002), och den genetiska mångfalden minskade signifikant i vissa sträckor (permutationstest; P = 0, 037 och 0, 020), jämfört med Por-genomsnittet. Detta kan indikera ett nyligen avsnitt av urval i Por, potentiellt under anpassning av tidpunkten, eftersom denna region också är starkt berikad för tidskorrelerade polymorfismer (fig. 1b, CS-panel). De mest extrema värdena för genetisk differentiering, genetisk mångfald och timingkorrelation lokaliseras till CaMKII.1- lokuset och den främre delen av en gen homolog med Big Bang (bbg) -genen.

CaMKII påverkar den cirkadiska kärnklockan

CaMKII.1- lokuset har inte bara det högsta antalet differentierade polymorfismer (kompletterande tabell 9), men CaMKII har också visat sig påverka tidpunkten för cirkadisk tid. Mus CaMKIIa fosforylerar CLOCK och underlättar dess dimerisering med BMAL in vivo 18 . Möss med inaktiva, kinas-döda CaMKIIa K42R har dämpat djurrytmer och en förlängd døgnfri löpningsperiod 18 . CaMKII fosforylerar också CLOCK-proteinet 19 i D. melanogaster S2-cellinjen och in vivo- hämning av Dme- CaMKII i en sensibiliserad bakgrund med reducerade Ca2 + -nivåer förlänger den cirkadiska frilöpande perioden 20, vilket antyder att rollen för CAMKII i Dygns timing bevaras över djur.

För att bestämma om CaMKII också kan påverka den cirkadiska kärnklockan i C. marinus testade vi effekten av Cma -CaMKII.1 i en cellbaserad analys med D. melanogaster S2-celler 19, 21 . Vi upprepade tidigare experiment 19 som visade att den kemiska hämningen av endogen Dme -CaMKII reducerar mängden genererat luciferas (Utvidgad data fig. 6a), medan tillsats av ett [Ca 2+ ] -beroende, och därför konstitutivt aktiv, variant av CaMKII ( mus, T286D) ökar mängden luciferas (Utvidgad data Fig. 6b). Sedan genererade vi konstruktioner för C. marinus klocka , C. marinus cykel och muterade kinas-döda (K42R) och [Ca 2+ ] -oberoende (T286D) versioner av Cma-CaMKII.1 . Transfektion av Cma-klocka och Cma-cykel till D. melanogaster S2-celler leder till luciferasaktivitet drivet från 3X69-promotorn härledd från Dme-periodpromotorn (fig. 2a). Tillsatsen av [Ca 2+ ] -beroende Cma-CaMKII.1 T286D leder till en väsentlig ökning av luciferas-signalen (fig. 2a), medan tillsats av den kinasdöda Cma - CaMKII.1 K42R inte förbättrar luciferasaktiviteten ( Fig. 2a). Dessa data antyder att CaMKII-kinasaktivitet förbättrar E-box-beroende transkription, vilket indikeras av luciferasproduktion drivet av 3X69- promotorn, via CLOCK-CYCLE-dimeren i C. marinus .

Image

a, Ytterligare C. marinus CaMKII.1 ökar den transkriptionella aktiviteten för C. marinus Clk och Cyc i en D. melanogaster S2-cellluciferasanalys med användning av 3X69 E-box innehållande förstärkare ( period 3X69– luc (ref. 21)). Data representeras som medelvärde ± sem; tvåsidig Welch tvåprov- t- test; biologiska replikat, n = 5, med undantag för ingen clk- kontroll, n = 3, varje biologiskt replikat representerar genomsnittet av tre beredningsreplikat. *** P <0, 0005. b, Exoner av hela (RA – RD) och partiella (RE – RO) Cma-CaMKII.1- transkript. c, fördelning av SNP: er (svart), indlar (orange) och en 125-bp insättning (röd prick) längs Cma-CaMKII.1- lokuset, alla med F ST ≥ 0, 8.

Bild i full storlek

  • Ladda ner PowerPoint-bilden

CaMKII.1- skarvning korrelerar med timing

Vi undersökte sedan hur polymorfismer i Cma-CaMKII.1- lokuset påverkar enzymet. Vi hittade två CaMKII.1- alleler: en i de tidigt framväxande Por-stammarna, He- och Ber-stammarna, och en annan i de sent framväxande Jean- och Vigo-stammarna. De flesta stamspecifika polymorfismer är belägna i introner (fig. 2b, c och kompletterande tabell 9). Om dessa polymorfismer var meningsfulla, bör de påverka CaMKII.1- uttryck och / eller skarvning. Cma-CaMKII.1 har fyra funktionella domäner 22 (fig. 2b). Majoriteten av differentierade polymorfismer kluster i området för den variabla länkdomänen (fig. 2b, c), inklusive en 125-bp-insättning (röd prick i fig. 2c; utvidgad data, fig. 7). Vi identifierade fyra alternativt skarvade transkript i full längd av Cma-CaMKII.1 (RA – RD), som skiljer sig i länkens längd (fig. 2b). RNA-sekvensering med hög täckning visade bevis för differentiell exonanvändning mellan Jean- och Por-stammarna, såväl som för tidigare icke-kommenterade exoner inom det variabla länkarområdet (Extender Data Fig. 6c). PCR och Sanger-sekvensering bekräftade flera partiella transkript av ytterligare skarvvarianter av länkområdet (RE – RO; Fig. 2b). Vi använde transkriptionsspecifik qPCR för att kvantifiera alla transkript från tredje instarlarver. Generellt uttrycks transkript RE-RO på mycket låga nivåer. Av dessa visade endast RO kvantifierbara expressionsskillnader mellan Jean- och Por-stammarna (fig. 3a och utvidgad data, fig. 6d). Det är viktigt att transkriptionsspecifik qPCR bekräftade signifikant differentiellt uttryck för de viktigaste transkripten i stammarna Jean kontra Por (fig. 3a, utvidgad data, fig. 6d), vilket matchar RNA-sekvenseringsdata (RNA-sekv.) (Utvidgad data, fig. 6c) . Konsekvent visade varianter med långa länkar (RA, RB) högre uttryck i Por-stammen, medan kortare varianter (RD, RO) visade högre uttryck i Jean-stammen (fig. 3a och utvidgad data, fig. 6c, d).

Image

a, qPCR-värden för CaMKII.1-splitsvarianter från Por- och Jean-stammar, normaliserade till Por (för icke-normaliserad data, se Utökad data, Fig. 6d). Data representeras som medelvärde ± sem; Por, n = 9 biologiska replikat; Jean, n = 10; RO, Por, n = 3; Jean n = 8; RO detekterades inte i sex Por-biologiska replikat, vilket antyder en ännu större uttrycksskillnad; tvåsidigt Wilcoxon rank-sumtest; * P <0, 05; ** P <0, 005; *** P <0, 0005; NS, inte signifikant; Holmkorrigering för flera tester. För RNA-seq-datakvantifiering, se Utökad data Fig. 6c. b, differentiell skarvning av CaMKII.1-länkregionen i D. melanogaster S2R + -celler, normaliserad till Por, n = 7 biologiska replikat; tvåsidig tvåprov- t- test, annars som en . c, Representativa fosforbildande gelsektioner enligt kvantifiering för b, två separata fält från samma gel (för full gel, se källdata). d, Fri-löpande rytm av vuxens uppkomst under konstant svagt vitt ljus (ungefär 100 lx). Han och Por delar CaMKII.1- alleler, medan Jean har den andra allelen. För att beräkna perioden med fri löpning, var tiden mellan efterföljande uppkomsttoppar i genomsnitt, med en vikt av varje topp med antalet individer.

Bild i full storlek

  • Ladda ner PowerPoint-bilden

Om de detekterade skillnaderna i överflödet av CaMKII.1-skarvvarianter är förknippade med tidskillnadsskillnaderna, bör de orsakas direkt av de stamspecifika polymorfismerna vid CaMKII.1- lokuset. För att testa detta genererade vi minigener som innehöll den alternativt skarvade länkregionen i CaMKII.1- lokuset från antingen Jean- eller Por-stammarna. De två minigenerna transfekterades till celler i D. melanogaster S2R + -cellinjen och uttryck av skarvvarianter analyserades med radioaktiv RT – PCR (fig. 3b, c). Vi upptäckte fyra varianter, motsvarande skarvvarianter RB, RC, RD och RO. Alla varianter visade samma stamspecifika mängdskillnader i S2R + -cellanalysen som i C. marinus- stammarna in vivo (fig. 3a, b). Eftersom det cellulära sammanhanget är detsamma för både Jean- och Por-minigenerna i S2R + -analysen kan trans- verkande element uteslutas som orsaken till differentiell skarvning, vilket antyder att det är ett direkt resultat av skillnaderna i genomisk sekvens vid Cma-CaMKII .1 lokus. Medan skarvvarianter RB, RC och RD och deras utgående exoner bevaras i D. melanogaster (se Flybase-kommentarer och ref. 23), finns det inte en D. melanogaster RA-motsvarighet. Detta kan förklara varför denna variant inte kan upptäckas i S2R + -celler (fig. 3b).

Från splitsvarianter till tidsskillnader

CaMKII-länkarlängdsvarianter har undersökts i flera arter. D. melanogaster CaMKII isoformer motsvarande RB-, RC- och RD-varianterna av C. marinus har olika substrataffiniteter och hastigheter för målfosforylering 23 . Dessa aktivitetsskillnader förklaras av det faktum att CaMKII fungerar som en dodkamera, och länkarlängden bestämmer kompaktheten och därmed substrattillgängligheten för holoenzym - enzymer med långa länkar har högre aktivitet. Denna struktur – funktion-relation är möjligen universell, eftersom den bevaras mellan människor och C. elegans 22, 24 .

Inaktivering eller hämning av CaMKII förlänger dygnsperioder hos mus och fruktflugor 18, 20 . En koppling mellan cirkadisk periodlängd och aktivitetsfas i ljus-mörka cykler är känd från mutationer i period i D. melanogaster 25 och mänskliga kronotyper 26 . Dessa fynd innebär att i C. marinus de mer aktiva och lättare Ca 2+ -aktiverade, långlänkande CaMKII.1- varianterna bör främja uppkomsten av vuxna genom att förkorta den dygnsklockperioden. I själva verket finner vi att de tidigt framväxande Por- och He-stammarna, som har samma långlänkande partiska CaMKII.1-alleler, har kortare friloppande døgnklockperioder än den sent framväxande Jean-stammen (Fig. 3d).

Genom att integrera våra resultat med de från ovannämnda litteratur föreslår vi att reglering av förhållandet mellan CaMKII.1-splitsvarianter utgör en evolutionär mekanism för att anpassa cirkadisk timing (Utvidgad data Fig. 8): skillnader i den genomiska sekvensen av CaMKII.1 leder till differentiell CaMKII.1- skarvning och aktivitet. Bland ett antal möjliga mål påverkar detta klock-cykel-dimerberoende transkription, vilket i sin tur påverkar cirkadisk periodlängd och resulterar i slutändan i skillnader i vuxens uppkomsttid.

Diskussion

Årliga, mån- och tidvattensrytmer, liksom naturlig tidsvariation mellan individer, är viktiga och utbredda fenomen som är dåligt förstås. Referensen genom C. marinus och den genetiska variationspanelen för fem stammar med olika cirkadiska och cirkulära timing skapar nya resurser för ytterligare studier av dessa ämnen.

Vi identifierade C. marinus ortologer för alla kärncirkadiska klockgener, varav ingen verkar vara involverad i cirkadiska eller circalunar timinganpassningar. För tidpunkten för circalunar stöder detta molekylära oberoende av circalunar klockan från circadian klockan, som rapporterats för Platynereis dumerilii 27 .

För cirkadisk timing framträder stamspecifik modulering i alternativ skarvning av CaMKII.1 som en möjlig mekanism för naturlig anpassning. Mot bakgrund av tidigare experiment i D. melanogaster och möss 18, 19, 20, 23 verkar det mest troligt att skillnader i CaMKII-aktivitet hos de olika skarvformerna leder till cirkadiska timingskillnader via fosforylering av CLOCK-CYCLE (Utvidgad data Fig. 8).

Det kan också tänkas att CaMKII påverkar tidpunkten för dykningen via andra mål. Exempelvis är CaMKII känd för att fosforylera cAMP- svarelementbindningsproteinet (CREB) 28, 29 . CREB är kopplat till den dygnsklocka av cAMP-svarelement (CRE) i promotorerna för perioden och tidlösa gener 30, 31 och genom fysisk interaktion av det CREB-bindande proteinet (CBP) med CREB, CLOCK och CYCLE 32, 33 . Dessutom är en av de mest studerade rollerna för CaMKII den morfologiska moduleringen av neuronal plasticitet och anslutning 34, 35, 36 . Sådana förändringar i anslutningsförmåga har alltmer implicerats som en del av den cirkadiska tidmekanismen i D. melanogaster och däggdjur 37 . Intressant nog har CaMKII: s roll vid utformningen av neuronell anslutning föreslagits för att koppla till flera neuropsykiatriska sjukdomar 38, som ofta förekommer med kronobiologiska störningar 39, 40, 41, 42 . Ytterligare studier behövs för att bestämma om moduleringen av CaMKII-aktivitet utgör en molekylär koppling mellan dessa fenomen.

metoder

Inga statistiska metoder användes för att förutbestämma provstorlek. Experimenten randomiserades inte och utredarna var inte blinda för tilldelning under experiment och utvärdering av resultatet.

Djurskultur och ljusregimer

Laboratoriebeståndet av C. marinus uppföddes enligt Neumann 1, vård av MFPL: s vattenanläggning. I korthet hölls C. marinus i 20 × 20 × 5 cm plastbehållare med sand och naturligt havsvatten utspädd till 15 ‰ med avsaltat vatten, matade diatomer ( Phaeodactylum tricornutum , stam UTEX 646) i tidiga larvstadier och näselpulver i senare stadier. Temperaturen i klimatkamrarna sattes till 20 ° C och den ljus-mörka cykeln var 12:12 (förutom där det anges annorlunda). Månsken simulerades med en glödlampa (ca 1 lx) som aktiverades hela natten under fyra på varandra följande nätter var 30 dagar.

Genommontering

Genommonteringsprocessen (utvidgad data fig. 9a) var baserad på tre sekvenseringsbibliotek (kompletterande tabell 10): ett 0, 2 kb insättningsbibliotek framställdes från en enda vuxen hane från Jean-laboratoriestammen (fastställd från fältprover tagna vid St. Jean-de-Luz, Frankrike, 2007;> 12 generationer i laboratoriet, som svält och hölls i havsvatten med penicillin (60 enheter per ml), streptomycin (60 μg ml −1 ) och neomycin (120 μg ml - 1 ) under de senaste 2 veckorna av utvecklingen. DNA extraherades med en utsaltningsmetod 46, skjuvades på en Covaris S2-sonikator (frekvenssvep-läge; 4 ° C; arbetscykel, 10%; intensitet, 7; cykler per skur, 300; microTUBE AFA-fiber 6 × 16 mm; 30 s) och bereddes för Illumina-sekvensering med standardprotokoll. Ett 2, 2 kb och ett 7, 6 kb insatsbibliotek framställdes från en polymorf DNA-pool av> 300 fältfångade Jean vuxna män av Eurofins MWG Operon (Ebersberg, Tyskland) enligt tillverkarens protokoll. Varje bibliotek sekvenserades i en körfält i en Illumina HiSeq2000 med 100 bp läsningar i parade ändar vid Next Generation Sequencing-enheten i Wien Biocenter Core Facility (//vbcf.ac.at).

Avläsningar filtrerades för läskvalitet, adapter- och distanssekvenser med cutadapt 47 (−b −n 3 −e 0, 1 −O 8 −q 20 −m 13) och duplikat avlägsnades med fastq-mcf från ea-utils 48 (−D 70 ). Läsparen sammanflätades med ngm-utils 49, vilket lämnade endast parade läsningar. Kontaminering med humant DNA som hittades i 0, 2-kb-biblioteket avlägsnades genom att ta bort läsningar som matchade det humana genomet med en skalad kvalitetsscore> 20 (justering med BWA 50 ).

Montering i contigs med Velvet 51 (ställning inaktiverad; 57 bp kmers bestämd av VelvetOptimiser 52 ) baserades endast på det mindre polymorfa 0, 2 kb-biblioteket. Cirka 600 återstående adaptersekvenser i ändarna av monterade contigs trimmades med cutadapt (−O 8 −e 0.1 −n 3). För monteringstatistik se tilläggstabell 11.

Byggnadsställningar baserades på alla tre biblioteken och utfördes med SSPACE 53 i två iterationer, det vill säga ställningar från den första omgången ställs upp igen. Användning av olika parametrar i iterationerna (tilläggstabell 12) möjliggjorde olika anslutningar och därmed ökade ställningsanslutning (tilläggstabell 13). Effekten beror troligen på den polymorfa naturen hos 2, 2-kb- och 7, 6-kb-biblioteken; det resulterar i ett "befolknings-konsensus vanligaste arrangemang av byggnadsställningar". Den iterativa ställningsprocessen utfördes med och utan att tillämpa en storleksavgränsning med undantag av konturer <1 kb, vilket resulterade i två oberoende enheter (CLUMA_0.3 och CLUMA_0.4; se utvidgad data fig. 9a), som skilde sig i övergripande anslutning och sekvens innehåll (kompletterande tabell 11), men också i identiteten och strukturen för de stora byggnadsställningarna. För att kombinera både anslutningsmöjligheter och sekvensinnehåll, och för att lösa motsägelserna i strukturen för de största byggnadsställningarna, jämfördes de två enheterna och förenades i en manuell super-ställningsprocess, som beskrivs i tilläggsmetod 1. Kortfattat överlappning av byggnadsställningar från de två enheterna testades med BLAST-sökningar och representerades i en grafisk nätverksstruktur. Byggnadsställningar med kongruent sekvensinnehåll i båda enheterna skulle resultera i ett linjärt nätverk, medan ställningar med motstridande sekvensinnehåll skulle leda till greningsnätverk. Samtidigt utsattes båda enheterna för kartläggning av genetisk bindning baserat på genotyper erhållna från restriktionsställ-associerad DNA-sekvensering (RAD-sekvensering) av en publicerad kartläggningsfamilj 6 (kompletterande metod 2). Den resulterande genetiska kopplingsinformationen tjänade till att lösa förgreningsnätverken i den längsta möjliga otvetydiga linjära subnätverket med konsekvent genetisk kopplingsinformation (se schema A i kompletterande metod 1). Slutligen kodades strukturen för de resulterande superställningarna i YAML-format och översattes till DNA-sekvens med Scaffolder 54, vilket resulterade i 75 kartlagda superställningar.

De återstående små och omotiverade ställningarna filtrerades för fragment av mitokondriellt genom, histongenklusteret och 18S / 28S ribosomalt rDNA-genkluster, som monterades separat (tilläggsmetod 3; utvidgad data fig. 10). Omappade ställningar filtrerades också för uppenbar kontaminering från andra arter (kompletterande metod 3). Graden till vilken de återstående obegränsade ställningarna är kvar polymorfa varianter av delar av de kartlagda superställningarna uppskattades genom sprängning av det förstnämnda mot det senare (kompletterande metod 3 och kompletterande tabell 14).

Alla ställningar utsattes för stängning av gap med GapFiller 55 och upprepade kanter, det vill säga luckor med nästan identiska sekvenser på båda sidor som i allmänhet inte är stängda på grund av genetiska polymorfismer, utvärderades och om möjligt avlägsnades med ett anpassat manus (tilläggsmetod 4; kod tillgänglig levererad som kildedatafil).

Slutmonteringen CLUMA_1.0 lämnades in under projektet PRJEB8339 (75 kartlade byggnadsställningar; 23.687 icke mappade ställningar ≥100 bp). Montering och ytterligare information kan också erhållas från ClunioBase (//cluniobase.cibiv.univie.ac.at).

Rekonstruktion av kromosomer och QTL-analys

Genetisk kopplingsinformation för de sista 75 superställningarna erhölls genom att upprepa läsmappning till genotyp som krävde RAD-sekvenseringsexperimentet som beskrivits ovan (kompletterande metod 2), men nu med montering CLUMA_1.0 som referens. Detta gjorde det möjligt för oss att placera och orientera superställningar längs den genetiska kopplingskartan (fig. 1a och utvidgade data fig. 2). Positionerna för rekombinationshändelserna inom ett ställning var ungefärliga som mitten mellan positionerna för de två RAD-markörerna mellan vilka markörmönstret ändrades från en kartplats till nästa. Den publicerade genetiska kopplingskartan förfinades och reviderades (kompletterande metod 5 och utvidgad data fig. 2). Baserat på den raffinerade kopplingskartan upprepades QTL-analys av den publicerade kartläggningsfamiljen såsom beskrivs 6 (kompletterande tabell 4 och kompletterande anmärkning 5). Med hjälp av korrespondensen mellan referensmonteringen och den genetiska kopplingskartan kunde vi direkt identifiera de genomiska regionerna som motsvarar konfidensintervallen för QTL: er (fig. 1 och utvidgad data, fig. 5a, b).

Transkript sekvensering

Sammansatta transkript från ett normaliserat cDNA-bibliotek av alla livsfaser och olika C. marinus- stammar (454 sekvensbestämning) var tillgängliga från tidigare experiment och RNA-sekvenseringsdata var tillgängliga för Jean-stam-vuxna (Illumina-sekvensering). Vidare, speciellt för genomanteckningar, bereddes RNA från 80 tredje instarlarver från Jean- och Por-laboratoriestammarna var och en för RNA-sekvensering enligt standardprotokoll (tilläggsmetod 6). Varje prov sekvenserades på en enda körfält från en Illumina HiSeq 2000. Alla transkriptläsningar överlämnades till European Nucleotide Archive (ENA) under projektet PRJEB8339.

För RNA-sekvenseringsdata för vuxna och larver kvalitetskontrollerades råavläsningar med fastqc 56, trimmades för adapternas kvalitet med cutadapt 47 och filtrerades för att endast innehålla läspar med användning av interleave-kommandot i ngm-utils 49 . Reads were assembled separately for larvae and adults with Trinity 57 (path_reinforcement_distance: 25; maximum paired-end insert size: 1, 500 bp; otherwise default parameters).

Genomotik

Automated annotation was performed with MAKER2 58 . Repeats were masked based on all available databases in repeatmasker. MAKER2 combined evidence from assembled transcripts (see above), mapped protein data sets from Culex quinquefasciatus (CpipJ1), Anopheles gambiae (AgamP3), Drosophila melanogaster (BDGP5), Danaus plexippus (DanPle_1.0), Apis mellifera (Amel4.0), Tribolium castaneum (Tcas3), Strigamia maritima (Smar1) and Daphnia pulex (Dappu1) and ab initio gene predictions with AUGUSTUS 59 and SNAP 60 into gene models. AUGUSTUS was trained for C. marinus based on assembled transcripts from the normalized cDNA library. SNAP was run with parameters for A. mellifera , which had the highest congruence with known C. marinus genes in preliminary trials (Supplementary Method 7). MAKER was set to infer gene models from all evidence combined (not transcripts only) and gene predictions without transcript evidence were allowed. Splice variant detection was enabled, single-exon genes had to be larger than 250 bp and intron size was limited to a maximum of 10 kb.

All gene models within the QTL confidence intervals, as well as all putative circadian clock genes and light receptor genes were manually curated: exon–intron boundaries were corrected according to transcript evidence (approximately 500 gene models), chimeric gene models were separated into the underlying individual genes (approximately 100 gene models separated into around 300 gene models) and erroneously split gene models were joined (approximately 15 gene models). Finally, this resulted in 21, 672 gene models, which were given IDs from CLUMA_CG000001 to CLUMA_CG021672 ('CLUMA' for Clunio marinus , following the controlled vocabulary of species from the UniProt Knowledgebase; CG for 'computated gene'). Splice variants of the same gene (detected in 752 gene models) were identified by the suffix '-RA', '-RB' and so on, and the corresponding proteins by the suffix '-PA', '-PB' and so forth.

Gene models were considered as supported if they overlapped with mapped transcripts or protein data (Supplementary Table 1). Gene counts for D. melanogaster were retrieved from BDGP5, version 75.546 and for A. gambiae from AgamP3, version 75.3. The putative identities of the C. marinus gene models were determined in reciprocal BLAST searches, first against UniProtKB/Swiss-Prot (8, 379 gene models assigned) and if no hit was found, second against the non-redundant protein sequences (nr database) at NCBI (1, 802 additional genes assigned). Reciprocal best hits with an e value < 1 × 10 −10 were considered putative orthologues (termed 'putative gene X'), non-reciprocal hits with the same e value were considered paralogues (termed 'similar to'). All remaining gene models were searched against the PFAM database of protein domains (111 gene models assigned; termed 'gene containing domain X'). If still no hit was found, the gene models were left unassigned ('NA').

Synteny comparisons

Genome-wide synteny between the C. marinus , D. melanogaster and A. gambiae genomes was assessed based on reciprocal best BLAST hits ( e value < 10 × 10 -10 ) between the three protein data sets (Ensembl Genomes, Release 22, for D. melanogaster and A. gambiae ). Positions of pairwise orthologous genes were retrieved from the reference genomes (BDGP5, AgamP3 and CLUMA_1.0) and plotted with Circos 61 . C. marinus chromosome arms were delimited based on centromeric and telomeric signatures in genetic diversity and linkage disequilibrium (Extended Data Fig. 3c and Supplementary Table 3; for data source see 'strain re-sequencing' below). Homologues for C. marinus chromosome arms were assigned based on enrichment with putative orthologous genes from specific chromosome arms in D. melanogaster and A. gambiae (Extended Data Figs 3, 4 and Supplementary Table 3). Additionally, for the 5, 388 detected putative 1:1:1 orthologues ( C. marinus : D. melanogaster : A. gambiae ), microsynteny was assessed by testing if all pairs of directly adjacent genes in one species were also directly adjacent in the other species. The degree of microsynteny was then calculated as the fraction of conserved adjacencies among all pairs of adjacent genes. From this fraction the relative levels of chromosomal rearrangements in the evolutionary lineage leading to C. marinus were estimated (Supplementary Note 3 and Extended Data Fig. 4).

Strain re-sequencing

Genetic variation in five C. marinus strains (Extended Data Fig. 1) was assessed based on pooled-sequencing data from field-caught males from the strains of St. Jean-de-Luz (Jean; Basque Coast, France; sampled in 2007; n = 300), Port-en-Bessin (Por; Normandie, France; 2007; n = 300), as well as Vigo (Spain; 2005; n = 100), Helgoland (He; Germany; 2005; n = 300) and Bergen (Ber; Norway; 2005; n = 100). Samples from Vigo and Bergen, were provided by D. Neumann and C. Augustin, respectively. For each strain we chose the largest available number of individuals to obtain the best possible resolution of allele frequencies. Females are not available, because they are virtually invisible in the field. For an overview of the experimental procedure, see Extended Data Fig. 9b. DNA was extracted with a salting-out method 46 from sub-pools of 50 males, the DNA pools were mixed at equal DNA amounts, sheared and prepared as described above and sequenced on four lanes of an Illumina HiSeq2000 with paired-end 100-bp reads (Ber and Vigo combined in one lane, distinguished by index reads). All reads were submitted to the European Nucleotide Archive (ENA) under project PRJEB8339. Sequencing reads were filtered for read quality and adaptor sequences with cutadapt 47 (−b −n 2 −e 0.1 −O 8 −q 13 −m 15), interleaved with ngm-utils 49 and duplicates were removed with fastq-mcf from ea-utils 48 (−D 70). Reads were aligned to the mapped super-scaffolds of assembly CLUMA_1.0 with BWA 50 (aln and sampe; maximal insert size (bp): −a 1500).

Detection of re-arrangements

Based on the unfiltered alignments, the samples from Por and Jean were screened for genomic inversions and indels relative to the reference sequence with the multi-sample version of DELLY 62 . Paired-end information was only considered if the mapping quality was high ( q ≥ 20) (see also Supplementary Note 3).

Population genomic analysis of the timing strains

For population genomic analysis (Extended Data Fig. 9b), the alignments of the pool-sequencing (pool–seq) data from Vigo, Jean, Por, He and Ber were filtered for mapping quality ( q ≥ 20), sorted, merged and indexed with SAMtools 63 . Reads were re-aligned around indels with the RealignerTargetCreator and the IndelRealigner in GATK 64 . The resulting coverage per strain is given in Supplementary Table 5.

For identification of SNPs, a pileup file was created with the mpileup command of SAMtools 63 . Base Alignment Quality computation was disabled (−B); instead, after creating a synchronized file with the mpileup2sync script in PoPoolation2 65, indels that occurred more than ten times were masked (including 3 bp upstream and downstream) with the identify-indel-regions and filter-sync-by-gtf scripts of PoPoolations2. F ST values were determined with the fst-sliding script of PoPoolation2, applying a minimum allele count of 10 (so that any false-positive SNPs resulting from the remaining unmasked indels were effectively excluded) and a minimum coverage of 40× for the comparison between Por and Jean or 10× for the comparison of all five strains. F ST was calculated at a single base resolution, as well as in windows of 5 kb (step size, 1 kb). Individual SNPs were only considered for further analyses or plotted if they were significantly differentiated as assessed by Fisher's exact test (fisher-test in PoPoolation2).

Average genome-wide genetic differentiation between timing strains, as obtained by averaging over 5-kb sliding-windows, was compared to the respective timing differences and geographic distances (see Supplementary Table 8) in Mantel tests (Pearson's product moment correlation; 9, 999 permutations), as implemented in the vegan package in the R statistical programming environment (ref. 66). Geographic distances and circadian timing differences were determined as described previously 67 (see Supplementary Table 8). For determination of lunar timing differences when comparing lunar with semilunar rhythms see Supplementary Note 6. In order to find genomic regions for which genetic differentiation is correlated with the timing differences between strains, the Mantel test was then applied to 5-kb genomic windows every 1 kb along the reference sequence. 5 kb is roughly the average size of a gene locus in C. marinus . Windows with a correlation coefficient of r ≥ 0.5 were tested for significance (999 permutations). For each genomic position the number of overlapping significantly correlated 5-kb windows was enumerated, resulting in a correlation score (CS; ranging from 0 to 5).

Genetic diversity, measured as Watterson's theta ( θ W ), for each strain was assessed with PoPoolation1.1.2 (ref. 68) in 20-kb windows with 10-kb steps. In order to save computing time, the pileup files of Jean, Por and He were linearly downscaled to 100× coverage with the subsample-pileup script ('fraction' option), positions below 100× coverage were discarded. Indel regions were excluded (default in PoPoolation 1.1.2) and a minimum of 66% of a sliding window needed to be covered. SNPs were only considered in θ W calculations if present ≥2 times, leading to slight inconsistencies in θ W estimates between strains due to differing coverage, but not affecting diversity comparisons within strains.

Linkage disequilibrium between the SNPs was determined for the Por and Jean strains with LDx 69, assuming physical linkage between alleles on the same read or read pairs. r 2 was determined by a maximum likelihood estimator, minimum and maximum read depths corresponded to the 2.5% and 97.5% coverage depths for each population (Jean, 111–315; Por, 98–319), total insert distance was limited to 600 bp, minimum phred-scaled base quality was 20, minimum allele frequency was 0.1 and a minimum coverage per pair of SNPs was 11. SNPs were binned by their physical distance for the plots (0–200 bp, 200–400 bp, 400–600 bp), with the mean value plotted.

Finally, small indels (<30 bp) in the Por and Jean strains were detected with the UnifiedGenotyper (−glm INDEL) in GATK 64 for positions with more than 20× coverage. Genetic differentiation for indels was calculated with the classical formula F ST = ( H T − H S )/ H T, where H S is the average expected heterozygosity according to Hardy–Weinberg Equilibrium (HWE) in the two subpopulations and H T is the expected heterozygosity in HWE of the hypothetical combined total population. If more than two alleles were present, only the two most abundant alleles were considered in the calculation of F ST .

Assessment of candidate genes

Gene models from the automated annotation were considered candidate genes, if they fulfilled the following criteria. (1) The gene was located within the reference sequence corresponding to the QTL confidence intervals as determined for the Por and Jean strains. (2) The gene contained a strongly differentiated SNP or small indel or it was directly adjacent to such a SNP or small indel ( F ST ≥ 0.8 for Por versus Jean, that is, the strains used in QTL mapping). This resulted in a preliminary list of 133 genes based on the comparison between Por and Jean (Supplementary Table 6). These candidate genes were narrowed down based on their overlap with genomic 5-kb windows, for which genetic differentiation between five European timing strains correlated with their timing differences (Fig. 1a, Extended Data Fig. 5a, b and Supplementary Table 9).

The location and putative effects of the SNPs and indels relative to the gene models were assessed with SNPeff 70 (−ud 0, otherwise default parameters; Extended Data Fig. 5c, d and Supplementary Tables 6, 9).

For Gene Ontology (GO) term analysis, all C. marinus gene models with putative orthologues in the UniProtKB/Swiss-Prot and non-redundant protein sequences (nr) databases based on reciprocal best BLAST hits (see above) were annotated with the GO terms of their detected orthologues (6, 837 gene models). Paralogues were not annotated. The enrichment of candidate SNPs and indels ( F ST ≥ 0.8 between Por and Jean) in specific GO terms was tested with SNP2GO 71 (min.regions = 1, otherwise default parameters). Hyper-geometric sampling was applied to test if individual genes of a GO term or a whole pathway of genes are enriched for SNPs (Supplementary Table 7).

Molecular characterization of CaMKII.1

RNA-seq data of the Por and Jean strains for CaMKII.1 were obtained from the larval RNA sequencing experiment described above. Besides four assembled full-length transcripts (RA–RD) from RNA-seq and assembled EST libraries, additional partial transcripts (RE–RO) were identified by PCR amplification (for PCR primers see Supplementary Table 15), gel extraction (QIAquick Gel Extraction Kit, Qiagen), cloning with the CloneJET PCR Cloning Kit (Thermo Scientific) and Sanger sequencing with pJET1.2 primers (LGC Genomics & Microsynth). cDNA was prepared from RNA extracted from third instar larvae of the Por and Jean laboratory strains (RNA extraction with RNeasy Plus Mini Kit, Qiagen; reverse transcription with QuantiTect Reverse Transcription Kit, Qiagen).

qPCR was performed with variant-specific primers and actin was used as a control gene (Supplementary Table 16). cDNA was obtained from independent pools of 20 third instar larvae of the Por and Jean strains. Sample size was ten pools per strain to cover different time points during the day and to test for reproducibility (two samples each at zeitgeber times 0, 4, 8, 16 and 20; for one Por sample extraction failed; RNA extraction and reverse transcription as above). qPCR was performed with Power SYBR Green PCR Master Mix on a StepOnePlus Real Time System (both Applied Biosystems). Fold-changes were calculated according to ref. 72 in a custom excel sheet. The assumption of equal variance was violated for the RD comparison ( F -test) and the assumption of normal distribution was violated for the data of RA and RC in the Por strain (Shapiro–Wilk normality test), possibly reflecting circadian effects in the samples from different times of day. Thus, expression differences were assessed for significance in a two-tailed Wilcoxon rank-sum test (wilcox.test in R 66 ). Holm correction 73 was used for multiple testing (default in p.adjust function of R).

CaMKII.1 minigenes

PCR fragments containing the CaMKII.1 linker region (exons 10–15) were amplified from genomic Por or Jean DNA, respectively, with primers CaMKII-Sc61-F-344112 and CaMKII-Sc61-R-351298 (Supplementary Table 15), cloned with the CloneJET PCR Cloning Kit (Thermo Scientific), transferred into the pcDNA3.1+ vector using NotI and XbaI (Thermo Scientific). These constructs were transfected into D. melanogaster S2R+ cells and RNA was prepared 48 h after transfection. After DNase digestion, isoform expression was analysed by radioactive, splicing-sensitive RT–PCR (primers in Supplementary Table 17) and phosphorimager quantification as described 74 . Identity of isoforms is based on size and sequencing of PCR products. To test for reproducibility, there were seven biological replicates (raw data in Supplementary Table 18). As the assumptions of equal variance ( F -test) and normal distribution of data (Shapiro–Wilk normality test) were not violated, the significance of expression differences was assessed in unpaired, two-sided two-sample t -tests. Holm correction 73 was used for multiple testing (default in p.adjust function of R). S2R+ cells were obtained from the laboratory of S. Sigrist, regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination. The entire experiment was reproduced several months later with three biological replicates (raw data in Supplementary Table 18).

S2 cell luciferase assay

Firefly luciferase is driven from a period 3X69 promoter under control of the CLOCK and CYCLE protein 19, 21 . The D. melanogaster pAc–clk construct was obtained from F. Rouyer, pCopia–Renilla luciferase and period 3X69–luc reporter constructs from M. Rosbash, a [Ca 2+ ]-independent mouse CaMKII T286D was provided by M. Mayford. The CaMKII inhibitor KN-93 was purchased from Abcam (#ab120980).

C. marinus Cyc , C. marinus Clk and C. marinus CaMKII.1–RD were cloned into the pAc5.1/V5–His A plasmid (Invitrogen) with stop codons before the tag. The Q5 Site-Directed Mutagenesis Kit (NEB) was used to make kinase-dead and [Ca 2+ ]-independent versions of C. marinus CaMKII.1–RD (for primers, see Supplementary Table 17).

D. melanogaster S2 cells (Invitrogen) were cultured at 25 °C in Schneider's D. melanogaster medium (Lonza) supplemented with fetal bovine serum (FBS, 10%, heat-inactivated), penicillin (100 U ml −1 ), streptomycin (100 μg ml −1 ) and 2 mM l -glutamine; Sigma). Cells were seeded into 24-well plates (800, 000 cells per well) and transfected with Effectene transfection reagent (Qiagen) according to the manufacturer's instructions. Experiment with mouse [Ca 2+ ]-independent CaMKII: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , 200 ng mouse pAc–CaMKII T286D . Experiment with CaMKII inhibitor KN-93: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , various amounts of KN-93. Experiment with C. marinus genes: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 100 ng C. marinus pAc–cyc , 100 ng C. marinus pAc–clk , 200 ng C. marinus CaMKII.1–RD K42R or 200 ng C. marinus CaMKII.1–RD T286D . In all experiments, the transfection mix was filled up with empty pAc5.1/V5–His A vector to a total of 435 ng DNA per well. After 48 h, cells were washed with PBS and lysed with Passive Lysis Buffer (Promega). Luciferase activities were determined on a Synergy H1 plate reader (Biotek) using a Dual-Luciferase Reporter Assay System (Promega). For each biological replicate three independent cell lysates were measured and their mean value determined. Firefly luciferase activity was normalized to Renilla luciferase activity and values were normalized to controls transfected with D. melanogaster pAc–clk or C. marinus pAc–clk and C. marinus pAc–cyc , respectively. S2 cells (Invitrogen/Life Technologies, Cat.no. R690-07) were regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination (Lonza MycoAlert). Sample size was chosen to test for reproducibility.

Circadian free-run experiments

For circadian free-run experiments, culture boxes of the Por, He and Jean strains were transferred from light–dark cycle (16:8) to constant dim light (light–light cycle, about 100 lx). Emerging adults were collected in 1-h intervals by a custom made C. marinus fraction collector (similar to those described in ref. 75) and counted once a day. Because collection was automated, the experimenter had no influence on the results and blinding was not necessary. As the circalunar clock restricts adult emergence to a few days, the circadian emergence rhythm can only be assessed over a few days. Several culture boxes were transferred to a light–light cycle at different time points. The resulting emergence data were combined for each strain using the switch to a light–light cycle as a common reference point. We used the maximum number of available individuals. Free-running period was calculated as the mean interval between subsequent emergence peaks, weighting each peak by the number of individuals.

Data tillgänglighet

All sequence data are deposited in the European Nucleotide Archive (ENA) under PRJEB8339. The reference genome is also on ClunioBase (//cluniobase.cibiv.univie.ac.at). Machine readable super-scaffolding data and the computer source code for the removal of repeated edges are supplied as source data files.

Utökad data

Utökade datasiffror

  1. 1.

    The biology of Clunio marinus .

  2. 2.

    The reconstructed chromosomes of C. marinus based on the genetic linkage map.

  3. 3.

    C. marinus genome characterization.

  4. 4.

    Synteny analyses of C. marinus chromosome arms.

  5. 5.

    Population genomic analysis of QTLs C1/L1 and C2 and genome-wide analysis of locations and putative effects of SNPs and indels.

  6. 6.

    CaMKII regulates CLK/CYC transcriptional activity and exhibits strain-specific splice variants.

  7. 7.

    A differentiated 125-bp insertion in the CaMKII locus.

  8. 8.

    Model of circadian timing adaptation via sequence differences in the CaMKII.1 genomic locus.

  9. 9.

    Analyses overview.

  10. 10.

    Arrangement of the mitochondrial genome and of the histone gene cluster in C. marinus .

Kompletterande information

PDF-filer

  1. 1.

    Kompletterande information

    This file contains Supplementary Tables 1-19, Supplementary Methods, Supplementary Notes, Supplementary References and a Supplementary Figure – see contents page for details.

Zip-filer

  1. 1.

    Kompletterande data

    This zipped file contains .yaml files containing all changes made to the genome assembly during the super-scaffolding process.

  2. 2.

    Kompletterande data

    This zipped file contains the source code for the software "Repeated Edge Remover (RE 2 )".

kommentarer

Genom att skicka en kommentar samtycker du till att följa våra villkor och gemenskapsriktlinjer. Om du finner något missbruk eller som inte överensstämmer med våra villkor eller riktlinjer ska du markera det som olämpligt.