P1_RC_GGL: Ett strikt slutningstest av galaxdynamik och svag linsning (rotationskurvor + GGL)
EFT:s medelgravitationsramverk jämfört med den minimala NFW-baslinjen för kall mörk materia (DM)
Ta del av den ursprungliga utvärderingsrapporten:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 Sammanfattning
Denna rapport är en publiceringsklar arkivutgåva deponerad på Zenodo. Den tillhandahåller en integrerad och auditerbar kedja som omfattar data, modellbokföring, rättvis jämförelse, slutningstester och reproducerbarhetsmaterial. Bilaga B (P1A) fungerar som ett robusthetstillägg. Den fokuserar på stresstester med en ”mer standardmässig DM-baslinje + en central linsningssystematik”, för att bedöma hur känsliga huvudslutsatserna är för mer realistisk DM-modellering och hantering av linsningssystematik.
Kärnslutsatser (fyra direkt citerbara påståenden; se avsnitt 2.4):
(1) Vid anpassning av rotationskurvor (RC) överträffar EFT-familjen DM_RAZOR signifikant under alla kombinationer av kärnfunktioner och priorer; en typisk förbättring är Δlog𝓛_RC ≈ 10^3 (se tabell S1a).
(2) I slutningstestet RC→GGL visar EFT starkare överförbarhet mellan sonder: slutningsstyrkan Δlog𝓛_closure (True−Perm) är signifikant högre än för DM_RAZOR, och skillnaden är robust under kovarianskrympning samt skanningar av R_min och σ_int (se fig. S3 och tabell S1b).
(3) I den gemensamma anpassningen (RC+GGL) behåller EFT en stabil fördel; under den negativa kontrollen som bryter den delade mappningen kollapsar denna fördel, vilket stödjer tolkningen att ”medelgravitationseffekten” kommer från den delade mappningen snarare än från en tillfällig anpassning (se fig. S4).
(4) Utan att väsentligt öka dimensionaliteten stresstestar bilaga B (P1A) DM-sidan med mer standardmässiga DM-baslinjemoduler och en central nuisance-parameter för linsningssystematik. Dessa förstärkningar tar inte bort EFT:s slutningsfördel (se tabell B1 och fig. B1).
Tillgänglighet för data och kod: rapportens Concept DOI 10.5281/zenodo.18526334; det fullständiga reproduktionspaketets Concept DOI 10.5281/zenodo.18526286. Taggarna som motsvarar bilaga B (P1A) är run_tag=20260213_151233, closure_tag=20260213_161731 och joint_tag=20260213_195428.
1 Abstrakt
Vi genomför en reproducerbar kvantitativ jämförelse av två teoretiska ramverk under samma data och samma statistiska protokoll: modellen för ”medelgravitationskorrigering” som föreslås av Energitrådsteori (Energy Filament Theory, EFT; skild från den vanliga förkortningen för effective field theory), samt en baslinjemodell med NFW-halo för kall mörk materia (DM_RAZOR). DM_RAZOR är avsiktligt vald som en ”minimal DM-baslinje”: en NFW-halo med fast c–M-relation (utan halo-till-halo-spridning), som fungerar som en auditerbar och reproducerbar kontroll. Det bör också betonas att denna artikel behandlar EFT som en fenomenologisk, MOND-lik parameterisering av effektivt fält / effektiv respons för testning under ett enhetligt statistiskt protokoll, snarare än att härleda dess mikroskopiska första principer inom ramen för detta arbete.
Data består av 2 295 hastighetsdatapunkter från SPARC-rotationskurvor (RC), enhetligt förbehandlade och binnade (104 galaxer, 20 RC-binnar), tillsammans med KiDS-1000:s överskottsytdensitet ΔΣ(R) från svag galax–galax-linsning (GGL) (4 stjärnmassbinnar × 15 R-punkter per bin, totalt 60 punkter, med användning av full kovarians).
Vi genomför i tur och ordning RC-only-inferens, ett RC→GGL-slutningstest, GGL-only-inferens och gemensam RC+GGL-inferens, och använder konsistensauditer för att säkerställa att varje citerat numeriskt värde är spårbart. Under strikt parameterbokföring och begränsningar för delad mappning (DM: 20 log M200_bin-parametrar; EFT: 20 log V0_bin-parametrar + 1 global log ℓ) överträffar EFT-familjen DM_RAZOR signifikant i den gemensamma anpassningen: ΔlogL_total = 1155–1337 relativt DM_RAZOR. Viktigare är att slutningstestet visar att RC-posterioren har icke-trivial prediktionskraft för GGL: EFT:s slutningsstyrka är ΔlogL_closure = 172–281, högre än DM_RAZOR:s 127. När grupperingen RC-bin→GGL-bin slumpmässigt blandas om kollapsar slutningssignalen till 6–23, vilket bekräftar att signalen inte är en statistisk tillfällighet eller en implementeringsartefakt. Över systematiska skanningar av σ_int, R_min och kovarianskrympning förblir EFT:s relativa fördel positiv och stabil i storlek. För att bemöta vanliga invändningar om att ”DM-baslinjen är för svag” eller att ”systematik misstas för fysik” ger bilaga B (P1A) ett mer standardmässigt men fortfarande lågdimensionellt och auditerbart stresstest av DM-baslinjen, inklusive hierarkisk c–M-spridning + prior, en enparametrig kärnproxy, linsnings-m och den kombinerade modellen DM_STD. Under samma slutningsprotokoll tar dessa förstärkningar inte bort EFT:s slutningsfördel (se tabell B1/fig. B1).
Nyckelord: rotationskurvor; svag galax–galax-linsning; slutningstest; EFT; kall mörk materia; Bayesiansk inferens
2 Introduktion och översikt över resultat
Rotationskurvor (RC) och svag galax–galax-linsning (GGL) är två kompletterande gravitationssonder: RC begränsar den dynamiska potentialen och den radiella accelerationsrelationen (RAR) i skivplanet, medan GGL mäter den projicerade massfördelningen och gravitationsresponsen på haloskala. För varje kandidatteori är kärnfrågan inte om den kan anpassa de två datamängderna var för sig, utan om den kan förklara dem konsistent under samma tvärdatamappning och delade begränsningar.
Därför använder denna artikel ”slutningstestet” som sitt centrala statistiska protokoll: först används RC-only-posterioren för att framåtprediktera GGL, och därefter jämförs den med en negativ kontroll där RC-bin→GGL-bin-mappningen permuteras/blandas om. Detta utvärderar prediktiv överförbarhet mellan datamängder och utesluter falska signaler som orsakas av implementeringsbias eller tillfällig anpassning.
Teoretisk positionering och omfattning: denna artikel försöker inte presentera en mikroskopisk härledning av Energitrådsteori (Energy Filament Theory, EFT) från första principer eller en relativistiskt fullständig formulering. I stället behandlar vi EFT som en lågdimensionell, MOND-lik parameterisering av effektivt fält / effektiv respons (beskriven av en kärna f(x) och en global skala ℓ), och testar dess tvärdatakonsistens och överförbara prediktionskraft genom slutningstestet RC→GGL under strikt parameterbokföring.
Forskningsprogram och omfattningsdeklaration: denna artikel ingår i ett pågående observationsbaserat hämtningsprogram i P-serien. I befintliga data på galaxskala söker vi efter två möjliga effektiva bakgrundsbidrag: (i) ett ”medelgravitationsgolv” som kan beskrivas av en grovkornad medelgravitationsrespons, och (ii) ett ”stokastiskt/brusgolv” kopplat till fluktuationer i mikroskopiska processer. I denna artikel (P1) fokuserar vi endast på det förstnämnda: utan att införa någon hypotes om mikroskopiska produktionsmekanismer använder vi slutningstestet RC→GGL för att hämta observationsindikationer på ett medelgravitationsgolv och jämför det med en auditerbar DM-baslinje under ett enhetligt kontrollprotokoll. Som heuristisk fysikalisk bild gäller att om kortlivade frihetsgrader finns, kan deras sönderfall/annihilation omvandla vilomassa till energi–rörelsemängd som bärs av andra frihetsgrader, vilket på effektiv nivå naturligt motsvarar en uppdelning i ”medelbidrag + fluktuationsbidrag”; denna artikel modellerar dock inte den mikroskopiska bilden kvantitativt.
För att undvika övertolkning är artikelns omfattningsgränser följande:
• Vad denna artikel gör: under strikt parameterbokföring och begränsningar för delad mappning använder den slutningstestning för att mäta prediktiv överförbarhet mellan datamängder och genomför en reproducerbar jämförelse mellan EFT:s medelgravitationsrespons och en DM-baslinje.
• Vad denna artikel inte gör: den diskuterar inte mikroskopiska produktionsmekanismer, abundanser/livslängder eller kosmologiska begränsningar; den modellerar inte den stokastiska termen som motsvarar ”brusgolvet”.
• Vad denna artikel inte hävdar: den syftar inte till att störta mörk materia; P1 levererar ingen slutlig dom om huruvida ett ”golv” finns, utan rapporterar evidens på etappnivå — att data inom den robusta mätdomän som valts här gynnar modeller som innehåller en medelgravitationsrespons.
Samtidigt klargör vi att DM_RAZOR endast representerar en minimal och auditerbar NFW-baslinje (fast c–M och ingen spridning; ingen adiabatisk kontraktion, feedbackkärna, icke-sfäricitet eller miljötermer). Därför är huvudslutsatsen i brödtexten strikt begränsad till följande påstående: under den minimala baslinjen och strikt parameterbokföring/mappningsbegränsningar visar EFT starkare tvärdatakonsistens. För att bemöta den vanliga frågan om huruvida en mer standardmässig ΛCDM-baslinje och modellering av centrala linsningssystematiker väsentligt skulle förändra slutsatsen, samlar vi mer standardmässiga men fortfarande lågdimensionella och auditerbara DM-förstärkningar samt en nuisance-parameter på linsningssidan i bilaga B (P1A: stresstest för standardisering av DM-baslinjen), samtidigt som vi behåller exakt samma delade mappning och slutningstestprotokoll som i huvudtexten (se tabell B1/fig. B1).
2.1 Tab S1a–S1b: sammanfattning av nyckelmetrik (Strict)
Tabell S1a rapporterar huvudjämförelsemetrik för den gemensamma anpassningen (RC+GGL): logL, ΔlogL, AICc och BIC. Tabell S1b rapporterar metrik för slutningstest och robusthetsskanningar: slutning, shuffle-negativ kontroll samt skanningsintervall för σ_int / R_min / cov-shrink. Alla värden kommer från den strikta huvudsammanfattningstabellen Tab_Z1_master_summary och kan spåras post för post i publiceringens arkivpaket.
Tabell S1a | Huvudmetrik för gemensam anpassning (RC+GGL, Strict).
Modell (workspace) | W-kärna | k | Gemensam logL_total (bäst) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tabell S1b | Slutnings- och robusthetsmetrik (Strict).
Modell (workspace) | Slutning ΔlogL (true-perm) | Negativ kontroll ΔlogL efter shuffle | σ_int-skanning ΔlogL-intervall | R_min-skanning ΔlogL-intervall | cov-shrink-skanning ΔlogL-intervall |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Fig. S3: slutningsstyrka (RC-only → predikterad GGL)
Slutningsstyrka definieras som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: på RC-only-posteriorprov predikteras GGL framåt och jämförs med en negativ kontroll där RC-bin→GGL-bin-mappningen permuteras.

Fig. S3 | Slutningsstyrka (högre är bättre): genomsnittlig log-likelihoodfördel för RC-only → GGL-prediktion.
2.3 Fig. S4: huvudjämförelse för gemensam anpassning (RC+GGL)
Fördel i gemensam anpassning definieras som ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Under samma data, samma mappning och nästan samma parameterskala uppnår EFT-familjen en signifikant högre gemensam log-likelihood.

Fig. S4 | Fördel i gemensam anpassning (högre är bättre): bästa logL_total för RC+GGL relativt DM_RAZOR.
2.4 Fyra slutsatser (direkt citerbara)
(1) I en enhetlig gemensam analys av SPARC-rotationskurvor och KiDS-1000 svag linsning överträffar modellen i EFT:s medelgravitationsramverk systematiskt DM_RAZOR under ett strikt kontrollprotokoll: ΔlogL_total = 1155–1337 relativt DM_RAZOR.
(2) Slutningstestet RC→GGL visar starkare prediktiv konsistens för EFT: ΔlogL_closure = 172–281, jämfört med 127 för DM_RAZOR. När grupperingen RC-bin→GGL-bin slumpmässigt blandas om kollapsar slutningssignalen till 6–23, vilket visar att signalen beror på korrekt tvärdatamappning snarare än tillfällig anpassning.
(3) Systematiska skanningar av σ_int, R_min och kovarianskrympning ändrar varken tecknet eller storleksordningen för ”EFT överträffar DM_RAZOR”, vilket visar att slutsatsen är robust mot vanliga systematiska störningar.
(4) Under samma slutningsprotokoll stärker bilaga B (P1A) DM-baslinjen på ett ”standardiserat och auditerbart” sätt: den behåller tre enparametriga förstärkningar (SCAT/AC/FB) och lägger till hierarkisk c–M-spridning + prior, en enparametrig kärnproxy och en shear-kalibreringsparameter m på linsningssidan (samt den kombinerade modellen DM_STD). Resultaten visar att endast feedback/core-grenen ger en liten nettoförbättring av slutningsstyrkan (122.21→129.45, ΔΔlogL_closure≈+7.25); de övriga förstärkningarna bidrar obetydligt eller negativt till slutningsstyrkan. Huvudslutsatsen är därför inte beroende av att DM_RAZOR skulle vara en alltför svag baslinje.
3 Data och förbehandling
Denna studie använder två offentliga datamängder. Inom det tekniska arbetsflödet slutförs nedladdning, checksummeverifiering (sha256) och förbehandling med spårbara skript. För att säkerställa rättvis jämförelse mellan modeller delar alla arbetsytor (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) exakt samma dataprodukter och binmappningar.
3.1 Rotationskurvor (RC, SPARC)
RC-data kommer från SPARC-databasens Rotmod_LTG-filer (175 rotmod-filer). Efter förbehandling omfattar modelleringsurvalet 104 galaxer och 2 295 datapunkter (r, V_obs), uppdelade i 20 RC-binnar enligt stjärnmassa och relaterade kriterier. Varje datapunkt innehåller radie r (kpc), observerad hastighet V_obs (km/s), observationsfel σ_obs samt hastighetskomponenterna för gas/skiva/bulge (V_gas, V_disk, V_bul).
3.2 Svag linsning (GGL, KiDS-1000 / Brouwer+2021)
GGL-data använder överskottsytdensiteten ΔΣ(R) från fig. 3 i Brouwer et al. (2021), baserad på KiDS-1000 (4 stjärnmassbinnar, 15 R-punkter per bin), tillsammans med den tillhandahållna fullständiga kovariansen. I det tekniska arbetsflödet rekonstrueras den ursprungliga långformatskovariansen till en 15×15-matris för varje bin, och Stage-B-auditer verifierar dimensionell och numerisk rimlighet.
3.3 RC-bin → GGL-bin-mappning och total urvalsstorlek
De 4 GGL-massbinnarna och 20 RC-binnarna kopplas samman genom en fast mappning: varje GGL-bin motsvarar 5 RC-binnar, och RC-bin-bidragen viktas efter antalet galaxer. Denna mappning hålls fast över alla modeller och är kärnbegränsningen för rättvis jämförelse i slutningstestning och gemensam anpassning. Den slutliga gemensamma datamängden innehåller n_total = 2355 punkter (RC=2295, GGL=60).
4 Modeller och statistiska metoder
4.1 Minimal matematisk specifikation för EFT och DM (auditerbar/testbar)
Detta avsnitt ger den minimala matematiska specifikationen som direkt motsvarar implementeringen.
(a) Modell för rotationskurvor (RC)
För varje RC-datapunkt (r, V_obs, σ_obs) använder vi komponentsuperposition: V_mod²(r) = V_bar²(r) + V_extra²(r). Här är V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Huvudresultaten i denna artikel använder Υ_d = Υ_b = 0.5, i linje med SPARC:s empiriska rekommendationer och användbart för att minska onödiga frihetsgrader.
(b) EFT:s medelgravitationskorrigering (EFT)
EFT:s extra term parameteriseras i formen ”medelhastighet i kvadrat”: V_extra²(r) = V0_bin² · f(r/ℓ). Här är V0_bin amplitudparametern för varje RC-bin (20 parametrar), ℓ är en global skala (1 parameter), och f(x) är en dimensionslös kärnformsfunktion. De kärnformer som jämförs i denna artikel (ingen av dem inför ytterligare kontinuerliga frihetsgrader) är:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (valfri kontroll) gaussian: f(x)=erf(x/√2) (ingår inte i huvudslutsatsuppsättningen)
Fysikalisk motivation (utökad): EFT tolkar den extra gravitationsresponsen på galaxskalor som en effektiv respons som erhålls genom grovkornning/skalmedelvärdesbildning av mer mikroskopiska verkningar över ändliga skalor. I denna artikel antar vi ingen specifik mikroskopisk mekanism; i stället använder vi en minimal och auditerbar parameterisering för kontrollerad jämförelse och testning under ett enhetligt statistiskt protokoll.
För intuition kan den extra termen skrivas i accelerationsform: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). När r≫ℓ gäller f→1 och V_extra→V0_bin, vilket ger ett ungefär platt extra hastighetsbidrag i ytterregionen. När r≪ℓ och f(x)≈x kan en karakteristisk accelerationsskala a0,bin≈V0_bin²/ℓ införas (upp till en O(1)-faktor från kärnfunktionen), vilket ger en MOND-lik intuition för övergångsskalan från inre till yttre region.
Den diskreta kärnfamiljen som används här (none/exponential/yukawa/powerlaw_tail) kan ses som lågdimensionella proxyer för olika ”initiala lutningar / övergångshastigheter / långräckviddiga svansar” (till exempel Yukawa-lik skärmning jämfört med en respons med längre svans). De används för robusthetsstresstestning snarare än för att uttömma modellrummet. I komponenten för svag linsning konstruerar vi en effektiv kuvertmassa och densitet från V_avg(r) och projicerar dem sedan för att erhålla ΔΣ(R). Denna effektiva densitet bör förstås som en effektiv beskrivning av linsningspotentialen under antaganden om sfärisk symmetri och svagfältsmappning (fullständiga detaljer har flyttats till bilaga A).
Alla ovanstående kärnformer uppfyller f(x)→1 när x→∞ (dvs. mättnad V_extra²→V0²), samtidigt som de ger linjär eller sublinjär tillväxt för x≪1: exempelvis exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Därför har olika kärnformer observerbara skillnader i ”initial lutning” vid liten radie, övergångshastighet och yttre svans, och kan särskiljas genom de gemensamma RC+GGL- och slutningstesterna.
EFT:s prediktion för svag-linsnings-ΔΣ(R) erhålls genom att härleda kuvertmassa och densitet från V_avg(r), följt av projektionsintegraler: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, och ΔΣ(R)=Σ̄(<R)−Σ(R). Den numeriska implementeringen använder ett logaritmiskt rutnät och förfinar det adaptivt i undantagsfall för att säkerställa stabilitet och reproducerbarhet.
(c) DM_RAZOR: NFW-baslinje för halo av kall mörk materia
Samtidigt klargör vi att DM_RAZOR endast representerar en minimal, auditerbar NFW-baslinje (fast c–M och ingen spridning; ingen adiabatisk kontraktion, feedbackkärna, icke-sfäricitet eller miljötermer). För att minska risken för en ”halmgubbebaslinje” hävdar denna artikel inte att sådana effekter inte finns. I stället införlivas de i bilaga B (P1A) som lågdimensionella och auditerbara stresstester, inklusive hierarkisk behandling av c–M-spridning, en kärnproxy och en shear-kalibreringsnuisance på linsningssidan.
4.2 Modellbokföring och rättvis jämförelse (delade parametrar = definitionen av slutning)
Antalet parametrar i huvudjämförelseuppsättningen är: DM_RAZOR k=20; EFT-familjen k=21 (den extra parametern är den globala log ℓ). Alla modeller delar samma RC-data, samma GGL-data och kovarians, samma RC-bin→GGL-bin-mappning, samma baryoniska termer och samma enhetsomvandlingar. Dessutom är kärnformen (none / exponential / yukawa / powerlaw_tail) ett diskret val och inför ingen ytterligare kontinuerlig parameter, vilket förhindrar att en fördel erhålls genom ”en extra frihetsgrad”.
4.3 Likelihood, priorer och sampler
RC-likelihooden är diagonal Gaussisk: σ_eff² = σ_obs² + σ_int². Huvudresultaten fixerar σ_int=5 km/s, och Run-5 skannar σ_int. GGL-likelihooden använder en fullkovarians-Gauss för varje bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Det gemensamma målet är logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priorerna kodar främst fysikaliskt möjliga gränser (intervallbegränsningar för log ℓ, log V0 och log M200); när fri Υ och σ_int aktiveras används svagt informativa priorer (se implementeringen och konfigurationen i release-paketet för detaljer).
Samplern använder en adaptiv block-Metropolis-random walk: varje steg uppdaterar endast ett slumpmässigt delblock av parameterrummet för att förbättra acceptansgraden i höga dimensioner, och steglängden anpassas lätt med hjälp av fönstrad acceptansgrad (målacceptansgrad omkring 0,25). Huvudresultaten använder quick-läge (inställningar såsom n_steps=800), och varje arbetsyta producerar spår, residualer och PPC-plottar för manuella och skriptade auditer.
4.4 Slutningstest och negativ kontroll (definition)
Slutningstestet (Run-2) testar om RC-only-posterioren kan prediktera GGL utan att GGL anpassas om. Mer specifikt framåtgenererar det ΔΣ(R) för 4 GGL-binnar från RC-only-posteriorprov och beräknar logL_true med full kovarians; därefter permuteras gruppmappningen RC-bin→GGL-bin slumpmässigt för att erhålla logL_perm. Slutningsstyrka definieras som ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Dessutom grupperar Run-10 slumpmässigt om de 20 RC-binnarna till 4×5 (shuffle) och beräknar slutningen på nytt, för att testa hur starkt slutningssignalen beror på korrekt mappning.
5 Huvudresultat och tolkning
5.1 Huvudresultat från gemensam anpassning (RC+GGL)
Den bästa logL_total från den gemensamma anpassningen och den relativa fördelen ΔlogL_total (relativt DM_RAZOR) visas i tabell S1a och fig. S4. I huvudjämförelseuppsättningen har EFT_BIN den största gemensamma fördelen (ΔlogL_total=1337.210), medan övriga EFT-kärnformer också behåller signifikanta fördelar (1154.827–1294.442). Under informationskriterier (AICc/BIC) överträffar EFT-familjen också DM_RAZOR signifikant, vilket visar att fördelen inte beror på bias från antalet parametrar.
Not: huvudbidraget till ΔlogL_total≈1337 kommer från RC-termen (ΔlogL_RC≈1065 i den gemensamma dekompositionen, omkring 80 %). Detta kan förstås som en måttlig förbättring på cirka Δχ²≈0.90 per punkt över N=2295 RC-datapunkter, vilket naturligt ackumuleras till en fördel av storleksordningen 10^3 under en diagonal Gaussisk likelihood. Samtidigt ger GGL och slutningstestet oberoende tvärdatabegränsningar, och rangordningen förblir stabil under stresstester med σ_int, R_min och cov-shrink (se avsnitt 6 och tabell S1b).
5.2 Resultat från slutningstest (RC-only → GGL)
Den centrala slutningsteststorheten ΔlogL_closure rapporteras i tabell S1b och fig. S3. EFT-familjen har slutningsstyrkor på 171.977–280.513, högre än DM_RAZOR:s 126.678. Detta innebär att, utan tillåtna ytterligare tvärdatafrihetsgrader, har de posteriorprov som EFT erhåller från RC-data starkare överförbar prediktionskraft för GGL-data.
Den negativa kontrollen stödjer ytterligare slutningssignalens fysikaliska relevans: när grupperingen RC-bin→GGL-bin slumpmässigt blandas om sjunker EFT:s slutningsstyrka till 6–15 (med små skillnader mellan kärnor), medan baslinjens slutningsstyrka är så hög som 172–281. Denna ”signalkollaps” utesluter falska fördelar som orsakas av numerisk implementering, enhetsfel eller felaktig kovarianshantering.

Fig. R1 | Negativ kontroll: efter shuffle-gruppering sjunker slutningssignalen signifikant (plottad från Tab_Z1-metrik).
5.3 Resultatens innebörd och begränsningar
Slutsatsen i denna studie är att ”under denna datamängd och detta protokoll överträffar EFT:s medelgravitationskorrigering den testade DM_RAZOR-baslinjen.” Det måste betonas att DM-sidan endast använder en minimal NFW-baslinje med fast c(M)-relation, utan kärnbildning, icke-sfäricitet, miljötermer eller mer komplexa galax–halo-kopplingsmodeller. Detta manuskript hävdar därför inte att alla DM-modellfamiljer utesluts. I stället ger det en reproducerbar, slutningstestcentrerad kontrollbaslinje för att utvärdera huruvida RC och GGL kan förklaras konsistent av samma tvärdataparametrar och mappning.
För att bemöta denna vanliga invändning slutförde vi ett oberoende utvidgningsprojekt, P1A (se bilaga B). Utan att ändra den delade RC-bin→GGL-bin-mappningen eller auditeringsramverket stärker det DM-baslinjen på ett ”standardiserat och auditerbart” sätt: utöver tre enparametriga förstärkningar (SCAT/AC/FB) lägger det till (i) hierarkisk c–M-spridning + mass–koncentrationsprior (DM_HIER_CMSCAT), (ii) en enparametrig kärnproxy för baryonisk feedback (DM_CORE1P), och (iii) en shear-kalibreringsnuisance m på svag-linsningssidan (DM_RAZOR_M), samt rapporterar en kombinerad modell DM_STD; EFT_BIN behålls som kontrollreferens.
• DM_RAZOR_SCAT (c–M-spridning) — inför koncentrationsspridningsparametern σ_logc mellan haloer för att testa om fast c(M) systematiskt underskattar DM:s förklaringskraft;
• DM_RAZOR_AC (adiabatisk kontraktion) — använder en enda parameter α_AC för att kontinuerligt interpolera mellan ”ingen kontraktion” och ”standardkontraktion”, och fångar baryoners tendens att kontrahera den inre halon till minimal kostnad;
• DM_RAZOR_FB (feedback/core) — använder en kärnskala (t.ex. log r_core) för att beskriva hur inre kärnbildning undertrycker rotationskurvor, samtidigt som NFW-approximationen bibehålls på svag-linsningsskalor.
Den kvantitativa P1A-scoreboarden ges i bilaga B, tabell B1 / fig. B1 (automatiskt genererad från Tab_S1_P1A_scoreboard). I slutningsmetriken ger DM_RAZOR_FB en liten nettoförbättring (122.21→129.45, +7.25), medan de andra förstärkningarna bidrar obetydligt eller negativt till slutningsstyrkan. På den gemensamma anpassningssidan kan tillägg av en hierarkisk c–M-spridningsprior (DM_HIER_CMSCAT) eller den kombinerade modellen (DM_STD) förbättra gemensam logL avsevärt, men förbättrar inte slutningsstyrkan, vilket antyder att det huvudsakligen tillför flexibilitet i den gemensamma anpassningen snarare än överförbarhet mellan sonder. Huvudtextens kärnslutsats bör därför läsas så här: under strikta begränsningar för delad mappning och slutningstest uppstår EFT:s tvärdatakonsistensfördel inte genom valet av en ”alltför svag baslinje” på DM-sidan. P1A-releasepaketet som motsvarar bilaga B (tilläggstabeller/figurer och full_fit_runpack) kommer att inkluderas som ytterligare filer under samma Zenodo Concept DOI som full_fit_runpack för denna artikel: https://doi.org/10.5281/zenodo.18526286.
6 Robusthets- och kontrollexperiment
6.1 σ_int-skanning (Run-5)
Vi skannar systematiskt den intrinsiska RC-spridningen σ_int och upprepar gemensam inferens vid varje σ_int, med beräkning av ΔlogL_total relativt DM_RAZOR. Minimum-/maximumvärdena för ΔlogL_total för varje modell över skanningsintervallet rapporteras i tabell S1b.

Fig. R2 | Intervall för ΔlogL_total under σ_int-skanningen (högre är bättre).
6.2 R_min-skanning (Run-6)
För att testa effekten av systematik i centralregionsdata (såsom icke-cirkulär rörelse, upplösning och otillräcklig baryonisk modellering) applicerar vi R_min-tröskelklipp på RC och upprepar gemensam inferens. EFT-familjens fördel förblir positiv och stabil i skala under R_min-skanningen.

Fig. R3 | Intervall för ΔlogL_total under R_min-skanningen (högre är bättre).
6.3 cov-shrink-skanning (Run-7)
För att testa osäkerhet i GGL-kovariansen applicerar vi krympning på kovariansmatrisen för varje massbin: C_α=(1−α)C+α·diag(C), och skannar α. Resultaten visar att EFT-familjens fördel är okänslig för denna behandling.

Fig. R4 | Intervall för ΔlogL_total under cov-shrink-skanningen (högre är bättre).
6.4 Ablationsstege (Run-8)
Inom EFT_BIN genomför vi nästlade ablationer: från en minimal modell (utan fria parametrar), till versioner som behåller endast ett litet antal frihetsgrader, och slutligen till den kompletta modellen med 20-bin-amplitud + global skala. AICc/BIC visar att den kompletta EFT_BIN-modellen starkt krävs av data.

Fig. R5 | EFT_BIN-ablationstege (AICc; lägre är bättre).
6.5 Holdout-prediktion (Run-9)
Vi kör dessutom ett leave-one-bin-out-test (LOO): bland de 4 GGL-massbinnarna hålls ett bin ute varje gång; inferensen görs om med de återstående binnarna (och all RC), varefter test-log-likelihooden utvärderas på det uthållna binnet. Sammanfattande metrik ges i tilläggstabellen Tab_R3_leave_one_bin_out (en Run-9-produkt; filvägsmönster anges i listan över nyckelprodukter i avsnitt 8.2). EFT-familjen förblir klart överlägsen DM_RAZOR även i det sämsta uthållna fallet.

Fig. R6 | LOO: log-likelihoodfördelning för det uthållna binnet (från Run-9-produkter).
6.6 Negativ kontroll: RC-bin-shuffle (Run-10)
Run-10 grupperar slumpmässigt om de 20 RC-binnarna till 4×5 och beräknar slutningen på nytt medan RC-only-posterioren hålls oförändrad. Resultaten visar att shuffle, jämfört med den ursprungliga mappningen, signifikant sänker både slutningens medelvärde logL_true och ΔlogL_closure (se tabell S1b och fig. R1), vilket ytterligare stödjer slutningssignalens tolkningsbarhet.

Fig. R7 | Negativ kontroll: shuffle-mappning orsakar en tydlig minskning av slutningens medelvärde logL_true (från Run-10-produkter).
7 Spårbarhet och konsistensaudit (proveniens)
Alla numeriska värden som citeras i denna artikel kan spåras post för post i releasearkivets strikta sammanfattningstabeller och auditposter. För att göra huvudtexten mer lättläst har hela provenienskedjan (tagglista, audittabeller, checksumlista och verifieringsmetod) flyttats till bilaga A.
8 Reproducerbarhet och Zenodo-arkiv
Deklaration om data- och kodtillgänglighet: SPARC-rotationskurvedata och KiDS-1000-data för svag linsning som används i denna artikel är offentliga datamängder. Den publiceringsklara rapporten har arkiverats på Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), och det fullständiga reproduktionspaketet har arkiverats på Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Detaljerade körsteg, beroendemiljö, arkivförteckning och information om hashverifiering ges i bilaga A; design, körtaggar och utdata för stresstestet för standardisering av DM-baslinjen (P1A) ges i bilaga B.
Under samma Concept DOI för det fullständiga reproduktionspaketet (https://doi.org/10.5281/zenodo.18526286) tillhandahåller vi två reproducerbara ingångar efter användningsfall: • P1 (huvudtext) full_fit_runpack: reproducerar RC-only-/slutnings-/gemensamma analyser och robusthetsskanningar för EFT vs DM_RAZOR, och genererar huvudtextens tillgångar inklusive tabeller S1a/S1b och figurer S3/S4; • P1A (bilaga B) full_fit_runpack: reproducerar stresstestet för standardisering av DM-baslinjen (SCAT/AC/FB + hierarkisk c–M-spridningsprior + core1p + linsnings-m + DM_STD, inklusive EFT_BIN-kontrollen), och genererar bilagetabell B1 och fig. B1. P1A:s tilläggstabeller/figurer och full_fit_runpack kommer att inkluderas som ytterligare filer under samma Concept DOI för att bevara en enda arkivingång.
9 Tack och deklarationer
9.1 Tack
Vi tackar SPARC- och KiDS-1000-teamen för att de tillhandahåller offentliga data och dokumentation, samt deltagarna i projektets rekonstruktions- och auditeringsarbetsflöde.
9.2 Författarbidrag
Guanglin Tu ansvarade för konceptuellt förslag, studiedesign, teknisk implementering, datakurering, formell analys, implementering och audit av reproducerbarhetsarbetsflödet samt manusförfattande.
9.3 Finansiering
Egenfinansierat av författaren Guanglin Tu (ingen extern finansiering / inget anslagsnummer).
9.4 Konkurrerande intressen
Författaren Guanglin Tu är affilierad med ”EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Kina)”; inga andra konkurrerande intressen deklareras.
9.5 AI-assistans
OpenAI GPT-5.2 Pro och Gemini 3 Pro användes för språkputsning, strukturell redigering och organisering av reproducerbarhetsarbetsflödet. De användes inte för att generera eller modifiera data, resultat, figurer, tabeller eller kod, och inte heller för att generera referenser. Författaren bär fullt ansvar för hela manuskriptets innehåll och referensnoggrannhet.
10 Referenser
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energitrådsteori. Zenodo (öppet vetenskapsarkiv) DOI: https://doi.org/10.5281/zenodo.18517411
Bilaga A: Detaljer om spårbarhet och reproducerbarhet
Denna bilaga sammanfattar långsiktig arkivinformation för spårbarhet och reproducerbarhet, inklusive körtaggar, auditresultat, arkivförteckningar och centrala verifieringspunkter, så att läsare kan kontrollera och reproducera arbetet vid behov.
A.1 Detaljer om spårbarhet och audit
För att säkerställa långsiktig spårbarhet använder projektet tidsstämplade taggar för varje körning och utdata, och behåller historiska produkter utan att skriva över dem. Kärnvärdena som citeras i detta manuskript kommer från den strikta kompileringen (compile_tag=20260205_035929) och har passerat följande konsistensauditer:
• Alla tabeller på stegnivå bär run_tag och stegtaggar; det strikta kompileringsskriptet väljer ”fullständiga och konsistenta” kanoniska tabellkällor från report/tables.
• Värden i Tab_Z1_master_summary och Tab_Z2_conclusion_highlights jämförs post för post med de valda kanoniska tabellerna.
• Under PDF-generering görs en taggaudit av ”refererade tabell-/figurtaggar” för att säkerställa att föråldrade produkter inte blandas in.
Centrala taggar (för att lokalisera alla mellanprodukter): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Resultat av konsistensaudit: Tab_AUDIT_checks_strict rapporterar pass=9, fail=0, skip=0 (se release-paketet för detaljer).
A.2 Körsteg för reproducerbarhet och arkivförteckning
Denna studie använder ett reproducerbarhetssystem som består av ”publiceringsklar rapport + tabell-/figurtillägg + fullt återkörbart körpaket”. Läsare kan direkt konsultera Tables & Figures Supplement för att verifiera alla tabell-/figurtillgångar som citeras i artikeln; för att reproducera numeriska värden och auditkedjan från grunden kan de använda full_fit_runpack för att ladda ned data och köra om hela arbetsflödet. Efter slutförande kan paketets inbyggda skript för referenstabelljämförelse användas för att verifiera konsistens i tabellvärden.
A.2.1 Snabbstart för reproduktion (RUN_FULL, Windows PowerShell)
Detta avsnitt ger en kortare reproduktionsväg (Windows PowerShell). För snabba kontroller rekommenderas läsare att direkt konsultera Tables & Figures Supplement och verifiera de citerade tabellerna och figurerna post för post. För end-to-end-reproduktion och generering av alla tabeller, figurer och auditprodukter används full_fit_runpack: följ paketets README/ONE_PAGE_REPRO_CHECKLIST för att köra verify_checksums.ps1 och RUN_FULL.ps1 (Mode=full rekommenderas).
Zenodo-arkivingång (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Huvudkedjetaggar för denna artikel: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.
A.2.2 Arkivmaterial och centrala verifieringspunkter (paket och kontroller)
Zenodo-arkivet tillhandahåller tre kompletterande materialkategorier: (1) publiceringsklar rapport (denna artikel, v1.1; inklusive bilaga B: P1A-stresstest för standardisering av DM-baslinjen); (2) Tables & Figures Supplement (tilläggstabeller och figurer som täcker alla tabell-/figurtillgångar som citeras i denna artikel, separat motsvarande P1 och P1A); och (3) full_fit_runpack (fullständigt reproduktionspaket: laddar ned data från grunden och kör om hela arbetsflödet, separat motsvarande P1 och P1A). Punkterna (1)–(2) stödjer snabb läsning och oberoende verifiering; punkt (3) ger fullständig end-to-end-reproducerbarhet.
Materialkategori | Filnamn (exempel) | Syfte och positionering (rekommenderad användningsordning) |
Publiceringsklar rapport (kinesiska och engelska) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Fullständig rapport arkiverad på Zenodo; huvudtexten ger kärnslutsatser och robusthetsauditer, och bilaga B ger P1A (stresstest för standardisering av DM-baslinjen). |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Alla tabeller (CSV) och figurer (PNG) som citeras i huvudtexten, inklusive genereringsskript och taggfiler. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Alla tabeller och figurer som citeras i bilaga B (P1A), inklusive Tab_S1_P1A_scoreboard och Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Fullständig end-to-end-reproduktion: ladda ned data från grunden och kör om RC-only/slutning/gemensam analys samt robusthetsskanningar. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Fullständig end-to-end-reproduktion (bilaga B): kör om DM 7+1 + DM_STD (inklusive EFT_BIN-kontrollen) och generera bilagetillgångar; paketet innehåller ett skript för referenstabelljämförelse för att verifiera tabellvärdeskonsistens. |
Citeringsrekommendation: när denna artikel eller medföljande reproducerbarhetsmaterial citeras, ange Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Centrala produkter som bör finnas och kunna jämföras efter reproduktion omfattar:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (slutningssammanfattning)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (sammanfattning av gemensam anpassning)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (σ_int-skanning)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (R_min-skanning)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (cov-shrink-skanning)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (negativ kontroll)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (Strict-huvudtabell; motsvarar tabeller S1a/S1b och värden i huvudtexten)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (publiceringsklart PDF-paket; kan användas för snabb genomgång och citering)
Bilaga B: P1A — stresstest för standardisering av DM-baslinjen (DM 7+1 + DM_STD; med EFT-kontroll)
Denna bilaga dokumenterar ett utvidgningsprojekt (P1A) för ”stresstestning av DM-baslinjestandardisering” som är konsistent med slutningsprotokollet i huvudtexten. Dess roll är att uppgradera den minimala DM_RAZOR-baslinjen som används i huvudtexten (NFW + fast c–M, ingen spridning / ingen kontraktion / ingen kärna) till en uppsättning DM-baslinjer som ligger närmare astrofysikalisk praxis och är mer motståndskraftig mot vanliga invändningar, utan att införa ett stort antal frihetsgrader och utan att ändra den delade RC-bin→GGL-bin-mappningen eller auditeringsramverket. P1A täcker, och är en superuppsättning av, det tidigare stresstestet med tre grenar: det behåller SCAT/AC/FB och lägger till hierarkisk c–M-spridning + prior, en enparametrig kärnproxy och en shear-kalibreringsnuisance m på linsningssidan; det tillhandahåller också den kombinerade modellen DM_STD. EFT_BIN behålls som kontrollreferens.
Tilläggsnot: slutningsstyrkor och relaterade värden i bilaga B (P1A) använder en större Monte Carlo-budget (till exempel ndraw=400, nperm=24) än quick-budgeten som används i huvudtexten för att täcka hela EFT-kärnfamiljen (till exempel ndraw=60, nperm=12). Därför kan absoluta värden visa O(10)-nivås samplingsdrift. Modell-till-modell-jämförelser inom samma budget/tabell är dock rättvisa, och fördelens tecken och storlek förblir stabila över budgetar.
B.1 Syfte och positionering (varför P1A, och varför som bilaga)
P1A försöker inte uttömma alla möjliga val för ΛCDM-halomodellering (såsom icke-sfäricitet, miljöberoende, komplexa galax–halo-kopplingar eller högdimensionell baryonfysik). I stället följer P1A principen ”lågdimensionell, auditerbar, reproducerbar”: varje förstärkningsmodul inför endast ≤1 central effektiv parameter och förblir underkastad artikelns tre hårda begränsningar:
(i) Parameterbokföring: varje ny parameter måste uttryckligen registreras och rapporteras tillsammans med informationskriterier (AICc/BIC);
(ii) Delad mappning: samma grupperingskarta RC-bin→GGL-bin används fortfarande; separat ”trimning av mappningen” för en enskild datamängd är inte tillåten;
(iii) Slutningstest: varje förstärkning måste visa en genuin vinst i RC→GGL-överföringsprediktion, inte enbart bättre RC-only-anpassning.
B.2 DM 7+1 + DM_STD: moduldefinitioner, parametrar och inträde i den gemensamma posterioren
Som ett oberoende runpack tillhandahåller P1A 8 DM-arbetsytor (DM 7+1) plus 1 EFT-kontroll: med DM_RAZOR som baslinje konstruerar det tre äldre enparametriga förstärkningar (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), lägger till tre mer standardmässiga defensiva moduler (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), och tillhandahåller därefter den kombinerade modellen DM_STD. Modulernas gemensamma mål är att täcka de tre vanligaste invändningarna samtidigt som dimensionaliteten ökas så lite som möjligt: (a) hur c–M-spridning och priorer träder in i en hierarkisk modell; (b) om huvudeffekten av baryonisk feedback kan fångas av en enparametrig kärnproxy; och (c) om centrala systematiker på linsningssidan skulle kunna misstas för en fysikalisk signal.
Workspace | dm_model | Ny parameter/nya parametrar (≤1) | Fysikalisk motivation (kärna) | Implementeringsprincip (auditvänlig) |
|---|---|---|---|---|
DM_RAZOR | NFW (fast c–M, ingen spridning) | — | Minimal, auditerbar ΛCDM-halo-baslinje; används för strikt jämförelse med EFT | Delad mappning fast; strikt parameterbokföring; används endast som baslinje för relativ jämförelse |
DM_RAZOR_SCAT | NFW + c–M-spridning (legacy) | σ_logc | c–M-relationen har spridning; approximeras med en enparametrig lognormal spridning | ≤1 ny parameter; delad mappning behålls; slutningsvinst används som acceptanskriterium |
DM_RAZOR_AC | NFW + adiabatisk kontraktion (legacy) | α_AC | Baryoniskt inflöde kan inducera adiabatisk kontraktion av halon; approximeras med en enparametrig styrka | ≤1 ny parameter; mappning oförändrad; rapportera AICc/BIC-förändringar och slutningsvinst |
DM_RAZOR_FB | NFW + feedbackkärna (legacy) | log r_core | Feedback kan bilda en kärna i den inre regionen; approximeras med en enparametrig kärnskala | ≤1 ny parameter; samma slutnings-/negativ-kontrollprotokoll; RC-only-förbättring är inte det enda målet |
DM_HIER_CMSCAT | Hierarkisk c–M-spridning + prior | σ_logc (hier) | Mer standardmässigt hierarkiskt c_i∼logN(c(M_i),σ_logc); påverkar den gemensamma posterioren för både RC och GGL | Explicit prior; latent c_i marginaliseras; fortfarande lågdimensionell och auditerbar |
DM_CORE1P | 1-parametrig kärnproxy (inspirerad av coreNFW/DC14) | log r_core | Använder en enparametrig kärnproxy för huvudeffekten av baryonisk feedback och undviker högdimensionella detaljer om stjärnbildning | Citerar standardlitteratur; ≤1 ny parameter; knuten till slutningstestet |
DM_RAZOR_M | NFW + nuisance för shear-kalibrering av linsning | m_shear (GGL) | Absorberar en central systematik i svag linsning som en effektiv parameter och minskar risken för att systematik misstas för fysik | Nuisance uttryckligen registrerad; kan inte påverka RC bakåt; resultat bedöms främst efter slutningsrobusthet |
DM_STD | Standardiserad DM-baslinje (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Inkluderar de tre vanligaste kritikklasserna i en fortfarande lågdimensionell standardbaslinje | Parameterbokföring + informationskriterier rapporteras; slutning är primär metrik; används som den starkaste defensiva DM-kontrollen |
Not: parameternamnen ovan följer den tekniska implementeringen (till exempel σ_logc, α_AC, log r_core och m_shear). Designfokus för P1A är att ”göra DM-baslinjen något starkare samtidigt som den förblir auditerbar”, inte att förvandla DM-sidan till en okontrollerbar högdimensionell anpassare. Särskilt inför DM_HIER_CMSCAT c–M-spridning hierarkiskt: koncentrationen c_i för varje halo tilldelas en lognormal spridning kring c(M_i), begränsad av den globala σ_logc och c(M)-prioren; denna hierarkiska struktur påverkar den gemensamma posterioren för både RC och GGL.
B.3 Statistiskt protokoll och produktkonventioner som är konsistenta med huvudtexten
P1A återanvänder alla dataprodukter, den delade mappningen och auditeringsramverket från huvudtexten. Körordningen och produktkonventionerna förblir konsistenta:
(1) Run‑1: RC-only-inferens (utdata posterior_samples.npz och metrics.json);
(2) Run‑2: RC→GGL-slutningstest (utdata closure_summary.json och den permuterade baslinjen);
(3) Run‑3: gemensam RC+GGL-anpassning (utdata joint_summary.json).
Alla citerade siffror kommer från den automatiskt kompilerade tabellen (Tab_S1_P1A_scoreboard) och kan kontrolleras efter omkörning av hela P1A-arbetsflödet med hjälp av skriptet för referenstabelljämförelse som är inbyggt i P1A full_fit_runpack.
B.4 Huvudresultat, tabell-/figuringångar och arkivplan (samma DOI)
Detta avsnitt ger P1A:s centrala kvantitativa slutsatser. Tabell B1 sammanfattar nyckelmetrik för RC-only, RC→GGL-slutning och gemensam RC+GGL-anpassning (parenteser anger skillnader relativt DM_RAZOR-baslinjen). Slutningsstyrka definieras som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (högre är bättre). Fig. B1 visualiserar samma scoreboard. Huvudpunkterna är följande:
• Bland de tre legacy-grenarna ger endast DM_RAZOR_FB (feedback/core) en liten nettoförbättring av slutningsstyrkan: 122.21→129.45 (+7.25); SCAT och AC ger ingen nettoförbättring;
• De nyligen tillagda DM_HIER_CMSCAT och DM_RAZOR_M har mycket små effekter (~0) på slutningsstyrkan, och DM_CORE1P visar likaså ingen signifikant nettoförbättring;
• Den kombinerade modellen DM_STD kan avsevärt förbättra gemensam logL (närmare optimum för gemensam anpassning), men dess slutningsstyrka minskar, vilket antyder att dess vinst huvudsakligen kommer från flexibilitet i gemensam anpassning snarare än överförbarhet mellan sonder;
• Som kontroll behåller EFT_BIN fortfarande en tydlig fördel både i slutningsstyrka och gemensam anpassning. Huvudslutsatsen är därför robust mot införandet av en ”starkare DM-baslinje + linsningsnuisance”.
För direkt jämförelse med huvudtextens resultat sammanfattar tabeller S1a–S1b den strikta jämförelsen mellan EFT-familjen och DM_RAZOR: EFT-modeller förbättrar den gemensamma anpassningen med ΔlogL_total≈1155–1337 relativt DM_RAZOR och når ΔlogL_closure=172–281 i slutningstestet. P1A skapar endast en ”hårdare kontroll” på DM-sidan; dess syfte är att minska invändningar som ”strawman baseline” eller ”systematics-as-physics”, inte att ersätta huvudjämförelsen.
Tabell B1 | P1A-scoreboard (högre är bättre; parenteser anger skillnader relativt DM_RAZOR-baslinjen).
Modellgren (workspace) | Δk | RC-only bästa logL_RC (Δ) | Slutningsstyrka ΔlogL_closure (Δ) | Gemensam bästa logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Fig. B1 | P1A-scoreboard: slutning och gemensam ΔlogL relativt baslinjen (högre är bättre).

Exempeltaggar för den färdigställda körningsuppsättningen som motsvarar denna bilaga är följande (används för att lokalisera P1A:s mellanprodukter och tabeller/figurer):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Föreslagen citering (citeringsnot för bilagan)
När läsare behöver citera ”stresstestet för standardisering av DM-baslinjen” utöver artikelns huvudslutsatser rekommenderas att de citerar huvudslutsatsen tillsammans med följande not: ”Se bilaga B (P1A) för standardiserade stresstester av DM-baslinjen (legacy SCAT/AC/FB + hierarkisk c–M-spridningsprior + kärnproxy + nuisance för shear-kalibrering av linsning), under samma slutningsprotokoll.”