← Experiment

Energitrådsteori (Energy Filament Theory, EFT): ramverk för genomsnittlig gravitation jämfört med en minimal NFW-baslinje för kall mörk materia (DM)

Författare: Guanglin Tu
E-post: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Affiliering: EFT-arbetsgruppen, Shenzhen Energy Filament Science Research Co., Ltd. (Kina)
Version: v1.1 | Datum: 2026-02-14

Preprint (ej sakkunniggranskad) | Denna version är avsedd för offentlig spridning och reproducerbar granskning; den motsvarar inte en slutlig tidskriftspublikation.

Licens: rapport (CC BY-NC-ND 4.0); komplett reproduktionspaket (CC BY 4.0).

Publiceringsrapport (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Komplett reproduktionspaket (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Sammanfattning (Executive Summary)

Denna rapport är en fullständig publiceringsversion arkiverad på Zenodo. Den ger en sammanhållen och granskningsbar kedja från data, modellbokföring, rättvis jämförelse och slutningstest till reproduktionsmaterial. Bilaga B (P1A) fungerar som ett robusthetskomplement: där samlas stresstestet ”en mer standardiserad DM-baslinje + centrala systematiska fel” för att pröva hur känsliga huvudtextens slutsatser är för mer realistisk DM-modellering och behandling av systematik i linsningen.

Huvudslutsatser (fyra meningar som kan citeras direkt; se avsnitt 2.4 för detaljer):

(1) Vid anpassning av rotationskurvor (RC) är EFT-familjen tydligt bättre än DM_RAZOR för samtliga kombinationer av kärnfunktioner och priorer; den typiska förbättringen är Δlog𝓛_RC ≈ 10^3 (se Tab. S1a).
(2) I slutningstestet RC→GGL ger EFT starkare överförbarhet mellan sonder: slutningsstyrkan Δlog𝓛_closure (True−Perm) är markant högre än för DM_RAZOR, och skillnaden är robust mot skanningar av covariance shrinkage, R_min och σ_int (se Fig. S3 och Tab. S1b).
(3) I den gemensamma anpassningen (RC+GGL) behåller EFT en stabil fördel, och denna fördel kollapsar under den negativa kontrollen där den delade mappningen bryts. Det stödjer tolkningen att ”effekten av genomsnittlig gravitation” kommer från den delade mappningen och inte från en tillfällig anpassning (se Fig. S4).
(4) Bilaga B (P1A) stresstestar DM-sidan med mer standardiserade DM-baslinjemoduler och en central nuisanceparameter för linsningssystematik, utan att öka dimensionsantalet väsentligt. Dessa förstärkningar undanröjer inte EFT:s slutningsfördel (se Tab. B1 och Fig. B1).

Tillgänglighet för data och kod: rapportens Concept DOI är 10.5281/zenodo.18526334; det kompletta reproduktionspaketets Concept DOI är 10.5281/zenodo.18526286. Taggarna för bilaga B (P1A) är run_tag=20260213_151233, closure_tag=20260213_161731 och joint_tag=20260213_195428.

1 Abstrakt

Vi genomför en reproducerbar kvantitativ jämförelse mellan två klasser av teoretiska ramverk på samma data och under samma statistiska protokoll: modellen för ”korrektion genom genomsnittlig gravitation” som föreslås av Energitrådsteori (Energy Filament Theory, EFT; inte den vanliga förkortningen för Effective Field Theory), och en baslinjemodell med NFW-halon för kall mörk materia (DM_RAZOR). DM_RAZOR väljs avsiktligt som en ”minimal DM-baslinje”: NFW-halo + fast c–M-relation, utan halo-to-halo scatter, för att ge en granskningsbar och reproducerbar jämförelsepunkt. Samtidigt bör det betonas att vi i denna artikel behandlar EFT som en fenomenologisk, MOND-lik parametrisering av ett Effektivt fält/en effektiv respons, avsedd att testas inom ett enhetligt statistiskt protokoll; vi härleder inte dess mikroskopiska första principer i denna text.

Datamaterialet omfattar 2295 hastighetspunkter från SPARC-rotationskurvor (RC) efter enhetlig förbehandling och binning (104 galaxer, 20 RC-binnar), samt den ekvivalenta yttätheten ΔΣ(R) från KiDS-1000:s galax–galax-svaglinsning (GGL): 4 binar i stjärnmassa × 15 R-punkter per bin, totalt 60 punkter, med full kovariansmatris.

Vi utför i tur och ordning RC-only-inferens, slutningstestet RC→GGL (closure), GGL-only-inferens och gemensam inferens RC+GGL, och använder en konsistensaudit för att säkerställa att alla citerade värden kan spåras. Under strikt parameterbokföring och begränsningar från den delade mappningen (DM: 20 parametrar log M200_bin; EFT: 20 parametrar log V0_bin + 1 global log ℓ) överträffar EFT-familjen DM_RAZOR tydligt i den gemensamma anpassningen: ΔlogL_total = 1155–1337 relativt DM_RAZOR. Än viktigare visar slutningstestet att RC-posterioren har icke-trivial prediktiv kraft för GGL: EFT:s slutningsstyrka är ΔlogL_closure = 172–281, jämfört med 127 för DM_RAZOR. När gruppmappningen RC-bin→GGL-bin slumpmässigt blandas om kollapsar slutningssignalen till 6–23, vilket visar att signalen inte är en statistisk tillfällighet eller en implementeringsbias. I systematiska skanningar av σ_int, R_min och covariance shrinkage förblir EFT:s relativa fördel positiv och stabil i storleksordning. För att bemöta den vanliga invändningen att ”DM-baslinjen är för svag / systematik läses som fysik” tillhandahåller vi i bilaga B (P1A) ett mer standardiserat men fortfarande lågdimensionellt och granskningsbart stresstest av DM-baslinjen: hierarkisk c–M scatter + prior, en enparameters core-proxy, lensing m och den kombinerade modellen DM_STD. Under samma slutningsprotokoll undanröjer dessa förstärkningar inte EFT:s slutningsfördel (se Tab. B1/Fig. B1).

Nyckelord: rotationskurvor; galax–galax-svaglinsning; slutningstest; EFT; kall mörk materia; bayesiansk inferens

2 Introduktion och resultatöversikt

Rotationskurvor (RC) och galax–galax-svaglinsning (GGL) är två komplementära gravitationssonder. RC begränsar den dynamiska potentialen i skivplanet och relationen för radiell acceleration (RAR), medan GGL mäter den projicerade massfördelningen och gravitationsresponsen på haloskalor. För varje kandidatteori är den avgörande frågan inte bara om den kan anpassa de två datamängderna var för sig, utan om den kan ge en konsekvent förklaring under en och samma mappning mellan datamängderna och samma delade begränsningar.

Därför sätter denna artikel ”slutningstestet” (closure test) i centrum för det statistiska protokollet: först används RC-only-posterioren för att förutsäga GGL framåt, och resultatet jämförs sedan med en negativ kontroll där mappningen RC-bin→GGL-bin permuteras eller shufflas. På så sätt mäter vi prediktiv överförbarhet mellan datamängder (predictive transferability) och utesluter falska signaler från implementeringsfel eller tillfällig anpassning.

Teoretisk positionering och räckvidd: denna artikel försöker inte härleda EFT:s (Energitrådsteoris) mikroskopiska första principer eller ge en relativistiskt fullständig form. I stället behandlar vi EFT som en lågdimensionell, MOND-lik parametrisering av ett effektivt fält/en effektiv respons, beskriven av en kärnfunktion f(x) och en global skala ℓ, och vi testar dess konsistens mellan datamängder och dess överförbara prediktionsförmåga genom slutningstestet RC→GGL under strikt parameterbokföring.

Forskningsplan och omfattning: artikeln ingår i ett pågående observationsprogram i P-serien. I tillgängliga data på galaxskalor söker vi efter två möjliga effektiva bakgrundsbidrag: (i) ett ”gravitationsgolv” (mean gravity floor), som kan beskrivas av en grovkornad respons av genomsnittlig gravitation, och (ii) ett ”brusgolv” (stochastic/noise floor), kopplat till fluktuationer i mikroskopiska processer. I denna artikel (P1) fokuserar vi enbart på det förstnämnda: utan att införa någon hypotes om mikroskopisk uppkomst söker vi observationella spår av ett golv för genomsnittlig gravitation genom slutningstestet RC→GGL och jämför det med en granskningsbar DM-baslinje under ett enhetligt jämförelseprotokoll. Som heuristisk fysisk bild kan man tänka sig att kortlivade frihetsgrader, om de finns, genom sönderfall/annihilation kan omvandla vilomassa till energi och rörelsemängd som bärs av andra frihetsgrader; på effektiv nivå motsvarar detta naturligt en uppdelning i ”medelbidrag + fluktuationsbidrag”. Den mikroskopiska bilden modelleras dock inte kvantitativt här.

För att undvika övertolkning drar vi följande gränser för artikelns räckvidd:
• Vad artikeln gör: under strikt parameterbokföring och delad mappning använder den slutningstestet för att mäta överförbar prediktionsförmåga mellan datamängder, och ger en reproducerbar jämförelse mellan EFT:s respons av genomsnittlig gravitation och en DM-baslinje.
• Vad artikeln inte gör: den diskuterar inte någon mikroskopisk uppkomstmekanism, abundanser/livstider eller kosmologiska begränsningar; den modellerar inte den stokastiska term som motsvarar ”brusgolvet”.
• Vad artikeln inte hävdar: målet är inte att falsifiera mörk materia; P1 ger ingen slutgiltig dom om huruvida ett ”golv” existerar. Den rapporterar ett etappvis evidensläge: inom det robusta mätområde som valts här föredrar data modeller som innehåller en respons av genomsnittlig gravitation.

Samtidigt anger vi uttryckligen att DM_RAZOR endast representerar en minimaliserad och granskningsbar NFW-baslinje: fast c–M utan scatter, utan Adiabatic Contraction, feedback-core, icke-sfäriska termer eller miljötermer. Huvudslutsatsen i texten är därför strikt begränsad: inom denna minimala baslinje och under strikt parameterbokföring/mappning visar EFT starkare konsistens mellan datamängderna. För att svara på den vanliga frågan om en mer standardiserad ΛCDM-baslinje och modellering av central linsningssystematik skulle ändra slutsatsen väsentligt, sammanfattar vi i bilaga B (P1A: stresstest för standardisering av DM-baslinjen) en mer standardiserad men fortfarande lågdimensionell och granskningsbar förstärkning av DM-sidan, tillsammans med nuisanceparametrar på linsningssidan, samtidigt som exakt samma delade mappning och definition av slutningstestet som i huvudtexten behålls (se Tab. B1/Fig. B1).

2.1 Tab S1a–S1b: sammanfattning av nyckelindikatorer (Strict)

Tabell S1a anger huvudmåtten för den gemensamma anpassningen (RC+GGL): logL, ΔlogL, AICc och BIC. Tabell S1b anger mått för slutningstest och robusthetsskanningar: closure, negativ shuffle-kontroll samt intervall för σ_int-, R_min- och cov-shrink-skanningar. Alla värden kommer från den strikta huvudsammanställningen Tab_Z1_master_summary och kan spåras punkt för punkt i release-arkivet.

Tabell S1a | Huvudmått för gemensam anpassning (RC+GGL, Strict).

Modell (workspace)

W-kärna

k

gemensam logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabell S1b | Slutnings- och robusthetsmått (Strict).

Modell (workspace)

slutning ΔlogL (true-perm)

ΔlogL efter negativ kontroll shuffle

ΔlogL-intervall vid σ_int-skanning

ΔlogL-intervall vid R_min-skanning

ΔlogL-intervall vid cov-shrink-skanning

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: slutningsstyrka (RC-only → förutsäger GGL)

Slutningsstyrkan definieras som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: på posteriorprover från RC-only förutsäger vi GGL framåt och jämför med den negativa kontrollen ”permuterad mappning RC-bin→GGL-bin”.

Figur S3 | Slutningsstyrka (större är bättre): genomsnittlig log-likelihoodfördel för RC-only → GGL-prediktion.


2.3 Fig S4: huvudjämförelse för gemensam anpassning (RC+GGL)

Fördel i gemensam anpassning definieras som ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). På samma data, med samma mappning och med ungefär samma parameterstorlek uppnår EFT-familjen en klart högre gemensam log-likelihood.

Figur S4 | Fördel i gemensam anpassning (större är bättre): best logL_total för RC+GGL relativt DM_RAZOR.


2.4 Fyra slutsatser (direkt citerbara)

(1) I den enhetliga gemensamma analysen av SPARC-rotationskurvor och KiDS-1000-svaglinsning är EFT-modellerna inom ramverket för genomsnittlig gravitation systematiskt bättre än DM_RAZOR under det strikta jämförelseprotokollet: ΔlogL_total = 1155–1337 relativt DM_RAZOR.

(2) Slutningstestet RC→GGL visar starkare prediktiv konsistens för EFT: ΔlogL_closure = 172–281, medan DM_RAZOR når 127. När RC-bin→GGL-bin-grupperna slumpmässigt blandas om kollapsar slutningssignalen till 6–23, vilket visar att signalen beror på den korrekta mappningen mellan datamängder och inte på tillfällig anpassning.

(3) Systematiska skanningar av σ_int, R_min och covariance shrinkage ändrar varken tecknet eller storleksordningen i slutsatsen att EFT överträffar DM_RAZOR; slutsatsen är därmed robust mot vanliga systematiska störningar.

(4) Bilaga B (P1A) förstärker DM-baslinjen på ett ”standardiserat och granskningsbart” sätt under samma slutningsprotokoll: tre enparametersförstärkningar (SCAT/AC/FB) behålls, och hierarkisk c–M scatter + prior, en enparameters core-proxy och linsningssidans shear-kalibrering m (samt kombinationen DM_STD) läggs till. Resultatet visar att endast feedback/core-grenen ger en liten nettoökning i slutningsstyrkan (122.21→129.45, ΔΔlogL_closure≈+7.25); övriga förstärkningar bidrar obetydligt eller negativt till slutningsstyrkan. Huvudtextens slutsats beror därför inte på antagandet att DM_RAZOR är en alltför svag baslinje.

3 Data och förbehandling

Studien använder två typer av offentliga data. Inom projektet laddas de ned, verifieras (sha256) och förbehandlas med spårbara skript. För att säkerställa rättvis jämförelse mellan modeller delar samtliga arbetsytor (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) exakt samma dataprodukter och bin-mappning.


3.1 Rotationskurvor (RC, SPARC)

RC-data kommer från SPARC-databasens Rotmod_LTG (175 rotmod-filer). Efter förbehandling ingår 104 galaxer i projektets modellering, totalt 2295 datapunkter (r, V_obs), uppdelade i 20 RC-binnar enligt bland annat stjärnmassa. Varje datapunkt innehåller radien r (kpc), den observerade hastigheten V_obs (km/s), osäkerheten σ_obs samt hastighetskomponenter från gas, skiva och bula (V_gas, V_disk, V_bul).


3.2 Svag linsning (GGL, KiDS-1000 / Brouwer+2021)

GGL-data använder den ekvivalenta yttätheten ΔΣ(R) i Fig. 3 hos Brouwer m.fl. (2021) för KiDS-1000: fyra binar i stjärnmassa, 15 R-punkter per bin, tillsammans med den fulla kovarians som författarna tillhandahåller. I projektet rekonstrueras den ursprungliga long-form-kovariansen till en 15×15-matris för varje bin, och Stage-B-auditen verifierar både dimensioner och numerisk rimlighet.


3.3 Mappning RC-bin → GGL-bin och total provstorlek

De fyra massbinarna i GGL kopplas till de 20 RC-binarna genom en fast mappning: varje GGL-bin motsvarar fem RC-binnar, och RC-binarnas bidrag viktas med antalet galaxer. Denna mappning hålls oförändrad i alla modeller och är den centrala rättvisebegränsningen i slutningstestet och den gemensamma anpassningen. Det slutliga antalet datapunkter i den gemensamma analysen är n_total = 2355 (RC=2295, GGL=60).

4 Modeller och statistiska metoder


4.1 Minsta matematiska specifikation för EFT och DM (granskningsbar/testbar)

Detta avsnitt ger den minsta matematiska specifikation som direkt motsvarar implementeringen.

(a) Modell för rotationskurvor (RC)

För varje RC-datapunkt (r, V_obs, σ_obs) använder vi komponentaddition: V_mod²(r) = V_bar²(r) + V_extra²(r). Här är V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). I huvudresultaten i denna artikel används Υ_d = Υ_b = 0.5, i linje med SPARC:s empiriska rekommendation och för att minska onödiga frihetsgrader.

(b) EFT-korrektion genom genomsnittlig gravitation (EFT)

EFT:s extra term parametriseras som ett ”genomsnittligt hastighetskvadrat”-bidrag: V_extra²(r) = V0_bin² · f(r/ℓ). Här är V0_bin amplitudparametern för varje RC-bin (20 stycken), ℓ är en global skala (1 parameter), och f(x) är en dimensionslös kärnformfunktion. De kärnformer som jämförs här, utan ytterligare kontinuerliga frihetsgrader, är:

Fysisk motivation (utvidgad): EFT tolkar den extra gravitationsresponsen på galaxskalor som en effektiv respons efter grovkornning/skalmässig medelbildning av mer mikroskopiska verkningar över ändliga skalor. I denna artikel förutsätter vi inte någon specifik mikroskopisk mekanism, utan använder en minimal och granskningsbar parametrisering för en kontrollerad jämförelse och prövning under ett enhetligt statistiskt protokoll.

För intuitiv förståelse kan den extra termen skrivas som en acceleration: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). När r≫ℓ gäller f→1 och därmed V_extra→V0_bin, vilket ger ett ungefär platt extra hastighetsbidrag i den yttre regionen. När r≪ℓ och f(x)≈x kan man införa en karakteristisk accelerationsskala a0,bin≈V0_bin²/ℓ, upp till en O(1)-faktor från kärnfunktionen; detta ger en MOND-lik intuition för övergångsskalan mellan inre och yttre region.

Den diskreta kärnfamiljen som används här (none/exponential/yukawa/powerlaw_tail) kan ses som lågdimensionella proxyer för olika ”initial lutning/övergångshastighet/långdistanssvans” — till exempel Yukawa-lik skärmning kontra mer långsvansig respons. Den används för robusthetsstresstest, inte för att uttömma hela modellrummet. I svaglinsningsdelen konstruerar vi en effektiv omslagsmassa och densitet från V_avg(r) och projicerar dem till ΔΣ(R). Den effektiva densiteten bör förstås som en effektiv beskrivning av linsningspotentialen under antaganden om sfärisk symmetri och svagt fält; fullständiga detaljer har flyttats till bilaga A.

Samtliga kärnformer ovan uppfyller f(x)→1 när x→∞, det vill säga V_extra²→V0² mättas. Vid x≪1 ger de linjär eller sublinjär tillväxt: till exempel exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Därför finns observerbara skillnader mellan kärnformerna i liten radie genom ”initial lutning”, övergångshastighet och yttre svans, och dessa kan särskiljas med den gemensamma RC+GGL-anpassningen och slutningstestet.

EFT-prediktionen för svaglinsningens ΔΣ(R) erhålls genom att från V_avg(r) härleda omslagsmassa och densitet och därefter göra projektionsintegralen: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Den numeriska implementeringen använder ett logaritmiskt rutnät och förtätar adaptivt vid avvikelser för att garantera stabilitet och reproducerbarhet.

(c) DM_RAZOR: NFW-baslinje för kall mörk materia

Samtidigt anger vi uttryckligen att DM_RAZOR endast representerar en minimaliserad och granskningsbar NFW-baslinje: fast c–M och ingen scatter; ingen Adiabatic Contraction, feedback-core, icke-sfäriska termer eller miljötermer. För att minska risken för en ”strawman baseline” hävdar vi inte att dessa effekter saknas. Tvärtom förs de in på ett lågdimensionellt och granskningsbart sätt i bilaga B (P1A) som ett stresstest: hierarkisk behandling av c–M scatter, core-proxy och nuisanceparametrar för shear-kalibrering på linsningssidan.


4.2 Modellbokföring och rättvis jämförelse (delade parametrar = definitionen av slutning)

Antalet parametrar i huvudjämförelsen är: DM_RAZOR k=20; EFT-familjen k=21, där den extra parametern är den globala log ℓ. Alla modeller delar samma RC-data, samma GGL-data och kovarians, samma mappning RC-bin→GGL-bin, samma baryoniska termer och samma enhetsomvandlingar. Kärnformen (none / exponential / yukawa / powerlaw_tail) är dessutom ett diskret val och inför ingen ytterligare kontinuerlig parameter, vilket förhindrar att fördelen erhålls genom ”en extra frihetsgrad”.


4.3 Likelihood, priorer och samplare

RC-likelihooden är diagonal gaussisk: σ_eff² = σ_obs² + σ_int². Huvudresultaten fixerar σ_int=5 km/s, och Run-5 skannar σ_int. GGL-likelihooden använder en full kovariansgauss per bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Det gemensamma målet är logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priorerna uttrycker främst fysiskt möjliga gränser, med intervallbegränsningar för log ℓ, log V0 och log M200; när fria Υ och σ_int aktiveras används svagt informativa priorer (se implementering och release-paketets konfiguration för detaljer).

Samplaren är en adaptiv block-Metropolis-slumpvandring: i varje steg uppdateras endast ett slumpmässigt delblock av parameterutrymmet för att höja acceptansgraden i hög dimension, och steglängden anpassas lätt efter acceptansgraden i ett fönster (målacceptans cirka 0.25). Huvudresultaten använder quick-läge (till exempel n_steps=800), och varje arbetsyta matar ut trace-, residual- och PPC-figurer för manuell och skriptbaserad audit.


4.4 Slutningstest och negativ kontroll (definition)

Slutningstestet (Run-2) prövar om RC-only-posterioren kan förutsäga GGL utan att GGL anpassas om. Konkret genererar vi ΔΣ(R) framåt för fyra GGL-binnar från posteriorprover från RC-only och beräknar logL_true med full kovarians; därefter permuterar vi den gruppvisa mappningen RC-bin→GGL-bin slumpmässigt och får logL_perm. Slutningsstyrkan definieras som ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Därutöver blandar Run-10 om 20 RC-binnar till 4×5 grupper (shuffle) och beräknar slutningen på nytt, för att pröva signalens beroende av korrekt mappning.

5 Huvudresultat och tolkning


5.1 Huvudresultat för gemensam anpassning (RC+GGL)

Den gemensamma anpassningens best logL_total och relativa fördel ΔlogL_total mot DM_RAZOR visas i Tab. S1a och Fig. S4. I huvudjämförelsen har EFT_BIN störst gemensam fördel (ΔlogL_total=1337.210), medan övriga EFT-kärnformer också behåller en tydlig fördel (1154.827–1294.442). Informationskriterierna (AICc/BIC) är likaså klart bättre för EFT-familjen än för DM_RAZOR, vilket visar att fördelen inte drivs av en bias från parametertalet.

Anmärkning: huvudbidraget till ΔlogL_total≈1337 kommer från RC-termen (i joint-uppdelningen är ΔlogL_RC≈1065, cirka 80%). Det kan förstås som att en måttlig förbättring per punkt, Δχ²≈0.90 över N=2295 RC-datapunkter, naturligt ackumuleras till en fördel av storleksordningen 10^3 under diagonal gaussisk likelihood. Samtidigt ger GGL och slutningstestet oberoende begränsningar mellan datamängder, och rangordningen förblir stabil under stresstester av σ_int, R_min och cov-shrink (se avsnitt 6 och Tab. S1b).


5.2 Resultat från slutningstestet (RC-only → GGL)

Nyckelstorheten i slutningstestet, ΔlogL_closure, visas i Tab. S1b och Fig. S3. EFT-familjens slutningsstyrka är 171.977–280.513, högre än DM_RAZOR:s 126.678. Det betyder att EFT:s posteriorprover från RC-data har starkare överförbar prediktionsförmåga för GGL-data när inga ytterligare frihetsgrader mellan datamängder tillåts.

Den negativa kontrollen ger ytterligare stöd för slutningssignalens fysiska relevans. När gruppmappningen RC-bin→GGL-bin slumpmässigt blandas om sjunker EFT:s slutningsstyrka till 6–15, med små skillnader mellan kärnor, medan baslinjens slutningsstyrka ligger på 172–281. Denna ”signalkollaps” utesluter en falsk fördel orsakad av numerisk implementering, enhetsfel eller felaktig kovarianshantering.

Figur R1 | Negativ kontroll: slutningssignalen minskar tydligt efter shuffle-gruppering (ritad från Tab_Z1-mått).


5.3 Resultatens innebörd och begränsningar

Studiens slutsats är att ”under denna datamängd och detta protokoll är EFT:s korrektion genom genomsnittlig gravitation bättre än den testade DM_RAZOR-baslinjen”. Det bör betonas att DM-sidan endast använder en minimal NFW-baslinje med fast c(M)-relation och utan exempelvis core-bildning, icke-sfäriska termer, miljötermer eller mer komplexa galax–halo-kopplingsmodeller. Därför hävdar artikeln inte att alla DM-modellfamiljer utesluts. Den erbjuder i stället en reproducerbar jämförelsebaslinje, centrerad på slutningstestet, för att bedöma om RC och GGL kan förklaras konsekvent av samma parametrar och mappning mellan datamängder.

För att bemöta denna vanliga fråga har vi genomfört ett oberoende utvidgningsprojekt, P1A (se bilaga B). Utan att ändra den delade mappningen RC-bin→GGL-bin eller auditramverket förstärks DM-baslinjen på ett ”standardiserat och granskningsbart” sätt: utöver tre enparametersförstärkningar (SCAT/AC/FB) läggs (i) hierarkisk c–M scatter + mass–concentration-prior (DM_HIER_CMSCAT), (ii) en enparameters baryonic-feedback core-proxy (DM_CORE1P) och (iii) nuisanceparametern m för shear-kalibrering på svaglinsningssidan (DM_RAZOR_M) till; dessutom ges den kombinerade modellen DM_STD. EFT_BIN behålls samtidigt som jämförande referens.

• DM_RAZOR_SCAT (c–M scatter) — inför koncentrationsspridningen σ_logc mellan halon för att pröva om fast c(M) systematiskt underskattar DM:s förklaringsförmåga;
• DM_RAZOR_AC (Adiabatic Contraction) — använder en enparameters α_AC för att interpolera kontinuerligt mellan ”ingen kontraktion” och ”standardkontraktion”, och fångar med minimal kostnad tendensen till baryoninducerad kontraktion i inre regioner;
• DM_RAZOR_FB (Feedback / core) — beskriver hur core-bildning i den inre regionen dämpar rotationskurvan med en core-skala, till exempel log r_core, samtidigt som NFW-approximationen behålls på svaglinsningsskalor.

P1A:s kvantitativa scoreboard finns i bilaga B, Tab. B1 / Fig. B1, och genereras automatiskt från Tab_S1_P1A_scoreboard. I slutningsmåttet ger DM_RAZOR_FB en liten nettoförbättring (122.21→129.45, +7.25), medan övriga förstärkningar ger obetydliga eller negativa bidrag till slutningsstyrkan. På den gemensamma anpassningens sida kan en hierarkisk c–M scatter-prior (DM_HIER_CMSCAT) eller den kombinerade modellen (DM_STD) förbättra joint logL avsevärt, men utan att öka slutningsstyrkan; det tyder på att den huvudsakliga vinsten är flexibilitet i den gemensamma anpassningen snarare än överförbarhet mellan sonder. Huvudtextens kärnslutsats bör därför förstås så här: under strikt delad mappning och slutningstestets begränsningar beror EFT:s fördel i konsistens mellan datamängder inte på att DM-sidan har valts som en ”för svag baslinje”. Det P1A-publiceringspaket som hör till bilaga B — supplementtabeller/figurer och full_fit_runpack — kommer att läggas in som tilläggsfiler under samma Zenodo Concept DOI som denna artikels full_fit_runpack: https://doi.org/10.5281/zenodo.18526286.

6 Robusthet och kontrollexperiment


6.1 σ_int-skanning (Run-5)

Vi gör en systematisk skanning av RC:s intrinsiska spridning σ_int och upprepar den gemensamma inferensen för varje σ_int. Därefter beräknas ΔlogL_total relativt DM_RAZOR. Minimi- och maxvärdena för varje modell inom skanningsintervallet visas i Tab. S1b.

Figur R2 | Intervall för ΔlogL_total under σ_int-skanning (större är bättre).


6.2 R_min-skanning (Run-6)

För att pröva påverkan från systematiska fel i centrala regioner, såsom icke-cirkulära rörelser, upplösning och otillräcklig baryonmodellering, trimmar vi RC-data med tröskeln R_min och upprepar den gemensamma inferensen. EFT-familjens fördel förblir positiv och stabil i storleksordning under R_min-skanningen.

Figur R3 | Intervall för ΔlogL_total under R_min-skanning (större är bättre).


6.3 cov-shrink-skanning (Run-7)

För att pröva osäkerheten i GGL-kovariansen applicerar vi shrinkage på kovariansmatrisen för varje massbin: C_α=(1−α)C+α·diag(C), och skannar α. Resultaten visar att EFT-familjens fördel är okänslig för denna behandling.

Figur R4 | Intervall för ΔlogL_total under cov-shrink-skanning (större är bättre).


6.4 Ablationstrappa (Run-8)

Vi gör en nästlad ablation inom EFT_BIN: från en extremt enkel modell utan fria parametrar, via modeller som behåller få frihetsgrader, till den fullständiga modellen med amplituder i 20 binar + en global skala. AICc/BIC visar att den fullständiga EFT_BIN är tydligt nödvändig för att förklara data.

Figur R5 | Ablationstrappa för EFT_BIN (AICc, mindre är bättre).


6.5 Leave-one-bin-out-prediktion (Run-9)

Vi utför dessutom ett leave-one-bin-out-test (LOO): av de fyra massbinarna i GGL lämnas ett bin i taget ut, inferensen görs om med övriga binar och hela RC, och test-log-likelihooden utvärderas på det utelämnade binet. Sammanfattningsmåttet finns i supplementtabellen Tab_R3_leave_one_bin_out (produkt från Run-9; sökvägsmönstret anges i listan över nyckelprodukter i avsnitt 8.2). EFT-familjen är fortfarande klart bättre än DM_RAZOR även i det sämsta utelämnade fallet.

Figur R6 | LOO: fördelning av log-likelihood för utelämnat bin (från Run-9-produkter).


6.6 Negativ kontroll: RC-bin shuffle (Run-10)

Run-10 grupperar slumpmässigt om de 20 RC-binarna till 4×5 och beräknar slutningen på nytt, samtidigt som RC-only-posterioren hålls oförändrad. Resultatet visar att shuffle, jämfört med den ursprungliga mappningen, tydligt sänker mean logL_true och ΔlogL_closure (se Tab. S1b och Fig. R1), vilket ytterligare stödjer slutningssignalens tolkningsbarhet.

Figur R7 | Negativ kontroll: shuffle-mappning ger en tydlig minskning av slutningens mean logL_true (från Run-10-produkter).

7 Spårbarhet och konsistensaudit (Provenance)

Alla värden som citeras i artikeln kan spåras punkt för punkt i de strikta sammanfattningstabeller och auditposter som ingår i release-arkivet. För att göra huvudtexten mer lättläst har den fullständiga spårbarhetskedjan — tagglistor, audittabeller, checksum-listor och kontrollmetoder — flyttats till bilaga A.

8 Reproducerbarhet och Zenodo-arkivering (Reproducibility & Archive)

Deklaration om data- och kodtillgänglighet: SPARC-rotationskurvorna och KiDS-1000-data för svag linsning som används i artikeln är offentliga. Publiceringsrapporten är arkiverad på Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334) och det kompletta reproduktionspaketet är arkiverat på Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Detaljerade körsteg, miljöberoenden, arkivförteckning och hash-kontrollinformation finns i bilaga A; design, körtaggar och utdata för stresstestet av standardiserad DM-baslinje (P1A) finns i bilaga B.

Under samma Concept DOI för det kompletta reproduktionspaketet (https://doi.org/10.5281/zenodo.18526286) tillhandahåller vi två reproducerbara ingångar efter användningssyfte:
• P1 (huvudtext) full_fit_runpack: reproducerar RC-only / closure / joint och robusthetsskanningar för EFT vs DM_RAZOR och genererar huvudtextens Tab. S1a/S1b, Fig. S3/S4 och andra tillgångar;
• P1A (bilaga B) full_fit_runpack: reproducerar stresstestet för standardisering av DM-baslinjen (SCAT/AC/FB + hierarkisk c–M scatter-prior + core1p + lensing m + DM_STD; inklusive EFT_BIN-kontroll) och genererar bilagans Tab. B1 och Fig. B1.
P1A:s supplementtabeller och figurer samt full_fit_runpack kommer att läggas till som ytterligare filer under samma Concept DOI, så att en enda arkivingång behålls.

9 Tack och deklarationer


9.1 Tack

Vi tackar SPARC- och KiDS-1000-teamen för offentliga data och dokumentation, samt deltagarna i projektets rekonstruktions- och auditflöde.


9.2 Författarbidrag

Guanglin Tu ansvarade för studiens koncept, projektdesign, tekniska genomförande, databearbetning, formella analys, implementering av reproduktionsflödet och audit, samt manusförfattande.


9.3 Finansiering

Studien finansierades privat av författaren Guanglin Tu (ingen extern finansiering / inget anslagsnummer).


9.4 Intressekonflikter

Författaren Guanglin Tu har anknytning till ”EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Kina)”; inga andra konkurrerande intressen deklareras.


9.5 AI-assistans

OpenAI GPT-5.2 Pro och Gemini 3 Pro användes för språklig putsning, strukturell redigering och genomgång av reproduktionsflödet. De användes inte för att generera eller ändra data, resultat, figurer eller kod, och inte heller för att generera referenser. Författaren tar fullt ansvar för hela textens innehåll och referensernas korrekthet.

10 Referenser

Bilaga A: detaljer om spårbarhet och reproducerbarhet

Denna bilaga sammanfattar långsiktigt arkiverad information om spårbarhet och reproducerbarhet — run-taggar, auditresultat, arkivlista och viktiga kontrollpunkter — så att läsaren vid behov kan kontrollera och reproducera resultaten.


A.1 Detaljer om spårbarhet och audit

För att säkerställa långsiktig spårbarhet använder projektet tidsstämplade taggar för varje körning och varje utdata, och historiska produkter skrivs inte över. De centrala värden som citeras i denna artikel kommer från den strikta sammanställningen (compile_tag=20260205_035929) och har passerat följande konsistensaudit:

• Alla mellantabeller bär både run_tag och fas-tagg; det strikta sammanställningsskriptet väljer de ”kompletta och konsistenta” canonical-tabellerna från report/tables.

• Värdena i Tab_Z1_master_summary och Tab_Z2_conclusion_highlights jämförs punkt för punkt med de valda canonical-tabellerna.

• Vid PDF-generering görs en taggaudit för citerade tabeller och figurer, så att äldre produkter inte blandas in.

Nyckeltaggar (för lokalisering av samtliga mellanprodukter): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Konsistensauditens resultat: Tab_AUDIT_checks_strict visar pass=9, fail=0, skip=0 (se release-paketet för detaljer).


A.2 Körsteg för reproducerbarhet och arkivförteckning

Studien använder ett reproducerbarhetssystem med ”publiceringsrapport + supplement för tabeller och figurer + komplett omkörningsbart körpaket”. Läsare kan kontrollera alla tabell- och figurprodukter som citeras i artikeln direkt i Tables & Figures Supplement. Den som vill reproducera värden och auditkedja från noll kan använda full_fit_runpack för att ladda ned data och köra om hela flödet; efter körningen kan tabellvärdenas konsistens verifieras med paketets referenstabelljämförelseskript.


A.2.1 Reproducerbar Quickstart (RUN_FULL, Windows PowerShell)

Detta avsnitt ger en kortare reproduktionsväg för Windows PowerShell. För snabb kontroll rekommenderas att först läsa Tables & Figures Supplement och där punkt för punkt jämföra de tabeller och figurer som citeras i artikeln. För end-to-end-reproduktion och generering av samtliga tabeller, figurer och auditprodukter används full_fit_runpack: kör verify_checksums.ps1 och RUN_FULL.ps1 enligt README/ONE_PAGE_REPRO_CHECKLIST i paketet (rekommenderat Mode=full).

Zenodo-arkivingång (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Taggar för artikelns huvudkedja: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.2.2 Arkivmaterial och viktiga kontrollpunkter (Packages & checks)

Zenodo-arkivet tillhandahåller tre kompletterande materialtyper: (1) publiceringsrapporten (denna text, v1.1, inklusive bilaga B: P1A-stresstest för standardisering av DM-baslinjen); (2) Tables & Figures Supplement, med tabeller och figurer som täcker alla tabeller och bilder som citeras i texten, separat för P1 och P1A; (3) full_fit_runpack, det kompletta reproduktionspaketet som från noll laddar ned data och kör om hela arbetsflödet, separat för P1 och P1A. Punkt (1)–(2) stöder snabb läsning och oberoende kontroll; punkt (3) ger full end-to-end-reproducerbarhet.

Materialkategori

Filnamn (exempel)

Syfte och position (rekommenderad användningsordning)

Publiceringsrapport (kinesiska och engelska)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Fullständig rapport arkiverad på Zenodo; huvudtexten anger huvudslutsatser och robusthetsaudit, medan bilaga B innehåller P1A (stresstest för standardisering av DM-baslinjen).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Alla tabeller (CSV) och figurer (PNG) som citeras i huvudtexten, inklusive genereringsskript och taggfiler.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Alla tabeller och figurer som citeras i bilaga B (P1A), inklusive Tab_S1_P1A_scoreboard och Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

End-to-end full reproduktion: laddar ned data från noll och kör om RC-only/closure/joint samt robusthetsskanningar.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

End-to-end full reproduktion för bilaga B: kör om DM 7+1 + DM_STD (inklusive EFT_BIN-kontroll) och skapar bilageunderlagen; paketet innehåller ett skript för jämförelse med referenstabellen.

Citeringsrekommendation: vid citering av denna artikel eller tillhörande reproduktionsmaterial, ange Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Nyckelprodukter som bör framträda efter reproduktion och kan jämföras:

Bilaga B: P1A — stresstest för standardisering av DM-baslinjen (DM 7+1 + DM_STD; inklusive EFT-kontroll)

Denna bilaga dokumenterar ett utvidgat projekt för ”stresstest av standardiserad DM-baslinje” (P1A), konsekvent med huvudtextens slutningsprotokoll. Dess roll är följande: utan att införa ett stort antal frihetsgrader och utan att ändra den delade mappningen RC-bin→GGL-bin eller auditramverket lyfter den den minimala DM_RAZOR som används i huvudtexten (NFW + fast c–M, utan scatter/kontraktion/core) till en uppsättning DM-baslinjer som ligger närmare astrofysikalisk praxis och bättre tål vanliga invändningar. P1A täcker och överordnar det tidigare tregrenade stresstestet: samtidigt som SCAT/AC/FB behålls läggs hierarkisk c–M scatter + prior, en enparameters core-proxy och linsningssidans shear-kalibrerings-nuisance m till; den kombinerade modellen DM_STD redovisas, och EFT_BIN behålls som jämförelsereferens.

Kompletterande anmärkning: slutningsstyrkor och andra tal i bilaga B (P1A) använder en högre Monte Carlo-budget, till exempel ndraw=400 och nperm=24, än quick-budgeten i huvudtexten, där exempelvis ndraw=60 och nperm=12 används för att täcka hela EFT-kärnfamiljen. Absolutvärden kan därför uppvisa sampling drift av storleksordningen O(10), men jämförelsen mellan modeller inom samma budget och samma tabell är rättvis, och både fördelens tecken och storleksordning är stabila över budgetar.


B.1 Syfte och placering (Why P1A, and why as an Appendix)

P1A försöker inte uttömma alla möjligheter i ΛCDM-halomodellering, såsom icke-sfärisk form, miljöberoende, komplex galax–halo-koppling eller högdimensionell baryonfysik. I stället följer P1A principen ”lågdimensionell, granskningsbar och reproducerbar”: varje förstärkningsmodul inför högst en central effektiv parameter och omfattas fortsatt av artikelns tre hårda begränsningar:
(i) parameterbokföring: varje ny parameter ska skrivas ut tydligt och rapporteras tillsammans med informationskriterierna (AICc/BIC);
(ii) delad mappning: samma gruppmappning RC-bin→GGL-bin används fortfarande, och det är inte tillåtet att ”justera mappningen” för en enskild datamängd;
(iii) slutningstest: varje förstärkning måste visa en verklig vinst i överförbar RC→GGL-prediktion, inte bara bättre RC-only-anpassning.


B.2 DM 7+1 + DM_STD: moduldefinitioner, parametrar och inträde i den gemensamma posterioren

P1A tillhandahåller som separat runpack åtta DM-arbetsytor (DM 7+1) och en EFT-kontroll. Med DM_RAZOR som baslinje konstrueras tre legacy-förstärkningar med en parameter (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), tre mer standardiserade defensiva moduler läggs till (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), och den kombinerade modellen DM_STD redovisas. Deras gemensamma mål är att med minsta möjliga dimensionsökning täcka tre vanliga invändningstyper: (a) hur scatter och prior i c–M-relationen går in i en hierarkisk modell; (b) om huvudverkan av baryonic feedback kan fångas av en enparameters core-proxy; (c) om central systematik på linsningssidan kan misstas för en fysikalisk signal.

Workspace

dm_model

Ny parameter (≤1)

Fysisk motivation (kärna)

Implementeringsprincip (auditvänlig)

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimal och granskningsbar ΛCDM-halo-baslinje; används för strikt jämförelse med EFT

Delad mappning fixerad; strikt parameterbokföring; baseline endast för relativ jämförelse

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

c–M-relationen har spridning; approximeras med en enparameters lognormal scatter

≤1 ny parameter; samma delade mappning; slutningsvinst är acceptanskriteriet

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Baryoniskt infall kan orsaka adiabatisk kontraktion av halot; en enparameters approximation av styrkan

≤1 ny parameter; mappningen ändras inte; rapportera AICc/BIC-förändringar och slutningsvinst

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback kan bilda en core i den inre regionen; approximeras med en enparameters core-skala

≤1 ny parameter; closure/negativ kontroll med samma protokoll; RC-only-förbättring är inte enda målet

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Mer standardiserad hierarki: c_i∼logN(c(M_i),σ_logc); påverkar RC- och GGL-posterioren gemensamt

Prior explicit; latent c_i marginaliseras; förblir lågdimensionellt och granskningsbart

DM_CORE1P

1-parameter core proxy (coreNFW/DC14-inspired)

log r_core

Huvudeffekten av baryonic feedback fångas av en enparameters core-proxy utan högdimensionella detaljer om stjärnbildning

Kopplat till standardlitteratur; ≤1 ny parameter; bundet till slutningstestet

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

Central systematik i svag linsning absorberas av en effektiv parameter för att minska risken för systematics-as-physics

Nuisancebokföring explicit; får inte återverka på RC; robust slutning är huvudmåttet

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

De tre vanligaste invändningstyperna samlas i en fortfarande lågdimensionell standardbaslinje

Parameterbokföring och informationskriterier rapporteras tillsammans; closure är huvudmåttet; starkaste defensiva DM-motparten

Anmärkning: parameternamnen följer den tekniska implementeringen, till exempel σ_logc, α_AC, log r_core och m_shear. P1A:s designfokus är att ”göra DM-baslinjen starkare men fortfarande granskningsbar”, inte att förvandla DM-sidan till en okontrollerbar högdimensionell fitter. I synnerhet inför DM_HIER_CMSCAT c–M scatter hierarkiskt: koncentrationen c_i för varje halo modelleras som en lognormal spridning kring c(M_i) och begränsas av den globala σ_logc och priorn c(M). Denna hierarkiska struktur påverkar den gemensamma posterioren för RC och GGL samtidigt.


B.3 Statistiskt protokoll och produktkonventioner identiska med huvudtexten

P1A återanvänder alla dataprodukter, den delade mappningen och auditramverket från huvudtexten. Körordning och utdataformat är oförändrade:
(1) Run‑1: RC-only-inferens (utdata posterior_samples.npz och metrics.json);
(2) Run‑2: slutningstest RC→GGL (utdata closure_summary.json och permuted baseline);
(3) Run‑3: gemensam anpassning RC+GGL (utdata joint_summary.json).
Alla citerade tal kommer från den automatiska sammanställningstabellen Tab_S1_P1A_scoreboard och kan kontrolleras efter en fullständig omkörning av P1A full_fit_runpack med paketets inbyggda referenstabelljämförelseskript.


B.4 Huvudresultat, ingång till tabeller/figurer och arkiveringsplan (samma DOI)

Detta avsnitt anger P1A:s huvudsakliga kvantitativa slutsatser. Tabell B1 sammanfattar nyckelmåtten för RC-only, slutning RC→GGL och gemensam anpassning RC+GGL; parenteserna anger skillnad mot baseline DM_RAZOR. Slutningsstyrkan definieras som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (större är bättre). Figur B1 visualiserar samma scoreboard. Huvudpunkterna är:
• av de tre legacy-grenarna ger endast DM_RAZOR_FB (feedback/core) en liten nettoökning av slutningsstyrkan: 122.21→129.45 (+7.25); SCAT och AC ger ingen nettovinst;
• de nya DM_HIER_CMSCAT och DM_RAZOR_M har mycket liten effekt på slutningsstyrkan (~0), och DM_CORE1P visar inte heller någon signifikant nettovinst;
• den kombinerade modellen DM_STD förbättrar joint logL kraftigt och närmar sig optimum för den gemensamma anpassningen, men slutningsstyrkan minskar i stället; detta antyder att huvudförbättringen kommer från flexibilitet i den gemensamma anpassningen, inte från överförbarhet mellan sonder;
• EFT_BIN behåller som kontroll en tydlig fördel både i slutningsstyrka och i gemensam anpassning, så huvudtextens slutsats är robust mot införandet av ”starkare DM-baslinje + linsningsnuisance”.

För direkt jämförelse med huvudtexten sammanfattar Tab. S1a–S1b de strikta resultaten för EFT-familjen och DM_RAZOR: EFT-modellerna förbättrar den gemensamma anpassningen relativt DM_RAZOR med ΔlogL_total≈1155–1337 och når ΔlogL_closure=172–281 i slutningstestet. P1A gör endast DM-sidan till en ”svårare motpart”; dess funktion är att minska invändningar av typen ”strawman baseline / systematics-as-physics”, inte att ersätta huvudjämförelsen.

Tabell B1 | P1A-scoreboard (större är bättre; parenteser anger skillnad relativt baseline DM_RAZOR).

Modellgren (workspace)

Δk

RC-only best logL_RC (Δ)

Slutningsstyrka ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Figur B1 | P1A-scoreboard: ΔlogL för slutning och gemensam anpassning relativt baseline (större är bättre).

Exempeltaggar för en redan slutförd körningsgrupp i denna bilaga anges nedan; de används för att lokalisera P1A:s mellanprodukter och tabeller/figurer:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Rekommenderat citeringssätt (Appendix citation note)

När läsaren behöver citera ”stresstestet för standardisering av DM-baslinjen” utöver huvudtextens huvudslutsatser rekommenderar vi att följande läggs till vid citering av artikelns huvudslutsatser: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’