← آزمایش‌ها

P1_RC_GGL: آزمون بستار سخت‌گیرانهٔ دینامیک کهکشان‌ها و عدسی‌گری ضعیف (منحنی‌های چرخش + GGL)

چارچوب گرانش میانگین در EFT در برابر خط پایهٔ حداقلی NFW برای مادهٔ تاریک سرد (DM)

نویسنده: Guanglin Tu
ایمیل: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
وابستگی سازمانی: کارگروه EFT، Shenzhen Energy Filament Science Research Co., Ltd. (چین)
نسخه: v1.1 | تاریخ: 2026-02-14

پیش‌چاپ (داوری همتا نشده) | این نسخه برای انتشار عمومی و بازتولیدپذیری تهیه شده است و نمایندهٔ نسخهٔ نهایی منتشرشده در مجله نیست.

مجوز: گزارش (CC BY-NC-ND 4.0)؛ بستهٔ کامل بازتولید (CC BY 4.0).

گزارش در سطح انتشار (Concept DOI): https://doi.org/10.5281/zenodo.18526334 بستهٔ کامل بازتولید (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 خلاصهٔ اجرایی

این گزارش نسخه‌ای آرشیوی و در سطح انتشار است که در Zenodo سپرده شده است. گزارش، زنجیره‌ای یکپارچه و قابل ممیزی از داده‌ها، دفتر ثبت مدل‌ها، مقایسهٔ منصفانه، آزمون بستار و مواد بازتولیدپذیری ارائه می‌کند. پیوست B (P1A) به‌عنوان مکمل پایداری عمل می‌کند و بر آزمون‌های فشار با «خط پایهٔ DM استانداردتر + یک سیستماتیک کلیدی در عدسی‌گری» تمرکز دارد تا حساسیت نتیجه‌گیری‌های اصلی نسبت به مدل‌سازی واقع‌بینانه‌تر DM و برخورد با سیستماتیک‌های عدسی‌گری سنجیده شود.

نتیجه‌گیری‌های اصلی (چهار گزارهٔ قابل نقل مستقیم؛ بنگرید به بخش 2.4):

(1) در برازش منحنی‌های چرخش (RC)، خانوادهٔ EFT در همهٔ ترکیب‌های هسته/پیشین به‌طور معنادار از DM_RAZOR بهتر عمل می‌کند؛ بهبود نمونه‌وار Δlog𝓛_RC ≈ 10^3 است (بنگرید به جدول S1a).
(2) در آزمون بستار RCGGL، EFT انتقال‌پذیری قوی‌تری میان کاوشگرها نشان می‌دهد: قدرت بستار Δlog𝓛_closure (TruePerm) به‌طور معناداری از DM_RAZOR بالاتر است و این تفاوت در برابر پیمایش‌های covariance shrinkage، R_min و σ_int پایدار می‌ماند (بنگرید به شکل S3 و جدول S1b).
(3) در برازش مشترک (RC+GGL)، EFT برتری پایداری را حفظ می‌کند؛ در کنترل منفی‌ای که نگاشت مشترک را می‌شکند، این برتری فرو می‌ریزد، و از این تفسیر پشتیبانی می‌کند که «اثر گرانش میانگین» از نگاشت مشترک می‌آید، نه از یک برازش تصادفی (بنگرید به شکل S4).
(4) پیوست B (P1A) بدون افزایش چشمگیر بُعد، سویهٔ DM را با ماژول‌های خط پایهٔ DM استانداردتر و یک پارامتر مزاحم کلیدی برای سیستماتیک‌های عدسی‌گری تحت آزمون فشار قرار می‌دهد. این تقویت‌ها برتری بستار EFT را حذف نمی‌کنند (بنگرید به جدول B1 و شکل B1).

دسترس‌پذیری داده و کد: Concept DOI گزارش 10.5281/zenodo.18526334؛ Concept DOI بستهٔ کامل بازتولید 10.5281/zenodo.18526286. برچسب‌های متناظر با پیوست B (P1A) عبارت‌اند از run_tag=20260213_151233، closure_tag=20260213_161731، و joint_tag=20260213_195428.

1 چکیده

ما مقایسه‌ای کمی و بازتولیدپذیر میان دو چارچوب نظری، زیر داده‌های یکسان و پروتکل آماری یکسان، انجام می‌دهیم: مدل «تصحیح گرانش میانگین» که نظریهٔ فیلامنت انرژی (Energy Filament Theory, EFT؛ متمایز از اختصار رایج effective field theory) پیشنهاد می‌کند، و مدل خط پایهٔ هالهٔ NFW برای مادهٔ تاریک سرد (DM_RAZOR). DM_RAZOR عمداً به‌عنوان «خط پایهٔ حداقلی DM» انتخاب شده است: هالهٔ NFW با رابطهٔ ثابت cM (بدون پراکندگی halo-to-halo)، تا کنترل‌گری قابل ممیزی و بازتولیدپذیر فراهم شود. همچنین باید تأکید کرد که این مقاله EFT را برای آزمودن در یک پروتکل آماری یکپارچه، به‌صورت یک پارامتردهی پدیدارشناختیِ شبیه MOND از میدان مؤثر/پاسخ مؤثر به‌کار می‌گیرد، نه اینکه در همین کار اصول نخستین میکروسکوپی آن را استخراج کند.

داده‌ها شامل 2,295 نقطهٔ سرعت از منحنی‌های چرخش SPARC (RC)، پس از پیش‌پردازش و binning یکنواخت (104 کهکشان، 20 bin برای RC)، همراه با چگالی سطحی افزودهٔ ΔΣ(R) در عدسی‌گری ضعیف کهکشان-کهکشان KiDS-1000 (4 bin جرم ستاره‌ای × 15 نقطهٔ R در هر bin، در مجموع 60 نقطه، با استفاده از کواریانس کامل) هستند.

ما به‌ترتیب استنتاج RC-only، آزمون بستار RCGGL، استنتاج GGL-only و استنتاج مشترک RC+GGL را اجرا می‌کنیم و با ممیزی‌های سازگاری اطمینان می‌دهیم که هر مقدار عددی نقل‌شده قابل ردیابی است. زیر دفتر ثبت پارامتر سخت‌گیرانه و قیود نگاشت مشترک (DM: 20 پارامتر log M200_bin؛ EFT: 20 پارامتر log V0_bin + 1 پارامتر جهانی log ℓ)، خانوادهٔ EFT در برازش مشترک به‌طور معنادار از DM_RAZOR بهتر عمل می‌کند: ΔlogL_total = 1155–1337 نسبت به DM_RAZOR. مهم‌تر اینکه آزمون بستار نشان می‌دهد پسین RC توان پیش‌بینی غیر بدیهی برای GGL دارد: قدرت بستار EFT برابر ΔlogL_closure = 172–281 است، بالاتر از مقدار 127 برای DM_RAZOR. هنگامی که گروه‌بندی RC-binGGL-bin به‌طور تصادفی shuffle می‌شود، سیگنال بستار به 6–23 فرو می‌ریزد، و تأیید می‌کند که سیگنال نه تصادف آماری است و نه مصنوع پیاده‌سازی. در پیمایش‌های نظام‌مند σ_int، R_min و covariance shrinkage، برتری نسبی EFT مثبت و از نظر مرتبه پایدار می‌ماند. برای پاسخ به نگرانی‌های رایج مبنی بر اینکه «خط پایهٔ DM بیش از حد ضعیف است» یا «سیستماتیک‌ها به‌جای فیزیک گرفته شده‌اند»، پیوست B (P1A) آزمون فشار خط پایهٔ DM استانداردتر ولی همچنان کم‌بُعد و قابل ممیزی ارائه می‌کند، از جمله hierarchical cM scatter + prior، یک proxy تک‌پارامتری برای core، lensing m، و مدل ترکیبی DM_STD. زیر همان پروتکل بستار، این تقویت‌ها برتری بستار EFT را حذف نمی‌کنند (بنگرید به جدول B1/شکل B1).

کلیدواژه‌ها: منحنی‌های چرخش؛ عدسی‌گری ضعیف کهکشان-کهکشان؛ آزمون بستار؛ EFT؛ مادهٔ تاریک سرد؛ استنتاج بیزی

2 مقدمه و نمای کلی نتایج

منحنی‌های چرخش (RC) و عدسی‌گری ضعیف کهکشان-کهکشان (GGL) دو کاوشگر گرانشی مکمل‌اند: RC پتانسیل دینامیکی و رابطهٔ شتاب شعاعی (RAR) را در صفحهٔ قرص محدود می‌کند، در حالی که GGL توزیع جرم فرافکنده و پاسخ گرانشی در مقیاس هاله را می‌سنجد. برای هر نظریهٔ نامزد، پرسش کلیدی این نیست که آیا می‌تواند دو مجموعه‌داده را جداگانه برازش کند، بلکه این است که آیا می‌تواند آن‌ها را زیر همان نگاشت میان‌داده‌ای و همان قیود مشترک به‌صورت سازگار توضیح دهد.

بر همین اساس، این مقاله «آزمون بستار (closure test)» را پروتکل آماری مرکزی خود قرار می‌دهد: نخست از پسین RC-only برای پیش‌بینی روبه‌جلوی GGL استفاده می‌کنیم، سپس آن را با کنترل منفی‌ای مقایسه می‌کنیم که در آن نگاشت RC-binGGL-bin permuted/shuffled شده است. این کار انتقال‌پذیری پیش‌بینی میان داده‌ها را ارزیابی می‌کند و سیگنال‌های کاذب ناشی از سوگیری پیاده‌سازی یا برازش تصادفی را کنار می‌زند.

جایگاه نظری و دامنه: این مقاله تلاش نمی‌کند استخراج میکروسکوپی از اصول نخستین EFT (نظریهٔ فیلامنت انرژی) یا فرمول‌بندی کامل نسبیتی آن را ارائه دهد. در عوض، EFT را به‌عنوان پارامتردهی کم‌بُعد و شبیه MOND از میدان مؤثر/پاسخ مؤثر (توصیف‌شده با هستهٔ f(x) و مقیاس جهانی ℓ) در نظر می‌گیریم و سازگاری میان‌داده‌ای و توان انتقال پیش‌بینی آن را از راه آزمون بستار RCGGL زیر دفتر ثبت پارامتر سخت‌گیرانه می‌آزماییم.

بیانیهٔ برنامهٔ پژوهشی و دامنه: این مقاله بخشی از برنامهٔ پیوستهٔ بازیابی رصدی سری P است. در داده‌های موجود در مقیاس کهکشان، ما دو سهم پس‌زمینه‌ای مؤثر ممکن را جست‌وجو می‌کنیم: (i) «کف گرانش میانگین» که با پاسخ گرانشی میانگینِ درشت‌دانه/مقیاس‌میانگین‌شده قابل توصیف است، و (ii) «کف تصادفی/نویز» مرتبط با نوسان‌های فرایندهای میکروسکوپی. در این مقاله (P1)، فقط بر اولی تمرکز می‌کنیم: بدون وارد کردن هیچ فرضیه‌ای دربارهٔ سازوکارهای تولید میکروسکوپی، از آزمون بستار RCGGL برای بازیابی نشانه‌های رصدی کف گرانش میانگین استفاده می‌کنیم و آن را زیر پروتکل کنترل یکپارچه با خط پایهٔ DM قابل ممیزی مقایسه می‌کنیم. به‌عنوان تصویر فیزیکی راهنما، اگر درجات آزادی کوتاه‌عمر وجود داشته باشند، واپاشی/نابودی آن‌ها می‌تواند جرم سکون را به انرژی-تکانهٔ حامل‌شده توسط درجات آزادی دیگر تبدیل کند؛ این امر در سطح مؤثر به‌طور طبیعی با تجزیهٔ «سهم میانگین + سهم نوسانی» متناظر است. با این حال، این مقاله آن تصویر میکروسکوپی را به‌صورت کمی مدل‌سازی نمی‌کند.

برای جلوگیری از تفسیر افراطی، مرزهای دامنهٔ این مقاله چنین است:
• این مقاله چه می‌کند: زیر قیود سخت‌گیرانهٔ دفتر ثبت پارامتر و نگاشت مشترک، از آزمون بستار برای سنجش انتقال‌پذیری پیش‌بینی میان داده‌ها استفاده می‌کند و مقایسه‌ای بازتولیدپذیر میان پاسخ گرانش میانگین در EFT و یک خط پایهٔ DM انجام می‌دهد.
• این مقاله چه نمی‌کند: سازوکارهای تولید میکروسکوپی، فراوانی/طول عمر یا قیود کیهان‌شناختی را بررسی نمی‌کند؛ جملهٔ تصادفی متناظر با «کف نویز» را مدل‌سازی نمی‌کند.
• این مقاله چه ادعا نمی‌کند: هدف آن برانداختن مادهٔ تاریک نیست؛ P1 حکم نهایی دربارهٔ وجود یا نبود چنین «کفی» صادر نمی‌کند، بلکه شواهد مرحله‌ای گزارش می‌دهد — یعنی در دامنهٔ سنجش پایدار انتخاب‌شده در اینجا، داده‌ها مدل‌هایی را ترجیح می‌دهند که شامل پاسخ گرانشی میانگین‌اند.

در عین حال روشن می‌کنیم که DM_RAZOR تنها یک خط پایهٔ NFW حداقلی و قابل ممیزی را نمایندگی می‌کند (cM ثابت و بدون scatter؛ بدون adiabatic contraction، feedback core، ناكروی‌بودن، یا جمله‌های محیطی). بنابراین نتیجهٔ اصلی متن دقیقاً به این گزاره محدود است: زیر خط پایهٔ حداقلی و قیود سخت‌گیرانهٔ دفتر ثبت پارامتر/نگاشت، EFT سازگاری قوی‌تری میان داده‌ها نشان می‌دهد. برای پاسخ به این پرسش رایج که آیا خط پایهٔ ΛCDM استانداردتر و مدل‌سازی سیستماتیک‌های کلیدی عدسی‌گری نتیجه را به‌طور جدی تغییر می‌دهند یا نه، تقویت‌های DM استانداردتر اما همچنان کم‌بُعد و قابل ممیزی و یک مزاحم در سوی عدسی‌گری را در پیوست B گرد آورده‌ایم (P1A: آزمون فشار استانداردسازی خط پایهٔ DM)، در حالی که نگاشت مشترک و پروتکل آزمون بستار دقیقاً همان متن اصلی باقی می‌ماند (بنگرید به جدول B1/شکل B1).

2.1 جدول S1aS1b: خلاصهٔ شاخص‌های کلیدی (Strict)

جدول S1a شاخص‌های اصلی مقایسه برای برازش مشترک (RC+GGL) را گزارش می‌کند: logL، ΔlogL، AICc و BIC. جدول S1b شاخص‌های آزمون بستار و پیمایش پایداری را گزارش می‌کند: بستار، کنترل منفی shuffle، و دامنه‌های پیمایش σ_int / R_min / cov-shrink. همهٔ مقادیر از جدول خلاصهٔ اصلی سخت‌گیرانه Tab_Z1_master_summary می‌آیند و در بستهٔ آرشیو انتشار، بند به بند قابل ردیابی‌اند.

جدول S1a | شاخص‌های اصلی مقایسهٔ برازش مشترک (RC+GGL، Strict).

BIC

AICc

ΔlogL_total در برابر DM

logL_total مشترک (بهترین)

k

هستهٔ W

مدل (workspace)

34010.811

33895.885

0.0

-16927.763

20

none

DM_RAZOR

31344.155

31223.501

1337.21

-15590.552

21

none

EFT_BIN

31500.711

31380.057

1258.932

-15668.83

21

exponential

EFT_WEXP

31708.922

31588.268

1154.827

-15772.936

21

yukawa

EFT_WYUK

31429.692

31309.038

1294.442

-15633.321

21

powerlaw_tail

EFT_WPOW

جدول S1b | شاخص‌های بستار و پایداری (Strict).

دامنهٔ ΔlogL در پیمایش cov-shrink

دامنهٔ ΔlogL در پیمایش R_min

دامنهٔ ΔlogL در پیمایش σ_int

ΔlogL کنترل منفی پس از shuffle

ΔlogL بستار (true-perm)

مدل (workspace)

22.725

126.678

DM_RAZOR

1337–1351

1243–1289

459–1548

14.984

231.611

EFT_BIN

1259–1277

1169–1207

408–1471

6.04

171.977

EFT_WEXP

1155–1166

1065–1099

380–1341

14.688

179.808

EFT_WYUK

1294–1308

1203–1247

457–1500

6.672

280.513

EFT_WPOW


2.2 شکل S3: قدرت بستار (RC-onlyGGL پیش‌بینی‌شده)

قدرت بستار به‌صورت ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ تعریف می‌شود: روی نمونه‌های پسین RC-only، GGL به‌صورت روبه‌جلو پیش‌بینی می‌شود و با کنترل منفی‌ای مقایسه می‌شود که در آن نگاشت RC-binGGL-bin permuted شده است.

شکل S3 | قدرت بستار (بزرگ‌تر بهتر است): برتری میانگین log-likelihood برای پیش‌بینی RC-onlyGGL.


2.3 شکل S4: مقایسهٔ اصلی برازش مشترک (RC+GGL)

برتری برازش مشترک به‌صورت ΔlogL_totallogL_total(model)logL_total(DM_RAZOR) تعریف می‌شود. زیر داده‌های یکسان، نگاشت یکسان و مقیاس پارامتر تقریباً یکسان، خانوادهٔ EFT به log-likelihood مشترک بسیار بالاتری دست می‌یابد.

شکل S4 | برتری برازش مشترک (بزرگ‌تر بهتر است): بهترین logL_total برای RC+GGL نسبت به DM_RAZOR.


2.4 چهار نتیجه‌گیری (قابل نقل مستقیم)

(1) در یک تحلیل مشترک یکپارچه از منحنی‌های چرخش SPARC و عدسی‌گری ضعیف KiDS-1000، مدل چارچوب گرانش میانگین EFT زیر پروتکل کنترل سخت‌گیرانه به‌طور نظام‌مند از DM_RAZOR بهتر عمل می‌کند: ΔlogL_total = 1155–1337 نسبت به DM_RAZOR.

(2) آزمون بستار RCGGL سازگاری پیش‌بینی قوی‌تری برای EFT نشان می‌دهد: ΔlogL_closure = 172–281، در مقایسه با 127 برای DM_RAZOR. وقتی گروه‌بندی RC-binGGL-bin به‌طور تصادفی shuffle می‌شود، سیگنال بستار به 6–23 فرو می‌ریزد، و نشان می‌دهد که سیگنال به نگاشت درست میان داده‌ها وابسته است، نه به برازش تصادفی.

(3) پیمایش‌های نظام‌مند σ_int، R_min و shrinkage کواریانس، علامت یا مقیاس گزارهٔ «EFT از DM_RAZOR بهتر عمل می‌کند» را تغییر نمی‌دهند؛ این امر نشان می‌دهد نتیجه نسبت به اختلال‌های سیستماتیک رایج پایدار است.

(4) زیر همان پروتکل بستار، پیوست B (P1A) خط پایهٔ DM را به شیوه‌ای «استانداردشده و قابل ممیزی» تقویت می‌کند: سه تقویت تک‌پارامتری (SCAT/AC/FB) را نگه می‌دارد و hierarchical cM scatter + prior، یک proxy تک‌پارامتری برای core و m کالیبراسیون shear در سوی عدسی‌گری (و مدل ترکیبی آن‌ها DM_STD) را می‌افزاید. نتایج نشان می‌دهد که فقط شاخهٔ feedback/core بهبود خالص کوچکی در قدرت بستار می‌آورد (122.21129.45، ΔΔlogL_closure≈+7.25)؛ دیگر تقویت‌ها سهم ناچیز یا منفی در قدرت بستار دارند. بنابراین نتیجهٔ اصلی به این وابسته نیست که DM_RAZOR خط پایه‌ای بیش از حد ضعیف باشد.

3 داده‌ها و پیش‌پردازش

این مطالعه از دو مجموعه‌دادهٔ عمومی استفاده می‌کند. در جریان کار مهندسی، دانلود، راستی‌آزمایی checksum (sha256) و پیش‌پردازش با اسکریپت‌های قابل ردیابی انجام می‌شود. برای تضمین مقایسهٔ منصفانهٔ میان مدل‌ها، همهٔ workspaceها (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) دقیقاً همان محصولات داده و نگاشت‌های bin را به اشتراک می‌گذارند.


3.1 منحنی‌های چرخش (RC، SPARC)

داده‌های RC از فایل‌های Rotmod_LTG پایگاه SPARC می‌آیند (175 فایل rotmod). پس از پیش‌پردازش، نمونهٔ مدل‌سازی شامل 104 کهکشان و 2,295 نقطهٔ دادهٔ (r, V_obs) است که بر اساس جرم ستاره‌ای و معیارهای مرتبط به 20 bin برای RC تقسیم شده‌اند. هر نقطهٔ داده شامل شعاع r (kpc)، سرعت مشاهده‌شده V_obs (km/s)، خطای مشاهده‌ای σ_obs و سرعت‌های مؤلفه‌های گاز/دیسک/برآمدگی (V_gas, V_disk, V_bul) است.


3.2 عدسی‌گری ضعیف (GGL، KiDS-1000 / Brouwer+2021)

داده‌های GGL از چگالی سطحی افزودهٔ ΔΣ(R) در شکل 3 مقالهٔ Brouwer و همکاران (2021)، بر پایهٔ KiDS-1000، استفاده می‌کنند (4 bin جرم ستاره‌ای، 15 نقطهٔ R در هر bin)، همراه با کواریانس کامل ارائه‌شده. در جریان کار مهندسی، کواریانس اصلیِ long-form برای هر bin به ماتریس 15×15 بازسازی می‌شود و ممیزی‌های Stage-B معقول‌بودن ابعادی و عددی را تأیید می‌کنند.


3.3 نگاشت RC-binGGL-bin و اندازهٔ کل نمونه

چهار bin جرمی GGL و بیست bin برای RC از راه یک نگاشت ثابت به هم متصل می‌شوند: هر bin در GGL متناظر با 5 bin در RC است و سهم‌های RC-bin بر اساس تعداد کهکشان‌ها وزن‌دهی می‌شوند. این نگاشت در همهٔ مدل‌ها ثابت نگه داشته می‌شود و قید مرکزی برای مقایسهٔ منصفانه در آزمون بستار و برازش مشترک است. مجموعه‌دادهٔ مشترک نهایی شامل n_total = 2355 نقطه است (RC=2295، GGL=60).

4 مدل‌ها و روش‌های آماری


4.1 مشخصه‌گذاری ریاضی حداقلی برای EFT و DM (قابل ممیزی/قابل آزمون)

این بخش مشخصه‌گذاری ریاضی حداقلی را ارائه می‌کند که مستقیماً به پیاده‌سازی نگاشت می‌شود.

(a) مدل منحنی چرخش (RC)

برای هر نقطهٔ دادهٔ RC یعنی (r, V_obs, σ_obs)، از برهم‌نهی مؤلفه‌ها استفاده می‌کنیم: V_mod²(r) = V_bar²(r) + V_extra²(r). در اینجا V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). نتایج اصلی این مقاله Υ_d = Υ_b = 0.5 را به‌کار می‌گیرند که با توصیه‌های تجربی SPARC سازگار است و برای کاهش درجات آزادی غیرضروری مفید است.

(b) تصحیح گرانش میانگین EFT (EFT)

جملهٔ اضافی EFT در قالب «میانگین مجذور سرعت» پارامتردهی می‌شود: V_extra²(r) = V0_bin² · f(r/ℓ). در اینجا V0_bin پارامتر دامنه برای هر bin در RC است (20 پارامتر)، ℓ یک مقیاس جهانی است (1 پارامتر)، و f(x) تابع شکل هستهٔ بی‌بُعد است. شکل‌های هسته‌ای که در این مقاله مقایسه می‌شوند (هیچ‌کدام درجهٔ آزادی پیوستهٔ اضافی وارد نمی‌کنند) عبارت‌اند از:

انگیزهٔ فیزیکی (گسترش‌یافته): EFT پاسخ گرانشی اضافی در مقیاس‌های کهکشانی را به‌عنوان پاسخ مؤثری تفسیر می‌کند که از درشت‌دانه‌سازی/میانگین‌گیری مقیاسیِ کنش‌های میکروسکوپی‌تر روی مقیاس‌های محدود به‌دست می‌آید. در این مقاله هیچ سازوکار میکروسکوپی مشخصی را فرض نمی‌کنیم؛ در عوض، برای مقایسهٔ کنترل‌شده و آزمون زیر یک پروتکل آماری یکپارچه، از پارامتردهی حداقلی و قابل ممیزی استفاده می‌کنیم.

برای شهود، جملهٔ اضافی را می‌توان در قالب شتاب نوشت: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). وقتی r≫ℓ، f→1 و V_extraV0_bin می‌شود و سهم سرعت اضافی تقریباً تختی در ناحیهٔ بیرونی ایجاد می‌کند. وقتی r≪ℓ و f(x)x باشد، می‌توان مقیاس شتاب مشخصهٔ a0,binV0_bin²/ℓ را وارد کرد (تا یک عامل O(1) وابسته به تابع هسته)، که شهودی شبیه MOND برای مقیاس گذار درونی به بیرونی فراهم می‌آورد.

خانوادهٔ هسته‌ای گسستهٔ استفاده‌شده در اینجا (none/exponential/yukawa/powerlaw_tail) را می‌توان proxyهای کم‌بُعد برای «شیب‌های اولیه / سرعت‌های گذار / دُم‌های بردبلند» متفاوت دانست (برای نمونه، پوشانندگی شبیه Yukawa در برابر پاسخی با دُم بلندتر). این‌ها برای آزمون فشار پایداری به‌کار می‌روند، نه برای فرسودن کل فضای مدل. در مؤلفهٔ عدسی‌گری ضعیف، از V_avg(r) جرم و چگالی پوش مؤثر را می‌سازیم و سپس آن‌ها را تصویر می‌کنیم تا ΔΣ(R) به‌دست آید. این چگالی مؤثر باید به‌عنوان توصیفی مؤثر از پتانسیل عدسی‌گری زیر فرض‌های تقارن کروی و نگاشت میدان ضعیف فهمیده شود (جزئیات کامل به پیوست A منتقل شده است).

همهٔ شکل‌های هستهٔ بالا f(x)→1 را وقتی x→∞ برآورده می‌کنند (یعنی اشباع V_extra²→V0²)، در حالی که برای x≪1 رشد خطی یا زیرخطی می‌دهند: برای نمونه، exponential: fx؛ yukawa: f0.5x؛ powerlaw_tail: f0.5x. بنابراین شکل‌های هسته‌ای مختلف در «شیب اولیه» در شعاع کوچک، سرعت گذار و دُم بیرونی تفاوت‌های مشاهده‌پذیر دارند و با آزمون‌های مشترک RC+GGL و بستار قابل تمایزند.

پیش‌بینی EFT برای ΔΣ(R) در عدسی‌گری ضعیف با استنتاج جرم و چگالی پوش از V_avg(r) و سپس انتگرال‌گیری‌های تصویرسازی به‌دست می‌آید: M_enc(r)=r·V_avg²(r)/G، ρ(r)=(1/4πr²)·dM_enc/dr، Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr، و ΔΣ(R)=Σ̄(<R)−Σ(R). پیاده‌سازی عددی از شبکهٔ لگاریتمی استفاده می‌کند و در موارد استثنایی آن را به‌صورت تطبیقی ریزتر می‌سازد تا پایداری و بازتولیدپذیری تضمین شود.

(c) DM_RAZOR: خط پایهٔ هالهٔ NFW برای مادهٔ تاریک سرد

در عین حال روشن می‌کنیم که DM_RAZOR تنها یک خط پایهٔ NFW حداقلی و قابل ممیزی را نمایندگی می‌کند (cM ثابت و بدون scatter؛ بدون adiabatic contraction، feedback core، ناكروی‌بودن یا جمله‌های محیطی). برای کاهش خطر «خط پایهٔ پوشالی»، این مقاله ادعا نمی‌کند که چنین اثرهایی وجود ندارند. بلکه آن‌ها را در پیوست B (P1A) به‌صورت آزمون‌های فشار کم‌بُعد و قابل ممیزی وارد می‌کند، از جمله برخورد سلسله‌مراتبی با cM scatter، یک proxy برای core و یک مزاحم کالیبراسیون shear در سوی عدسی‌گری.


4.2 دفتر ثبت مدل و مقایسهٔ منصفانه (پارامترهای مشترک = تعریف بستار)

تعداد پارامترها در مجموعهٔ مقایسهٔ اصلی چنین است: DM_RAZOR k=20؛ خانوادهٔ EFT k=21 (پارامتر اضافی، log ℓ جهانی است). همهٔ مدل‌ها همان داده‌های RC، همان داده‌ها و کواریانس GGL، همان نگاشت RC-binGGL-bin، همان جمله‌های باریونی و همان تبدیل‌های واحد را به اشتراک می‌گذارند. افزون بر این، شکل هسته (none / exponential / yukawa / powerlaw_tail) انتخابی گسسته است و هیچ پارامتر پیوستهٔ اضافی وارد نمی‌کند؛ بنابراین امکان کسب برتری با «یک درجهٔ آزادی اضافی» از میان می‌رود.


4.3 درست‌نمایی، پیشین‌ها و نمونه‌گیر

درست‌نمایی RC گاوسی قطری است: σ_eff² = σ_obs² + σ_int². نتایج اصلی σ_int=5 km/s را ثابت می‌گیرند و Run-5 روی σ_int پیمایش می‌کند. درست‌نمایی GGL برای هر bin از گاوسی با کواریانس کامل استفاده می‌کند: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). تابع هدف مشترک logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) است. پیشین‌ها عمدتاً مرزهای فیزیکی ممکن را کدگذاری می‌کنند (قیود بازه‌ای بر log ℓ، log V0 و log M200)؛ هنگامی که Υ و σ_int آزاد می‌شوند، از پیشین‌های کم‌اطلاع استفاده می‌شود (برای جزئیات به پیاده‌سازی و پیکربندی بستهٔ انتشار بنگرید).

نمونه‌گیر از random walk متروپولیس با بلوک تطبیقی استفاده می‌کند: در هر گام فقط یک زیر‌بلوک تصادفی از فضای پارامتر به‌روزرسانی می‌شود تا نرخ پذیرش در ابعاد بالا بهتر شود، و اندازهٔ گام با نرخ پذیرش پنجره‌ای به‌نرمی تطبیق می‌یابد (نرخ پذیرش هدف حدود 0.25). نتایج اصلی از quick mode استفاده می‌کنند (تنظیماتی مانند n_steps=800)، و هر workspace ردپاها، باقی‌مانده‌ها و نمودارهای PPC را برای ممیزی دستی و اسکریپتی خروجی می‌دهد.


4.4 آزمون بستار و کنترل منفی (تعریف)

آزمون بستار (Run-2) می‌آزماید که آیا پسین RC-only می‌تواند بدون بازبرازش GGL آن را پیش‌بینی کند یا نه. به‌طور مشخص، ΔΣ(R) برای 4 bin در GGL از نمونه‌های پسین RC-only به‌صورت روبه‌جلو تولید می‌شود و logL_true با کواریانس کامل محاسبه می‌گردد؛ سپس نگاشت گروهی RC-binGGL-bin به‌صورت تصادفی permute می‌شود تا logL_perm به‌دست آید. قدرت بستار به‌صورت ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ تعریف می‌شود. افزون بر این، Run-10 بیست bin در RC را به‌طور تصادفی به 4×5 گروه‌بندی دوباره می‌کند (shuffle) و بستار را دوباره محاسبه می‌کند تا سنجیده شود سیگنال بستار تا چه اندازه به نگاشت درست وابسته است.

5 نتایج اصلی و تفسیر


5.1 نتایج اصلی برازش مشترک (RC+GGL)

بهترین logL_total از برازش مشترک و برتری نسبی ΔlogL_total (نسبت به DM_RAZOR) در جدول S1a و شکل S4 نشان داده شده‌اند. در مجموعهٔ مقایسهٔ اصلی، EFT_BIN بزرگ‌ترین برتری مشترک را دارد (ΔlogL_total=1337.210)، در حالی که دیگر شکل‌های هسته‌ای EFT نیز برتری‌های چشمگیری حفظ می‌کنند (1154.8271294.442). بر اساس معیارهای اطلاعاتی (AICc/BIC)، خانوادهٔ EFT نیز به‌طور معنادار از DM_RAZOR بهتر عمل می‌کند؛ این نشان می‌دهد برتری ناشی از سوگیری تعداد پارامترها نیست.

نکته: سهم اصلی در ΔlogL_total≈1337 از جملهٔ RC می‌آید (ΔlogL_RC≈1065 در تجزیهٔ مشترک، حدود 80%). این را می‌توان به‌صورت بهبود متوسط حدود Δχ²≈0.90 برای هر نقطه در N=2295 نقطهٔ دادهٔ RC فهمید که در یک درست‌نمایی گاوسی قطری به‌طور طبیعی به برتری از مرتبهٔ 10^3 انباشته می‌شود. در عین حال، GGL و آزمون بستار قیود مستقل میان‌مجموعه‌داده‌ای فراهم می‌کنند و رتبه‌بندی زیر آزمون‌های فشار σ_int، R_min و cov-shrink پایدار می‌ماند (بنگرید به بخش 6 و جدول S1b).


5.2 نتایج آزمون بستار (RC-onlyGGL)

کمیت کلیدی آزمون بستار، ΔlogL_closure، در جدول S1b و شکل S3 گزارش شده است. خانوادهٔ EFT قدرت بستاری برابر 171.977280.513 دارد که از 126.678 برای DM_RAZOR بالاتر است. این یعنی بدون اجازه‌دادن به درجات آزادی میان‌داده‌ای اضافی، نمونه‌های پسینی که EFT از داده‌های RC به‌دست می‌آورد، توان پیش‌بینی انتقال‌پذیر قوی‌تری برای داده‌های GGL دارند.

کنترل منفی اهمیت فیزیکی سیگنال بستار را بیشتر پشتیبانی می‌کند: وقتی گروه‌بندی RC-binGGL-bin به‌طور تصادفی shuffle می‌شود، قدرت بستار EFT به 6–15 کاهش می‌یابد (با تفاوت‌های کوچک میان هسته‌ها)، در حالی که قدرت بستار پایه به 172–281 می‌رسد. این «فروپاشی سیگنال» برتری‌های کاذب ناشی از پیاده‌سازی عددی، خطاهای واحد یا برخورد نادرست با کواریانس را رد می‌کند.

شکل R1 | کنترل منفی: پس از گروه‌بندی shuffle، سیگنال بستار به‌طور معنادار کاهش می‌یابد (ترسیم‌شده از شاخص‌های Tab_Z1).


5.3 معنای نتایج و حدود آن‌ها

نتیجهٔ این مطالعه این است که «زیر این مجموعه‌داده و این پروتکل، تصحیح گرانش میانگین EFT از خط پایهٔ DM_RAZOR آزموده‌شده بهتر عمل می‌کند». باید تأکید کرد که سویهٔ DM فقط از خط پایهٔ NFW حداقلی با رابطهٔ ثابت c(M) استفاده می‌کند، بدون core formation، ناكروی‌بودن، جمله‌های محیطی یا مدل‌های پیچیده‌تر اتصال کهکشان-هاله. بنابراین این دست‌نوشته ادعا نمی‌کند همهٔ خانواده‌های مدل DM را رد می‌کند. بلکه یک خط پایهٔ کنترل بازتولیدپذیر و مرکز‌یافته بر آزمون بستار ارائه می‌کند برای ارزیابی اینکه آیا RC و GGL را می‌توان با همان پارامترها و نگاشت میان‌داده‌ای به‌صورت سازگار توضیح داد.

برای پاسخ به این نگرانی رایج، یک پروژهٔ گسترش مستقل به نام P1A را تکمیل کرده‌ایم (بنگرید به پیوست B). بدون تغییر نگاشت مشترک RC-binGGL-bin یا چارچوب ممیزی، این پروژه خط پایهٔ DM را به شیوه‌ای «استانداردشده و قابل ممیزی» تقویت می‌کند: فراتر از سه تقویت تک‌پارامتری (SCAT/AC/FB)، (i) hierarchical cM scatter + massconcentration prior (DM_HIER_CMSCAT)، (ii) یک proxy تک‌پارامتری برای core ناشی از بازخورد باریونی (DM_CORE1P)، و (iii) مزاحم m برای کالیبراسیون shear در سوی عدسی‌گری ضعیف (DM_RAZOR_M) را اضافه می‌کند و مدل ترکیبی DM_STD را گزارش می‌دهد؛ EFT_BIN به‌عنوان مرجع کنترل حفظ می‌شود.

DM_RAZOR_SCAT (cM scatter) — پارامتر پراکندگی تمرکز halo-to-halo یعنی σ_logc را وارد می‌کند تا بیازماید آیا c(M) ثابت، توان توضیحی DM را به‌طور نظام‌مند کمتر از واقع برآورد می‌کند یا نه؛
DM_RAZOR_AC (Adiabatic Contraction) — با یک پارامتر α_AC بین «بدون انقباض» و «انقباض استاندارد» به‌صورت پیوسته درون‌یابی می‌کند و گرایش باریون‌ها به فشرده‌کردن هالهٔ درونی را با کمترین هزینه ثبت می‌کند؛
DM_RAZOR_FB (Feedback/core) — از یک مقیاس core (برای مثال log r_core) استفاده می‌کند تا چگونگی سرکوب منحنی‌های چرخش توسط تشکیل core درونی را توصیف کند، در حالی که تقریب NFW را در مقیاس‌های عدسی‌گری ضعیف حفظ می‌کند.

scoreboard کمی P1A در پیوست B، جدول B1 / شکل B1 ارائه شده است (به‌صورت خودکار از Tab_S1_P1A_scoreboard تولید شده). در شاخص بستار، DM_RAZOR_FB بهبود خالص کوچکی می‌دهد (122.21129.45، +7.25)، در حالی که دیگر تقویت‌ها در قدرت بستار سهم ناچیز یا منفی دارند. در سوی برازش مشترک، افزودن پیشین پراکندگی cM سلسله‌مراتبی (DM_HIER_CMSCAT) یا مدل ترکیبی (DM_STD) می‌تواند logL مشترک را به‌طور چشمگیر بهتر کند، اما قدرت بستار را بهتر نمی‌کند؛ این نشان می‌دهد که عمدتاً انعطاف برازش مشترک می‌افزاید، نه انتقال‌پذیری میان کاوشگرها. بنابراین نتیجهٔ محوری متن اصلی باید چنین خوانده شود: زیر قیود سخت‌گیرانهٔ نگاشت مشترک و آزمون بستار، برتری سازگاری میان‌داده‌ای EFT از انتخاب یک «خط پایهٔ بیش از حد ضعیف» در سوی DM ناشی نمی‌شود. بستهٔ انتشار P1A متناظر با پیوست B (جداول/شکل‌های تکمیلی و full_fit_runpack) به‌عنوان فایل‌های اضافی زیر همان Zenodo Concept DOI بستهٔ full_fit_runpack این مقاله قرار خواهد گرفت: https://doi.org/10.5281/zenodo.18526286.

6 پایداری و آزمایش‌های کنترل


6.1 پیمایش σ_int (Run-5)

ما پراکندگی ذاتی RC یعنی σ_int را به‌طور نظام‌مند پیمایش می‌کنیم و در هر σ_int استنتاج مشترک را تکرار می‌کنیم و ΔlogL_total را نسبت به DM_RAZOR محاسبه می‌کنیم. کمینه/بیشینهٔ مقادیر ΔlogL_total برای هر مدل در دامنهٔ پیمایش، در جدول S1b گزارش شده است.

شکل R2 | دامنهٔ ΔlogL_total زیر پیمایش σ_int (بزرگ‌تر بهتر است).


6.2 پیمایش R_min (Run-6)

برای آزمودن اثر سیستماتیک‌های داده‌های ناحیهٔ مرکزی (مانند حرکت غیرمدور، وضوح، و مدل‌سازی ناکافی باریونی)، برش‌های آستانهٔ R_min را روی RC اعمال می‌کنیم و استنتاج مشترک را تکرار می‌کنیم. برتری خانوادهٔ EFT در پیمایش R_min از نظر علامت مثبت و از نظر مقیاس پایدار می‌ماند.

شکل R3 | دامنهٔ ΔlogL_total زیر پیمایش R_min (بزرگ‌تر بهتر است).


6.3 پیمایش cov-shrink (Run-7)

برای آزمودن نااطمینانی در کواریانس GGL، روی ماتریس کواریانس هر bin جرمی shrinkage اعمال می‌کنیم: C_α=(1−α)C+α·diag(C)، و α را پیمایش می‌کنیم. نتایج نشان می‌دهند که برتری خانوادهٔ EFT نسبت به این برخورد حساس نیست.

شکل R4 | دامنهٔ ΔlogL_total زیر پیمایش cov-shrink (بزرگ‌تر بهتر است).


6.4 نردبان ablation (Run-8)

درون EFT_BIN، ablationهای تودرتو انجام می‌دهیم: از مدل حداقلی (بدون پارامتر آزاد) تا نسخه‌هایی که فقط تعداد اندکی درجهٔ آزادی را نگه می‌دارند، و در نهایت مدل کامل با دامنهٔ 20-bin + مقیاس جهانی. AICc/BIC نشان می‌دهند که مدل کامل EFT_BIN به‌شدت توسط داده‌ها طلب می‌شود.

شکل R5 | نردبان ablation برای EFT_BIN (AICc؛ کوچک‌تر بهتر است).


6.5 پیش‌بینی holdout (Run-9)

ما آزمون leave-one-bin-out (LOO) را نیز اجرا می‌کنیم: از میان 4 bin جرمی GGL، هر بار یک bin کنار گذاشته می‌شود؛ استنتاج با استفاده از binهای باقی‌مانده (و همهٔ RC) دوباره انجام می‌شود، و سپس log-likelihood آزمون روی bin کنارگذاشته‌شده ارزیابی می‌شود. شاخص‌های خلاصه در جدول تکمیلی Tab_R3_leave_one_bin_out آمده‌اند (محصول Run-9؛ الگوهای مسیر فایل در فهرست محصولات کلیدی بخش 8.2 ذکر شده‌اند). خانوادهٔ EFT حتی در بدترین مورد holdout نیز آشکارا از DM_RAZOR بهتر می‌ماند.

شکل R6 | LOO: توزیع log-likelihood برای bin کنارگذاشته‌شده (از محصولات Run-9).


6.6 کنترل منفی: shuffle کردن RC-bin (Run-10)

Run-10 بیست bin در RC را به‌طور تصادفی به 4×5 گروه‌بندی دوباره می‌کند و بستار را با ثابت نگه داشتن پسین RC-only دوباره محاسبه می‌کند. نتایج نشان می‌دهد که در مقایسه با نگاشت اصلی، shuffle کردن هم میانگین logL_true در بستار و هم ΔlogL_closure را به‌طور چشمگیر کاهش می‌دهد (بنگرید به جدول S1b و شکل R1)، و این امر تفسیرپذیری سیگنال بستار را بیشتر پشتیبانی می‌کند.

شکل R7 | کنترل منفی: نگاشت shuffle باعث افت آشکار در میانگین بستار logL_true می‌شود (از محصولات Run-10).

7 ردیابی‌پذیری و ممیزی سازگاری (منشأ)

همهٔ مقادیر عددی نقل‌شده در این مقاله در جدول‌های خلاصهٔ سخت‌گیرانه و سوابق ممیزی آرشیو انتشار، بند به بند قابل ردیابی‌اند. برای خواناتر ماندن متن اصلی، زنجیرهٔ کامل منشأ (فهرست برچسب‌ها، جدول‌های ممیزی، فهرست checksum و روش راستی‌آزمایی) به پیوست A منتقل شده است.

8 بازتولیدپذیری و آرشیو Zenodo

بیانیهٔ دسترس‌پذیری داده و کد: داده‌های منحنی چرخش SPARC و داده‌های عدسی‌گری ضعیف KiDS-1000 که در این مقاله استفاده شده‌اند، مجموعه‌داده‌های عمومی‌اند. گزارش در سطح انتشار در Zenodo آرشیو شده است (Concept DOI: https://doi.org/10.5281/zenodo.18526334)، و بستهٔ کامل بازتولید نیز در Zenodo آرشیو شده است (Concept DOI: https://doi.org/10.5281/zenodo.18526286). گام‌های اجرایی تفصیلی، محیط وابستگی‌ها، inventory آرشیو و اطلاعات راستی‌آزمایی hash در پیوست A ارائه شده‌اند؛ طراحی، برچسب‌های اجرا و خروجی‌های آزمون فشار استانداردسازی خط پایهٔ DM (P1A) در پیوست B آمده‌اند.

زیر همان Concept DOI بستهٔ کامل بازتولید (https://doi.org/10.5281/zenodo.18526286)، دو نقطهٔ ورود بازتولیدپذیر را بر اساس مورد استفاده فراهم می‌کنیم: • P1 (متن اصلی) full_fit_runpack: تحلیل‌های RC-only / closure / joint و پیمایش‌های پایداری برای EFT در برابر DM_RAZOR را بازتولید می‌کند و دارایی‌های متن اصلی از جمله جدول‌های S1a/S1b و شکل‌های S3/S4 را می‌سازد؛ • P1A (پیوست B) full_fit_runpack: آزمون فشار استانداردسازی خط پایهٔ DM را بازتولید می‌کند (SCAT/AC/FB + hierarchical cM scatter prior + core1p + lensing m + DM_STD، شامل کنترل EFT_BIN)، و جدول B1 و شکل B1 پیوست را می‌سازد. جداول/شکل‌های تکمیلی P1A و full_fit_runpack به‌عنوان فایل‌های اضافی زیر همان Concept DOI قرار خواهند گرفت تا یک نقطهٔ ورود آرشیوی واحد حفظ شود.

9 سپاسگزاری‌ها و اظهارنامه‌ها


9.1 سپاسگزاری‌ها

از تیم‌های SPARC و KiDS-1000 برای فراهم‌کردن داده‌ها و مستندات عمومی، و از مشارکت‌کنندگان در جریان کار بازسازی و ممیزی این پروژه سپاسگزاری می‌کنیم.


9.2 مشارکت‌های نویسنده

Guanglin Tu مسئول پیشنهاد مفهومی، طراحی مطالعه، پیاده‌سازی مهندسی، سازمان‌دهی داده، تحلیل صوری، اجرای جریان کار بازتولیدپذیری و ممیزی، و نگارش دست‌نوشته بوده است.


9.3 تأمین مالی

تأمین مالی شخصی توسط نویسنده، Guanglin Tu (بدون تأمین مالی بیرونی / بدون شمارهٔ گرنت).


9.4 منافع رقیب

نویسنده، Guanglin Tu، وابسته به «کارگروه EFT، Shenzhen Energy Filament Science Research Co., Ltd. (چین)» است؛ هیچ منفعت رقیب دیگری اعلام نمی‌شود.


9.5 کمک هوش مصنوعی

OpenAI GPT-5.2 Pro و Gemini 3 Pro برای صیقل زبانی، ویرایش ساختاری و سازمان‌دهی جریان کار بازتولیدپذیری استفاده شدند. از آن‌ها برای تولید یا تغییر داده‌ها، نتایج، شکل‌ها، جدول‌ها یا کد، و نیز برای تولید استنادها استفاده نشده است. نویسنده مسئولیت کامل محتوای دست‌نوشته و دقت استنادها را بر عهده دارد.

10 منابع

پیوست A: جزئیات ردیابی‌پذیری و بازتولیدپذیری

این پیوست اطلاعات آرشیوی بلندمدت برای ردیابی‌پذیری و بازتولیدپذیری را خلاصه می‌کند، از جمله برچسب‌های اجرا، نتایج ممیزی، inventoryهای آرشیو و نقاط کلیدی راستی‌آزمایی، تا خوانندگان بتوانند در صورت نیاز کار را بررسی و بازتولید کنند.


A.1 جزئیات ردیابی‌پذیری و ممیزی

برای تضمین ردیابی‌پذیری بلندمدت، این پروژه برای هر اجرا و خروجی از برچسب‌های زمان‌دار استفاده می‌کند و محصولات تاریخی را بدون بازنویسی نگه می‌دارد. مقادیر محوری نقل‌شده در این دست‌نوشته از compilation سخت‌گیرانه (compile_tag=20260205_035929) می‌آیند و ممیزی‌های سازگاری زیر را گذرانده‌اند:

• همهٔ جدول‌های سطح مرحله run_tag و برچسب مرحله دارند؛ اسکریپت compilation سخت‌گیرانه، منابع جدول canonical «کامل و سازگار» را از report/tables انتخاب می‌کند.

• مقادیر Tab_Z1_master_summary و Tab_Z2_conclusion_highlights بند به بند با جدول‌های canonical انتخاب‌شده مقایسه می‌شوند.

• هنگام تولید PDF، برای «برچسب‌های جدول/شکل ارجاع‌شده» ممیزی برچسب انجام می‌شود تا اطمینان حاصل شود محصولات قدیمی درهم آمیخته نشده‌اند.

برچسب‌های کلیدی (برای مکان‌یابی همهٔ محصولات میانی): run_tag=20260204_122515؛ closure_tag=20260204_124721؛ joint_tag=20260204_152714؛ sigma_sweep_tag=20260204_161852؛ rmin_sweep_tag=20260204_195247؛ covshrink_tag=20260204_203219؛ ablation_tag=20260204_214642؛ LOO_tag=20260204_224827؛ negctrl_tag=20260204_234528؛ strict_compile_tag=20260205_035929؛ release_tag=20260205_112442.

نتیجهٔ ممیزی سازگاری: Tab_AUDIT_checks_strict مقدار pass=9، fail=0، skip=0 را گزارش می‌کند (برای جزئیات به بستهٔ انتشار بنگرید).


A.2 گام‌های اجرای بازتولید و inventory آرشیو

این مطالعه سامانه‌ای برای بازتولیدپذیری به‌کار می‌گیرد که از «گزارش در سطح انتشار + مکمل جدول‌ها/شکل‌ها + بستهٔ اجرای کامل و قابل اجرای دوباره» تشکیل شده است. خوانندگان می‌توانند برای راستی‌آزمایی همهٔ دارایی‌های جدول/شکلِ نقل‌شده در مقاله مستقیماً به Tables & Figures Supplement مراجعه کنند؛ برای بازتولید مقادیر عددی و زنجیرهٔ ممیزی از ابتدا، می‌توانند از full_fit_runpack برای دانلود داده‌ها و اجرای دوبارهٔ جریان کار کامل استفاده کنند. پس از پایان، اسکریپت داخلی مقایسهٔ جدول‌های مرجع در بسته می‌تواند برای راستی‌آزمایی سازگاری مقادیر جدول‌ها به‌کار رود.


A.2.1 شروع سریع بازتولید (RUN_FULL، Windows PowerShell)

این بخش مسیر کوتاه‌تری برای بازتولید ارائه می‌دهد (Windows PowerShell). برای بررسی سریع، به خوانندگان توصیه می‌شود مستقیماً به Tables & Figures Supplement مراجعه کنند و جدول‌ها و شکل‌های نقل‌شده را بند به بند راستی‌آزمایی کنند. برای بازتولید انتها به انتها و تولید همهٔ جدول‌ها، شکل‌ها و محصولات ممیزی، از full_fit_runpack استفاده کنید: مطابق README/ONE_PAGE_REPRO_CHECKLIST بسته، verify_checksums.ps1 و RUN_FULL.ps1 را اجرا کنید (Mode=full توصیه می‌شود).

ورودی آرشیو Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
برچسب‌های زنجیرهٔ اصلی این مقاله: run_tag=20260204_122515؛ strict compile_tag=20260205_035929؛ release_tag=20260205_112442.


A.2.2 مواد آرشیو و نقاط کلیدی راستی‌آزمایی (Packages & checks)

آرشیو Zenodo سه دستهٔ مکمل از مواد فراهم می‌کند: (1) گزارش در سطح انتشار (این مقاله، v1.1؛ شامل پیوست B: آزمون فشار استانداردسازی خط پایهٔ DM در P1A(2) Tables & Figures Supplement (جدول‌ها و شکل‌های تکمیلی که همهٔ دارایی‌های جدول/شکلِ نقل‌شده در این مقاله را پوشش می‌دهند و جداگانه متناظر با P1 و P1A هستند)؛ و (3) full_fit_runpack (بستهٔ کامل بازتولید: داده‌ها را از ابتدا دانلود می‌کند و جریان کار کامل را دوباره اجرا می‌کند، جداگانه متناظر با P1 و P1A). موارد (1)(2) از خواندن سریع و راستی‌آزمایی مستقل پشتیبانی می‌کنند؛ مورد (3) بازتولیدپذیری کامل انتها به انتها را فراهم می‌کند.

هدف و جایگاه (ترتیب پیشنهادی استفاده)

نام فایل (نمونه)

دستهٔ ماده

گزارش کامل آرشیوشده در Zenodo؛ متن اصلی نتیجه‌گیری‌های محوری و ممیزی‌های پایداری را می‌دهد، و پیوست B آزمون P1A را ارائه می‌کند (آزمون فشار استانداردسازی خط پایهٔ DM).

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

گزارش در سطح انتشار (چینی و انگلیسی)

همهٔ جدول‌ها (CSV) و شکل‌ها (PNG) که در متن اصلی نقل شده‌اند، شامل اسکریپت‌های تولید و فایل‌های برچسب.

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Tables & Figures Supplement (P1)

همهٔ جدول‌ها و شکل‌های نقل‌شده در پیوست B (P1A)، شامل Tab_S1_P1A_scoreboard و Fig_S1_P1A_scoreboard.

P1A_supplement_figs_tables_v1.zip

Tables & Figures Supplement (P1A)

بازتولید کامل انتها به انتها: دانلود داده‌ها از ابتدا و اجرای دوبارهٔ RC-only/closure/joint و پیمایش‌های پایداری.

P1_RC_GGL_full_fit_runpack_v1_1.zip

full_fit_runpack (P1)

بازتولید کامل انتها به انتها (پیوست B): اجرای دوبارهٔ DM 7+1 + DM_STD (شامل کنترل EFT_BIN) و تولید دارایی‌های پیوست؛ بسته شامل اسکریپت مقایسهٔ جدول مرجع برای راستی‌آزمایی سازگاری مقادیر جدول است.

P1A_RC_GGL_full_fit_runpack_v1.zip

full_fit_runpack (P1A)

توصیهٔ استناد: هنگام استناد به این مقاله یا مواد بازتولیدپذیری همراه آن، لطفاً به Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334) استناد کنید.

محصولات کلیدی که پس از بازتولید باید ظاهر شوند و قابل مقایسه باشند عبارت‌اند از:

پیوست B: P1A — آزمون فشار استانداردسازی خط پایهٔ DM (DM 7+1 + DM_STD؛ همراه با کنترل EFT)

این پیوست یک پروژهٔ گسترش (P1A) برای «آزمون فشار استانداردسازی خط پایهٔ DM» را مستند می‌کند که با پروتکل بستار متن اصلی سازگار است. نقش آن این است که خط پایهٔ حداقلی DM_RAZOR استفاده‌شده در متن اصلی (NFW + cM ثابت، بدون scatter / بدون contraction / بدون core) را به مجموعه‌ای از خط پایه‌های DM ارتقا دهد که به عمل اخترفیزیکی نزدیک‌تر و در برابر نقدهای رایج مقاوم‌تر است، بی‌آنکه تعداد زیادی درجهٔ آزادی وارد کند و بی‌آنکه نگاشت مشترک RC-binGGL-bin یا چارچوب ممیزی را تغییر دهد. P1A آزمون فشار سه‌شاخهٔ قبلی را پوشش می‌دهد و ابرمجموعهٔ آن است: SCAT/AC/FB را حفظ می‌کند و hierarchical cM scatter + prior، یک proxy تک‌پارامتری برای core و مزاحم m برای کالیبراسیون shear در سوی عدسی‌گری را می‌افزاید؛ همچنین مدل ترکیبی DM_STD را ارائه می‌کند. EFT_BIN به‌عنوان مرجع کنترل حفظ می‌شود.

یادداشت تکمیلی: قدرت‌های بستار و مقادیر مرتبط در پیوست B (P1A) از بودجهٔ Monte Carlo بزرگ‌تری استفاده می‌کنند (برای مثال ndraw=400، nperm=24) نسبت به بودجهٔ quick که در متن اصلی برای پوشش خانوادهٔ کامل هسته‌های EFT به‌کار رفته است (برای مثال ndraw=60، nperm=12). بنابراین مقادیر مطلق ممکن است drift نمونه‌گیری در سطح O(10) نشان دهند. با این حال، مقایسهٔ مدل با مدل درون همان بودجه/جدول منصفانه است و علامت و مقیاس برتری در بودجه‌های مختلف پایدار می‌ماند.


B.1 هدف و جایگاه (چرا P1A، و چرا در قالب پیوست)

P1A نمی‌کوشد همهٔ انتخاب‌های ممکن در مدل‌سازی هالهٔ ΛCDM را exhausted کند (مانند ناكروی‌بودن، وابستگی محیطی، اتصال‌های پیچیدهٔ کهکشان-هاله، یا فیزیک باریونی پُربُعد). در عوض P1A از اصل «کم‌بُعد، قابل ممیزی، بازتولیدپذیر» پیروی می‌کند: هر ماژول تقویتی فقط حداکثر ۱ پارامتر مؤثر کلیدی وارد می‌کند و همچنان تابع سه قید سخت این مقاله است:
(i) دفتر ثبت پارامتر: هر پارامتر تازه باید صریحاً ثبت و همراه با معیارهای اطلاعاتی (AICc/BIC) گزارش شود؛
(ii) نگاشت مشترک: همان نقشهٔ گروه‌بندی RC-binGGL-bin همچنان استفاده می‌شود؛ «تنظیم نگاشت» به‌صورت جداگانه برای یک مجموعه‌دادهٔ منفرد مجاز نیست؛
(iii) آزمون بستار: هر تقویت باید سود واقعی در انتقال پیش‌بینی RCGGL نشان دهد، نه صرفاً برازش بهتر RC-only.


B.2 DM 7+1 + DM_STD: تعریف ماژول‌ها، پارامترها و ورود به پسین مشترک

P1A به‌عنوان یک runpack مستقل، 8 workspace برای DM (DM 7+1) به‌علاوهٔ 1 کنترل EFT فراهم می‌کند: از DM_RAZOR به‌عنوان خط پایه آغاز می‌کند، سه تقویت legacy تک‌پارامتری (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB) را می‌سازد، سه ماژول دفاعی استانداردتر (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) را اضافه می‌کند، و سپس مدل ترکیبی DM_STD را ارائه می‌دهد. هدف مشترک این ماژول‌ها پوشش سه نقد رایج با کمترین افزایش ممکن در بُعد است: (a) پراکندگی cM و پیشین‌ها چگونه وارد مدل سلسله‌مراتبی می‌شوند؛ (b) آیا اثر اصلی بازخورد باریونی را می‌توان با یک proxy تک‌پارامتری برای core ثبت کرد؛ و (c) آیا سیستماتیک‌های کلیدی در سوی عدسی‌گری ممکن است با سیگنال فیزیکی اشتباه گرفته شوند.

اصل پیاده‌سازی (سازگار با ممیزی)

انگیزهٔ فیزیکی (هسته)

پارامتر(های) جدید (حداکثر ۱)

dm_model

Workspace

نگاشت مشترک ثابت؛ دفتر ثبت پارامتر سخت‌گیرانه؛ فقط به‌عنوان خط پایه برای مقایسهٔ نسبی استفاده می‌شود

خط پایهٔ حداقلی و قابل ممیزی هالهٔ ΛCDM؛ برای مقایسهٔ سخت‌گیرانه با EFT استفاده می‌شود

NFW (fixed cM, no scatter)

DM_RAZOR

حداکثر ۱ پارامتر جدید؛ نگاشت مشترک حفظ می‌شود؛ سود بستار معیار پذیرش است

رابطهٔ cM پراکندگی دارد؛ با پراکندگی log-normal تک‌پارامتری تقریب زده می‌شود

σ_logc

NFW + cM scatter(legacy)

DM_RAZOR_SCAT

حداکثر ۱ پارامتر جدید؛ نگاشت تغییر نمی‌کند؛ تغییرات AICc/BIC و سود بستار گزارش می‌شوند

سقوط باریونی ممکن است انقباض آدیاباتیک هاله را القا کند؛ با شدت تک‌پارامتری تقریب زده می‌شود

α_AC

NFW + Adiabatic Contraction(legacy)

DM_RAZOR_AC

حداکثر ۱ پارامتر جدید؛ همان پروتکل بستار/کنترل منفی؛ بهبود RC-only تنها هدف نیست

بازخورد ممکن است در ناحیهٔ درونی core ایجاد کند؛ با مقیاس core تک‌پارامتری تقریب زده می‌شود

log r_core

NFW + feedback core(legacy)

DM_RAZOR_FB

پیشین صریح؛ c_i پنهان marginalized می‌شود؛ همچنان کم‌بُعد و قابل ممیزی است

ساختار سلسله‌مراتبی استانداردتر c_ilogN(c(M_i),σ_logc)؛ بر پسین مشترک هر دو RC و GGL اثر می‌گذارد

σ_logc(hier)

Hierarchical cM scatter + prior

DM_HIER_CMSCAT

به ادبیات استاندارد استناد می‌کند؛ حداکثر ۱ پارامتر جدید؛ به آزمون بستار گره خورده است

از یک proxy تک‌پارامتری برای core و اثر اصلی بازخورد باریونی استفاده می‌کند و از جزئیات پُربُعد تشکیل ستاره پرهیز می‌کند

log r_core

1‑parameter core proxy (coreNFW/DC14inspired)

DM_CORE1P

مزاحم به‌روشنی ثبت شده است؛ نمی‌تواند به عقب بر RC اثر بگذارد؛ نتایج عمدتاً با پایداری بستار داوری می‌شوند

یک سیستماتیک کلیدی در عدسی‌گری ضعیف را به‌صورت پارامتر مؤثر جذب می‌کند و خطر اشتباه گرفتن سیستماتیک با فیزیک را کاهش می‌دهد

m_shear(GGL)

NFW + lensing shearcalibration nuisance

DM_RAZOR_M

دفتر ثبت پارامتر + معیارهای اطلاعاتی گزارش می‌شوند؛ بستار شاخص اصلی است؛ به‌عنوان قوی‌ترین کنترل دفاعی DM استفاده می‌شود

سه ردهٔ نقد رایج را در خط پایهٔ استانداردی می‌گنجاند که همچنان کم‌بُعد است

σ_logc + log r_core (+ m_shear)

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

DM_STD

نکته: نام پارامترهای بالا از پیاده‌سازی مهندسی پیروی می‌کنند (برای مثال σ_logc، α_AC، log r_core و m_shear). تمرکز طراحی P1A این است که «خط پایهٔ DM را تا حدی قوی‌تر کند، در حالی که قابل ممیزی بماند»، نه اینکه سویهٔ DM را به برازشگر پُربُعد و مهارنشدنی تبدیل کند. به‌ویژه، DM_HIER_CMSCAT پراکندگی cM را به‌صورت سلسله‌مراتبی وارد می‌کند: تمرکز c_i هر هاله، پیرامون c(M_i) پراکندگی log-normal می‌گیرد و با σ_logc جهانی و پیشین c(M) محدود می‌شود؛ این ساختار سلسله‌مراتبی بر پسین مشترک هر دو دادهٔ RC و GGL اثر می‌گذارد.


B.3 پروتکل آماری و قراردادهای محصول سازگار با متن اصلی

P1A همهٔ محصولات داده، نگاشت مشترک و چارچوب ممیزی متن اصلی را دوباره به‌کار می‌گیرد. ترتیب اجرا و قراردادهای محصول سازگار می‌مانند:
(1) Run‑1: استنتاج RC-only (خروجی posterior_samples.npz و metrics.json
(2) Run‑2: آزمون بستار RCGGL (خروجی closure_summary.json و baselineِ permuted
(3) Run‑3: برازش مشترک RC+GGL (خروجی joint_summary.json).
همهٔ اعداد نقل‌شده از جدول گردآوری‌شدهٔ خودکار (Tab_S1_P1A_scoreboard) می‌آیند و پس از اجرای دوبارهٔ جریان کار کامل P1A با اسکریپت مقایسهٔ جدول مرجعِ تعبیه‌شده در P1A full_fit_runpack قابل بررسی‌اند.


B.4 نتایج اصلی، نقاط ورود جدول/شکل و برنامهٔ آرشیو (همان DOI)

این بخش نتیجه‌گیری‌های کمی محوری P1A را ارائه می‌کند. جدول B1 شاخص‌های کلیدی برای RC-only، بستار RCGGL و برازش مشترک RC+GGL را خلاصه می‌کند (پرانتزها اختلاف نسبت به خط پایهٔ DM_RAZOR را نشان می‌دهند). قدرت بستار به‌صورت ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ تعریف می‌شود (بزرگ‌تر بهتر است). شکل B1 همان scoreboard را تصویر می‌کند. نکات اصلی چنین است:
• از میان سه شاخهٔ legacy، فقط DM_RAZOR_FB (feedback/core) بهبود خالص کوچکی در قدرت بستار می‌دهد: 122.21129.45 (+7.25SCAT و AC بهبود خالصی فراهم نمی‌کنند؛
DM_HIER_CMSCAT و DM_RAZOR_M که تازه افزوده شده‌اند، اثرهای بسیار کوچکی (~0) بر قدرت بستار دارند، و DM_CORE1P نیز بهبود خالص معناداری نشان نمی‌دهد؛
• مدل ترکیبی DM_STD می‌تواند logL مشترک را به‌طور چشمگیر بهبود دهد (نزدیک‌تر به بهینهٔ برازش مشترک)، اما قدرت بستار آن کاهش می‌یابد؛ این نشان می‌دهد سود آن عمدتاً از انعطاف برازش مشترک می‌آید، نه از انتقال‌پذیری میان کاوشگرها؛
• به‌عنوان کنترل، EFT_BIN همچنان برتری روشنی هم در قدرت بستار و هم در برازش مشترک حفظ می‌کند. بنابراین نتیجهٔ اصلی نسبت به وارد کردن «خط پایهٔ DM قوی‌تر + مزاحم عدسی‌گری» پایدار است.

برای مقایسهٔ مستقیم با نتایج متن اصلی، جدول‌های S1aS1b مقایسهٔ سخت‌گیرانهٔ میان خانوادهٔ EFT و DM_RAZOR را خلاصه می‌کنند: مدل‌های EFT برازش مشترک را به اندازهٔ ΔlogL_total≈1155–1337 نسبت به DM_RAZOR بهبود می‌دهند و در آزمون بستار به ΔlogL_closure=172–281 می‌رسند. P1A فقط در سوی DM یک «کنترل سخت‌تر» می‌سازد؛ هدف آن کاهش نگرانی‌هایی مانند «خط پایهٔ پوشالی» یا «سیستماتیک به‌جای فیزیک» است، نه جایگزین‌کردن مقایسهٔ اصلی.

جدول B1 | scoreboard پیوست P1A (بزرگ‌تر بهتر است؛ پرانتزها اختلاف نسبت به خط پایهٔ DM_RAZOR را نشان می‌دهند).

بهترین logL_total مشترک (Δ)

قدرت بستار ΔlogL_closure (Δ)

بهترین logL_RC در RC-only (Δ)

Δk

شاخهٔ مدل (workspace)

-27347.068 (+0.000)

122.205 (+0.000)

-15702.654 (+0.000)

0

DM_RAZOR

-23153.311 (+4193.758)

121.236 (-0.969)

-15702.294 (+0.361)

1

DM_RAZOR_SCAT

-23982.557 (+3364.511)

121.531 (-0.674)

-15703.689 (-1.035)

1

DM_RAZOR_AC

-27478.531 (-131.463)

129.454 (+7.249)

-15496.046 (+206.609)

1

DM_RAZOR_FB

-23153.160 (+4193.908)

121.978 (-0.227)

-15702.644 (+0.010)

1

DM_HIER_CMSCAT

-27336.258 (+10.810)

122.056 (-0.149)

-15723.158 (-20.504)

1

DM_CORE1P

-27340.451 (+6.617)

122.205 (+0.000)

-15702.654 (+0.000)

0 (+m)

DM_RAZOR_M

-22984.445 (+4362.623)

105.690 (-16.515)

-15832.203 (-129.549)

2 (+m)

DM_STD

-19001.142 (+8345.926)

204.620 (+82.415)

-14631.537 (+1071.117)

1

EFT_BIN

شکل B1 | scoreboard پیوست P1A: بستار و ΔlogL مشترک نسبت به خط پایه (بزرگ‌تر بهتر است).

برچسب‌های نمونه برای مجموعهٔ اجرای تکمیل‌شدهٔ متناظر با این پیوست چنین است (برای مکان‌یابی محصولات میانی و جدول‌ها/شکل‌های P1A استفاده می‌شود):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428‎.


B.5 پیشنهاد استناد (یادداشت استناد به پیوست)

هنگامی که خوانندگان بخواهند افزون بر نتیجه‌گیری‌های اصلی مقاله به «آزمون فشار استانداردسازی خط پایهٔ DM» استناد کنند، پیشنهاد می‌شود نتیجهٔ اصلی را همراه با این یادداشت نقل کنند: «See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical cM scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.»