P1_RC_GGL: آزمون بستار سختگیرانهٔ دینامیک کهکشانها و عدسیگری ضعیف (منحنیهای چرخش + GGL)
چارچوب گرانش میانگین در EFT در برابر خط پایهٔ حداقلی NFW برای مادهٔ تاریک سرد (DM)
نسخهٔ اصلی گزارش ارزیابی را مشاهده کنید:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 خلاصهٔ اجرایی
این گزارش نسخهای آرشیوی و در سطح انتشار است که در Zenodo سپرده شده است. گزارش، زنجیرهای یکپارچه و قابل ممیزی از دادهها، دفتر ثبت مدلها، مقایسهٔ منصفانه، آزمون بستار و مواد بازتولیدپذیری ارائه میکند. پیوست B (P1A) بهعنوان مکمل پایداری عمل میکند و بر آزمونهای فشار با «خط پایهٔ DM استانداردتر + یک سیستماتیک کلیدی در عدسیگری» تمرکز دارد تا حساسیت نتیجهگیریهای اصلی نسبت به مدلسازی واقعبینانهتر DM و برخورد با سیستماتیکهای عدسیگری سنجیده شود.
نتیجهگیریهای اصلی (چهار گزارهٔ قابل نقل مستقیم؛ بنگرید به بخش 2.4):
(1) در برازش منحنیهای چرخش (RC)، خانوادهٔ EFT در همهٔ ترکیبهای هسته/پیشین بهطور معنادار از DM_RAZOR بهتر عمل میکند؛ بهبود نمونهوار Δlog𝓛_RC ≈ 10^3 است (بنگرید به جدول S1a).
(2) در آزمون بستار RC→GGL، EFT انتقالپذیری قویتری میان کاوشگرها نشان میدهد: قدرت بستار Δlog𝓛_closure (True−Perm) بهطور معناداری از DM_RAZOR بالاتر است و این تفاوت در برابر پیمایشهای covariance shrinkage، R_min و σ_int پایدار میماند (بنگرید به شکل S3 و جدول S1b).
(3) در برازش مشترک (RC+GGL)، EFT برتری پایداری را حفظ میکند؛ در کنترل منفیای که نگاشت مشترک را میشکند، این برتری فرو میریزد، و از این تفسیر پشتیبانی میکند که «اثر گرانش میانگین» از نگاشت مشترک میآید، نه از یک برازش تصادفی (بنگرید به شکل S4).
(4) پیوست B (P1A) بدون افزایش چشمگیر بُعد، سویهٔ DM را با ماژولهای خط پایهٔ DM استانداردتر و یک پارامتر مزاحم کلیدی برای سیستماتیکهای عدسیگری تحت آزمون فشار قرار میدهد. این تقویتها برتری بستار EFT را حذف نمیکنند (بنگرید به جدول B1 و شکل B1).
دسترسپذیری داده و کد: Concept DOI گزارش 10.5281/zenodo.18526334؛ Concept DOI بستهٔ کامل بازتولید 10.5281/zenodo.18526286. برچسبهای متناظر با پیوست B (P1A) عبارتاند از run_tag=20260213_151233، closure_tag=20260213_161731، و joint_tag=20260213_195428.
1 چکیده
ما مقایسهای کمی و بازتولیدپذیر میان دو چارچوب نظری، زیر دادههای یکسان و پروتکل آماری یکسان، انجام میدهیم: مدل «تصحیح گرانش میانگین» که نظریهٔ فیلامنت انرژی (Energy Filament Theory, EFT؛ متمایز از اختصار رایج effective field theory) پیشنهاد میکند، و مدل خط پایهٔ هالهٔ NFW برای مادهٔ تاریک سرد (DM_RAZOR). DM_RAZOR عمداً بهعنوان «خط پایهٔ حداقلی DM» انتخاب شده است: هالهٔ NFW با رابطهٔ ثابت c–M (بدون پراکندگی halo-to-halo)، تا کنترلگری قابل ممیزی و بازتولیدپذیر فراهم شود. همچنین باید تأکید کرد که این مقاله EFT را برای آزمودن در یک پروتکل آماری یکپارچه، بهصورت یک پارامتردهی پدیدارشناختیِ شبیه MOND از میدان مؤثر/پاسخ مؤثر بهکار میگیرد، نه اینکه در همین کار اصول نخستین میکروسکوپی آن را استخراج کند.
دادهها شامل 2,295 نقطهٔ سرعت از منحنیهای چرخش SPARC (RC)، پس از پیشپردازش و binning یکنواخت (104 کهکشان، 20 bin برای RC)، همراه با چگالی سطحی افزودهٔ ΔΣ(R) در عدسیگری ضعیف کهکشان-کهکشان KiDS-1000 (4 bin جرم ستارهای × 15 نقطهٔ R در هر bin، در مجموع 60 نقطه، با استفاده از کواریانس کامل) هستند.
ما بهترتیب استنتاج RC-only، آزمون بستار RC→GGL، استنتاج GGL-only و استنتاج مشترک RC+GGL را اجرا میکنیم و با ممیزیهای سازگاری اطمینان میدهیم که هر مقدار عددی نقلشده قابل ردیابی است. زیر دفتر ثبت پارامتر سختگیرانه و قیود نگاشت مشترک (DM: 20 پارامتر log M200_bin؛ EFT: 20 پارامتر log V0_bin + 1 پارامتر جهانی log ℓ)، خانوادهٔ EFT در برازش مشترک بهطور معنادار از DM_RAZOR بهتر عمل میکند: ΔlogL_total = 1155–1337 نسبت به DM_RAZOR. مهمتر اینکه آزمون بستار نشان میدهد پسین RC توان پیشبینی غیر بدیهی برای GGL دارد: قدرت بستار EFT برابر ΔlogL_closure = 172–281 است، بالاتر از مقدار 127 برای DM_RAZOR. هنگامی که گروهبندی RC-bin→GGL-bin بهطور تصادفی shuffle میشود، سیگنال بستار به 6–23 فرو میریزد، و تأیید میکند که سیگنال نه تصادف آماری است و نه مصنوع پیادهسازی. در پیمایشهای نظاممند σ_int، R_min و covariance shrinkage، برتری نسبی EFT مثبت و از نظر مرتبه پایدار میماند. برای پاسخ به نگرانیهای رایج مبنی بر اینکه «خط پایهٔ DM بیش از حد ضعیف است» یا «سیستماتیکها بهجای فیزیک گرفته شدهاند»، پیوست B (P1A) آزمون فشار خط پایهٔ DM استانداردتر ولی همچنان کمبُعد و قابل ممیزی ارائه میکند، از جمله hierarchical c–M scatter + prior، یک proxy تکپارامتری برای core، lensing m، و مدل ترکیبی DM_STD. زیر همان پروتکل بستار، این تقویتها برتری بستار EFT را حذف نمیکنند (بنگرید به جدول B1/شکل B1).
کلیدواژهها: منحنیهای چرخش؛ عدسیگری ضعیف کهکشان-کهکشان؛ آزمون بستار؛ EFT؛ مادهٔ تاریک سرد؛ استنتاج بیزی
2 مقدمه و نمای کلی نتایج
منحنیهای چرخش (RC) و عدسیگری ضعیف کهکشان-کهکشان (GGL) دو کاوشگر گرانشی مکملاند: RC پتانسیل دینامیکی و رابطهٔ شتاب شعاعی (RAR) را در صفحهٔ قرص محدود میکند، در حالی که GGL توزیع جرم فرافکنده و پاسخ گرانشی در مقیاس هاله را میسنجد. برای هر نظریهٔ نامزد، پرسش کلیدی این نیست که آیا میتواند دو مجموعهداده را جداگانه برازش کند، بلکه این است که آیا میتواند آنها را زیر همان نگاشت میاندادهای و همان قیود مشترک بهصورت سازگار توضیح دهد.
بر همین اساس، این مقاله «آزمون بستار (closure test)» را پروتکل آماری مرکزی خود قرار میدهد: نخست از پسین RC-only برای پیشبینی روبهجلوی GGL استفاده میکنیم، سپس آن را با کنترل منفیای مقایسه میکنیم که در آن نگاشت RC-bin→GGL-bin permuted/shuffled شده است. این کار انتقالپذیری پیشبینی میان دادهها را ارزیابی میکند و سیگنالهای کاذب ناشی از سوگیری پیادهسازی یا برازش تصادفی را کنار میزند.
جایگاه نظری و دامنه: این مقاله تلاش نمیکند استخراج میکروسکوپی از اصول نخستین EFT (نظریهٔ فیلامنت انرژی) یا فرمولبندی کامل نسبیتی آن را ارائه دهد. در عوض، EFT را بهعنوان پارامتردهی کمبُعد و شبیه MOND از میدان مؤثر/پاسخ مؤثر (توصیفشده با هستهٔ f(x) و مقیاس جهانی ℓ) در نظر میگیریم و سازگاری میاندادهای و توان انتقال پیشبینی آن را از راه آزمون بستار RC→GGL زیر دفتر ثبت پارامتر سختگیرانه میآزماییم.
بیانیهٔ برنامهٔ پژوهشی و دامنه: این مقاله بخشی از برنامهٔ پیوستهٔ بازیابی رصدی سری P است. در دادههای موجود در مقیاس کهکشان، ما دو سهم پسزمینهای مؤثر ممکن را جستوجو میکنیم: (i) «کف گرانش میانگین» که با پاسخ گرانشی میانگینِ درشتدانه/مقیاسمیانگینشده قابل توصیف است، و (ii) «کف تصادفی/نویز» مرتبط با نوسانهای فرایندهای میکروسکوپی. در این مقاله (P1)، فقط بر اولی تمرکز میکنیم: بدون وارد کردن هیچ فرضیهای دربارهٔ سازوکارهای تولید میکروسکوپی، از آزمون بستار RC→GGL برای بازیابی نشانههای رصدی کف گرانش میانگین استفاده میکنیم و آن را زیر پروتکل کنترل یکپارچه با خط پایهٔ DM قابل ممیزی مقایسه میکنیم. بهعنوان تصویر فیزیکی راهنما، اگر درجات آزادی کوتاهعمر وجود داشته باشند، واپاشی/نابودی آنها میتواند جرم سکون را به انرژی-تکانهٔ حاملشده توسط درجات آزادی دیگر تبدیل کند؛ این امر در سطح مؤثر بهطور طبیعی با تجزیهٔ «سهم میانگین + سهم نوسانی» متناظر است. با این حال، این مقاله آن تصویر میکروسکوپی را بهصورت کمی مدلسازی نمیکند.
برای جلوگیری از تفسیر افراطی، مرزهای دامنهٔ این مقاله چنین است:
• این مقاله چه میکند: زیر قیود سختگیرانهٔ دفتر ثبت پارامتر و نگاشت مشترک، از آزمون بستار برای سنجش انتقالپذیری پیشبینی میان دادهها استفاده میکند و مقایسهای بازتولیدپذیر میان پاسخ گرانش میانگین در EFT و یک خط پایهٔ DM انجام میدهد.
• این مقاله چه نمیکند: سازوکارهای تولید میکروسکوپی، فراوانی/طول عمر یا قیود کیهانشناختی را بررسی نمیکند؛ جملهٔ تصادفی متناظر با «کف نویز» را مدلسازی نمیکند.
• این مقاله چه ادعا نمیکند: هدف آن برانداختن مادهٔ تاریک نیست؛ P1 حکم نهایی دربارهٔ وجود یا نبود چنین «کفی» صادر نمیکند، بلکه شواهد مرحلهای گزارش میدهد — یعنی در دامنهٔ سنجش پایدار انتخابشده در اینجا، دادهها مدلهایی را ترجیح میدهند که شامل پاسخ گرانشی میانگیناند.
در عین حال روشن میکنیم که DM_RAZOR تنها یک خط پایهٔ NFW حداقلی و قابل ممیزی را نمایندگی میکند (c–M ثابت و بدون scatter؛ بدون adiabatic contraction، feedback core، ناكرویبودن، یا جملههای محیطی). بنابراین نتیجهٔ اصلی متن دقیقاً به این گزاره محدود است: زیر خط پایهٔ حداقلی و قیود سختگیرانهٔ دفتر ثبت پارامتر/نگاشت، EFT سازگاری قویتری میان دادهها نشان میدهد. برای پاسخ به این پرسش رایج که آیا خط پایهٔ ΛCDM استانداردتر و مدلسازی سیستماتیکهای کلیدی عدسیگری نتیجه را بهطور جدی تغییر میدهند یا نه، تقویتهای DM استانداردتر اما همچنان کمبُعد و قابل ممیزی و یک مزاحم در سوی عدسیگری را در پیوست B گرد آوردهایم (P1A: آزمون فشار استانداردسازی خط پایهٔ DM)، در حالی که نگاشت مشترک و پروتکل آزمون بستار دقیقاً همان متن اصلی باقی میماند (بنگرید به جدول B1/شکل B1).
2.1 جدول S1a–S1b: خلاصهٔ شاخصهای کلیدی (Strict)
جدول S1a شاخصهای اصلی مقایسه برای برازش مشترک (RC+GGL) را گزارش میکند: logL، ΔlogL، AICc و BIC. جدول S1b شاخصهای آزمون بستار و پیمایش پایداری را گزارش میکند: بستار، کنترل منفی shuffle، و دامنههای پیمایش σ_int / R_min / cov-shrink. همهٔ مقادیر از جدول خلاصهٔ اصلی سختگیرانه Tab_Z1_master_summary میآیند و در بستهٔ آرشیو انتشار، بند به بند قابل ردیابیاند.
جدول S1a | شاخصهای اصلی مقایسهٔ برازش مشترک (RC+GGL، Strict).
BIC | AICc | ΔlogL_total در برابر DM | logL_total مشترک (بهترین) | k | هستهٔ W | مدل (workspace) |
34010.811 | 33895.885 | 0.0 | -16927.763 | 20 | none | DM_RAZOR |
31344.155 | 31223.501 | 1337.21 | -15590.552 | 21 | none | EFT_BIN |
31500.711 | 31380.057 | 1258.932 | -15668.83 | 21 | exponential | EFT_WEXP |
31708.922 | 31588.268 | 1154.827 | -15772.936 | 21 | yukawa | EFT_WYUK |
31429.692 | 31309.038 | 1294.442 | -15633.321 | 21 | powerlaw_tail | EFT_WPOW |
جدول S1b | شاخصهای بستار و پایداری (Strict).
دامنهٔ ΔlogL در پیمایش cov-shrink | دامنهٔ ΔlogL در پیمایش R_min | دامنهٔ ΔlogL در پیمایش σ_int | ΔlogL کنترل منفی پس از shuffle | ΔlogL بستار (true-perm) | مدل (workspace) |
— | — | — | 22.725 | 126.678 | DM_RAZOR |
1337–1351 | 1243–1289 | 459–1548 | 14.984 | 231.611 | EFT_BIN |
1259–1277 | 1169–1207 | 408–1471 | 6.04 | 171.977 | EFT_WEXP |
1155–1166 | 1065–1099 | 380–1341 | 14.688 | 179.808 | EFT_WYUK |
1294–1308 | 1203–1247 | 457–1500 | 6.672 | 280.513 | EFT_WPOW |
2.2 شکل S3: قدرت بستار (RC-only → GGL پیشبینیشده)
قدرت بستار بهصورت ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ تعریف میشود: روی نمونههای پسین RC-only، GGL بهصورت روبهجلو پیشبینی میشود و با کنترل منفیای مقایسه میشود که در آن نگاشت RC-bin→GGL-bin permuted شده است.

شکل S3 | قدرت بستار (بزرگتر بهتر است): برتری میانگین log-likelihood برای پیشبینی RC-only → GGL.
2.3 شکل S4: مقایسهٔ اصلی برازش مشترک (RC+GGL)
برتری برازش مشترک بهصورت ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) تعریف میشود. زیر دادههای یکسان، نگاشت یکسان و مقیاس پارامتر تقریباً یکسان، خانوادهٔ EFT به log-likelihood مشترک بسیار بالاتری دست مییابد.

شکل S4 | برتری برازش مشترک (بزرگتر بهتر است): بهترین logL_total برای RC+GGL نسبت به DM_RAZOR.
2.4 چهار نتیجهگیری (قابل نقل مستقیم)
(1) در یک تحلیل مشترک یکپارچه از منحنیهای چرخش SPARC و عدسیگری ضعیف KiDS-1000، مدل چارچوب گرانش میانگین EFT زیر پروتکل کنترل سختگیرانه بهطور نظاممند از DM_RAZOR بهتر عمل میکند: ΔlogL_total = 1155–1337 نسبت به DM_RAZOR.
(2) آزمون بستار RC→GGL سازگاری پیشبینی قویتری برای EFT نشان میدهد: ΔlogL_closure = 172–281، در مقایسه با 127 برای DM_RAZOR. وقتی گروهبندی RC-bin→GGL-bin بهطور تصادفی shuffle میشود، سیگنال بستار به 6–23 فرو میریزد، و نشان میدهد که سیگنال به نگاشت درست میان دادهها وابسته است، نه به برازش تصادفی.
(3) پیمایشهای نظاممند σ_int، R_min و shrinkage کواریانس، علامت یا مقیاس گزارهٔ «EFT از DM_RAZOR بهتر عمل میکند» را تغییر نمیدهند؛ این امر نشان میدهد نتیجه نسبت به اختلالهای سیستماتیک رایج پایدار است.
(4) زیر همان پروتکل بستار، پیوست B (P1A) خط پایهٔ DM را به شیوهای «استانداردشده و قابل ممیزی» تقویت میکند: سه تقویت تکپارامتری (SCAT/AC/FB) را نگه میدارد و hierarchical c–M scatter + prior، یک proxy تکپارامتری برای core و m کالیبراسیون shear در سوی عدسیگری (و مدل ترکیبی آنها DM_STD) را میافزاید. نتایج نشان میدهد که فقط شاخهٔ feedback/core بهبود خالص کوچکی در قدرت بستار میآورد (122.21→129.45، ΔΔlogL_closure≈+7.25)؛ دیگر تقویتها سهم ناچیز یا منفی در قدرت بستار دارند. بنابراین نتیجهٔ اصلی به این وابسته نیست که DM_RAZOR خط پایهای بیش از حد ضعیف باشد.
3 دادهها و پیشپردازش
این مطالعه از دو مجموعهدادهٔ عمومی استفاده میکند. در جریان کار مهندسی، دانلود، راستیآزمایی checksum (sha256) و پیشپردازش با اسکریپتهای قابل ردیابی انجام میشود. برای تضمین مقایسهٔ منصفانهٔ میان مدلها، همهٔ workspaceها (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) دقیقاً همان محصولات داده و نگاشتهای bin را به اشتراک میگذارند.
3.1 منحنیهای چرخش (RC، SPARC)
دادههای RC از فایلهای Rotmod_LTG پایگاه SPARC میآیند (175 فایل rotmod). پس از پیشپردازش، نمونهٔ مدلسازی شامل 104 کهکشان و 2,295 نقطهٔ دادهٔ (r, V_obs) است که بر اساس جرم ستارهای و معیارهای مرتبط به 20 bin برای RC تقسیم شدهاند. هر نقطهٔ داده شامل شعاع r (kpc)، سرعت مشاهدهشده V_obs (km/s)، خطای مشاهدهای σ_obs و سرعتهای مؤلفههای گاز/دیسک/برآمدگی (V_gas, V_disk, V_bul) است.
3.2 عدسیگری ضعیف (GGL، KiDS-1000 / Brouwer+2021)
دادههای GGL از چگالی سطحی افزودهٔ ΔΣ(R) در شکل 3 مقالهٔ Brouwer و همکاران (2021)، بر پایهٔ KiDS-1000، استفاده میکنند (4 bin جرم ستارهای، 15 نقطهٔ R در هر bin)، همراه با کواریانس کامل ارائهشده. در جریان کار مهندسی، کواریانس اصلیِ long-form برای هر bin به ماتریس 15×15 بازسازی میشود و ممیزیهای Stage-B معقولبودن ابعادی و عددی را تأیید میکنند.
3.3 نگاشت RC-bin → GGL-bin و اندازهٔ کل نمونه
چهار bin جرمی GGL و بیست bin برای RC از راه یک نگاشت ثابت به هم متصل میشوند: هر bin در GGL متناظر با 5 bin در RC است و سهمهای RC-bin بر اساس تعداد کهکشانها وزندهی میشوند. این نگاشت در همهٔ مدلها ثابت نگه داشته میشود و قید مرکزی برای مقایسهٔ منصفانه در آزمون بستار و برازش مشترک است. مجموعهدادهٔ مشترک نهایی شامل n_total = 2355 نقطه است (RC=2295، GGL=60).
4 مدلها و روشهای آماری
4.1 مشخصهگذاری ریاضی حداقلی برای EFT و DM (قابل ممیزی/قابل آزمون)
این بخش مشخصهگذاری ریاضی حداقلی را ارائه میکند که مستقیماً به پیادهسازی نگاشت میشود.
(a) مدل منحنی چرخش (RC)
برای هر نقطهٔ دادهٔ RC یعنی (r, V_obs, σ_obs)، از برهمنهی مؤلفهها استفاده میکنیم: V_mod²(r) = V_bar²(r) + V_extra²(r). در اینجا V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). نتایج اصلی این مقاله Υ_d = Υ_b = 0.5 را بهکار میگیرند که با توصیههای تجربی SPARC سازگار است و برای کاهش درجات آزادی غیرضروری مفید است.
(b) تصحیح گرانش میانگین EFT (EFT)
جملهٔ اضافی EFT در قالب «میانگین مجذور سرعت» پارامتردهی میشود: V_extra²(r) = V0_bin² · f(r/ℓ). در اینجا V0_bin پارامتر دامنه برای هر bin در RC است (20 پارامتر)، ℓ یک مقیاس جهانی است (1 پارامتر)، و f(x) تابع شکل هستهٔ بیبُعد است. شکلهای هستهای که در این مقاله مقایسه میشوند (هیچکدام درجهٔ آزادی پیوستهٔ اضافی وارد نمیکنند) عبارتاند از:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (کنترل اختیاری) gaussian: f(x)=erf(x/√2) (در مجموعهٔ نتیجهگیری اصلی گنجانده نشده است)
انگیزهٔ فیزیکی (گسترشیافته): EFT پاسخ گرانشی اضافی در مقیاسهای کهکشانی را بهعنوان پاسخ مؤثری تفسیر میکند که از درشتدانهسازی/میانگینگیری مقیاسیِ کنشهای میکروسکوپیتر روی مقیاسهای محدود بهدست میآید. در این مقاله هیچ سازوکار میکروسکوپی مشخصی را فرض نمیکنیم؛ در عوض، برای مقایسهٔ کنترلشده و آزمون زیر یک پروتکل آماری یکپارچه، از پارامتردهی حداقلی و قابل ممیزی استفاده میکنیم.
برای شهود، جملهٔ اضافی را میتوان در قالب شتاب نوشت: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). وقتی r≫ℓ، f→1 و V_extra→V0_bin میشود و سهم سرعت اضافی تقریباً تختی در ناحیهٔ بیرونی ایجاد میکند. وقتی r≪ℓ و f(x)≈x باشد، میتوان مقیاس شتاب مشخصهٔ a0,bin≈V0_bin²/ℓ را وارد کرد (تا یک عامل O(1) وابسته به تابع هسته)، که شهودی شبیه MOND برای مقیاس گذار درونی به بیرونی فراهم میآورد.
خانوادهٔ هستهای گسستهٔ استفادهشده در اینجا (none/exponential/yukawa/powerlaw_tail) را میتوان proxyهای کمبُعد برای «شیبهای اولیه / سرعتهای گذار / دُمهای بردبلند» متفاوت دانست (برای نمونه، پوشانندگی شبیه Yukawa در برابر پاسخی با دُم بلندتر). اینها برای آزمون فشار پایداری بهکار میروند، نه برای فرسودن کل فضای مدل. در مؤلفهٔ عدسیگری ضعیف، از V_avg(r) جرم و چگالی پوش مؤثر را میسازیم و سپس آنها را تصویر میکنیم تا ΔΣ(R) بهدست آید. این چگالی مؤثر باید بهعنوان توصیفی مؤثر از پتانسیل عدسیگری زیر فرضهای تقارن کروی و نگاشت میدان ضعیف فهمیده شود (جزئیات کامل به پیوست A منتقل شده است).
همهٔ شکلهای هستهٔ بالا f(x)→1 را وقتی x→∞ برآورده میکنند (یعنی اشباع V_extra²→V0²)، در حالی که برای x≪1 رشد خطی یا زیرخطی میدهند: برای نمونه، exponential: f≈x؛ yukawa: f≈0.5x؛ powerlaw_tail: f≈0.5x. بنابراین شکلهای هستهای مختلف در «شیب اولیه» در شعاع کوچک، سرعت گذار و دُم بیرونی تفاوتهای مشاهدهپذیر دارند و با آزمونهای مشترک RC+GGL و بستار قابل تمایزند.
پیشبینی EFT برای ΔΣ(R) در عدسیگری ضعیف با استنتاج جرم و چگالی پوش از V_avg(r) و سپس انتگرالگیریهای تصویرسازی بهدست میآید: M_enc(r)=r·V_avg²(r)/G، ρ(r)=(1/4πr²)·dM_enc/dr، Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr، و ΔΣ(R)=Σ̄(<R)−Σ(R). پیادهسازی عددی از شبکهٔ لگاریتمی استفاده میکند و در موارد استثنایی آن را بهصورت تطبیقی ریزتر میسازد تا پایداری و بازتولیدپذیری تضمین شود.
(c) DM_RAZOR: خط پایهٔ هالهٔ NFW برای مادهٔ تاریک سرد
در عین حال روشن میکنیم که DM_RAZOR تنها یک خط پایهٔ NFW حداقلی و قابل ممیزی را نمایندگی میکند (c–M ثابت و بدون scatter؛ بدون adiabatic contraction، feedback core، ناكرویبودن یا جملههای محیطی). برای کاهش خطر «خط پایهٔ پوشالی»، این مقاله ادعا نمیکند که چنین اثرهایی وجود ندارند. بلکه آنها را در پیوست B (P1A) بهصورت آزمونهای فشار کمبُعد و قابل ممیزی وارد میکند، از جمله برخورد سلسلهمراتبی با c–M scatter، یک proxy برای core و یک مزاحم کالیبراسیون shear در سوی عدسیگری.
4.2 دفتر ثبت مدل و مقایسهٔ منصفانه (پارامترهای مشترک = تعریف بستار)
تعداد پارامترها در مجموعهٔ مقایسهٔ اصلی چنین است: DM_RAZOR k=20؛ خانوادهٔ EFT k=21 (پارامتر اضافی، log ℓ جهانی است). همهٔ مدلها همان دادههای RC، همان دادهها و کواریانس GGL، همان نگاشت RC-bin→GGL-bin، همان جملههای باریونی و همان تبدیلهای واحد را به اشتراک میگذارند. افزون بر این، شکل هسته (none / exponential / yukawa / powerlaw_tail) انتخابی گسسته است و هیچ پارامتر پیوستهٔ اضافی وارد نمیکند؛ بنابراین امکان کسب برتری با «یک درجهٔ آزادی اضافی» از میان میرود.
4.3 درستنمایی، پیشینها و نمونهگیر
درستنمایی RC گاوسی قطری است: σ_eff² = σ_obs² + σ_int². نتایج اصلی σ_int=5 km/s را ثابت میگیرند و Run-5 روی σ_int پیمایش میکند. درستنمایی GGL برای هر bin از گاوسی با کواریانس کامل استفاده میکند: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). تابع هدف مشترک logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) است. پیشینها عمدتاً مرزهای فیزیکی ممکن را کدگذاری میکنند (قیود بازهای بر log ℓ، log V0 و log M200)؛ هنگامی که Υ و σ_int آزاد میشوند، از پیشینهای کماطلاع استفاده میشود (برای جزئیات به پیادهسازی و پیکربندی بستهٔ انتشار بنگرید).
نمونهگیر از random walk متروپولیس با بلوک تطبیقی استفاده میکند: در هر گام فقط یک زیربلوک تصادفی از فضای پارامتر بهروزرسانی میشود تا نرخ پذیرش در ابعاد بالا بهتر شود، و اندازهٔ گام با نرخ پذیرش پنجرهای بهنرمی تطبیق مییابد (نرخ پذیرش هدف حدود 0.25). نتایج اصلی از quick mode استفاده میکنند (تنظیماتی مانند n_steps=800)، و هر workspace ردپاها، باقیماندهها و نمودارهای PPC را برای ممیزی دستی و اسکریپتی خروجی میدهد.
4.4 آزمون بستار و کنترل منفی (تعریف)
آزمون بستار (Run-2) میآزماید که آیا پسین RC-only میتواند بدون بازبرازش GGL آن را پیشبینی کند یا نه. بهطور مشخص، ΔΣ(R) برای 4 bin در GGL از نمونههای پسین RC-only بهصورت روبهجلو تولید میشود و logL_true با کواریانس کامل محاسبه میگردد؛ سپس نگاشت گروهی RC-bin→GGL-bin بهصورت تصادفی permute میشود تا logL_perm بهدست آید. قدرت بستار بهصورت ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ تعریف میشود. افزون بر این، Run-10 بیست bin در RC را بهطور تصادفی به 4×5 گروهبندی دوباره میکند (shuffle) و بستار را دوباره محاسبه میکند تا سنجیده شود سیگنال بستار تا چه اندازه به نگاشت درست وابسته است.
5 نتایج اصلی و تفسیر
5.1 نتایج اصلی برازش مشترک (RC+GGL)
بهترین logL_total از برازش مشترک و برتری نسبی ΔlogL_total (نسبت به DM_RAZOR) در جدول S1a و شکل S4 نشان داده شدهاند. در مجموعهٔ مقایسهٔ اصلی، EFT_BIN بزرگترین برتری مشترک را دارد (ΔlogL_total=1337.210)، در حالی که دیگر شکلهای هستهای EFT نیز برتریهای چشمگیری حفظ میکنند (1154.827–1294.442). بر اساس معیارهای اطلاعاتی (AICc/BIC)، خانوادهٔ EFT نیز بهطور معنادار از DM_RAZOR بهتر عمل میکند؛ این نشان میدهد برتری ناشی از سوگیری تعداد پارامترها نیست.
نکته: سهم اصلی در ΔlogL_total≈1337 از جملهٔ RC میآید (ΔlogL_RC≈1065 در تجزیهٔ مشترک، حدود 80%). این را میتوان بهصورت بهبود متوسط حدود Δχ²≈0.90 برای هر نقطه در N=2295 نقطهٔ دادهٔ RC فهمید که در یک درستنمایی گاوسی قطری بهطور طبیعی به برتری از مرتبهٔ 10^3 انباشته میشود. در عین حال، GGL و آزمون بستار قیود مستقل میانمجموعهدادهای فراهم میکنند و رتبهبندی زیر آزمونهای فشار σ_int، R_min و cov-shrink پایدار میماند (بنگرید به بخش 6 و جدول S1b).
5.2 نتایج آزمون بستار (RC-only → GGL)
کمیت کلیدی آزمون بستار، ΔlogL_closure، در جدول S1b و شکل S3 گزارش شده است. خانوادهٔ EFT قدرت بستاری برابر 171.977–280.513 دارد که از 126.678 برای DM_RAZOR بالاتر است. این یعنی بدون اجازهدادن به درجات آزادی میاندادهای اضافی، نمونههای پسینی که EFT از دادههای RC بهدست میآورد، توان پیشبینی انتقالپذیر قویتری برای دادههای GGL دارند.
کنترل منفی اهمیت فیزیکی سیگنال بستار را بیشتر پشتیبانی میکند: وقتی گروهبندی RC-bin→GGL-bin بهطور تصادفی shuffle میشود، قدرت بستار EFT به 6–15 کاهش مییابد (با تفاوتهای کوچک میان هستهها)، در حالی که قدرت بستار پایه به 172–281 میرسد. این «فروپاشی سیگنال» برتریهای کاذب ناشی از پیادهسازی عددی، خطاهای واحد یا برخورد نادرست با کواریانس را رد میکند.

شکل R1 | کنترل منفی: پس از گروهبندی shuffle، سیگنال بستار بهطور معنادار کاهش مییابد (ترسیمشده از شاخصهای Tab_Z1).
5.3 معنای نتایج و حدود آنها
نتیجهٔ این مطالعه این است که «زیر این مجموعهداده و این پروتکل، تصحیح گرانش میانگین EFT از خط پایهٔ DM_RAZOR آزمودهشده بهتر عمل میکند». باید تأکید کرد که سویهٔ DM فقط از خط پایهٔ NFW حداقلی با رابطهٔ ثابت c(M) استفاده میکند، بدون core formation، ناكرویبودن، جملههای محیطی یا مدلهای پیچیدهتر اتصال کهکشان-هاله. بنابراین این دستنوشته ادعا نمیکند همهٔ خانوادههای مدل DM را رد میکند. بلکه یک خط پایهٔ کنترل بازتولیدپذیر و مرکزیافته بر آزمون بستار ارائه میکند برای ارزیابی اینکه آیا RC و GGL را میتوان با همان پارامترها و نگاشت میاندادهای بهصورت سازگار توضیح داد.
برای پاسخ به این نگرانی رایج، یک پروژهٔ گسترش مستقل به نام P1A را تکمیل کردهایم (بنگرید به پیوست B). بدون تغییر نگاشت مشترک RC-bin→GGL-bin یا چارچوب ممیزی، این پروژه خط پایهٔ DM را به شیوهای «استانداردشده و قابل ممیزی» تقویت میکند: فراتر از سه تقویت تکپارامتری (SCAT/AC/FB)، (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT)، (ii) یک proxy تکپارامتری برای core ناشی از بازخورد باریونی (DM_CORE1P)، و (iii) مزاحم m برای کالیبراسیون shear در سوی عدسیگری ضعیف (DM_RAZOR_M) را اضافه میکند و مدل ترکیبی DM_STD را گزارش میدهد؛ EFT_BIN بهعنوان مرجع کنترل حفظ میشود.
• DM_RAZOR_SCAT (c–M scatter) — پارامتر پراکندگی تمرکز halo-to-halo یعنی σ_logc را وارد میکند تا بیازماید آیا c(M) ثابت، توان توضیحی DM را بهطور نظاممند کمتر از واقع برآورد میکند یا نه؛
• DM_RAZOR_AC (Adiabatic Contraction) — با یک پارامتر α_AC بین «بدون انقباض» و «انقباض استاندارد» بهصورت پیوسته درونیابی میکند و گرایش باریونها به فشردهکردن هالهٔ درونی را با کمترین هزینه ثبت میکند؛
• DM_RAZOR_FB (Feedback/core) — از یک مقیاس core (برای مثال log r_core) استفاده میکند تا چگونگی سرکوب منحنیهای چرخش توسط تشکیل core درونی را توصیف کند، در حالی که تقریب NFW را در مقیاسهای عدسیگری ضعیف حفظ میکند.
scoreboard کمی P1A در پیوست B، جدول B1 / شکل B1 ارائه شده است (بهصورت خودکار از Tab_S1_P1A_scoreboard تولید شده). در شاخص بستار، DM_RAZOR_FB بهبود خالص کوچکی میدهد (122.21→129.45، +7.25)، در حالی که دیگر تقویتها در قدرت بستار سهم ناچیز یا منفی دارند. در سوی برازش مشترک، افزودن پیشین پراکندگی c–M سلسلهمراتبی (DM_HIER_CMSCAT) یا مدل ترکیبی (DM_STD) میتواند logL مشترک را بهطور چشمگیر بهتر کند، اما قدرت بستار را بهتر نمیکند؛ این نشان میدهد که عمدتاً انعطاف برازش مشترک میافزاید، نه انتقالپذیری میان کاوشگرها. بنابراین نتیجهٔ محوری متن اصلی باید چنین خوانده شود: زیر قیود سختگیرانهٔ نگاشت مشترک و آزمون بستار، برتری سازگاری میاندادهای EFT از انتخاب یک «خط پایهٔ بیش از حد ضعیف» در سوی DM ناشی نمیشود. بستهٔ انتشار P1A متناظر با پیوست B (جداول/شکلهای تکمیلی و full_fit_runpack) بهعنوان فایلهای اضافی زیر همان Zenodo Concept DOI بستهٔ full_fit_runpack این مقاله قرار خواهد گرفت: https://doi.org/10.5281/zenodo.18526286.
6 پایداری و آزمایشهای کنترل
6.1 پیمایش σ_int (Run-5)
ما پراکندگی ذاتی RC یعنی σ_int را بهطور نظاممند پیمایش میکنیم و در هر σ_int استنتاج مشترک را تکرار میکنیم و ΔlogL_total را نسبت به DM_RAZOR محاسبه میکنیم. کمینه/بیشینهٔ مقادیر ΔlogL_total برای هر مدل در دامنهٔ پیمایش، در جدول S1b گزارش شده است.

شکل R2 | دامنهٔ ΔlogL_total زیر پیمایش σ_int (بزرگتر بهتر است).
6.2 پیمایش R_min (Run-6)
برای آزمودن اثر سیستماتیکهای دادههای ناحیهٔ مرکزی (مانند حرکت غیرمدور، وضوح، و مدلسازی ناکافی باریونی)، برشهای آستانهٔ R_min را روی RC اعمال میکنیم و استنتاج مشترک را تکرار میکنیم. برتری خانوادهٔ EFT در پیمایش R_min از نظر علامت مثبت و از نظر مقیاس پایدار میماند.

شکل R3 | دامنهٔ ΔlogL_total زیر پیمایش R_min (بزرگتر بهتر است).
6.3 پیمایش cov-shrink (Run-7)
برای آزمودن نااطمینانی در کواریانس GGL، روی ماتریس کواریانس هر bin جرمی shrinkage اعمال میکنیم: C_α=(1−α)C+α·diag(C)، و α را پیمایش میکنیم. نتایج نشان میدهند که برتری خانوادهٔ EFT نسبت به این برخورد حساس نیست.

شکل R4 | دامنهٔ ΔlogL_total زیر پیمایش cov-shrink (بزرگتر بهتر است).
6.4 نردبان ablation (Run-8)
درون EFT_BIN، ablationهای تودرتو انجام میدهیم: از مدل حداقلی (بدون پارامتر آزاد) تا نسخههایی که فقط تعداد اندکی درجهٔ آزادی را نگه میدارند، و در نهایت مدل کامل با دامنهٔ 20-bin + مقیاس جهانی. AICc/BIC نشان میدهند که مدل کامل EFT_BIN بهشدت توسط دادهها طلب میشود.

شکل R5 | نردبان ablation برای EFT_BIN (AICc؛ کوچکتر بهتر است).
6.5 پیشبینی holdout (Run-9)
ما آزمون leave-one-bin-out (LOO) را نیز اجرا میکنیم: از میان 4 bin جرمی GGL، هر بار یک bin کنار گذاشته میشود؛ استنتاج با استفاده از binهای باقیمانده (و همهٔ RC) دوباره انجام میشود، و سپس log-likelihood آزمون روی bin کنارگذاشتهشده ارزیابی میشود. شاخصهای خلاصه در جدول تکمیلی Tab_R3_leave_one_bin_out آمدهاند (محصول Run-9؛ الگوهای مسیر فایل در فهرست محصولات کلیدی بخش 8.2 ذکر شدهاند). خانوادهٔ EFT حتی در بدترین مورد holdout نیز آشکارا از DM_RAZOR بهتر میماند.

شکل R6 | LOO: توزیع log-likelihood برای bin کنارگذاشتهشده (از محصولات Run-9).
6.6 کنترل منفی: shuffle کردن RC-bin (Run-10)
Run-10 بیست bin در RC را بهطور تصادفی به 4×5 گروهبندی دوباره میکند و بستار را با ثابت نگه داشتن پسین RC-only دوباره محاسبه میکند. نتایج نشان میدهد که در مقایسه با نگاشت اصلی، shuffle کردن هم میانگین logL_true در بستار و هم ΔlogL_closure را بهطور چشمگیر کاهش میدهد (بنگرید به جدول S1b و شکل R1)، و این امر تفسیرپذیری سیگنال بستار را بیشتر پشتیبانی میکند.

شکل R7 | کنترل منفی: نگاشت shuffle باعث افت آشکار در میانگین بستار logL_true میشود (از محصولات Run-10).
7 ردیابیپذیری و ممیزی سازگاری (منشأ)
همهٔ مقادیر عددی نقلشده در این مقاله در جدولهای خلاصهٔ سختگیرانه و سوابق ممیزی آرشیو انتشار، بند به بند قابل ردیابیاند. برای خواناتر ماندن متن اصلی، زنجیرهٔ کامل منشأ (فهرست برچسبها، جدولهای ممیزی، فهرست checksum و روش راستیآزمایی) به پیوست A منتقل شده است.
8 بازتولیدپذیری و آرشیو Zenodo
بیانیهٔ دسترسپذیری داده و کد: دادههای منحنی چرخش SPARC و دادههای عدسیگری ضعیف KiDS-1000 که در این مقاله استفاده شدهاند، مجموعهدادههای عمومیاند. گزارش در سطح انتشار در Zenodo آرشیو شده است (Concept DOI: https://doi.org/10.5281/zenodo.18526334)، و بستهٔ کامل بازتولید نیز در Zenodo آرشیو شده است (Concept DOI: https://doi.org/10.5281/zenodo.18526286). گامهای اجرایی تفصیلی، محیط وابستگیها، inventory آرشیو و اطلاعات راستیآزمایی hash در پیوست A ارائه شدهاند؛ طراحی، برچسبهای اجرا و خروجیهای آزمون فشار استانداردسازی خط پایهٔ DM (P1A) در پیوست B آمدهاند.
زیر همان Concept DOI بستهٔ کامل بازتولید (https://doi.org/10.5281/zenodo.18526286)، دو نقطهٔ ورود بازتولیدپذیر را بر اساس مورد استفاده فراهم میکنیم: • P1 (متن اصلی) full_fit_runpack: تحلیلهای RC-only / closure / joint و پیمایشهای پایداری برای EFT در برابر DM_RAZOR را بازتولید میکند و داراییهای متن اصلی از جمله جدولهای S1a/S1b و شکلهای S3/S4 را میسازد؛ • P1A (پیوست B) full_fit_runpack: آزمون فشار استانداردسازی خط پایهٔ DM را بازتولید میکند (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD، شامل کنترل EFT_BIN)، و جدول B1 و شکل B1 پیوست را میسازد. جداول/شکلهای تکمیلی P1A و full_fit_runpack بهعنوان فایلهای اضافی زیر همان Concept DOI قرار خواهند گرفت تا یک نقطهٔ ورود آرشیوی واحد حفظ شود.
9 سپاسگزاریها و اظهارنامهها
9.1 سپاسگزاریها
از تیمهای SPARC و KiDS-1000 برای فراهمکردن دادهها و مستندات عمومی، و از مشارکتکنندگان در جریان کار بازسازی و ممیزی این پروژه سپاسگزاری میکنیم.
9.2 مشارکتهای نویسنده
Guanglin Tu مسئول پیشنهاد مفهومی، طراحی مطالعه، پیادهسازی مهندسی، سازماندهی داده، تحلیل صوری، اجرای جریان کار بازتولیدپذیری و ممیزی، و نگارش دستنوشته بوده است.
9.3 تأمین مالی
تأمین مالی شخصی توسط نویسنده، Guanglin Tu (بدون تأمین مالی بیرونی / بدون شمارهٔ گرنت).
9.4 منافع رقیب
نویسنده، Guanglin Tu، وابسته به «کارگروه EFT، Shenzhen Energy Filament Science Research Co., Ltd. (چین)» است؛ هیچ منفعت رقیب دیگری اعلام نمیشود.
9.5 کمک هوش مصنوعی
OpenAI GPT-5.2 Pro و Gemini 3 Pro برای صیقل زبانی، ویرایش ساختاری و سازماندهی جریان کار بازتولیدپذیری استفاده شدند. از آنها برای تولید یا تغییر دادهها، نتایج، شکلها، جدولها یا کد، و نیز برای تولید استنادها استفاده نشده است. نویسنده مسئولیت کامل محتوای دستنوشته و دقت استنادها را بر عهده دارد.
10 منابع
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- نظریهٔ فیلامنت انرژی. Zenodo (مخزن علم باز) DOI: https://doi.org/10.5281/zenodo.18517411
پیوست A: جزئیات ردیابیپذیری و بازتولیدپذیری
این پیوست اطلاعات آرشیوی بلندمدت برای ردیابیپذیری و بازتولیدپذیری را خلاصه میکند، از جمله برچسبهای اجرا، نتایج ممیزی، inventoryهای آرشیو و نقاط کلیدی راستیآزمایی، تا خوانندگان بتوانند در صورت نیاز کار را بررسی و بازتولید کنند.
A.1 جزئیات ردیابیپذیری و ممیزی
برای تضمین ردیابیپذیری بلندمدت، این پروژه برای هر اجرا و خروجی از برچسبهای زماندار استفاده میکند و محصولات تاریخی را بدون بازنویسی نگه میدارد. مقادیر محوری نقلشده در این دستنوشته از compilation سختگیرانه (compile_tag=20260205_035929) میآیند و ممیزیهای سازگاری زیر را گذراندهاند:
• همهٔ جدولهای سطح مرحله run_tag و برچسب مرحله دارند؛ اسکریپت compilation سختگیرانه، منابع جدول canonical «کامل و سازگار» را از report/tables انتخاب میکند.
• مقادیر Tab_Z1_master_summary و Tab_Z2_conclusion_highlights بند به بند با جدولهای canonical انتخابشده مقایسه میشوند.
• هنگام تولید PDF، برای «برچسبهای جدول/شکل ارجاعشده» ممیزی برچسب انجام میشود تا اطمینان حاصل شود محصولات قدیمی درهم آمیخته نشدهاند.
برچسبهای کلیدی (برای مکانیابی همهٔ محصولات میانی): run_tag=20260204_122515؛ closure_tag=20260204_124721؛ joint_tag=20260204_152714؛ sigma_sweep_tag=20260204_161852؛ rmin_sweep_tag=20260204_195247؛ covshrink_tag=20260204_203219؛ ablation_tag=20260204_214642؛ LOO_tag=20260204_224827؛ negctrl_tag=20260204_234528؛ strict_compile_tag=20260205_035929؛ release_tag=20260205_112442.
نتیجهٔ ممیزی سازگاری: Tab_AUDIT_checks_strict مقدار pass=9، fail=0، skip=0 را گزارش میکند (برای جزئیات به بستهٔ انتشار بنگرید).
A.2 گامهای اجرای بازتولید و inventory آرشیو
این مطالعه سامانهای برای بازتولیدپذیری بهکار میگیرد که از «گزارش در سطح انتشار + مکمل جدولها/شکلها + بستهٔ اجرای کامل و قابل اجرای دوباره» تشکیل شده است. خوانندگان میتوانند برای راستیآزمایی همهٔ داراییهای جدول/شکلِ نقلشده در مقاله مستقیماً به Tables & Figures Supplement مراجعه کنند؛ برای بازتولید مقادیر عددی و زنجیرهٔ ممیزی از ابتدا، میتوانند از full_fit_runpack برای دانلود دادهها و اجرای دوبارهٔ جریان کار کامل استفاده کنند. پس از پایان، اسکریپت داخلی مقایسهٔ جدولهای مرجع در بسته میتواند برای راستیآزمایی سازگاری مقادیر جدولها بهکار رود.
A.2.1 شروع سریع بازتولید (RUN_FULL، Windows PowerShell)
این بخش مسیر کوتاهتری برای بازتولید ارائه میدهد (Windows PowerShell). برای بررسی سریع، به خوانندگان توصیه میشود مستقیماً به Tables & Figures Supplement مراجعه کنند و جدولها و شکلهای نقلشده را بند به بند راستیآزمایی کنند. برای بازتولید انتها به انتها و تولید همهٔ جدولها، شکلها و محصولات ممیزی، از full_fit_runpack استفاده کنید: مطابق README/ONE_PAGE_REPRO_CHECKLIST بسته، verify_checksums.ps1 و RUN_FULL.ps1 را اجرا کنید (Mode=full توصیه میشود).
ورودی آرشیو Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
برچسبهای زنجیرهٔ اصلی این مقاله: run_tag=20260204_122515؛ strict compile_tag=20260205_035929؛ release_tag=20260205_112442.
A.2.2 مواد آرشیو و نقاط کلیدی راستیآزمایی (Packages & checks)
آرشیو Zenodo سه دستهٔ مکمل از مواد فراهم میکند: (1) گزارش در سطح انتشار (این مقاله، v1.1؛ شامل پیوست B: آزمون فشار استانداردسازی خط پایهٔ DM در P1A)؛ (2) Tables & Figures Supplement (جدولها و شکلهای تکمیلی که همهٔ داراییهای جدول/شکلِ نقلشده در این مقاله را پوشش میدهند و جداگانه متناظر با P1 و P1A هستند)؛ و (3) full_fit_runpack (بستهٔ کامل بازتولید: دادهها را از ابتدا دانلود میکند و جریان کار کامل را دوباره اجرا میکند، جداگانه متناظر با P1 و P1A). موارد (1)–(2) از خواندن سریع و راستیآزمایی مستقل پشتیبانی میکنند؛ مورد (3) بازتولیدپذیری کامل انتها به انتها را فراهم میکند.
هدف و جایگاه (ترتیب پیشنهادی استفاده) | نام فایل (نمونه) | دستهٔ ماده |
گزارش کامل آرشیوشده در Zenodo؛ متن اصلی نتیجهگیریهای محوری و ممیزیهای پایداری را میدهد، و پیوست B آزمون P1A را ارائه میکند (آزمون فشار استانداردسازی خط پایهٔ DM). | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | گزارش در سطح انتشار (چینی و انگلیسی) |
همهٔ جدولها (CSV) و شکلها (PNG) که در متن اصلی نقل شدهاند، شامل اسکریپتهای تولید و فایلهای برچسب. | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Tables & Figures Supplement (P1) |
همهٔ جدولها و شکلهای نقلشده در پیوست B (P1A)، شامل Tab_S1_P1A_scoreboard و Fig_S1_P1A_scoreboard. | P1A_supplement_figs_tables_v1.zip | Tables & Figures Supplement (P1A) |
بازتولید کامل انتها به انتها: دانلود دادهها از ابتدا و اجرای دوبارهٔ RC-only/closure/joint و پیمایشهای پایداری. | P1_RC_GGL_full_fit_runpack_v1_1.zip | full_fit_runpack (P1) |
بازتولید کامل انتها به انتها (پیوست B): اجرای دوبارهٔ DM 7+1 + DM_STD (شامل کنترل EFT_BIN) و تولید داراییهای پیوست؛ بسته شامل اسکریپت مقایسهٔ جدول مرجع برای راستیآزمایی سازگاری مقادیر جدول است. | P1A_RC_GGL_full_fit_runpack_v1.zip | full_fit_runpack (P1A) |
توصیهٔ استناد: هنگام استناد به این مقاله یا مواد بازتولیدپذیری همراه آن، لطفاً به Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334) استناد کنید.
محصولات کلیدی که پس از بازتولید باید ظاهر شوند و قابل مقایسه باشند عبارتاند از:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (خلاصهٔ بستار)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (خلاصهٔ برازش مشترک)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (پیمایش σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (پیمایش R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (پیمایش cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (کنترل منفی)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (جدول اصلی Strict؛ متناظر با جدولهای S1a/S1b و مقادیر متن اصلی)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (بستهٔ PDF در سطح انتشار؛ برای مرور سریع و استناد قابل استفاده است)
پیوست B: P1A — آزمون فشار استانداردسازی خط پایهٔ DM (DM 7+1 + DM_STD؛ همراه با کنترل EFT)
این پیوست یک پروژهٔ گسترش (P1A) برای «آزمون فشار استانداردسازی خط پایهٔ DM» را مستند میکند که با پروتکل بستار متن اصلی سازگار است. نقش آن این است که خط پایهٔ حداقلی DM_RAZOR استفادهشده در متن اصلی (NFW + c–M ثابت، بدون scatter / بدون contraction / بدون core) را به مجموعهای از خط پایههای DM ارتقا دهد که به عمل اخترفیزیکی نزدیکتر و در برابر نقدهای رایج مقاومتر است، بیآنکه تعداد زیادی درجهٔ آزادی وارد کند و بیآنکه نگاشت مشترک RC-bin→GGL-bin یا چارچوب ممیزی را تغییر دهد. P1A آزمون فشار سهشاخهٔ قبلی را پوشش میدهد و ابرمجموعهٔ آن است: SCAT/AC/FB را حفظ میکند و hierarchical c–M scatter + prior، یک proxy تکپارامتری برای core و مزاحم m برای کالیبراسیون shear در سوی عدسیگری را میافزاید؛ همچنین مدل ترکیبی DM_STD را ارائه میکند. EFT_BIN بهعنوان مرجع کنترل حفظ میشود.
یادداشت تکمیلی: قدرتهای بستار و مقادیر مرتبط در پیوست B (P1A) از بودجهٔ Monte Carlo بزرگتری استفاده میکنند (برای مثال ndraw=400، nperm=24) نسبت به بودجهٔ quick که در متن اصلی برای پوشش خانوادهٔ کامل هستههای EFT بهکار رفته است (برای مثال ndraw=60، nperm=12). بنابراین مقادیر مطلق ممکن است drift نمونهگیری در سطح O(10) نشان دهند. با این حال، مقایسهٔ مدل با مدل درون همان بودجه/جدول منصفانه است و علامت و مقیاس برتری در بودجههای مختلف پایدار میماند.
B.1 هدف و جایگاه (چرا P1A، و چرا در قالب پیوست)
P1A نمیکوشد همهٔ انتخابهای ممکن در مدلسازی هالهٔ ΛCDM را exhausted کند (مانند ناكرویبودن، وابستگی محیطی، اتصالهای پیچیدهٔ کهکشان-هاله، یا فیزیک باریونی پُربُعد). در عوض P1A از اصل «کمبُعد، قابل ممیزی، بازتولیدپذیر» پیروی میکند: هر ماژول تقویتی فقط حداکثر ۱ پارامتر مؤثر کلیدی وارد میکند و همچنان تابع سه قید سخت این مقاله است:
(i) دفتر ثبت پارامتر: هر پارامتر تازه باید صریحاً ثبت و همراه با معیارهای اطلاعاتی (AICc/BIC) گزارش شود؛
(ii) نگاشت مشترک: همان نقشهٔ گروهبندی RC-bin→GGL-bin همچنان استفاده میشود؛ «تنظیم نگاشت» بهصورت جداگانه برای یک مجموعهدادهٔ منفرد مجاز نیست؛
(iii) آزمون بستار: هر تقویت باید سود واقعی در انتقال پیشبینی RC→GGL نشان دهد، نه صرفاً برازش بهتر RC-only.
B.2 DM 7+1 + DM_STD: تعریف ماژولها، پارامترها و ورود به پسین مشترک
P1A بهعنوان یک runpack مستقل، 8 workspace برای DM (DM 7+1) بهعلاوهٔ 1 کنترل EFT فراهم میکند: از DM_RAZOR بهعنوان خط پایه آغاز میکند، سه تقویت legacy تکپارامتری (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB) را میسازد، سه ماژول دفاعی استانداردتر (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) را اضافه میکند، و سپس مدل ترکیبی DM_STD را ارائه میدهد. هدف مشترک این ماژولها پوشش سه نقد رایج با کمترین افزایش ممکن در بُعد است: (a) پراکندگی c–M و پیشینها چگونه وارد مدل سلسلهمراتبی میشوند؛ (b) آیا اثر اصلی بازخورد باریونی را میتوان با یک proxy تکپارامتری برای core ثبت کرد؛ و (c) آیا سیستماتیکهای کلیدی در سوی عدسیگری ممکن است با سیگنال فیزیکی اشتباه گرفته شوند.
اصل پیادهسازی (سازگار با ممیزی) | انگیزهٔ فیزیکی (هسته) | پارامتر(های) جدید (حداکثر ۱) | dm_model | Workspace |
|---|---|---|---|---|
نگاشت مشترک ثابت؛ دفتر ثبت پارامتر سختگیرانه؛ فقط بهعنوان خط پایه برای مقایسهٔ نسبی استفاده میشود | خط پایهٔ حداقلی و قابل ممیزی هالهٔ ΛCDM؛ برای مقایسهٔ سختگیرانه با EFT استفاده میشود | — | NFW (fixed c–M, no scatter) | DM_RAZOR |
حداکثر ۱ پارامتر جدید؛ نگاشت مشترک حفظ میشود؛ سود بستار معیار پذیرش است | رابطهٔ c–M پراکندگی دارد؛ با پراکندگی log-normal تکپارامتری تقریب زده میشود | σ_logc | NFW + c–M scatter(legacy) | DM_RAZOR_SCAT |
حداکثر ۱ پارامتر جدید؛ نگاشت تغییر نمیکند؛ تغییرات AICc/BIC و سود بستار گزارش میشوند | سقوط باریونی ممکن است انقباض آدیاباتیک هاله را القا کند؛ با شدت تکپارامتری تقریب زده میشود | α_AC | NFW + Adiabatic Contraction(legacy) | DM_RAZOR_AC |
حداکثر ۱ پارامتر جدید؛ همان پروتکل بستار/کنترل منفی؛ بهبود RC-only تنها هدف نیست | بازخورد ممکن است در ناحیهٔ درونی core ایجاد کند؛ با مقیاس core تکپارامتری تقریب زده میشود | log r_core | NFW + feedback core(legacy) | DM_RAZOR_FB |
پیشین صریح؛ c_i پنهان marginalized میشود؛ همچنان کمبُعد و قابل ممیزی است | ساختار سلسلهمراتبی استانداردتر c_i∼logN(c(M_i),σ_logc)؛ بر پسین مشترک هر دو RC و GGL اثر میگذارد | σ_logc(hier) | Hierarchical c–M scatter + prior | DM_HIER_CMSCAT |
به ادبیات استاندارد استناد میکند؛ حداکثر ۱ پارامتر جدید؛ به آزمون بستار گره خورده است | از یک proxy تکپارامتری برای core و اثر اصلی بازخورد باریونی استفاده میکند و از جزئیات پُربُعد تشکیل ستاره پرهیز میکند | log r_core | 1‑parameter core proxy (coreNFW/DC14‑inspired) | DM_CORE1P |
مزاحم بهروشنی ثبت شده است؛ نمیتواند به عقب بر RC اثر بگذارد؛ نتایج عمدتاً با پایداری بستار داوری میشوند | یک سیستماتیک کلیدی در عدسیگری ضعیف را بهصورت پارامتر مؤثر جذب میکند و خطر اشتباه گرفتن سیستماتیک با فیزیک را کاهش میدهد | m_shear(GGL) | NFW + lensing shear‑calibration nuisance | DM_RAZOR_M |
دفتر ثبت پارامتر + معیارهای اطلاعاتی گزارش میشوند؛ بستار شاخص اصلی است؛ بهعنوان قویترین کنترل دفاعی DM استفاده میشود | سه ردهٔ نقد رایج را در خط پایهٔ استانداردی میگنجاند که همچنان کمبُعد است | σ_logc + log r_core (+ m_shear) | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | DM_STD |
نکته: نام پارامترهای بالا از پیادهسازی مهندسی پیروی میکنند (برای مثال σ_logc، α_AC، log r_core و m_shear). تمرکز طراحی P1A این است که «خط پایهٔ DM را تا حدی قویتر کند، در حالی که قابل ممیزی بماند»، نه اینکه سویهٔ DM را به برازشگر پُربُعد و مهارنشدنی تبدیل کند. بهویژه، DM_HIER_CMSCAT پراکندگی c–M را بهصورت سلسلهمراتبی وارد میکند: تمرکز c_i هر هاله، پیرامون c(M_i) پراکندگی log-normal میگیرد و با σ_logc جهانی و پیشین c(M) محدود میشود؛ این ساختار سلسلهمراتبی بر پسین مشترک هر دو دادهٔ RC و GGL اثر میگذارد.
B.3 پروتکل آماری و قراردادهای محصول سازگار با متن اصلی
P1A همهٔ محصولات داده، نگاشت مشترک و چارچوب ممیزی متن اصلی را دوباره بهکار میگیرد. ترتیب اجرا و قراردادهای محصول سازگار میمانند:
(1) Run‑1: استنتاج RC-only (خروجی posterior_samples.npz و metrics.json)؛
(2) Run‑2: آزمون بستار RC→GGL (خروجی closure_summary.json و baselineِ permuted)؛
(3) Run‑3: برازش مشترک RC+GGL (خروجی joint_summary.json).
همهٔ اعداد نقلشده از جدول گردآوریشدهٔ خودکار (Tab_S1_P1A_scoreboard) میآیند و پس از اجرای دوبارهٔ جریان کار کامل P1A با اسکریپت مقایسهٔ جدول مرجعِ تعبیهشده در P1A full_fit_runpack قابل بررسیاند.
B.4 نتایج اصلی، نقاط ورود جدول/شکل و برنامهٔ آرشیو (همان DOI)
این بخش نتیجهگیریهای کمی محوری P1A را ارائه میکند. جدول B1 شاخصهای کلیدی برای RC-only، بستار RC→GGL و برازش مشترک RC+GGL را خلاصه میکند (پرانتزها اختلاف نسبت به خط پایهٔ DM_RAZOR را نشان میدهند). قدرت بستار بهصورت ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ تعریف میشود (بزرگتر بهتر است). شکل B1 همان scoreboard را تصویر میکند. نکات اصلی چنین است:
• از میان سه شاخهٔ legacy، فقط DM_RAZOR_FB (feedback/core) بهبود خالص کوچکی در قدرت بستار میدهد: 122.21→129.45 (+7.25)؛ SCAT و AC بهبود خالصی فراهم نمیکنند؛
• DM_HIER_CMSCAT و DM_RAZOR_M که تازه افزوده شدهاند، اثرهای بسیار کوچکی (~0) بر قدرت بستار دارند، و DM_CORE1P نیز بهبود خالص معناداری نشان نمیدهد؛
• مدل ترکیبی DM_STD میتواند logL مشترک را بهطور چشمگیر بهبود دهد (نزدیکتر به بهینهٔ برازش مشترک)، اما قدرت بستار آن کاهش مییابد؛ این نشان میدهد سود آن عمدتاً از انعطاف برازش مشترک میآید، نه از انتقالپذیری میان کاوشگرها؛
• بهعنوان کنترل، EFT_BIN همچنان برتری روشنی هم در قدرت بستار و هم در برازش مشترک حفظ میکند. بنابراین نتیجهٔ اصلی نسبت به وارد کردن «خط پایهٔ DM قویتر + مزاحم عدسیگری» پایدار است.
برای مقایسهٔ مستقیم با نتایج متن اصلی، جدولهای S1a–S1b مقایسهٔ سختگیرانهٔ میان خانوادهٔ EFT و DM_RAZOR را خلاصه میکنند: مدلهای EFT برازش مشترک را به اندازهٔ ΔlogL_total≈1155–1337 نسبت به DM_RAZOR بهبود میدهند و در آزمون بستار به ΔlogL_closure=172–281 میرسند. P1A فقط در سوی DM یک «کنترل سختتر» میسازد؛ هدف آن کاهش نگرانیهایی مانند «خط پایهٔ پوشالی» یا «سیستماتیک بهجای فیزیک» است، نه جایگزینکردن مقایسهٔ اصلی.
جدول B1 | scoreboard پیوست P1A (بزرگتر بهتر است؛ پرانتزها اختلاف نسبت به خط پایهٔ DM_RAZOR را نشان میدهند).
بهترین logL_total مشترک (Δ) | قدرت بستار ΔlogL_closure (Δ) | بهترین logL_RC در RC-only (Δ) | Δk | شاخهٔ مدل (workspace) |
-27347.068 (+0.000) | 122.205 (+0.000) | -15702.654 (+0.000) | 0 | DM_RAZOR |
-23153.311 (+4193.758) | 121.236 (-0.969) | -15702.294 (+0.361) | 1 | DM_RAZOR_SCAT |
-23982.557 (+3364.511) | 121.531 (-0.674) | -15703.689 (-1.035) | 1 | DM_RAZOR_AC |
-27478.531 (-131.463) | 129.454 (+7.249) | -15496.046 (+206.609) | 1 | DM_RAZOR_FB |
-23153.160 (+4193.908) | 121.978 (-0.227) | -15702.644 (+0.010) | 1 | DM_HIER_CMSCAT |
-27336.258 (+10.810) | 122.056 (-0.149) | -15723.158 (-20.504) | 1 | DM_CORE1P |
-27340.451 (+6.617) | 122.205 (+0.000) | -15702.654 (+0.000) | 0 (+m) | DM_RAZOR_M |
-22984.445 (+4362.623) | 105.690 (-16.515) | -15832.203 (-129.549) | 2 (+m) | DM_STD |
-19001.142 (+8345.926) | 204.620 (+82.415) | -14631.537 (+1071.117) | 1 | EFT_BIN |
شکل B1 | scoreboard پیوست P1A: بستار و ΔlogL مشترک نسبت به خط پایه (بزرگتر بهتر است).

برچسبهای نمونه برای مجموعهٔ اجرای تکمیلشدهٔ متناظر با این پیوست چنین است (برای مکانیابی محصولات میانی و جدولها/شکلهای P1A استفاده میشود):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 پیشنهاد استناد (یادداشت استناد به پیوست)
هنگامی که خوانندگان بخواهند افزون بر نتیجهگیریهای اصلی مقاله به «آزمون فشار استانداردسازی خط پایهٔ DM» استناد کنند، پیشنهاد میشود نتیجهٔ اصلی را همراه با این یادداشت نقل کنند: «See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.»