# data/ — MASLDTriangulate-Kor 데이터 출처

본 디렉토리의 모든 CSV는 **공개 자료 큐레이션 (정성적 요약치)** 이며,
임상의사결정이 아닌 **연구 가설 생성·triangulation 진단 목적의 시뮬레이션 입력값**입니다.

## 파일

### effects_sample.csv
5-design 효과 추정치 (≥30행 큐레이션).
| 컬럼 | 설명 |
|---|---|
| masld_stage | S0/S1/MASH/F2/F3/F4 (S1_lean = 한국 lean MASLD) |
| biomarker | NIT proxy (FIB-4·VCTE kPa·histology) |
| outcome | hepatic·CV·extra-hepatic·neuro·metabolic |
| design | observational / MR / RCT / ex_vivo_pcls / within_subject_lifestyle |
| mr_instrument | PNPLA3·TM6SF2·HSD17B13·MBOAT7·GCKR·BMI/T2DM polygenic / PNPLA3_korean |
| effect_estimate, ci_low, ci_high | HR·OR 등 (스케일은 source 그대로) |

대표 출처: Sanyal 2021 NEJM, Mantovani 2021/2022 Gut, Vujkovic 2022 Nat Genet,
Bianco 2020 J Hepatol, Abul-Husn 2018 NEJM, Harrison 2024 NEJM (MAESTRO-NASH),
Lee H 2021 CGH, Eslam 2020 Lancet GH 등.

### masld_stages.csv
MASLD 단계 정의 (S0/S1/MASH/F2/F3/F4) + NIT proxy (FIB-4·VCTE).

### outcome_ontology.csv
15+ outcome (hepatic mortality·HCC·decompensation·CV·CKD/ESKD·T2DM·sarcopenia·dementia
+ 12개 extra-hepatic cancer).

### mr_instruments.csv
MR instrument 6종 + Korean PNPLA3 layer.
- PNPLA3 rs738409 / TM6SF2 rs58542926 / HSD17B13 rs72613567 / MBOAT7 rs641738 /
  GCKR rs1260326 / BMI·T2DM·WC polygenic.

### allele_frequency_korean.csv
한국 ancestry allele frequency (PNPLA3 G ~0.30, HSD17B13 protective ~0.27).

## 한계
- 모든 값은 정성적 큐레이션 (개별 study 정확치 ≠ 본 도구 입력값).
- MR 효과는 단위 (per allele, per SD log MASLD liability) 혼재 — triangulation 진단 목적상 정성 비교만.
- RCT는 MAESTRO-NASH interim 등 단기 follow-up이므로 LRC mortality·HCC는 proxy 신호.
