# 오베시티리스폰서서브페노 (ObesityResponderSubpheno)

비만 약물치료의 **subphenotype × drug class × time × maintenance** 4D 온톨로지 기반
미탐색 cell ranking, 한국 코호트 적합성 평가, 한국어 hypothesis card/Protocol skeleton/IIT·grant proposal abstract 생성기.

- 도메인: Obesity (비만대사질환)
- 카테고리: 연구 아이디어 생성 (가설 생성 · 문헌 갭 분석 · 온톨로지 기반 새 연구 도출)
- 형태: 단일 Python CLI (`main.py`), 표준 라이브러리만 사용

## 디스클레이머 (필수)

본 도구는 mock 데이터 기반 **연구 아이디어 발굴 보조 도구**이다.
임상 진료, 환자 의사결정, 약물 처방, 보험 청구의 근거로 사용해서는 **안 된다**.
실제 임상 적용 전에는 최신 RCT 원문, 가이드라인, 라벨, 한국 보험기준을
직접 확인해야 한다.

외부 네트워크 호출, 외부 유료 API, 전역 패키지 설치는 일절 수행하지 않는다.
출력에 등장하는 RCT id (STEP, SURMOUNT, SURPASS, SELECT, OASIS, REDEFINE 등)는 구조 시연용 mock summary이며 실제 abstract를 그대로 reproduce하지 않는다.

## 핵심 기능 5

1. **항비만약 RCT/RWE literature ETL + KM auto-digitize (mock)**: 약 50개 mock RCT/RWE 코퍼스, 한국 부지 참여 표시 + KM digitization summary 합성.
2. **Subphenotype × drug class × time × maintenance 4D ontology + 정규화**: 12 × 12 × 6 × 4 = 3,456 cell. monogenic LEPR/MC4R/POMC, BBS, hypothalamic, hyperandrogenic PCOS, CAH, sarcopenic obesity, hepatic-predominant MASH, visceral, post-bariatric regain, adolescent, postpartum, default essential 포함.
3. **미탐색 cell ranking + novelty score + Korean cohort suitability**: novelty(1 − published/expected), clinical impact, KR feasibility(KORACO/BBStopCoach RWE/NHIS/KoGES/K-CURE/KSPED), IIT 채택 가능성 결합 priority score.
4. **진료환경 feasibility + 라벨/가이드라인 cross-link**: KR BMI 23 vs WHO 25 cutoff, FDA/EMA/MFDS 라벨, KSSO 2023, KDA 2023, ADA 2025, EASO 2024, KSPED 2024, KSSO/KDA/KASL MASLD 2025 안 cross-link.
5. **한국어 hypothesis card + STROBE-RCT/SPIRIT protocol skeleton + KHIDI/NRF/NIH/Novo/Lilly/BI/Amgen/Pfizer IIT proposal abstract** 생성.

## 실행법

```bash
cd "/Users/sangjoonpark/claude daily project/2026 metabolic daily idea/projects/2026-05-08-2-obesity-responder-subpheno"

# 요약 통계
python3 main.py
python3 main.py --summary

# 상위 미탐색 cell
python3 main.py --top 10

# 특정 subphenotype 갭 분석
python3 main.py --subpheno hepatic_predominant_mash
python3 main.py --subpheno sarcopenic_obesity

# 특정 drug class 갭
python3 main.py --drug glp1_gip_dual
python3 main.py --drug setmelanotide

# 가설 카드 / 프로토콜 / proposal
python3 main.py --card
python3 main.py --protocol
python3 main.py --proposal

# 목록
python3 main.py --list-subpheno
python3 main.py --list-drugs
```

## 검수 체크리스트

- [x] `python3 -c "import ast; ast.parse(open('main.py').read())"` 구문 통과
- [x] `python3 main.py --help` 정상 동작
- [x] `python3 main.py --top 5` 정상 출력
- [x] `python3 main.py --card` 정상 출력
- [x] `python3 main.py --protocol` 정상 출력
- [x] `python3 main.py --proposal` 정상 출력
- [x] 모든 `data/*.json` 파일 `json.load` 통과
- [x] README/CLI 모든 출력에 디스클레이머 포함
- [x] 외부 네트워크 호출 0
- [x] 외부 유료 API 0
- [x] 전역 패키지 설치 0

## 데이터 출처(mock)

본 corpus는 **구조 시연 목적의 합성 데이터**이다. 실제 RCT 결과·KM curve·RWE 수치를 정확히 reproduce하지 않으며, 인용 시 반드시 원문 및 ClinicalTrials.gov / WHO ICTRP / 한국 CRIS의 최신 문서를 직접 확인해야 한다.

참조한 한국 인프라 (개념적 cross-link, 실제 데이터 미포함):

- KORACO (대한비만학회 코호트), BBStopCoach RWE
- NHIS 빅데이터, KoGES, K-CURE, KSPED 청소년 코호트
- KSSO/KDA/KASL/KSPED/EASO/ADA 가이드라인
- FDA/EMA/MFDS 라벨

## 파일 구조

```
2026-05-08-2-obesity-responder-subpheno/
├── README.md
├── main.py
├── QA.md
└── data/
    ├── subphenotypes.json
    ├── drug_classes.json
    ├── time_buckets.json
    ├── maintenance.json
    ├── corpus.json
    ├── korean_cohorts.json
    ├── labels.json
    └── guidelines.json
```
