# GLP1AESignal-Kor (지엘피원에이이시그널-코어)

> ⚠️ **참고용·연구용 — Not for clinical decision.**
> 본 도구는 약물감시(pharmacovigilance) 워크플로 프로토타이핑을 위한 합성 데이터 기반 standalone MVP입니다. 환자 치료, 규제 제출, 실제 시그널 판단에 그대로 사용할 수 없습니다.

## 1. 목적

GLP-1 수용체 작용제(GLP-1RA) 및 차세대 항비만제(semaglutide, liraglutide, tirzepatide, retatrutide, CagriSema, orforglipron)의 임상시험(RCT/observational)에서 수집된 이상반응(AE)을 MedDRA-style로 코딩하고, **GLP-1 class 특이 안전성 시그널 7종**을 다음과 같이 모니터링한다:

- 시계열 (early <12wk vs late)
- subgroup (BMI, age, sex, T2DM, prior pancreatitis Hx)
- dose-response
- FAERS-like background와의 disproportionality 비교

최종적으로 DSC(Data Safety Committee) quarterly 시그널 리포트 및 RMP/PSUR/DSUR 모듈 docx 초안을 표준 산출한다.

## 2. 도메인 / 카테고리

- **도메인**: Obesity (비만)
- **카테고리**: 인체실험 도구 (RCT/observational study pharmacovigilance)

## 3. 핵심 기능 5개

1. **AE ingest + MedDRA 매핑 + de-identification**
   - eCRF AE 자유텍스트 / 체크박스 CSV import
   - 내장 **합성 mini-MedDRA-like 사전** (약 80 PT — MedDRA 라이센스 우회용 자체 작성)
   - SOC/PT/LLT 분류 mock
   - 환자 ID hash, site mask

2. **GLP-1RA class-특이 signal panel 7개**
   - (a) **췌장염**: amylase/lipase 시계열 + 복통 PT + 영상 → Atlanta classification (mild/moderate/severe)
   - (b) **갑상선**: calcitonin 시계열 + ≥50 pg/mL flag + sex/CKD 보정
   - (c) **담낭염/담석증**
   - (d) **GI AE** (nausea/vomiting/diarrhea) + dose interruption 사이트별 이질성
   - (e) **주사부위 반응**
   - (f) **망막병증** 악화 (SUSTAIN-6 historical signal)
   - (g) **suicidality/자해** (C-SSRS 변화)

3. **시계열·subgroup·dose-response 시그널 detection**
   - IRR(incidence rate ratio) + 95% CI (drug vs placebo)
   - onset 분포 (early <12wk vs late)
   - dose-response
   - subgroup: baseline BMI, age, sex, DM 여부, prior pancreatitis Hx

4. **FAERS background disproportionality**
   - 합성 FAERS-like CSV (drug × AE pair 약 200 row)
   - **ROR**, **PRR**, **EBGM** 산출
   - PRR ≥ 2 + χ² ≥ 4 + count ≥ 3 시그널 검출 threshold
   - trial signal vs FAERS background 비교 시각화

5. **DSC quarterly 리포트 + RMP/PSUR/DSUR 자동 export**
   - quarterly 요약 (panel별 incidence·시계열·FAERS disproportionality·subgroup·dose-response)
   - RMP / PSUR / DSUR module docx 초안
   - 시그널 강도별 우선순위 (strong / emerging / no signal)
   - SUSAR 7-day, 15-day reporting candidate flag

## 4. 기술 스택

Python 3.10+, streamlit, pandas, numpy, scipy, statsmodels, matplotlib, python-docx, sqlite3 (내장).
오프라인 standalone. 외부 네트워크 호출 없음.

## 5. 실행법

```bash
# 1) 가상환경
python3 -m venv .venv && source .venv/bin/activate

# 2) 의존성
pip install -r requirements.txt

# 3-a) CLI 데모 (의존성 없어도 argparse만으로 --help 동작)
python3 main.py --help
python3 main.py --demo

# 3-b) Streamlit UI
streamlit run app.py
```

## 6. 디렉토리 구조

```
2026-05-26-2-glp1-ae-signal-kor/
├── README.md
├── app.py
├── main.py
├── requirements.txt
├── modules/
│   ├── __init__.py
│   ├── ingest.py
│   ├── panels.py
│   ├── disproportion.py
│   ├── subgroup.py
│   └── report.py
├── data/
│   ├── synthetic_ae.csv
│   ├── synthetic_labs.csv
│   ├── synthetic_faers.csv
│   ├── meddra_mini.csv
│   └── charter_example.yaml
├── reports/
│   └── .gitkeep
└── QA.md
```

## 7. 검수 체크리스트

- [x] Python 구문 체크 (ast.parse)
- [x] `python3 main.py --help` 정상 동작
- [x] 합성 데이터 CSV 로드 가능
- [x] `python3 main.py --demo` 30 라인 이내 정상 출력
- [x] 디스클레이머 README/app.py 상단 명시

## 8. 출처 / 참고 자료

- Banks PA et al. **Classification of acute pancreatitis—2012: revision of the Atlanta classification.** *Gut* 2013;62:102–111.
- Marso SP et al. **Semaglutide and cardiovascular outcomes in patients with type 2 diabetes (SUSTAIN-6).** *NEJM* 2016;375:1834–1844. (망막병증 시그널 관련)
- FDA Guidance: **Good Pharmacovigilance Practices and Pharmacoepidemiologic Assessment** (2005).
- ICH E2E **Pharmacovigilance Planning**; ICH E2D **Post-Approval Safety Data**.
- van Puijenbroek EP et al. **A comparison of measures of disproportionality for signal detection in spontaneous reporting systems for adverse drug reactions.** *Pharmacoepidemiol Drug Saf* 2002;11:3–10.
- DuMouchel W. **Bayesian data mining in large frequency tables (EBGM).** *Am Stat* 1999;53:177–190.
- MedDRA: 본 도구는 실제 MedDRA를 사용하지 않으며, 라이센스 우회를 위해 합성 mini-사전을 자체 작성함.
- FAERS: 실제 FAERS 데이터는 사용하지 않으며, 합성 mini CSV로 대체함.

## 9. 디스클레이머

본 도구는 합성 데이터에 기반한 프로토타입으로, 실제 임상시험·약물감시·규제 제출에 그대로 사용할 수 없습니다. 실제 시그널 평가는 자격을 갖춘 약물감시 전문가, 임상의, 통계학자가 검증된 MedDRA / FAERS / EudraVigilance 데이터로 수행해야 합니다.
