# ObesityPreprintRadar (오베시티프리프린트레이더)

> **참고용·연구용 도구 / 임상 결정 대체 금지**
> 본 도구는 비만/대사 분야 preprint 큐레이션·재현성 평가·동일 저자 출판 추적 등을 자동화하기 위한 **연구 보조 도구**입니다. 진단·치료·처방 등 임상 결정에 직접 사용해서는 안 됩니다. 데이터는 모두 합성(synthetic) 자료이며 실제 preprint·논문이 아닙니다.

## 목적
bioRxiv·medRxiv·Research Square·ChemRxiv에서 비만 도메인(incretin, MC4R 경로, leptin, GDF15, orexin, brown fat, sarcopenic obesity, gut microbiome-obesity 등) preprint를 일일 자동 수집·평가·추적·디제스트하는 standalone Streamlit 연구 알림 도구.

## 도메인 / 카테고리
- 도메인: **Obesity (비만·대사)**
- 카테고리: **연구 알림 (Research Alert)**

## 핵심 기능
1. **다중 preprint server 수집** — bioRxiv·medRxiv·Research Square·ChemRxiv → 공통 schema(server, doi, title, authors, affiliations, abstract, posted_date, version, subject), 비만/incretin/MC4R/GDF15/leptin/orexin/gut microbiome-obesity/brown fat 토픽 자동 라벨링
2. **데이터·코드·프로토콜 availability scoring (0~5점)** — GitHub/GitLab/Zenodo/OSF/protocols.io 자동 추출 → reproducibility score, threshold filter
3. **동일 저자 PubMed 출판 추적** — preprint posted_date → published_date lag (일), "출판 안 된 preprint" flag, version(v1→v2→published) 추적
4. **dedup + watchlist** — 토픽·title 유사도 기반 cross-post dedup, 키워드·저자·소속 watchlist 우선 정렬(sqlite 저장)
5. **digest + 리포트** — 일일/주간 digest (국문/영문 동시), docx export, 월간 trend 리포트(분야별 수·평균 availability·정식 출판 비율)

## 실행법
```bash
cd "/Users/sangjoonpark/claude daily project/2026 metabolic daily idea/projects/2026-05-21-2-obesity-preprint-radar"
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
streamlit run app.py
```

CLI 요약:
```bash
python3 app.py --summary
```

## 검수 체크리스트
- [ ] `python3 -c "import ast; ast.parse(open('app.py').read())"` 통과
- [ ] `data/preprints.json`, `data/publications.json`, `data/topics.json`, `data/kol_seed.json` 모두 `json.load` 통과
- [ ] preprint 합성 데이터 50건 이상, 서버 4개 모두 포함
- [ ] CLI `--summary` 출력: 총 preprint 수·서버별 분포·평균 availability·관심 토픽 top5·매칭 publication 평균 lag
- [ ] requirements.txt pinned version (==)
- [ ] 모든 Streamlit 페이지 하단에 참고용·연구용 디스클레이머 노출

## 출처 (합성 데이터 모티프)
- bioRxiv preprint server 메타데이터 schema (server, doi, posted_date, version)
- medRxiv preprint server 메타데이터 schema
- Research Square 메타데이터 schema
- ChemRxiv 메타데이터 schema
- NCBI PubMed eUtils ESummary 응답 schema (pmid, journal, pubdate)
- Anti-obesity drug class 분류: GLP-1/GIP/glucagon agonist, MC4R agonist (setmelanotide), amylin analog, GDF15 mimetic, leptin replacement (metreleptin)
- AWGS 2019 sarcopenic obesity criteria
- protocols.io / Zenodo / OSF / GitHub 링크 패턴

## OpenClaw 약물 재조합 연계 메모
- 본 도구의 availability score >=3 preprint는 OpenClaw 바이오 피벗(약물 재조합 DB) 후보 입력으로 사용 가능
- KOL watchlist + 토픽 라벨 매핑은 OpenClaw 위그드라실(Yggdrasil) 지식그래프의 entity-relation 채굴 시드로 재활용 가능
- 동일 저자 preprint→publication lag 분포는 OpenClaw "출판 안 된 preprint" 영역(잠재 idea 풀) 정량 평가에 활용

## 디스클레이머
- 본 도구의 모든 데이터는 합성(synthetic)이며 실제 preprint 서버·PubMed의 데이터를 fetch하지 않습니다.
- 본 도구는 의학적 진단·치료·처방을 대체할 수 없습니다.
- 연구·아카이브 검토 보조용으로만 사용하시기 바랍니다.
