Files
ExperionCrawler/plans/local-llm-chat-webpage-plan.md

103 lines
3.7 KiB
Markdown

# 폐쇄 네트워크 로컬 LLM 채팅 웹페이지 제작 계획
## 1. 분석 요약
### Ollama (로컬 LLM 런타임)
- **기본 API 엔드포인트**: `http://localhost:11434/api`
- **OpenAI 호환 API**: `http://localhost:11434/v1/`
- **주요 API**:
- `POST /api/chat` - 채팅 (메시지 배열 기반)
- `POST /api/generate` - 텍스트 생성 (프롬프트 기반)
- `GET /api/tags` - 로컬 모델 목록 조회
- `POST /api/pull` - 모델 다운로드 (폐쇄 네트워크에서는 사전 다운로드 필요)
- **스트리밍 응답**: NDJSON 형식 (`application/x-ndjson`), `"stream": false`로 비활성화 가능
- **모델**: 폐쇄 네트워크에서는 `ollama pull`로 사전 다운로드 필요 (예: `llama3`, `gemma3`, `qwen3` 등)
### Open WebUI (참용 웹 UI)
- **기술 스택**: Svelte (프론트엔드) + FastAPI (백엔드)
- **설치**: Docker 또는 pip (`pip install open-webui`)
- **Ollama 연결**: `OLLAMA_BASE_URL` 환경변수
- **참고**: 폐쇄 네트워크에서 바로 사용 가능한 완성된 솔루션이지만, 커스텀 웹페이지 제작을 위한 참고용으로 활용
---
## 2. 필요한 정보 요약
### 필수 조건
1. **Ollama 설치 및 실행** (폐쇄 네트워크에 사전 설치)
2. **로컬 모델 다운로드** (사전 `ollama pull <model_name>` 실행)
3. **웹 서버** (정적 파일 서빙 + API 프록시, 또는 프론트엔드에서 직접 Ollama API 호출)
### API 요청/응답 형식
```json
// 채팅 요청 (POST /api/chat)
{
"model": "llama3",
"messages": [
{"role": "user", "content": "안녕하세요"}
],
"stream": false
}
// 채팅 응답
{
"model": "llama3",
"message": {"role": "assistant", "content": "안녕하세요! 어떻게 도와드릴까요?"}
}
```
### 스트리밍 응답 처리 (선택사항)
- NDJSON 형식으로 각 줄이独立的 JSON 객체
- `done: true`로 응답 종료 신호
- `ReadableStream` + `TextDecoder`로 처리 가능
---
## 3. Todo List
### Phase 1: 환경 준비
- [ ] 1.1 폐쇄 네트워크 서버에 Ollama 설치
- [ ] 1.2 필요한 LLM 모델 사전 다운로드 (`ollama pull`)
- [ ] 1.3 Ollama 서비스 실행 및 `localhost:11434` 접근 확인
### Phase 2: 프론트엔드 기본 구조
- [ ] 2.1 HTML/CSS/JavaScript 기반 채팅 UI 스키레션 작성
- [ ] 2.2 채팅 메시지 표시 영역 (사용자/보조 구분)
- [ ] 2.3 입력 필드 및 전송 버튼 구현
- [ ] 2.4 반응형 디자인 (모바일/데스크톱)
### Phase 3: Ollama API 연동
- [ ] 3.1 `fetch()`로 Ollama `/api/chat` 엔드포인트 호출 구현
- [ ] 3.2 메시지 히스토리 관리 (배열 유지)
- [ ] 3.3 모델 선택 기능 (`/api/tags`로 모델 목록 조회)
- [ ] 3.4 로딩 상태 및 에러 처리
### Phase 4: 스트리밍 응답 (선택사항)
- [ ] 4.1 NDJSON 스트리밍 파싱 구현
- [ ] 4.2 실시간 텍스트 표시 (타이핑 효과)
- [ ] 4.3 스트리밍 중단 기능
### Phase 5: 추가 기능
- [ ] 5.1 채팅 기록 저장 (localStorage)
- [ ] 5.2 새 채팅 시작 / 채팅 초기화
- [ ] 5.3 Markdown 렌더링 (코드 블록, 수식 등)
- [ ] 5.4 시스템 프롬프트 설정 기능
### Phase 6: 배포
- [ ] 6.1 정적 파일 빌드
- [ ] 6.2 폐쇄 네트워크 서버에 배포
- [ ] 6.3 CORS 설정 (Ollama `OLLAMA_HOST` 환경변수)
- [ ] 6.4 최종 테스트
---
## 4. 기술 선택 가이드
| 옵션 | 설명 | 추천도 |
|------|------|--------|
| 순수 HTML/JS | 의존성 없음, 폐쇄 네트워크에 적합 | ⭐⭐⭐ |
| Vue/React SPA | 빌드 필요, 하지만 풍부한 생태계 | ⭐⭐ |
| Open WebUI 그대로 사용 | 별도 개발 불필요, Docker로 배포 | ⭐⭐⭐ |
**폐쇄 네트워크 권장**: 순수 HTML/CSS/JavaScript 또는 Open WebUI Docker 배포