# 폐쇄 네트워크 로컬 LLM 채팅 웹페이지 제작 계획 ## 1. 분석 요약 ### Ollama (로컬 LLM 런타임) - **기본 API 엔드포인트**: `http://localhost:11434/api` - **OpenAI 호환 API**: `http://localhost:11434/v1/` - **주요 API**: - `POST /api/chat` - 채팅 (메시지 배열 기반) - `POST /api/generate` - 텍스트 생성 (프롬프트 기반) - `GET /api/tags` - 로컬 모델 목록 조회 - `POST /api/pull` - 모델 다운로드 (폐쇄 네트워크에서는 사전 다운로드 필요) - **스트리밍 응답**: NDJSON 형식 (`application/x-ndjson`), `"stream": false`로 비활성화 가능 - **모델**: 폐쇄 네트워크에서는 `ollama pull`로 사전 다운로드 필요 (예: `llama3`, `gemma3`, `qwen3` 등) ### Open WebUI (참용 웹 UI) - **기술 스택**: Svelte (프론트엔드) + FastAPI (백엔드) - **설치**: Docker 또는 pip (`pip install open-webui`) - **Ollama 연결**: `OLLAMA_BASE_URL` 환경변수 - **참고**: 폐쇄 네트워크에서 바로 사용 가능한 완성된 솔루션이지만, 커스텀 웹페이지 제작을 위한 참고용으로 활용 --- ## 2. 필요한 정보 요약 ### 필수 조건 1. **Ollama 설치 및 실행** (폐쇄 네트워크에 사전 설치) 2. **로컬 모델 다운로드** (사전 `ollama pull ` 실행) 3. **웹 서버** (정적 파일 서빙 + API 프록시, 또는 프론트엔드에서 직접 Ollama API 호출) ### API 요청/응답 형식 ```json // 채팅 요청 (POST /api/chat) { "model": "llama3", "messages": [ {"role": "user", "content": "안녕하세요"} ], "stream": false } // 채팅 응답 { "model": "llama3", "message": {"role": "assistant", "content": "안녕하세요! 어떻게 도와드릴까요?"} } ``` ### 스트리밍 응답 처리 (선택사항) - NDJSON 형식으로 각 줄이独立的 JSON 객체 - `done: true`로 응답 종료 신호 - `ReadableStream` + `TextDecoder`로 처리 가능 --- ## 3. Todo List ### Phase 1: 환경 준비 - [ ] 1.1 폐쇄 네트워크 서버에 Ollama 설치 - [ ] 1.2 필요한 LLM 모델 사전 다운로드 (`ollama pull`) - [ ] 1.3 Ollama 서비스 실행 및 `localhost:11434` 접근 확인 ### Phase 2: 프론트엔드 기본 구조 - [ ] 2.1 HTML/CSS/JavaScript 기반 채팅 UI 스키레션 작성 - [ ] 2.2 채팅 메시지 표시 영역 (사용자/보조 구분) - [ ] 2.3 입력 필드 및 전송 버튼 구현 - [ ] 2.4 반응형 디자인 (모바일/데스크톱) ### Phase 3: Ollama API 연동 - [ ] 3.1 `fetch()`로 Ollama `/api/chat` 엔드포인트 호출 구현 - [ ] 3.2 메시지 히스토리 관리 (배열 유지) - [ ] 3.3 모델 선택 기능 (`/api/tags`로 모델 목록 조회) - [ ] 3.4 로딩 상태 및 에러 처리 ### Phase 4: 스트리밍 응답 (선택사항) - [ ] 4.1 NDJSON 스트리밍 파싱 구현 - [ ] 4.2 실시간 텍스트 표시 (타이핑 효과) - [ ] 4.3 스트리밍 중단 기능 ### Phase 5: 추가 기능 - [ ] 5.1 채팅 기록 저장 (localStorage) - [ ] 5.2 새 채팅 시작 / 채팅 초기화 - [ ] 5.3 Markdown 렌더링 (코드 블록, 수식 등) - [ ] 5.4 시스템 프롬프트 설정 기능 ### Phase 6: 배포 - [ ] 6.1 정적 파일 빌드 - [ ] 6.2 폐쇄 네트워크 서버에 배포 - [ ] 6.3 CORS 설정 (Ollama `OLLAMA_HOST` 환경변수) - [ ] 6.4 최종 테스트 --- ## 4. 기술 선택 가이드 | 옵션 | 설명 | 추천도 | |------|------|--------| | 순수 HTML/JS | 의존성 없음, 폐쇄 네트워크에 적합 | ⭐⭐⭐ | | Vue/React SPA | 빌드 필요, 하지만 풍부한 생태계 | ⭐⭐ | | Open WebUI 그대로 사용 | 별도 개발 불필요, Docker로 배포 | ⭐⭐⭐ | **폐쇄 네트워크 권장**: 순수 HTML/CSS/JavaScript 또는 Open WebUI Docker 배포