Files
ExperionCrawler/mcp-server/parsers/__init__.py
windpacer 908bfe151f feat: Knowledge Base RAG 시스템 + 채팅 LLM 개선 (Phase 0~5 완료)
- KB RAG 전체 파이프라인: 업로드, 파싱(xlsx/pdf/docx/text), 임베딩, Qdrant 인덱싱
- KB 관리 UI(14번 탭): 로그인, 문서 목록, 업로드, 삭제, 재인덱스
- OllamaController: 한글 시스템 프롬프트, plant_context.md 외부 파일화, SSE tool_start/tool_result 이벤트
- 프론트: 툴 실행 카드, KB 인용 링크, 표 자동 렌더, 추천 질문 칩
- nl2sql_worker: history_table.recorded_at 사용, tag_metadata 응답 개선
- DB: KB 테이블 5개 DDL + 시드, pgcrypto 확장
2026-05-13 20:22:27 +09:00

9 lines
380 B
Python

"""KB 문서 파서 모음.
각 모듈은 `parse(path: str) -> list[dict]` 인터페이스를 제공한다.
반환 청크는 다음 키를 가진다:
text: str 임베딩 대상 본문 (보통 200~1500자)
chunk_kind: str row | sheet | section | table | page | paragraph | heading
locator: str 사람 가독 위치 문자열 (예: "sheet=Pump-A; row=12")
"""