- OllamaController: Ollama/vLLM 프록시 API (채팅, 스트리밍, 모델 목록, 설정) - UI: 새 대화 탭, 세션 관리, Markdown 렌더링, 스트리밍 응답 - vLLM: OpenAI-compatible API 지원, MCP function calling 통합 - Fix: McpClient DI 팩토리 등록 (HttpClient BaseAddress 문제 해결) - Fix: llm-model.json 직렬화 JsonSerializer 사용 - Fix: nl2sql_worker KST 시간대 표시 (AT TIME ZONE Asia/Seoul) - Program.cs: Ollama/vLLM HttpClient 등록 (1800s timeout)
22 lines
459 B
JSON
22 lines
459 B
JSON
{
|
|
"$schema": "https://opencode.ai/config.json",
|
|
"provider": {
|
|
"vllm": {
|
|
"npm": "@ai-sdk/openai-compatible",
|
|
"name": "vLLM (local)",
|
|
"options": {
|
|
"baseURL": "http://localhost:8000/v1"
|
|
},
|
|
"models": {
|
|
"google/gemma-4-31B-it-vllm-fp8-dflash-16k": {
|
|
"name": "Gemma 4 31B dflash",
|
|
"limit": {
|
|
"context": 16384,
|
|
"output": 8192
|
|
}
|
|
}
|
|
}
|
|
}
|
|
}
|
|
}
|