Lokale LLMs

CEIR-OS Bedienungsanleitung
0.1.0 - ci-build Germany

CEIR-OS Bedienungsanleitung - Local Development build (v0.1.0) built by the FHIR (HL7® FHIR® Standard) Build Tools. See the Directory of published versions

Ollama Server
Modell-Empfehlungen
GPU-Unterstützung
Open WebUI
Typischer Arbeitsablauf
Konfiguration

CEIR-OS bietet eine vollständige lokale LLM-Infrastruktur: Ollama als Modell-Server, die MCP Bridge für Tool-Integration und Open WebUI als Chat-Oberfläche.

Ollama Server

Eigenschaft	Wert
Container	`ceir-ollama`
Port	11434
Image	`ollama/ollama:latest`
Volume	`ollama-data` (heruntergeladene Modelle)

Beim ersten Start lädt der Init-Container ceir-ollama-init automatisch das Standard-Modell qwen2.5:7b herunter.

Modell-Empfehlungen

Modell	Größe	Stärken	Empfehlung
`qwen2.5:7b`	4.7 GB	Gute Balance aus Qualität und Geschwindigkeit	Standard - wird automatisch geladen
`qwen3:14b`	9.0 GB	Besseres Tool Calling, komplexere Antworten	Empfohlen bei ausreichend RAM/VRAM
`llama3.1:8b`	4.7 GB	Starke allgemeine Fähigkeiten	Alternative zu Qwen
`mistral:7b`	4.1 GB	Schnell, gute europäische Sprachen	Für einfache Abfragen
`gemma2:9b`	5.4 GB	Gutes Sprachverständnis	Alternative

Weitere Modelle können manuell geladen werden:

docker exec ceir-ollama ollama pull qwen3:14b

GPU-Unterstützung

Apple Metal (macOS)

Für optimale Leistung auf macOS mit Apple Silicon sollte Ollama nativ auf dem Host laufen (nicht im Container):

Installiere Ollama nativ: ollama.com
Setze in der .env:

OLLAMA_URL=http://host.docker.internal:11434

Dies ist der Standard in CEIR-OS. Die MCP Bridge greift über host.docker.internal auf den nativen Ollama-Server zu.

NVIDIA GPU (Linux)

Für NVIDIA-GPUs kommentiere in der docker-compose.yml den GPU-Abschnitt ein:

ollama:
  # ...
  deploy:
    resources:
      reservations:
        devices:
          - driver: nvidia
            count: all
            capabilities: [gpu]

Setze außerdem:

OLLAMA_URL=http://ollama:11434

Nur CPU

Wenn keine GPU verfügbar ist, setze:

OLLAMA_URL=http://ollama:11434

Ollama läuft dann im CPU-Modus im Container. Die Inferenz ist langsamer, aber funktional.

Open WebUI

Eigenschaft	Wert
Container	`ceir-webui`
Port	3080
Image	`ghcr.io/open-webui/open-webui:main`

Open WebUI ist die Chat-Oberfläche von CEIR-OS. Sie ist so konfiguriert, dass alle Anfragen über die MCP Bridge laufen.

Wichtige Einstellungen

Die folgenden Einstellungen sind in der docker-compose.yml bereits korrekt konfiguriert:

Einstellung	Wert	Erklärung
`ENABLE_OLLAMA_API`	`false`	Direkte Ollama-Verbindung deaktiviert
`ENABLE_OPENAI_API`	`true`	OpenAI-API aktiviert (via Bridge)
`OPENAI_API_BASE_URL`	`http://mcp-bridge:8000/v1`	Zeigt auf die MCP Bridge
`OPENAI_API_KEY`	`not-needed`	Kein echter Key nötig
`WEBUI_AUTH`	`false`	Keine Authentifizierung (lokal)
`WEBUI_NAME`	`CEIR-OS`	Branding

Warum Ollama deaktivieren? Wenn OpenWebUI direkt mit Ollama kommuniziert, werden die MCP-Tools umgangen. Alle Anfragen müssen über die MCP Bridge laufen, damit Tool-Aufrufe (Terminologie-Suche, FHIR-Lookup etc.) funktionieren.

Empfohlene Chat-Einstellungen in der OpenWebUI-Oberfläche

Parameter	Wert	Erklärung
Temperature	0.3	Niedrig für konsistente Terminologie-Antworten
num_ctx	4096	Kontextfenster (mehr = langsamer)
Top P	0.9	Nucleus Sampling

Diese Einstellungen können in OpenWebUI unter "Settings > Models" pro Modell angepasst werden.

Typischer Arbeitsablauf

Öffne http://localhost:3080 im Browser
Wähle ein Modell (z.B. qwen2.5:7b)
Stelle eine Frage wie: "Was ist der ICD-10 Code für Diabetes mellitus Typ 2?"
Das LLM erkennt den Tool-Bedarf und die Bridge führt automatisch search_across_versions aus
Das Ergebnis (z.B. E11.9) wird in die Antwort eingebettet

Konfiguration

Umgebungsvariable	Standard	Beschreibung
`OLLAMA_PORT`	`11434`	Ollama Host-Port
`WEBUI_PORT`	`3080`	OpenWebUI Host-Port
`BRIDGE_PORT`	`8000`	MCP Bridge Host-Port
`OLLAMA_URL`	`http://host.docker.internal:11434`	Ollama-Endpunkt für die Bridge

IG © 2024+ Berlin Institute of Health at Charité. Package ceir-os-ig#0.1.0 based on FHIR 4.0.1. Generated 2026-03-16
Links: Table of Contents | QA Report