Zum Inhalt

Sovereign MoE – Dokumentation

Self-hosted Mixture-of-Experts Orchestrator — Routet Anfragen an spezialisierte lokale LLMs, reichert den Kontext per Neo4j Knowledge-Graph und Web-Suche an, fasst Ergebnisse mit einem Judge-LLM zusammen. OpenAI-kompatibler API-Endpunkt — funktioniert mit Claude Code, Continue.dev und jedem OpenAI-kompatiblen Client.


Schnellnavigation

Bereich Seiten Beschreibung
Benutzerhandbuch Quickstart · Handbuch · API Einstieg, Modi, Skills, Vision, API-Nutzung
Admin-Backend Übersicht Verwaltung von Usern, Budgets, Templates, Profilen
User-Portal Übersicht Self-Service für Endnutzer: Verbrauch, Keys, Abrechnung
Referenz Authentifizierung · Experten-Prompts · Import/Export API-Referenz, System-Prompts, Schemas
FAQ FAQ Häufige Fragen zu Claude Code, API, Troubleshooting
Changelog Changelog Versionshistorie aller Releases

Service-Übersicht

Service URL Zweck
Orchestrator API http://localhost:8002/v1 Hauptendpunkt (OpenAI-kompatibel)
Admin UI http://localhost:8088 Konfiguration & Monitoring
User Portal http://localhost:8088/user/dashboard Endnutzer-Interface
Grafana http://localhost:3001 Metriken-Dashboards
Prometheus http://localhost:9090 Raw-Metriken
Neo4j Browser http://localhost:7474 Knowledge-Graph-Explorer
MCP Server http://localhost:8003 Precision Tools

Verbindung mit Claude Code

~/.claude/settings.json
{
  "env": {
    "ANTHROPIC_BASE_URL": "http://localhost:8002/v1",
    "ANTHROPIC_API_KEY": "moe-sk-..."
  }
}

Alternativ: Profil im Admin-UI unter Profile konfigurieren und aktivieren.


Dokumentationsstruktur

docs/
├── index.md                        ← Diese Seite
├── faq.md                          ← Häufige Fragen (Claude Code, API, Troubleshooting)
├── changelog.md                    ← Versionshistorie
├── guide/
│   ├── index.md                    ← Benutzerhandbuch – Übersicht
│   ├── quickstart.md               ← Services, Pipeline, erste Schritte
│   ├── handout.md                  ← Vollständiges Benutzerhandbuch
│   └── api.md                      ← API-Zugang, Keys, curl- & SDK-Beispiele
├── admin/
│   └── index.md                    ← Admin-Backend Dokumentation
├── portal/
│   └── index.md                    ← User-Portal Dokumentation
└── reference/
    ├── auth.md                     ← Authentifizierung (OIDC, API-Key)
    ├── expert-prompts.md           ← System-Prompts aller 14 Experten-Rollen
    └── import-export.md            ← JSON-Schemas für Templates und Profile

Stack

Komponente Rolle
LangGraph Pipeline-Orchestrierung
Ollama Lokale LLM-Inferenz
ChromaDB Semantischer Vektor-Cache
Redis Stack Checkpoints, Budget-Counter, Scoring
Neo4j 5 Knowledge-Graph (GraphRAG)
Apache Kafka Event-Streaming & Async-Learning
Prometheus + Grafana Metriken & Dashboards
FastAPI + uvicorn HTTP-API-Layer
SQLite (WAL) User-Datenbank