Sovereign MoE – Dokumentation¶
Self-hosted Mixture-of-Experts Orchestrator — Routet Anfragen an spezialisierte lokale LLMs, reichert den Kontext per Neo4j Knowledge-Graph und Web-Suche an, fasst Ergebnisse mit einem Judge-LLM zusammen. OpenAI-kompatibler API-Endpunkt — funktioniert mit Claude Code, Continue.dev und jedem OpenAI-kompatiblen Client.
Schnellnavigation¶
| Bereich | Seiten | Beschreibung |
|---|---|---|
| Benutzerhandbuch | Quickstart · Handbuch · API | Einstieg, Modi, Skills, Vision, API-Nutzung |
| Admin-Backend | Übersicht | Verwaltung von Usern, Budgets, Templates, Profilen |
| User-Portal | Übersicht | Self-Service für Endnutzer: Verbrauch, Keys, Abrechnung |
| Referenz | Authentifizierung · Experten-Prompts · Import/Export | API-Referenz, System-Prompts, Schemas |
| FAQ | FAQ | Häufige Fragen zu Claude Code, API, Troubleshooting |
| Changelog | Changelog | Versionshistorie aller Releases |
Service-Übersicht¶
| Service | URL | Zweck |
|---|---|---|
| Orchestrator API | http://localhost:8002/v1 |
Hauptendpunkt (OpenAI-kompatibel) |
| Admin UI | http://localhost:8088 |
Konfiguration & Monitoring |
| User Portal | http://localhost:8088/user/dashboard |
Endnutzer-Interface |
| Grafana | http://localhost:3001 |
Metriken-Dashboards |
| Prometheus | http://localhost:9090 |
Raw-Metriken |
| Neo4j Browser | http://localhost:7474 |
Knowledge-Graph-Explorer |
| MCP Server | http://localhost:8003 |
Precision Tools |
Verbindung mit Claude Code¶
~/.claude/settings.json
{
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:8002/v1",
"ANTHROPIC_API_KEY": "moe-sk-..."
}
}
Alternativ: Profil im Admin-UI unter Profile konfigurieren und aktivieren.
Dokumentationsstruktur¶
docs/
├── index.md ← Diese Seite
├── faq.md ← Häufige Fragen (Claude Code, API, Troubleshooting)
├── changelog.md ← Versionshistorie
│
├── guide/
│ ├── index.md ← Benutzerhandbuch – Übersicht
│ ├── quickstart.md ← Services, Pipeline, erste Schritte
│ ├── handout.md ← Vollständiges Benutzerhandbuch
│ └── api.md ← API-Zugang, Keys, curl- & SDK-Beispiele
│
├── admin/
│ └── index.md ← Admin-Backend Dokumentation
│
├── portal/
│ └── index.md ← User-Portal Dokumentation
│
└── reference/
├── auth.md ← Authentifizierung (OIDC, API-Key)
├── expert-prompts.md ← System-Prompts aller 14 Experten-Rollen
└── import-export.md ← JSON-Schemas für Templates und Profile
Stack¶
| Komponente | Rolle |
|---|---|
| LangGraph | Pipeline-Orchestrierung |
| Ollama | Lokale LLM-Inferenz |
| ChromaDB | Semantischer Vektor-Cache |
| Redis Stack | Checkpoints, Budget-Counter, Scoring |
| Neo4j 5 | Knowledge-Graph (GraphRAG) |
| Apache Kafka | Event-Streaming & Async-Learning |
| Prometheus + Grafana | Metriken & Dashboards |
| FastAPI + uvicorn | HTTP-API-Layer |
| SQLite (WAL) | User-Datenbank |