MoE API – Benutzerhandbuch¶
Sovereign Mixture of Experts Orchestrator Interne KI-Plattform · Zugangsdokumentation für API-Nutzer
Inhaltsverzeichnis¶
- Zugang & Erstanmeldung
- User-Portal – Übersicht
- API Keys verwalten
- API nutzen
- Token-Budget & Verbrauch
- Profil & Passwort ändern
- Fehler & FAQ
1. Zugang & Erstanmeldung¶
Zugangsdaten erhalten¶
Dein Account wird vom Administrator angelegt. Du erhältst:
- Username (z. B.
max.mustermann) - Initiales Passwort (vom Admin vergeben)
- URL des User-Portals (z. B.
http://moe.intern:8088/user/login)
Erste Anmeldung¶
- Öffne das User-Portal im Browser:
http://<server>:8088/user/login - Gib Username und Passwort ein
- Du wirst zum Dashboard weitergeleitet
- Ändere dein Passwort sofort unter Profil & Passwort
Hinweis: Dein Account hat standardmäßig keine Berechtigungen. Der Administrator muss explizit Zugriffsrechte (Modelle, Modi, Skills) freischalten. Wende dich bei Bedarf an den Admin.
2. User-Portal – Übersicht¶
Das Portal erreichst du unter: http://<server>:8088/user/
| Bereich | URL | Beschreibung |
|---|---|---|
| Dashboard | /user/dashboard |
Budget-Status, letzte Aktivität, API Keys |
| Abrechnung | /user/billing |
Token-Verbrauch nach Modell/Modus |
| Nutzungshistorie | /user/usage |
Alle Anfragen mit Token-Zählung |
| API Keys | /user/keys |
Keys erstellen & sperren |
| Profil | /user/profile |
Anzeigename, E-Mail, Passwort |
Dashboard auf einen Blick¶
Das Dashboard zeigt:
- Budget-Balken für tägliches, monatliches und Gesamt-Limit
- Grün (< 70%), Orange (70–90%), Rot (> 90%)
- 14-Tage-Chart mit täglichem Token-Verbrauch
- Aktive API Keys mit Zeitstempel der letzten Nutzung
3. API Keys verwalten¶
Warum API Keys?¶
Die MoE-API ist nicht direkt über Browser nutzbar — du brauchst einen API Key für jede Anwendung (Claude Code, Open WebUI, eigene Skripte).
Neuen Key erstellen¶
- Navigiere zu API Keys (
/user/keys) - Vergib eine Bezeichnung, z. B.
Claude Code Laptop - Klicke auf Key erstellen
- Der vollständige Key wird einmalig angezeigt — sofort kopieren!
Wichtig: Nach dem Schließen des Fensters ist der Key nie wieder vollständig sichtbar. Nur der Prefix (z. B.
moe-sk-a3f8...) bleibt zur Identifikation erhalten.
Key sperren¶
Wenn ein Key kompromittiert wurde oder nicht mehr benötigt wird:
- Gehe zu API Keys
- Klicke Sperren neben dem betreffenden Key
- Der Key ist sofort ungültig (Redis-Cache wird invalidiert)
Empfehlung¶
- Erstelle pro Gerät / Anwendung einen eigenen Key
- Benenne Keys aussagekräftig (
Claude Code Server,Open WebUI,Python Script) - Rotiere Keys regelmäßig (alle 90 Tage empfohlen)
4. API nutzen¶
Endpunkt¶
Die Plattform bietet zwei kompatible API-Schnittstellen:
| Schnittstelle | Endpunkt | Verwendung |
|---|---|---|
| Anthropic Messages API | /v1/messages |
Claude Code, Anthropic SDK |
| OpenAI Chat Completions API | /v1/chat/completions |
Open WebUI, native LLMs, OpenAI SDK |
Wichtig: Claude Code kommuniziert ausschließlich über die Anthropic Messages API (via
ANTHROPIC_BASE_URL). Die OpenAI-kompatible API ist für native LLM-Zugriffe gedacht (Open WebUI, eigene Skripte mit dem openai-SDK).
Authentifizierung¶
Übergib den API Key als Authorization: Bearer Header oder als x-api-key Header:
# Anthropic Messages API – für Claude Code
curl http://<server>:8002/v1/messages \
-H "Authorization: Bearer moe-sk-xxxxxxxx..." \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-6",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Erkläre mir Docker Compose."}]
}'
# OpenAI Chat Completions API – für native LLMs / Open WebUI
curl http://<server>:8002/v1/chat/completions \
-H "x-api-key: moe-sk-xxxxxxxx..." \
-H "Content-Type: application/json" \
-d '{
"model": "llama3.3:70b@N04-RTX",
"messages": [{"role": "user", "content": "Erkläre mir Docker Compose."}]
}'
Konfiguration in Claude Code¶
Claude Code verwendet die Anthropic Messages API. Setze folgende Umgebungsvariablen:
Oder dauerhaft in ~/.claude/settings.json:
{
"env": {
"ANTHROPIC_BASE_URL": "http://<server>:8002",
"ANTHROPIC_API_KEY": "moe-sk-xxxxxxxx..."
}
}
Claude Code überträgt deine Anfragen an den MoE-Orchestrator, der das konfigurierte
Claude Code Profil (cc_profile) für Tool-Ausführung und Routing verwendet.
Konfiguration in Open WebUI (native LLMs)¶
Open WebUI nutzt die OpenAI-kompatible API:
- Gehe zu Settings → Connections → OpenAI API
- API Base URL:
http://<server>:8002/v1 - API Key:
moe-sk-xxxxxxxx...
Python (Anthropic SDK)¶
import anthropic
client = anthropic.Anthropic(
api_key="moe-sk-xxxxxxxx...",
base_url="http://<server>:8002",
)
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Hallo!"}]
)
print(message.content[0].text)
Python (OpenAI SDK – für native LLMs)¶
from openai import OpenAI
client = OpenAI(
api_key="moe-sk-xxxxxxxx...",
base_url="http://<server>:8002/v1",
)
response = client.chat.completions.create(
model="llama3.3:70b@N04-RTX",
messages=[{"role": "user", "content": "Hallo!"}]
)
print(response.choices[0].message.content)
Verfügbare Modell-IDs¶
Welche Modelle du nutzen kannst, hängt von deinen Freigaben ab (siehe Abschnitt 5). Frage deinen Administrator welche Modell-IDs für dich freigeschaltet sind.
Typische Claude-Modell-IDs (für Claude Code / Anthropic Messages API):
claude-sonnet-4-6— Standard (MoE-Orchestrierung)claude-opus-4-6— Erweiterte MoE-Orchestrierungclaude-haiku-4-5-20251001— Schnell & kompakt
Native LLM-IDs folgen dem Format modell:tag@server, z.B. llama3.3:70b@N04-RTX.
5. Token-Budget & Verbrauch¶
Was ist ein Token-Budget?¶
Dein Account hat Limits für:
| Limit | Beschreibung | Reset |
|---|---|---|
| Täglich | Max. Tokens pro Tag | Mitternacht (UTC) |
| Monatlich | Max. Tokens pro Monat | Monatserster |
| Gesamt | Lifetime-Limit (falls konfiguriert) | Kein Reset |
1 Token ≈ 0,75 Wörter auf Englisch, ca. 0,5 Wörter auf Deutsch. Eine typische Chat-Anfrage verbraucht 500–3.000 Tokens.
Budget überschritten?¶
Wenn dein Budget ausgeschöpft ist:
- Die API antwortet mit HTTP
429 Too Many Requests - Im Portal erscheint der Budget-Balken in Rot
- Wende dich an den Administrator für eine Erhöhung
Verbrauch einsehen¶
Unter Abrechnung siehst du:
- Verbrauch heute / diesen Monat / gesamt
- Aufschlüsselung nach Modell und Modus
- Wie viele Tokens noch verbleiben
Unter Nutzungshistorie findest du:
- Jede einzelne Anfrage mit Timestamp
- Prompt-Tokens, Completion-Tokens, Gesamt
- Status (ok / budget_exceeded / error)
Freigaben¶
Per Default sind alle Zugriffe gesperrt. Freigeschaltete Ressourcen sind:
- expert_template — Experten-Konfigurationspaket (definiert welche LLMs für welche Fachgebiete genutzt werden)
- cc_profile — Claude Code Integrations-Profil (Tool-Modell, MoE-Modus, Reasoning-Einstellungen)
- model_endpoint — Native LLMs auf welchem Inference-Server (OpenAI-API Zugriff)
- moe_mode — Verarbeitungsmodus (
native,moe_orchestrated,moe_reasoning) - skill — Claude Code Skills die dir zur Verfügung stehen
- mcp_tool — MCP-Tools (Präzisionsrechner etc.)
6. Profil & Passwort ändern¶
- Navigiere zu Profil & Passwort (
/user/profile) - Ändere Anzeigename und/oder E-Mail
- Um das Passwort zu ändern: neues Passwort in beide Felder eingeben (mind. 8 Zeichen)
- Klicke Speichern
Hinweis: Der Username kann nicht selbst geändert werden — bei Bedarf wende dich an den Admin.
7. Fehler & FAQ¶
401 Unauthorized¶
Ursache: API Key ungültig, gesperrt oder nicht vorhanden. Lösung: Prüfe im Portal ob dein Key aktiv ist. Erstelle bei Bedarf einen neuen Key.
429 Too Many Requests¶
Ursache: Tägliches oder monatliches Token-Budget ausgeschöpft. Lösung: Warte bis zum Reset (Mitternacht / Monatserster) oder wende dich an den Admin.
403 Forbidden¶
Ursache: Keine Berechtigung für das angefragte Modell, den Modus oder den Skill. Lösung: Bitte den Administrator, die entsprechende Freigabe zu erteilen.
Anmeldung funktioniert nicht¶
- Prüfe Groß-/Kleinschreibung beim Username
- Stelle sicher, dass dein Account nicht gesperrt ist (der Admin kann das prüfen)
- Nutze die Browser-Konsole (F12) für Fehlerdetails
Key vergessen / verloren¶
Es gibt keine Möglichkeit, einen bestehenden Key wieder anzuzeigen. Erstelle einen neuen Key und sperre den alten.
Wer ist der Administrator?¶
Wende dich bei Account-Fragen, Budget-Erhöhungen oder Freigaben an die zuständige Person in deinem Unternehmen (IT-Abteilung oder der/die MoE-Plattform-Betreiber:in).
MoE Sovereign Orchestrator — Intern — Stand: April 2026