Zum Inhalt

MoE API – Benutzerhandbuch

Sovereign Mixture of Experts Orchestrator Interne KI-Plattform · Zugangsdokumentation für API-Nutzer


Inhaltsverzeichnis

  1. Zugang & Erstanmeldung
  2. User-Portal – Übersicht
  3. API Keys verwalten
  4. API nutzen
  5. Token-Budget & Verbrauch
  6. Profil & Passwort ändern
  7. Fehler & FAQ

1. Zugang & Erstanmeldung

Zugangsdaten erhalten

Dein Account wird vom Administrator angelegt. Du erhältst:

  • Username (z. B. max.mustermann)
  • Initiales Passwort (vom Admin vergeben)
  • URL des User-Portals (z. B. http://moe.intern:8088/user/login)

Erste Anmeldung

  1. Öffne das User-Portal im Browser: http://<server>:8088/user/login
  2. Gib Username und Passwort ein
  3. Du wirst zum Dashboard weitergeleitet
  4. Ändere dein Passwort sofort unter Profil & Passwort

Hinweis: Dein Account hat standardmäßig keine Berechtigungen. Der Administrator muss explizit Zugriffsrechte (Modelle, Modi, Skills) freischalten. Wende dich bei Bedarf an den Admin.


2. User-Portal – Übersicht

Das Portal erreichst du unter: http://<server>:8088/user/

Bereich URL Beschreibung
Dashboard /user/dashboard Budget-Status, letzte Aktivität, API Keys
Abrechnung /user/billing Token-Verbrauch nach Modell/Modus
Nutzungshistorie /user/usage Alle Anfragen mit Token-Zählung
API Keys /user/keys Keys erstellen & sperren
Profil /user/profile Anzeigename, E-Mail, Passwort

Dashboard auf einen Blick

Das Dashboard zeigt:

  • Budget-Balken für tägliches, monatliches und Gesamt-Limit
  • Grün (< 70%), Orange (70–90%), Rot (> 90%)
  • 14-Tage-Chart mit täglichem Token-Verbrauch
  • Aktive API Keys mit Zeitstempel der letzten Nutzung

3. API Keys verwalten

Warum API Keys?

Die MoE-API ist nicht direkt über Browser nutzbar — du brauchst einen API Key für jede Anwendung (Claude Code, Open WebUI, eigene Skripte).

Neuen Key erstellen

  1. Navigiere zu API Keys (/user/keys)
  2. Vergib eine Bezeichnung, z. B. Claude Code Laptop
  3. Klicke auf Key erstellen
  4. Der vollständige Key wird einmalig angezeigt — sofort kopieren!
moe-sk-a3f8c1b2d4e5f6a7b8c9d0e1f2a3b4c5d6e7f8a9b0c1

Wichtig: Nach dem Schließen des Fensters ist der Key nie wieder vollständig sichtbar. Nur der Prefix (z. B. moe-sk-a3f8...) bleibt zur Identifikation erhalten.

Key sperren

Wenn ein Key kompromittiert wurde oder nicht mehr benötigt wird:

  1. Gehe zu API Keys
  2. Klicke Sperren neben dem betreffenden Key
  3. Der Key ist sofort ungültig (Redis-Cache wird invalidiert)

Empfehlung

  • Erstelle pro Gerät / Anwendung einen eigenen Key
  • Benenne Keys aussagekräftig (Claude Code Server, Open WebUI, Python Script)
  • Rotiere Keys regelmäßig (alle 90 Tage empfohlen)

4. API nutzen

Endpunkt

http://<server>:8002

Die Plattform bietet zwei kompatible API-Schnittstellen:

Schnittstelle Endpunkt Verwendung
Anthropic Messages API /v1/messages Claude Code, Anthropic SDK
OpenAI Chat Completions API /v1/chat/completions Open WebUI, native LLMs, OpenAI SDK

Wichtig: Claude Code kommuniziert ausschließlich über die Anthropic Messages API (via ANTHROPIC_BASE_URL). Die OpenAI-kompatible API ist für native LLM-Zugriffe gedacht (Open WebUI, eigene Skripte mit dem openai-SDK).

Authentifizierung

Übergib den API Key als Authorization: Bearer Header oder als x-api-key Header:

# Anthropic Messages API – für Claude Code
curl http://<server>:8002/v1/messages \
  -H "Authorization: Bearer moe-sk-xxxxxxxx..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "Erkläre mir Docker Compose."}]
  }'

# OpenAI Chat Completions API – für native LLMs / Open WebUI
curl http://<server>:8002/v1/chat/completions \
  -H "x-api-key: moe-sk-xxxxxxxx..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama3.3:70b@N04-RTX",
    "messages": [{"role": "user", "content": "Erkläre mir Docker Compose."}]
  }'

Konfiguration in Claude Code

Claude Code verwendet die Anthropic Messages API. Setze folgende Umgebungsvariablen:

export ANTHROPIC_BASE_URL=http://<server>:8002
export ANTHROPIC_API_KEY=moe-sk-xxxxxxxx...

Oder dauerhaft in ~/.claude/settings.json:

{
  "env": {
    "ANTHROPIC_BASE_URL": "http://<server>:8002",
    "ANTHROPIC_API_KEY": "moe-sk-xxxxxxxx..."
  }
}

Claude Code überträgt deine Anfragen an den MoE-Orchestrator, der das konfigurierte Claude Code Profil (cc_profile) für Tool-Ausführung und Routing verwendet.

Konfiguration in Open WebUI (native LLMs)

Open WebUI nutzt die OpenAI-kompatible API:

  1. Gehe zu Settings → Connections → OpenAI API
  2. API Base URL: http://<server>:8002/v1
  3. API Key: moe-sk-xxxxxxxx...

Python (Anthropic SDK)

import anthropic

client = anthropic.Anthropic(
    api_key="moe-sk-xxxxxxxx...",
    base_url="http://<server>:8002",
)

message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hallo!"}]
)
print(message.content[0].text)

Python (OpenAI SDK – für native LLMs)

from openai import OpenAI

client = OpenAI(
    api_key="moe-sk-xxxxxxxx...",
    base_url="http://<server>:8002/v1",
)

response = client.chat.completions.create(
    model="llama3.3:70b@N04-RTX",
    messages=[{"role": "user", "content": "Hallo!"}]
)
print(response.choices[0].message.content)

Verfügbare Modell-IDs

Welche Modelle du nutzen kannst, hängt von deinen Freigaben ab (siehe Abschnitt 5). Frage deinen Administrator welche Modell-IDs für dich freigeschaltet sind.

Typische Claude-Modell-IDs (für Claude Code / Anthropic Messages API):

  • claude-sonnet-4-6 — Standard (MoE-Orchestrierung)
  • claude-opus-4-6 — Erweiterte MoE-Orchestrierung
  • claude-haiku-4-5-20251001 — Schnell & kompakt

Native LLM-IDs folgen dem Format modell:tag@server, z.B. llama3.3:70b@N04-RTX.


5. Token-Budget & Verbrauch

Was ist ein Token-Budget?

Dein Account hat Limits für:

Limit Beschreibung Reset
Täglich Max. Tokens pro Tag Mitternacht (UTC)
Monatlich Max. Tokens pro Monat Monatserster
Gesamt Lifetime-Limit (falls konfiguriert) Kein Reset

1 Token ≈ 0,75 Wörter auf Englisch, ca. 0,5 Wörter auf Deutsch. Eine typische Chat-Anfrage verbraucht 500–3.000 Tokens.

Budget überschritten?

Wenn dein Budget ausgeschöpft ist:

  • Die API antwortet mit HTTP 429 Too Many Requests
  • Im Portal erscheint der Budget-Balken in Rot
  • Wende dich an den Administrator für eine Erhöhung

Verbrauch einsehen

Unter Abrechnung siehst du:

  • Verbrauch heute / diesen Monat / gesamt
  • Aufschlüsselung nach Modell und Modus
  • Wie viele Tokens noch verbleiben

Unter Nutzungshistorie findest du:

  • Jede einzelne Anfrage mit Timestamp
  • Prompt-Tokens, Completion-Tokens, Gesamt
  • Status (ok / budget_exceeded / error)

Freigaben

Per Default sind alle Zugriffe gesperrt. Freigeschaltete Ressourcen sind:

  • expert_template — Experten-Konfigurationspaket (definiert welche LLMs für welche Fachgebiete genutzt werden)
  • cc_profile — Claude Code Integrations-Profil (Tool-Modell, MoE-Modus, Reasoning-Einstellungen)
  • model_endpoint — Native LLMs auf welchem Inference-Server (OpenAI-API Zugriff)
  • moe_mode — Verarbeitungsmodus (native, moe_orchestrated, moe_reasoning)
  • skill — Claude Code Skills die dir zur Verfügung stehen
  • mcp_tool — MCP-Tools (Präzisionsrechner etc.)

6. Profil & Passwort ändern

  1. Navigiere zu Profil & Passwort (/user/profile)
  2. Ändere Anzeigename und/oder E-Mail
  3. Um das Passwort zu ändern: neues Passwort in beide Felder eingeben (mind. 8 Zeichen)
  4. Klicke Speichern

Hinweis: Der Username kann nicht selbst geändert werden — bei Bedarf wende dich an den Admin.


7. Fehler & FAQ

401 Unauthorized

Ursache: API Key ungültig, gesperrt oder nicht vorhanden. Lösung: Prüfe im Portal ob dein Key aktiv ist. Erstelle bei Bedarf einen neuen Key.

429 Too Many Requests

Ursache: Tägliches oder monatliches Token-Budget ausgeschöpft. Lösung: Warte bis zum Reset (Mitternacht / Monatserster) oder wende dich an den Admin.

403 Forbidden

Ursache: Keine Berechtigung für das angefragte Modell, den Modus oder den Skill. Lösung: Bitte den Administrator, die entsprechende Freigabe zu erteilen.

Anmeldung funktioniert nicht

  • Prüfe Groß-/Kleinschreibung beim Username
  • Stelle sicher, dass dein Account nicht gesperrt ist (der Admin kann das prüfen)
  • Nutze die Browser-Konsole (F12) für Fehlerdetails

Key vergessen / verloren

Es gibt keine Möglichkeit, einen bestehenden Key wieder anzuzeigen. Erstelle einen neuen Key und sperre den alten.

Wer ist der Administrator?

Wende dich bei Account-Fragen, Budget-Erhöhungen oder Freigaben an die zuständige Person in deinem Unternehmen (IT-Abteilung oder der/die MoE-Plattform-Betreiber:in).


MoE Sovereign Orchestrator — Intern — Stand: April 2026