AI-Infrastruktur & internes OS
Das Betriebssystem unter Ihren AI-Anwendungen.
- Lohnenswert ab
- 3+ Agents
- Kosten-Visibility
- pro Call
- Security
- by design
- LiteLLM / OpenRouter / Vercel AI Gateway
- Postgres + pgvector
- Neo4j / Graph-DB optional
- Prometheus / Grafana
- Next.js Admin
- Schweizer Hosting (Exoscale / Infomaniak) optional
Warum jetzt und nicht später.
Wenn mehrere AI-Anwendungen laufen, brauchen Sie eine Schicht darunter: Modell-Orchestrierung (welche Modelle, welche Kosten, welche Fallbacks), Vector-Store und Knowledge-Graph (Ihr Unternehmenswissen, durchsuchbar), Observability (was kostet Agent X, welche Anfragen scheitern), Security (wer darf was).
Schritte bis zum produktiven Betrieb
- Schritt 01
Inventar: welche AI-Nutzungen gibt es aktuell, was ist geplant, welche Anforderungen überlappen?
- Schritt 02
Architektur für eine zentrale Schicht: Modell-Provider-Abstraktion, Cache, Observability, Access-Control.
- Schritt 03
Knowledge-Layer: Ihre Dokumente, Daten, Prozesse in einem Vector-Store + Knowledge-Graph, für alle Agents nutzbar.
- Schritt 04
Kosten-Tracking pro Agent, pro Team, pro Kunde — kein monatlicher Blindflug.
- Schritt 05
Sicherheit by design: API-Keys rotierbar, Zugriffe protokolliert, Ausnahmen dokumentiert.
Deliverables
- ✓Zentrale AI-Infrastruktur-Schicht in Ihrer Cloud (oder bei uns)
- ✓Admin-Dashboard mit Kosten-, Nutzungs- und Fehler-Metriken
- ✓Entwickler-SDK für Ihre internen Teams
- ✓Security-Review und Penetrations-Test-Vorbereitung
Stack & Tools
Wir arbeiten mit bewährten Open-Source-Tools und gängigen AI-Providern. Kein proprietäres Framework, kein Lock-in — wenn Sie den Code später selbst weiterentwickeln, ist das kein Problem, sondern geplant.
- LiteLLM / OpenRouter / Vercel AI Gateway
- Postgres + pgvector
- Neo4j / Graph-DB optional
- Prometheus / Grafana
- Next.js Admin
- Schweizer Hosting (Exoscale / Infomaniak) optional
DSG- und revDSG-konform per Default. Auf Wunsch Apertus-Modell und 100% Schweizer Infrastruktur. Auftragsbearbeitungsverzeichnis auf Anfrage erhältlich.
Entscheidungs-Fragen
Ist das nicht Overkill für einen einzigen Agent?
Ja. Bei einem Agent bauen wir ihn direkt, ohne separate Infrastruktur-Schicht. Die Infrastruktur lohnt sich ab etwa dem dritten produktiven Use-Case oder wenn mehrere Teams gleichzeitig AI einsetzen wollen.
Was sind die Bausteine einer AI-Infrastruktur-Schicht?
Sechs Kernkomponenten: (1) Modell-Gateway mit Routing und Failover (LiteLLM / Vercel AI Gateway). (2) Vector-Store für Knowledge-Layer (pgvector oder Pinecone). (3) Audit-Log mit Retention-Management. (4) Cost-Tracking pro Anwendung. (5) Access-Control (RBAC, OAuth, Service-Accounts). (6) Admin-UI für Konfiguration und Monitoring.
Wie verhält sich die Infrastruktur zu Schweizer Hosting?
Die AI-Infrastruktur kann komplett auf Schweizer Boden laufen: Postgres bei Exoscale oder Infomaniak, Apertus 70B via Swisscom, Audit-Logs in CH-Region, Storage CH-konform. Bei Hybrid-Setups (CH-Strict für sensitive Strecken, US für nicht-sensitive) übernimmt die Infrastruktur das Routing automatisch.
Was kostet die Infrastruktur-Schicht?
Initial 25'000–60'000 CHF je nach Komplexität (Anzahl Modelle, Hosting-Setup, Compliance-Tiefe). Laufend 800–2'500 CHF/Monat Wartung plus die Modell-Kosten der einzelnen Anwendungen. Bei 3+ produktiven AI-Anwendungen amortisiert sich die Schicht typisch im ersten Jahr.
Welche Observability-Tools werden eingesetzt?
Sentry für Error-Tracking, Prometheus + Grafana für Metriken (Token-Usage, Latenz, Fehlerquoten pro Modell), Custom-Dashboards in der Admin-UI für Geschäfts-Kennzahlen (Anzahl Agent-Anfragen pro Team, Kosten pro Use-Case, Eskalations-Quoten). Wir bauen so, dass Sie monatlich präzise Reports an die GL geben können.
Können wir externe AI-Tools (M365 Copilot, ChatGPT Business) auch über die Schicht steuern?
Teilweise. SaaS-Tools mit eigener UI laufen weiter, aber die Schicht kann Telemetrie sammeln (über API-Logs / Microsoft Graph) und im zentralen Dashboard aggregieren. Voll integriert sind nur API-getriebene Anwendungen — bei SaaS-Tools beschränkt sich die Infrastruktur auf Reporting und Kosten-Tracking.

Ein Agentproduktiv in
Beschreib uns dein Projekt in ein paar Sätzen. Innerhalb von 24 Stunden hältst du eine funktionierende AI-Demo in den Händen — und siehst, was heute möglich ist. Kostenlos. Unverbindlich.