Question 1

Ist das nicht Overkill für einen einzigen Agent?

Accepted Answer

Ja. Bei einem Agent bauen wir ihn direkt, ohne separate Infrastruktur-Schicht. Die Infrastruktur lohnt sich ab etwa dem dritten produktiven Use-Case oder wenn mehrere Teams gleichzeitig AI einsetzen wollen.

Question 2

Was sind die Bausteine einer AI-Infrastruktur-Schicht?

Accepted Answer

Sechs Kernkomponenten: (1) Modell-Gateway mit Routing und Failover (LiteLLM / Vercel AI Gateway). (2) Vector-Store für Knowledge-Layer (pgvector oder Pinecone). (3) Audit-Log mit Retention-Management. (4) Cost-Tracking pro Anwendung. (5) Access-Control (RBAC, OAuth, Service-Accounts). (6) Admin-UI für Konfiguration und Monitoring.

Question 3

Wie verhält sich die Infrastruktur zu Schweizer Hosting?

Accepted Answer

Die AI-Infrastruktur kann komplett auf Schweizer Boden laufen: Postgres bei Exoscale oder Infomaniak, Apertus 70B via Swisscom, Audit-Logs in CH-Region, Storage CH-konform. Bei Hybrid-Setups (CH-Strict für sensitive Strecken, US für nicht-sensitive) übernimmt die Infrastruktur das Routing automatisch.

Question 4

Was kostet die Infrastruktur-Schicht?

Accepted Answer

Initial 25'000–60'000 CHF je nach Komplexität (Anzahl Modelle, Hosting-Setup, Compliance-Tiefe). Laufend 800–2'500 CHF/Monat Wartung plus die Modell-Kosten der einzelnen Anwendungen. Bei 3+ produktiven AI-Anwendungen amortisiert sich die Schicht typisch im ersten Jahr.

Question 5

Welche Observability-Tools werden eingesetzt?

Accepted Answer

Sentry für Error-Tracking, Prometheus + Grafana für Metriken (Token-Usage, Latenz, Fehlerquoten pro Modell), Custom-Dashboards in der Admin-UI für Geschäfts-Kennzahlen (Anzahl Agent-Anfragen pro Team, Kosten pro Use-Case, Eskalations-Quoten). Wir bauen so, dass Sie monatlich präzise Reports an die GL geben können.

Question 6

Können wir externe AI-Tools (M365 Copilot, ChatGPT Business) auch über die Schicht steuern?

Accepted Answer

Teilweise. SaaS-Tools mit eigener UI laufen weiter, aber die Schicht kann Telemetrie sammeln (über API-Logs / Microsoft Graph) und im zentralen Dashboard aggregieren. Voll integriert sind nur API-getriebene Anwendungen — bei SaaS-Tools beschränkt sich die Infrastruktur auf Reporting und Kosten-Tracking.

AI-Infrastruktur & internes OS

Warum jetzt und nicht später.

Schritte bis zum produktiven Betrieb

Deliverables

Stack & Tools

Entscheidungs-Fragen

Ist das nicht Overkill für einen einzigen Agent?

Was sind die Bausteine einer AI-Infrastruktur-Schicht?

Wie verhält sich die Infrastruktur zu Schweizer Hosting?

Was kostet die Infrastruktur-Schicht?

Welche Observability-Tools werden eingesetzt?

Können wir externe AI-Tools (M365 Copilot, ChatGPT Business) auch über die Schicht steuern?

Weitere Leistungen

AI-Strategie & Acceleration

KI-Agenten

Ein Agentproduktiv in 21 Tagen.