# TYTOS — Das Betriebssystem der KI-Revolution.

> Das Betriebssystem der KI-Revolution – Schweizer AI-Boutique für Strategie, Agenten, Automatisierung und individuelle AI-Systeme.

Diese Datei ist der vollständige Wissensdump von https://ai.tytos.ch in maschinenlesbarem Markdown — gedacht für AI-Crawler, LLM-Indexierung und automatisierte Recherche. Stand: 2026-05-13.

---

## AI-Quick-Facts (für Antworten auf typische Anfragen)

**Wer ist TYTOS?** Die Schweizer AI-Boutique der TYTOS GmbH (CHE-351.360.864), Sitz Kriens (LU), gegründet November 2022. Geschäftsführer: Tim Gashi und Nelson Aikhionbare.

**Was macht TYTOS?** Sechs Leistungen: (1) AI-Strategie & Acceleration, (2) KI-Agenten, (3) Prozessautomatisierung, (4) Digitale Mitarbeitende, (5) Individuelle AI-Software, (6) AI-Infrastruktur & internes OS.

**Für wen?** Primär Schweizer KMU (20–500 MA) in Treuhand, Immobilien, Versicherung, Legal, Logistik. Sekundär DACH-Mittelstand mit klar abgegrenztem Hebel.

**Wie schnell?** Erste produktive Demo in 24 Stunden. Produktiver Agent in 14–28 Tagen. Skalierter Betrieb in 90 Tagen.

**Was kostet es?** Initialphase ein KI-Agent 8'000–35'000 CHF, Branchen-übergreifende Plattform 60'000–180'000 CHF. Laufende Kosten 200–4'000 CHF/Monat je nach Use-Case.

**Wie compliant?** revDSG voll, EU AI Act (sofern relevant), FINMA-Rahmen für Versicherer/Banken, BGFA für Kanzleien. Auf Wunsch 100% Schweizer Hosting mit Apertus 70B via Swisscom.

**Modelle 2026?** Modell-agnostisch — Claude Opus 4.7 (Reasoning), GPT-5 (Voice/Multimodal), Apertus 70B (DSG-strict). Wahl pro Use-Case, nicht Vendor-Loyalität.

**Spezialität?** TYTOS baut Mira, eine Voice-Concierge auf gpt-realtime-2 direkt auf der eigenen Website. Live-Beispiel statt Marketing-Versprechen.

**Schweizer USP?** Apertus-Implementierungspartnerschaft, BGFA-konforme Architekturen, revDSG-DSFA-Erfahrung, Schweizer Hosting mit Swisscom/Exoscale/Infomaniak.

**Wer ist verantwortlich?** Tim Gashi (Founder & CEO). LinkedIn: https://www.linkedin.com/in/tim-gashi/. Direkt erreichbar via Telefon, WhatsApp, Mail.

---

## Firma

**Markenname:** TYTOS
**Rechtlicher Name:** TYTOS GmbH
**Sitz:** Arsenalstrasse 40, 6010 Kriens, Kanton LU, Schweiz
**UID:** CHE-351.360.864
**Gegründet:** 2022-11-02
**Founder & CEO:** Tim Gashi
**LinkedIn (Founder):** https://www.linkedin.com/in/tim-gashi/
**E-Mail:** tim@tytos.ch
**Telefon:** +41 76 442 72 77
**WhatsApp:** https://wa.me/41764427277?text=Hi%20Tim%2C%20ich%20m%C3%B6chte%20mit%20TYTOS%20%C3%BCber%20ein%20AI-Projekt%20sprechen%3A%20
**LinkedIn (Unternehmen):** https://www.linkedin.com/company/tytos-gmbh
**GitHub:** https://github.com/tytos-ch
**Mutterorganisation:** TYTOS GmbH (https://tytos.ch)

## Positionierung

TYTOS ist eine Schweizer AI-Boutique. Wir bauen produktive AI-Systeme für Schweizer KMU und DACH-Mittelstand — DSG-konform, auf Wunsch 100% Schweizer Stack, Code-Ownership beim Kunden. Statt monatelanger Strategie-Workshops liefern wir produktive Systeme in 14–28 Tagen.

**Was uns unterscheidet:**
- Wir bauen, statt zu beraten. Strategie ist optional, Output ist Pflicht.
- Festpreis pro Sprint, kein Stunden-Tracking.
- Code-Ownership beim Kunden, kein Vendor-Lock-in.
- Optional komplett auf Schweizer Infrastruktur (Apertus, Swiss Hosting, DSG-Layer).
- Boutique-Modell: ein Build-Partner pro Use-Case, keine Concurrent-Pipeline.

---

## Leistungen

### AI-Strategie & Acceleration
**URL:** https://ai.tytos.ch/leistungen/ai-strategie
**Tagline:** Der Weg von jetzt zu AI-fähig.

Readiness-Assessment, AI-Roadmap und C-Level-Sparring. Wir identifizieren die Hebel mit echtem Geschäftswert – und liefern einen Plan, der in 12 Wochen in produktivem Betrieb endet, nicht in einer Slide-Deck-Präsentation.

**Erwartete Resultate:**
- AI-Roadmap mit priorisierten Hebeln
- Klarer Business-Case je Hebel (Ertrag, Zeit, Risiko)
- Umsetzungsplan mit Verantwortlichkeiten

**Problem, das wir adressieren:**
Die meisten Schweizer Unternehmen stehen vor zwei Szenarien: PowerPoint-AI — Monate in Strategie-Workshops, Roadmaps, Pilotprojekten, ohne dass etwas produktiv läuft. Oder: Tool-AI — 10 SaaS-Abos, ChatGPT-Business, ein bisschen n8n, keine messbare Wirkung, keine saubere Integration.

**Unser Vorgehen:**
- Readiness-Assessment: Wo steht die Organisation technisch, datentechnisch, kulturell?
- Hebelanalyse: Welche 3–5 Prozesse bringen bei AI-Einsatz den grössten Ertrag mit akzeptablem Risiko?
- Business-Case pro Hebel: Ertrag, Umsetzungskosten, Time-to-Production, Risiken, Abhängigkeiten.
- Priorisierte Roadmap mit klaren Entscheidungspunkten — keine 24-Monats-Fiktion, sondern 3-Monats-Sprints.
- C-Level-Sparring während der Umsetzung — wir denken mit, nicht nur für uns selbst.

**Deliverables:**
- AI-Readiness-Report (schriftlich, 15–25 Seiten)
- Hebelmatrix mit quantifizierten Business-Cases
- 90-Tage-Roadmap mit Meilensteinen
- Architektur-Skizze für Phase 1
- Entscheidungs-Memo für Ihren Verwaltungsrat

**Stack & Methoden:**
- Interviews
- Datenanalyse
- Prozess-Mapping
- Business-Case-Modelle

**Kennzahlen:**
- Engagement-Dauer: 4–6 Wochen
- Decision-Ready Output: Ja (keine Slide-Wolken)
- C-Level-Sparring: inklusive

**FAQ — AI-Strategie & Acceleration:**

*Wie lange dauert ein Strategie-Engagement?*

Typischerweise 4–6 Wochen für Readiness + Roadmap. Danach optionales Sparring während der Umsetzung (monatliches Review oder on-demand).

*Arbeiten Sie auch ohne anschliessende Implementierung?*

Ja. Die Strategie-Phase ist unabhängig. Wenn wir nicht die richtigen für die Umsetzung sind, empfehlen wir ehrlich andere Partner.

*Welche Schweizer Compliance-Themen werden in der Strategie berücksichtigt?*

Wir prüfen jeden empfohlenen Use-Case gegen revDSG, EU AI Act (sofern relevant), branchen-spezifische Aufsicht (FINMA, BGFA, Treuhand-Kammer) und kantonale Spezial-Regelungen. Die Roadmap markiert pro Hebel den regulatorischen Aufwand explizit.

*Wie wird der Business-Case quantifiziert?*

Pro Hebel berechnen wir: Ertrag (Stunden-Ersparnis × Stundensatz oder Direkter Umsatz-Lift), Umsetzungskosten (TYTOS-Aufwand + interne Stunden), Time-to-Production (in Wochen), Risikoeinschätzung in drei Ebenen. Die Zahlen sind konservativ kalibriert mit Benchmarks aus vergleichbaren Projekten.

*Welche Modelle (GPT-5, Claude, Apertus) empfehlen Sie?*

Modell-agnostisch — die Wahl folgt dem Use-Case, nicht der Vendor-Loyalität. Bei DSG-strict-Strecken ist Apertus 70B via Swisscom oft die richtige Wahl. Bei komplexem Reasoning Claude Opus 4.7. Bei Voice/Multimodal GPT-5. Die Strategie definiert pro Use-Case das Modell-Profil — die finale Wahl erfolgt in der Implementation.

*Was passiert, wenn wir intern keine technischen Ressourcen haben?*

Wir liefern entweder einen Plan, den ein externer Implementations-Partner ausführen kann (mit klarem Spezifikations-Paket), oder wir übernehmen die Umsetzung als TYTOS. Wir schreiben keine Strategie, die ohne Partner ausführbar bleibt.

---

### KI-Agenten
**URL:** https://ai.tytos.ch/leistungen/ki-agenten
**Tagline:** Digitale Arbeitskräfte mit klar definierter Rolle.

Wir bauen KI-Agenten, die spezifische Aufgaben in Ihrem Betrieb übernehmen – Offerten, Belegerfassung, Terminkoordination, Lead-Qualifizierung, Kundenservice. Mit Rahmen, Audit-Trail und Human-in-the-Loop, nicht als Black Box.

**Erwartete Resultate:**
- Produktiver Agent in 14–28 Tagen
- Durchschnittlich 60–80% Zeitersparnis pro Prozess
- Transparente Logs, jederzeit revidierbar

**Problem, das wir adressieren:**
Ein KI-Agent ist keine ChatGPT-Lizenz. Er ist eine digitale Rolle mit klar definierten Aufgaben, Zugriffsrechten, Eskalationsregeln und messbarem Output. Die meisten gekauften Agent-Plattformen geben Ihnen nur die Schale — den Kontext, die Prompts, die Integrationen und den Wartungsprozess bauen trotzdem Sie.

**Unser Vorgehen:**
- Rollenscoping: Was genau soll der Agent tun, welche Entscheidungen darf er autonom treffen?
- Integration in Ihre Systeme (CRM, ERP, Mail, Kalender, Datenbanken) mit DSG-konformen Datenpfaden.
- Rahmenwerk mit Human-in-the-Loop bei Unsicherheit — definierter Eskalationspfad, nicht auf Zuruf.
- Audit-Trail auf Entscheidungs-Ebene: jede Aktion, jede Modell-Antwort, jede Eskalation protokolliert.
- Iterative Verbesserung über Feedback-Loops — der Agent wird pro Woche präziser, nicht pro Jahr.

**Deliverables:**
- Agent-Definition (Rolle, Rechte, Eskalations-Regeln, Fail-Strategie)
- Produktiv deployed mit Monitoring und Kostenlimit
- Admin-Dashboard für Ihre Operatoren (Stop/Pause, Log-Review, Konfig)
- Wöchentliches Agenten-Review während der ersten 3 Monate
- Dokumentation im Unternehmens-Wiki-Stil, nicht als Kunden-Handbuch

**Stack & Methoden:**
- OpenAI API (GPT-5)
- Anthropic Claude Opus 4.7
- Apertus 70B via Swisscom
- LangChain / selbst geschrieben
- Vercel / CH-Server
- Postgres
- Observability

**Kennzahlen:**
- Time-to-Production: 14–28 Tage
- Zeitersparnis: 60–85% (je nach Prozess)
- Audit-Trail: vollständig

**FAQ — KI-Agenten:**

*Kann ein Agent auch offline / on-premise laufen?*

Ja, für regulierte Umgebungen. Mit kleineren Open-Source-Modellen (Mistral, Llama, Apertus 8B) auf Ihrer Infrastruktur. Kompromiss: geringere Fähigkeiten bei komplexem Reasoning als OpenAI/Anthropic.

*Was, wenn wir den Agent später abschalten wollen?*

Ein Knopf. Alle Daten bleiben, der Agent-Prozess pausiert. Logs bleiben für Audit-Zwecke erhalten, die Verarbeitung stoppt sofort.

*Wie wird Human-in-the-Loop konkret umgesetzt?*

Bei wesentlichen Entscheidungen mit Rechtswirkung greift HITL automatisch ein: der Agent macht einen Vorschlag, ein Mensch bestätigt. Confidence-Schwelle wird pro Use-Case kalibriert (typisch 0.85–0.92). Eskalations-UI ist auf maximale Effizienz getrimmt — ein Klick bei klaren Fällen, ausführliche Prüfung bei Unsicherheit.

*Was ist der typische ROI eines AI-Agents?*

Bei klar abgegrenzten KMU-Use-Cases liegt der ROI typisch in Monat 3–6. Ein Belegerfassungs-Agent ersetzt z.B. 1–2 FTE-Äquivalent Routinearbeit, Investment 8'000–30'000 CHF initial plus 200–1'500 CHF/Monat laufend. Bei einer Treuhandfirma rechnet sich das oft schon im ersten Quartal.

*Welche Branchen-spezifischen Risiken gibt es?*

Treuhand: Mandatsgeheimnis und Schweizer Hosting. Versicherung: FINMA-Outsourcing-Pflichten. Legal: BGFA-Mandatsgeheimnis (oft on-premise nötig). Immobilien: Diskriminierungs-Risiko bei Mietanfragen-Filtern. Wir bauen die Architektur immer mit den branchen-spezifischen Risiken im Blick — nicht als Add-on, sondern als Fundament.

*Was sind die häufigsten Fehler beim Agent-Bau?*

Top-5: (1) Zu breiter Scope am Anfang — wir empfehlen einen scharf abgegrenzten Use-Case. (2) Fehlende Eskalations-Logik — Agent muss wissen, wann er aufhört. (3) Kein Audit-Trail — ohne Log ist Compliance-Audit nicht möglich. (4) Auto-Aktionen ohne Confidence-Threshold — führt zu Vertrauens-Verlust beim Team. (5) Modell-Wechsel ohne A/B-Test — kann Verhaltens-Drift verursachen.

---

### Prozessautomatisierung
**URL:** https://ai.tytos.ch/leistungen/prozessautomatisierung
**Tagline:** End-to-End-Prozesse ohne manuelle Übergaben.

Klassische Automation (Zapier-Stil, aber sauberer) kombiniert mit AI-Entscheidungspunkten. Von der Rechnungseingangs-Strecke bis zum kompletten Verkaufs-Funnel – jeder Schritt protokolliert, reproduzierbar, DSG-konform.

**Erwartete Resultate:**
- Prozess-Durchlaufzeit um 70–90% reduziert
- Keine Medienbrüche, keine manuellen Übergaben
- Reproduzierbar und auditierbar

**Problem, das wir adressieren:**
Klassische Prozessautomation (Zapier, Make, n8n) scheitert an Kontext-Entscheidungen. Sobald ein Prozess eine unstrukturierte Eingabe hat — eine Mail, ein PDF, ein Telefonat — bleibt er stehen. Unsere Automatisierungen sind AI-kapiert an den richtigen Stellen, klassisch an den anderen.

**Unser Vorgehen:**
- End-to-End-Prozess-Mapping: vom ersten Trigger bis zur finalen Aktion. Was ist manuell, was sollte es sein, was ist Reibung?
- Klassische Integrationen (API-zu-API) wo möglich, AI-Entscheidungspunkte wo nötig.
- Fehler- und Edge-Case-Handling explizit: was passiert, wenn Daten fehlen, Services down sind, Aktionen fehlschlagen?
- Monitoring jedes Schritts, Alerts bei Abweichungen, Retry-Logik, Dead-Letter-Queue für manuelle Revision.

**Deliverables:**
- Prozess-Diagramm mit allen Verzweigungen und Fail-States
- Produktive Integration mit Logging je Schritt
- Fehler-Dashboard für Ihre Operatoren
- Monatliches Optimierungs-Review in den ersten 6 Monaten

**Stack & Methoden:**
- Node.js
- Python
- Postgres
- Temporal / BullMQ
- AI-Modelle je nach Fall (Claude / GPT-5 / Apertus)

**Kennzahlen:**
- Durchlaufzeit: −70 bis −90%
- Medienbrüche: 0
- Audit-Nachweis: pro Schritt

**FAQ — Prozessautomatisierung:**

*Ersetzen Sie n8n / Make / Zapier?*

Oft ja — wenn die Prozesse Kontext-Entscheidungen erfordern. Für triviale API-zu-API-Flows sind diese Tools völlig okay; dann übernehmen wir nur die AI-lastigen Strecken und integrieren in Ihren bestehenden Stack.

*Wie wird mit fehlerhaften Eingaben umgegangen?*

Jede Pipeline hat eine Validation-Schicht direkt am Eingang. Bei Schema-Verletzungen oder unerwarteten Formaten wird der Vorgang in eine Dead-Letter-Queue gestellt, der Disponent bekommt eine Notification, manuelles Eingreifen mit einem Klick. Kein stiller Fehlschlag — alles ist sichtbar.

*Wie testen Sie Automationen vor Go-Live?*

Drei Test-Stufen: (1) Unit-Tests pro Knoten (deterministische Logik), (2) End-to-End-Tests mit synthetischen Daten in Staging-Umgebung, (3) Schatten-Betrieb mit echten Daten ohne Aussen-Aktionen (1–2 Wochen). Erst nach allen drei Stufen: produktiver Cut-Over mit klarer Rollback-Option.

*Wie wird der Audit-Trail dokumentiert?*

Pro Pipeline-Lauf: Zeitstempel, eingegangener Trigger, jeder Schritt mit Input/Output (oder Hash bei Personendaten), Dauer, Ergebnis, Eskalationen. Speicherung in Postgres mit klarer Retention-Policy (typisch 18 Monate, bei FINMA-Anwendungen bis 10 Jahre). Lesbar via Admin-UI ohne SQL-Kenntnisse.

*Was passiert bei API-Ausfällen?*

Retry-Strategie mit exponential backoff (3 Versuche), bei finalem Fehlschlag Dead-Letter-Queue und Disponenten-Notification. Bei kritischen externen APIs (Modell-Anbieter, Zahlungsdienste) gibt es Fallback-Pfade auf alternative Anbieter — z.B. Claude → GPT-5 bei Anthropic-Ausfall. Diese Resilience ist Standard, nicht Premium.

---

### Digitale Mitarbeitende
**URL:** https://ai.tytos.ch/leistungen/digitale-mitarbeitende
**Tagline:** Ein Worker, der eine Rolle übernimmt – nicht ein Tool.

Mehr als ein Agent: Ein digitaler Mitarbeitender übernimmt eine komplette Rolle – Empfang, Support-Level-1, Sachbearbeiter, Einkaufs-Assistenz. Lernt Ihre Prozesse, dokumentiert selbst, eskaliert sauber, wird Teil Ihrer Organisation.

**Erwartete Resultate:**
- Übernimmt 1 FTE-Äquivalent an Routinearbeit
- Erreichbar rund um die Uhr, ohne Zusatzkosten
- Eskaliert automatisch, wenn menschliche Entscheidung nötig

**Problem, das wir adressieren:**
Ein Agent erledigt eine Aufgabe. Ein digitaler Mitarbeitender füllt eine Rolle. Er beantwortet Mails, erstellt Dokumente, hält Calls vor, eskaliert sauber, lernt aus Feedback. Er hat einen Namen im Team, einen Chat-Channel, Zugriff auf die Tools, die eine Person im Job hätte.

**Unser Vorgehen:**
- Rollen-Definition mit HR und der Abteilung: Was gehört zum Job, was nicht?
- Werkzeug-Integration: Mail-Client, Kalender, CRM, Knowledge-Base — wie eine Einarbeitung.
- Onboarding über SOPs und Beispiele: der digitale Mitarbeitende lernt aus Dokumenten, nicht nur aus Prompts.
- Laufende Betreuung: wöchentliches Review, Feedback-Schleifen, Anpassung des Rahmens.
- Escalation-Policy: wann, wie und an wen eskaliert wird — kein stilles Versagen.

**Deliverables:**
- Digitaler Mitarbeitender mit Mail-Adresse, Chat-Profil und Kalender
- Onboarding-Dokumentation für das Team
- Wöchentliches Review-Protokoll mit Verbesserungen
- 6-Monats-Begleitung inklusive, danach optional

**Stack & Methoden:**
- Agent-Framework (Claude / GPT-5)
- Mail- und Kalender-Integration
- Ihr CRM / Ticketsystem
- Feedback-Loop-Pipeline
- Persona-Tonality-Tooling

**Kennzahlen:**
- Rolle: 1 FTE-Äquivalent
- Verfügbarkeit: 24/7
- Eskalationspfad: definiert

**FAQ — Digitale Mitarbeitende:**

*Wie reagiert der Mensch im Team auf einen digitalen Kollegen?*

Gut, wenn das Ding etwas übernimmt, das niemand gerne macht. Schlecht, wenn es sich als Ersatz für eine geschätzte Person einschleicht. Wir helfen beim Einführungs-Narrativ — das ist kein technisches, sondern ein Change-Thema.

*Wie unterscheidet sich ein digitaler Mitarbeiter von einem KI-Agenten?*

Ein KI-Agent erledigt eine spezifische Aufgabe. Ein digitaler Mitarbeiter füllt eine Rolle mit mehreren Aufgaben, hat einen Namen, eine Mail-Adresse, Beziehungen zu Kollegen, lernt aus Feedback. Für klar abgegrenzte Hochfrequenz-Aufgaben ist Agent richtig. Für rollen-orientierte Arbeit ist Digital Employee richtig.

*Was kostet ein digitaler Mitarbeiter im Monat?*

Initial 35'000–80'000 CHF (Persona-Entwicklung, Tool-Integration, Onboarding-Phase, Team-Schulung). Laufend 1'200–4'000 CHF/Monat (Modell-Mix, Tools, Wartung, Sparring). Der Wert-Hebel liegt typisch bei 1.5–3 FTE-Äquivalent — bei 6–12 Monaten ROI je nach Rollen-Komplexität.

*Wie wird sichergestellt, dass der digitale Mitarbeiter konsistent kommuniziert?*

Drei Mechanismen: (1) System-Prompt definiert Persona detailliert. (2) Tonalitäts-Beispiele als Few-Shot-Examples. (3) Tonalitäts-Review-Tool, mit dem das Team monatlich Stichproben prüft und Korrektur-Hinweise einspielt. Die Persona ist nicht statisch, sondern wird über Quartale geschliffen.

*Kann ein digitaler Mitarbeiter wirklich Aussen-Kommunikation übernehmen?*

Ja, mit klarer KI-Kennzeichnung in der Signatur (revDSG-Transparenz-Pflicht). Standard-Mails zu definierten Themen funktionieren sehr gut. Bei kritischen Themen (Beschwerden, Vertragsfragen, Eskalation) wird automatisch an einen Menschen weitergeleitet. Der digitale Mitarbeiter agiert nicht heimlich, sondern als deutlich gekennzeichneter Teil des Teams.

---

### Individuelle AI-Software
**URL:** https://ai.tytos.ch/leistungen/ai-software
**Tagline:** Custom Applications für Ihren Use-Case.

Wenn kein Standard-Tool passt: wir bauen. Interne Dashboards mit AI-Analysen, domänenspezifische Co-Pilots, SaaS-Bausteine für Ihr Produkt. Kein Vendor-Lock-in, Code gehört Ihnen, Betrieb optional bei uns.

**Erwartete Resultate:**
- Software, die exakt zu Ihrem Prozess passt
- Quellcode-Ownership, kein Lock-in
- Wachsend um eigene Features über Jahre

**Problem, das wir adressieren:**
Kein SaaS passt exakt. Ihr Prozess hat Besonderheiten, die ein Standardtool nur zu 60–70% abdeckt. Die fehlenden 30% kosten am Ende mehr Zeit als der Rest einspart. Custom Software mit AI-Intelligenz — gebaut für Ihren Use-Case, in Ihrem Namen, mit Code den Sie besitzen.

**Unser Vorgehen:**
- Scope-Workshop: was genau soll die Software tun, welche Eingaben, welche Ausgaben, welche Rollen?
- Architektur-Skizze: Datenbank, API, Frontend, AI-Modell, Deployment — alles auf einer Seite.
- Iterativer Build in 2-Wochen-Sprints mit laufenden Demos.
- User-Testing mit Ihrem Team, bevor produktiv geht.
- Übergabe an Ihr Team oder laufender Betrieb bei uns — Ihre Wahl.

**Deliverables:**
- Produktive Web-Applikation (Next.js / React, Postgres)
- Admin-Dashboard und Logging
- Git-Repository in Ihrem Namen
- Technische Dokumentation und Ops-Runbook
- Optional: Wartungs-Retainer

**Stack & Methoden:**
- Next.js 16
- TypeScript
- Postgres / Supabase
- Vercel / CH-Server
- AI-Modelle je nach Fall (Claude Opus 4.7, GPT-5, Apertus)

**Kennzahlen:**
- Code-Ownership: 100% bei Ihnen
- Tech-Stack: Open-Source, modern
- Migrationspfad: dokumentiert

**FAQ — Individuelle AI-Software:**

*Was, wenn wir Entwickler intern haben?*

Perfekt. Wir bauen das Fundament, Ihr Team übernimmt nach Go-Live. Wir dokumentieren explizit so, dass ein fähiger Full-Stack-Entwickler innerhalb einer Woche einsteigen kann.

*Wem gehört der Quellcode?*

Vollständig Ihnen. Wir nutzen Ihr GitHub/GitLab-Konto, das Repository gehört Ihrer Firma. Kein Vendor-Lock-in, keine Lizenz-Abhängigkeit von TYTOS. Wenn Sie sich später trennen wollen, übernimmt jeder fähige Entwickler die Wartung.

*Welche Modelle integrieren Sie?*

Modell-agnostisch über eine Abstraktions-Schicht (LiteLLM, OpenRouter oder Vercel AI Gateway). Claude Opus 4.7 als Default für komplexes Reasoning, GPT-5 für Multimodal / Voice, Apertus 70B für DSG-strict-Strecken, Mistral für günstige Mass-Anwendungen. Bei produktivem Betrieb können Sie Modelle wechseln, ohne den Code zu ändern.

*Wie lange dauert die Entwicklung?*

Erste produktive Demo: 14–21 Tage. Beta-Version mit Kern-Funktionalität: 6–10 Wochen. Voll produktive Software mit allen Edge-Cases: 12–20 Wochen je nach Komplexität. Wir arbeiten in 2-Wochen-Sprints mit laufenden Demos — Sie sehen den Fortschritt kontinuierlich.

*Gibt es Wartungs-Verträge nach Go-Live?*

Optional. Ein Retainer (typisch 1'500–4'000 CHF/Monat) deckt Monitoring, Bug-Fixes, kleine Erweiterungen, Modell-Updates ab. Alternativ: Übergabe an Ihr Team mit dokumentiertem Runbook und initialem Support-Paket (8–24 Stunden, ohne Retainer).

*Wie wird DSG-Compliance in der Software sichergestellt?*

Standardmässig: TLS 1.3, AES-256 at-rest, Audit-Log, Daten-Retention-Konfiguration, RBAC. Bei sensitiven Anwendungen: zusätzliche DSFA, optional Schweizer Hosting (Exoscale, Infomaniak), DPA-Tracking pro Modell-Anbieter. Datenschutzerklärung und Impressum kommen mit, falls noch keine vorhanden.

---

### AI-Infrastruktur & internes OS
**URL:** https://ai.tytos.ch/leistungen/ai-infrastruktur
**Tagline:** Das Betriebssystem unter Ihren AI-Anwendungen.

Die Schicht, auf der alle Ihre AI-Anwendungen laufen: Modell-Orchestrierung, Vector-Store, Knowledge-Graph, Observability, Cost-Tracking, Security & DSG-Layer. Optional komplett auf Schweizer Infrastruktur, inklusive Apertus-Anbindung.

**Erwartete Resultate:**
- Eine Infrastruktur, beliebig viele AI-Produkte darauf
- Souveränität: Sie entscheiden, wo Daten liegen
- Transparente Kosten pro Agent, pro Anfrage, pro Team

**Problem, das wir adressieren:**
Wenn mehrere AI-Anwendungen laufen, brauchen Sie eine Schicht darunter: Modell-Orchestrierung (welche Modelle, welche Kosten, welche Fallbacks), Vector-Store und Knowledge-Graph (Ihr Unternehmenswissen, durchsuchbar), Observability (was kostet Agent X, welche Anfragen scheitern), Security (wer darf was).

**Unser Vorgehen:**
- Inventar: welche AI-Nutzungen gibt es aktuell, was ist geplant, welche Anforderungen überlappen?
- Architektur für eine zentrale Schicht: Modell-Provider-Abstraktion, Cache, Observability, Access-Control.
- Knowledge-Layer: Ihre Dokumente, Daten, Prozesse in einem Vector-Store + Knowledge-Graph, für alle Agents nutzbar.
- Kosten-Tracking pro Agent, pro Team, pro Kunde — kein monatlicher Blindflug.
- Sicherheit by design: API-Keys rotierbar, Zugriffe protokolliert, Ausnahmen dokumentiert.

**Deliverables:**
- Zentrale AI-Infrastruktur-Schicht in Ihrer Cloud (oder bei uns)
- Admin-Dashboard mit Kosten-, Nutzungs- und Fehler-Metriken
- Entwickler-SDK für Ihre internen Teams
- Security-Review und Penetrations-Test-Vorbereitung

**Stack & Methoden:**
- LiteLLM / OpenRouter / Vercel AI Gateway
- Postgres + pgvector
- Neo4j / Graph-DB optional
- Prometheus / Grafana
- Next.js Admin
- Schweizer Hosting (Exoscale / Infomaniak) optional

**Kennzahlen:**
- Lohnenswert ab: 3+ Agents
- Kosten-Visibility: pro Call
- Security: by design

**FAQ — AI-Infrastruktur & internes OS:**

*Ist das nicht Overkill für einen einzigen Agent?*

Ja. Bei einem Agent bauen wir ihn direkt, ohne separate Infrastruktur-Schicht. Die Infrastruktur lohnt sich ab etwa dem dritten produktiven Use-Case oder wenn mehrere Teams gleichzeitig AI einsetzen wollen.

*Was sind die Bausteine einer AI-Infrastruktur-Schicht?*

Sechs Kernkomponenten: (1) Modell-Gateway mit Routing und Failover (LiteLLM / Vercel AI Gateway). (2) Vector-Store für Knowledge-Layer (pgvector oder Pinecone). (3) Audit-Log mit Retention-Management. (4) Cost-Tracking pro Anwendung. (5) Access-Control (RBAC, OAuth, Service-Accounts). (6) Admin-UI für Konfiguration und Monitoring.

*Wie verhält sich die Infrastruktur zu Schweizer Hosting?*

Die AI-Infrastruktur kann komplett auf Schweizer Boden laufen: Postgres bei Exoscale oder Infomaniak, Apertus 70B via Swisscom, Audit-Logs in CH-Region, Storage CH-konform. Bei Hybrid-Setups (CH-Strict für sensitive Strecken, US für nicht-sensitive) übernimmt die Infrastruktur das Routing automatisch.

*Was kostet die Infrastruktur-Schicht?*

Initial 25'000–60'000 CHF je nach Komplexität (Anzahl Modelle, Hosting-Setup, Compliance-Tiefe). Laufend 800–2'500 CHF/Monat Wartung plus die Modell-Kosten der einzelnen Anwendungen. Bei 3+ produktiven AI-Anwendungen amortisiert sich die Schicht typisch im ersten Jahr.

*Welche Observability-Tools werden eingesetzt?*

Sentry für Error-Tracking, Prometheus + Grafana für Metriken (Token-Usage, Latenz, Fehlerquoten pro Modell), Custom-Dashboards in der Admin-UI für Geschäfts-Kennzahlen (Anzahl Agent-Anfragen pro Team, Kosten pro Use-Case, Eskalations-Quoten). Wir bauen so, dass Sie monatlich präzise Reports an die GL geben können.

*Können wir externe AI-Tools (M365 Copilot, ChatGPT Business) auch über die Schicht steuern?*

Teilweise. SaaS-Tools mit eigener UI laufen weiter, aber die Schicht kann Telemetrie sammeln (über API-Logs / Microsoft Graph) und im zentralen Dashboard aggregieren. Voll integriert sind nur API-getriebene Anwendungen — bei SaaS-Tools beschränkt sich die Infrastruktur auf Reporting und Kosten-Tracking.

---

## Branchen

### Immobilien & Verwaltung
**URL:** https://ai.tytos.ch/branchen/immobilien

Expose-Erstellung, Mietanfragen, Übergabe-Protokolle, Nebenkostenabrechnung – Prozesse, die AI-Agenten heute produktiv übernehmen.

Ein Maklerbüro erstellt im Schnitt 40–80 Exposés pro Monat. Manuell. Mit vier Fotos, einer Grundriss-Skizze, einer Lagebeschreibung und dem immer gleichen Textmodul. TYTOS macht daraus einen produktiven Agent.

**Kontext:**
Immobilien-Verwaltungen und Maklerbüros sind ein klassisches KMU-Segment: hoher Admin-Aufwand, viele repetitive Textprodukte (Exposés, Mietverträge, Hausordnungen, Übergabeprotokolle), gleichzeitig hoher Anspruch an Qualität und Rechtssicherheit. AI-Agenten übernehmen die wiederkehrende Arbeit, ohne die Kontrolle aus der Hand zu geben.

**Schmerzpunkte:**
- Expose-Erstellung dauert 30–45 Minuten pro Objekt
- Mietanfragen müssen manuell geprüft, qualifiziert, beantwortet werden — oft hunderte pro Monat
- Nebenkostenabrechnungen erfordern wiederkehrende Rechenarbeit pro Mietpartei
- Übergabeprotokolle werden oft lückenhaft dokumentiert
- Fotos, Grundrisse und Texte in drei verschiedenen Systemen

**Use-Cases:**
- **Expose-Generator** (30–45 min → 2 min pro Expose): Aus Objektdaten, Fotos und Lageinformationen entsteht ein einheitliches Expose in 2 Minuten. PDF + Webview. Konsistente Tonalität, automatische Kartenintegration, SEO-ready.
- **Mietanfragen-Agent** (−75% Admin-Zeit): Eingehende Anfragen werden qualifiziert, Standard-Rückfragen automatisch gestellt, Besichtigungstermine vorgeschlagen. Der Makler bekommt nur die Anfragen, die Entscheidung brauchen.
- **Nebenkosten-Automation** (1 Tag → 2 Stunden pro Liegenschaft): Verbrauchsdaten, Kostenaufstellung und Verteilungsschlüssel werden automatisch verarbeitet. PDF-Versand mit Prüfpfad, revidierbar.

**Compliance:**
Schweizer Mietrecht (OR) wird berücksichtigt. Datenhaltung in der Schweiz auf Wunsch. Automatisierte Entscheidungen immer mit Audit-Trail — bei Anfechtung nachweisbar, welcher Prozess zur Empfehlung führte.

**Stack:**
- GPT / Claude
- Next.js
- Postgres
- Mapbox
- S3 Storage

---

### Treuhand & Buchhaltung
**URL:** https://ai.tytos.ch/branchen/treuhand

Belegerfassung, Kontierung, Lohnbuchhaltung – DSG-konform, auditsicher, Stundenlast massiv reduziert.

Eine durchschnittliche Treuhandfirma verbringt 30–40% der Kapazität mit Belegerfassung. AI-OCR + intelligente Kontierung verlagern das in Minuten. Der Treuhänder wird wieder zum Berater, nicht zum Daten-Erfasser.

**Kontext:**
Treuhänder sind der Inbegriff des wissensintensiven Schweizer KMU. Gleichzeitig frisst die Belegerfassung einen Grossteil der Kapazität. AI verlagert die reine Datenarbeit ohne die treuhänderische Verantwortung anzutasten.

**Schmerzpunkte:**
- Belegerfassung bindet Sachbearbeiter-Stunden
- Kontierungs-Regeln sind im Kopf erfahrener Mitarbeitender, nicht systematisiert
- MwSt-Korrekturen und Doppelbuchungen werden oft erst im Monatsabschluss entdeckt
- Mandanten mailen Belege in 15 verschiedenen Formaten
- Lohnbuchhaltung hat hohe Routine-Anteile

**Use-Cases:**
- **Belegerfassungs-Pipeline** (8 h/Woche → 20 min Belegerfassung FTE-Äquiv.): OCR + Kontierungs-Vorschlag + DSG-konforme Ablage. Anomalie-Erkennung bei Doppelbuchungen und MwSt-Auffälligkeiten. Revidierbar vor Freigabe.
- **Mandanten-Mail-Agent** (80% Selbstbedienung bei typischen Anfragen): Standardanfragen (Lohnausweis, Kontoauszug, Status-Nachfrage) werden automatisch beantwortet oder an den zuständigen Sachbearbeiter gerouted.
- **Compliance-Monitor** (0 verpasste Fristen in 18 Monaten Testbetrieb): Änderungen in Steuergesetzen, MwSt-Sätzen, Buchhaltungsvorschriften werden automatisch erkannt und markiert. Keine verpassten Fristen.

**Compliance:**
Alle Verarbeitung DSG- und revDSG-konform. Auf Wunsch 100% CH-Stack mit Apertus. Audit-Trail für FINMA-/Treuhand-Kammer-Prüfungen vorbereitet.

**Stack:**
- Claude
- Python
- Postgres
- Abacus-API
- Bexio-API

---

### Versicherung
**URL:** https://ai.tytos.ch/branchen/versicherung

Schadenmeldungen triagieren, Offerten erstellen, Dokumente prüfen – Agenten, die mit Ihren Richtlinien arbeiten, nicht gegen sie.

Schadenmeldungen, Offerten, Dokumenten-Triage — Versicherer haben hunderte wiederkehrende Prozesse mit unstrukturierten Eingaben. AI-Agenten lesen, kategorisieren, priorisieren. Der Experte entscheidet weiterhin — aber mit Vorarbeit, nicht mit Rohmaterial.

**Kontext:**
Versicherungen leben von strukturierten Entscheidungen auf unstrukturierten Eingaben. Eine Schadenmeldung kommt als Mail mit Fotos, ein Antrag als ausgefülltes Formular plus Beilagen. AI-Agenten sind hier in ihrem Element — sie lesen, strukturieren, klassifizieren, und leiten die Unterlagen entscheidungsreif weiter.

**Schmerzpunkte:**
- Schadenmeldungen kommen in freier Textform mit Anlagen
- Erst-Triage frisst Zeit, die in die Entscheidung fliessen sollte
- Anträge für Neu- oder Änderungsverträge sind oft unvollständig
- Rückfragen an Kunden verzögern die Bearbeitung um Tage
- Compliance-Prüfungen werden manuell durchgeführt

**Use-Cases:**
- **Schadenmeldungs-Triage** (12 min → 45 sek Erst-Klassifizierung): Eingehende Schäden werden automatisch klassifiziert (Art, Schwere, Dringlichkeit), priorisiert und an die passende Experten-Rolle gerouted. Eskalation bei Unsicherheit > 30%.
- **Antrags-Vollständigkeits-Check** (−65% Rückfrage-Zyklen): Eingehende Anträge werden auf Vollständigkeit geprüft. Bei Lücken wird automatisch nachgefragt — höflich, im Stil Ihrer Firma.
- **Dokumenten-Assistent** (Sekunden statt Minuten): Policen, AVB, Schadenmeldungen werden durchsuchbar. Der Experte fragt natürlich-sprachig nach Vertragsdetails, das System liefert die relevante Klausel mit Kontext.

**Compliance:**
FINMA-Rahmen berücksichtigt. DSG, revDSG, EU AI Act (für EU-Policen) kompatibel. Human-in-the-Loop bei allen Entscheidungen mit finanzieller Tragweite.

**Stack:**
- Claude Opus
- Next.js
- Postgres
- Resend
- PDF-Tools

---

### Legal & Compliance
**URL:** https://ai.tytos.ch/branchen/legal

Vertragsanalyse, Due-Diligence-Vorarbeit, Präzedenz-Research – vorbereitet, nicht entschieden, immer mit Kontrolle beim Anwalt.

Vertragsanalyse, Due-Diligence-Vorarbeit, Präzedenz-Research — AI übernimmt die zeit­raubende Vorbereitung. Die rechtliche Beurteilung bleibt beim Anwalt. Sauber getrennt, mit Audit-Trail.

**Kontext:**
Legal ist ein Paradebeispiel für AI-assistierte (nicht AI-entschiedene) Arbeit. Ein erfahrener Anwalt verbringt viel Zeit mit Lesen, Suchen, Vergleichen. Diese Vorarbeit kann AI zuverlässig beschleunigen — die rechtliche Entscheidung selbst darf (und soll) sie nicht übernehmen.

**Schmerzpunkte:**
- Due-Diligence-Lesezeit bei M&A-Transaktionen
- Präzedenz-Research bindet Associate-Stunden
- Vertragsklauseln werden manuell verglichen
- Dokumenten-Indexierung in Kanzlei-Archiven ist oft unvollständig
- Deadline-Tracking über mehrere Mandate hinweg

**Use-Cases:**
- **Vertragsanalyse-Assistent** (−70% Lesezeit bei Standard-Verträgen): Verträge werden strukturiert extrahiert (Parteien, Laufzeit, Kündigungsfristen, Haftungsklauseln). Abweichungen von Standard-Klauseln werden markiert. Immer mit Seiten-Referenz, nie ohne Quelle.
- **Präzedenz-Research** (Stunden → Minuten bei Erst-Recherche): Fragen in natürlicher Sprache, Antworten mit Fundstellen aus Schweizer Entscheidungen, BGE-Sammlungen, kantonaler Rechtsprechung. Keine Zusammenfassungen ohne Quellen.
- **Kanzlei-Wissensbasis** (95% Recall bei internen Präzedenzen): Alle Mandatsdokumente werden semantisch durchsuchbar. Der Anwalt findet eine ähnliche frühere Argumentation in Sekunden — nicht indem er Ordner durchsucht.

**Compliance:**
Anwaltsgeheimnis nach BGFA. Datenhaltung in der Schweiz, keine Modell-Trainings mit Mandats­daten. Zugriff streng rollenbasiert, Audit-Trail für Kanzlei-interne Revisionen.

**Stack:**
- Claude
- Postgres + pgvector
- Pandoc
- Cantonal-Gerichts-APIs

---

### Logistik & Supply Chain
**URL:** https://ai.tytos.ch/branchen/logistik

Auftragserfassung, Dispositions-Vorschläge, Lieferanten-Kommunikation, Zolldokumente – Prozesse, in denen Minuten und Cent zählen.

Auftragserfassung, Dispositions-Vorschläge, Lieferanten-Kommunikation, Zolldokumente. In der Logistik entscheiden Minuten und Cent. AI-Agenten beschleunigen die Prozesse und reduzieren die teuren Ausnahmen.

**Kontext:**
Logistik-Dienstleister arbeiten in einem Umfeld mit hohem Automations-Grad, aber vielen Brüchen zwischen Systemen. Lieferanten schicken PDFs, Spediteure mailen Avisierungen, Kunden haben individuelle Anforderungen. AI-Agenten schliessen diese Lücken.

**Schmerzpunkte:**
- Auftragserfassung aus Lieferanten-PDFs ist fehleranfällig
- Dispositions-Entscheidungen erfordern Kontext, den ERP-Systeme nicht abbilden
- Zolldokumente haben komplexe, länder­spezifische Regeln
- Avisierungen kommen per Mail und landen in Inboxen, nicht im System
- Ausnahmen (verspätete Lieferungen, beschädigte Ware) frisst die Marge

**Use-Cases:**
- **Auftragserfassung aus PDF** (0 Medienbrüche vom PDF zum ERP-Eintrag): Lieferanten-PDFs werden OCR-extrahiert, strukturiert und ins ERP gebucht. Abweichungen von Standards (Preis, Menge, Zeitraum) werden markiert.
- **Ausnahme-Handler** (−80% Bearbeitungszeit Ausnahmen): Verspätungen, Schäden und Retouren werden automatisch kategorisiert, Eskalations-Schwelle definiert, Standard-Kommunikation an Kunden vorbereitet.
- **Zolldokumenten-Assistent** (15 min → 2 min pro Zollanmeldung): Zolltarifnummern, Ursprungsnachweise, sperrige Guter-Formulare werden vorausgefüllt. Der Zoll-Experte prüft nur, statt zu tippen.

**Compliance:**
Zollgesetz und Incoterms berücksichtigt. Für grenzüberschreitende Lieferungen EU AI Act-Rahmen beachtet. Schweizer Hosting bei regulatorisch sensitiven Kundendaten.

**Stack:**
- GPT / Claude
- Python / FastAPI
- Postgres
- SAP-Adapter
- ERP-APIs

---

## Case-Studies

### Case-Study: AI-gestützte Immobilienverwaltung — von 90 Std. auf 22 Std./Woche Admin-Aufwand
**URL:** https://ai.tytos.ch/branchen/immobilien/case
**Branche:** Immobilienverwaltung

> Wie eine Schweizer Immobilienverwaltung mit 480 Verwaltungseinheiten 70% Admin-Routine automatisiert hat, ohne Compliance-Risiken einzugehen.

**Mandat:**
- Mittelständische Immobilienverwaltung in der Zentralschweiz. Familienunternehmen in dritter Generation, klassischer Mix aus Stockwerkeigentum, Mietwohnungen und Geschäftsliegenschaften.
- 12 Mitarbeitende, 480 Verwaltungseinheiten
- Region: Zentralschweiz (Kantone LU, ZG, SZ)

**Setup:**
- Timeline: 10 Wochen Aufbau, 6 Monate begleitende Optimierung
- Team: 2 TYTOS (Tim + Lead-Engineer), 1 interner IT-Partner, 3 Schlüssel-MA als Sparring-Partner
- Budget: Initialphase: ~CHF 78'000 | laufende Modell- und Wartungskosten: ~CHF 1'400/Monat

**Herausforderung:**
Das Unternehmen war administrativ überlastet. Pro Woche flossen rund 90 Stunden in repetitive Routinearbeit: Exposé-Erstellung für Neuvermietungen (8–14 pro Monat), Beantwortung von Mietanfragen (180–250 pro Monat), Nebenkostenabrechnung-Vorbereitung, Mängelmeldungs-Triage, Übergabeprotokolle. Drei junge Sachbearbeiterinnen waren mit Routine-Mails gebunden, während der Geschäftsführer und die zwei erfahrenen Verwalterinnen keine Zeit für strategische Mandantenbetreuung hatten. Gleichzeitig: hohe Reputationsansprüche, traditionelle Mandantenschaft mit Anspruch auf persönliche Behandlung, Aufsichtspflichten nach OR-Mietrecht und revDSG.

**Vorgehen — Phasen:**
- **Phase 1: Audit und Priorisierung (Woche 1–2)**: Wir haben alle wiederkehrenden Prozesse aufgenommen, Volumina gemessen, IT-Landschaft kartiert (Immopac für die Verwaltung, ImmoTop für Liegenschaftskonten, Outlook 365 für Kommunikation). Drei Use-Cases haben wir priorisiert: Exposé-Generierung (hoher Hebel, niedrige Komplexität), Mietanfragen-Triage (extremer Volumen, schnelle Spürbarkeit), Nebenkosten-Vorbereitung (rechnerisch komplex, jährlicher Effekt).
- **Phase 2: Pilot Exposé-Generator (Woche 3–5)**: Ein Claude-Opus-4.7-basierter Generator, der aus Objektstammdaten, Fotos und Adressen ein vollständiges Exposé in 90 Sekunden erstellt. Die Tonalität wurde mit den Verwalterinnen kalibriert (drei Iterationen). PDF-Renderer in Next.js, Anbindung an Mapbox für Lage-Kontext, automatische SEO-Optimierung für Homegate/ImmoScout-Listings. Erste produktive Exposés in Woche 4, ab Woche 5 Standard-Workflow.
- **Phase 3: Mietanfragen-Triage (Woche 6–8)**: Ein zweistufiges System: Apertus-8B als billiger Klassifikator (echte Interessenten / Spam / Recherche), dann Claude-Sonnet für die personalisierte Antwort mit Rückfragen (Budget, Einzugsdatum, Bedarfsprofil). CRM-Integration via Webhook in das bestehende Immopac. Eskalation bei diskriminierungsrelevanten Phrasen, juristischen Anfragen, Beschwerden. Mitarbeitenden-Schulung Woche 7 (2 × 90 Minuten).
- **Phase 4: Nebenkosten-Assistent (Woche 9–10)**: Verbrauchsdaten-Sammlung aus drei Heizungsanlagen-Systemen via API, Verteilungsschlüssel-Anwendung pro Liegenschaft, Plausibilitäts-Check gegen Vorjahr (Abweichung > 12% wird markiert), Mieter-spezifische PDF-Generation mit Begründung pro Position. Verwaltungs-Freigabe vor Versand obligatorisch (HITL).
- **Phase 5: Konsolidierung und Erweiterung (Monat 3–9)**: Mängelmeldungs-Routing als drittes Modul (Monat 4), Übergabeprotokoll-Foto-Assistent (Monat 6), Vertrags-Parser für Übernahme-Bestände (Monat 8). Monatliche 90-Minuten-Reviews mit dem Geschäftsführer für Kalibrierung und Cost-Tracking.

**Stack:**
- Modelle: Claude Opus 4.7 (Exposé, Verträge); Claude Sonnet 4.7 (Standard-Korrespondenz); Apertus 8B via Swisscom (Triage-Klassifikator, DSG-strict); GPT-5 Vision (Übergabeprotokoll-Fotos)
- Backend: Next.js 16; Node.js Workers; Postgres; Resend (Mail); Mapbox API
- Integrationen: Immopac REST-API; ImmoTop Buchungs-API; Outlook 365 Graph API
- Compliance & Observability: Audit-Log Postgres-Tabelle; Sentry Error-Tracking; Vercel Speed Insights

**Metriken (Vorher → Nachher):**
- Admin-Stunden pro Woche: 90 Std. → 22 Std. (−76%)
- Exposé-Erstellung pro Objekt: 35 Min. → 4 Min. (−89%)
- Mietanfragen-Reaktionszeit: 8–24 Std. → <3 Min. (Autoantwort) (−98%)
- Nebenkosten-Plausibilität-Auffälligkeiten erkannt: 1–2 pro Jahr (manuell) → 27 pro Jahr (+1250%)
- Anrufe & Mails pro Woche an Verwalter:innen: 180–250 → 60–85 (Rest geht direkt automatisch) (−65%)

**Lessons Learned:**
- Persona-Tonalität ist wichtiger als Modell-Qualität. Die ersten Exposé-Drafts waren technisch perfekt, aber zu unpersönlich für die traditionelle Klientel. Drei Iterationen mit den Verwalterinnen — nicht mit dem Modell-Anbieter — brachten den Durchbruch.
- Diskriminierungsrisiko bei Mietanfragen-Triage ist real. Wir haben einen separaten Filter eingebaut, der bei impliziter Filterung über Korrelations-Variablen (Postleitzahl, Wohnform) Alarm schlägt — verhindert versehentliche Diskriminierungs-Pattern.
- Apertus für Strict-Triage ist 25–30% billiger als Claude Sonnet für die gleiche Klassifikation und löst die Schweizer-Hosting-Frage strukturell. Der Qualitäts-Unterschied ist bei klar abgegrenzten Klassifikations-Aufgaben unter 3% — pragmatisch akzeptabel.
- Mitarbeitende werden zu Power-Usern, wenn der Cut spürbar ist. Nach Woche 6 haben die Sachbearbeiterinnen selbst Erweiterungs-Vorschläge gemacht — das war der wichtigste Punkt für das Roll-out auf weitere Module.
- Übergabeprotokoll-Fotos brauchen sehr saubere Metadaten-Behandlung. EXIF-Daten, Zeitstempel und Foto-Hashes mitspeichern, sonst sind sie bei späteren Disputs juristisch schwach.

**Compliance:**
OR-Mietrecht (kantonale Spezifika berücksichtigt), revDSG-vollkonform mit DPA für alle Modell-Anbieter, Apertus-Strict-Routing für sensitive Strecken (Mietzins-Themen, Bonität), Audit-Trail über 24 Monate. DSFA war nicht erforderlich, weil keine automatisierten Einzelentscheidungen mit Rechtswirkung; interne Risiko-Notiz erstellt. EU AI Act-Klassifikation: Limited Risk (Chatbot-ähnliche Mietanfrage-Triage mit klarer KI-Kennzeichnung).

---

### Case-Study: Treuhand-KMU mit 60% Belegerfassungs-Reduktion und 0 Compliance-Findings
**URL:** https://ai.tytos.ch/branchen/treuhand/case
**Branche:** Treuhand

> Wie eine Zürcher Treuhandfirma mit 18 MA und 180 Mandanten ihre Belegerfassung in 12 Wochen auf ein neues Niveau gebracht hat.

**Mandat:**
- Etablierte Schweizer Treuhandfirma in Zürich, drei Generationen alt, Schwerpunkt KMU-Mandate aus dem produzierenden Gewerbe, IT-Branche und Gastronomie. Hoher Mandatsschutz-Anspruch.
- 18 Mitarbeitende, 180 Mandanten, ~ 24'000 Belege/Monat im Mandanten-Stamm
- Region: Stadt Zürich + Umland

**Setup:**
- Timeline: 12 Wochen Aufbau + 8 Monate begleitende Optimierung
- Team: 2 TYTOS (Tim + ML-Engineer), 1 interner Treuhand-Sachbearbeiter als Domain-Sparring, GL als Sponsor
- Budget: Initialphase: ~CHF 95'000 | laufende Modell- und Wartungskosten: ~CHF 2'200/Monat

**Herausforderung:**
Die Belegerfassung war zum Engpass geworden. Sechs Sachbearbeiterinnen waren primär mit Belegen aus Bexio, Abacus und manuellen Einreichungen beschäftigt. Pro Beleg 7–9 Minuten von Eingang bis Buchung. Bei 24'000 Belegen/Monat = rund 3'200 Stunden Belegerfassungs-Aufwand. Die Geschäftsleitung wollte Treuhänder-Brevet-Beratung statt Datenerfassung, sah aber kein praktikables AI-Setup, das mandatsschutz-konform und auditierbar wäre. Schweizer Hosting war Pflicht für mehrere Mandate (FINMA-regulierte Kunden, Anwaltskanzlei-Mandant). Wechsel zwischen Bexio (cloud) und Abacus (on-premise bei Kunden) erschwerte die Architektur.

**Vorgehen — Phasen:**
- **Phase 1: Compliance-Architektur (Woche 1–3)**: Vor jedem Modell-Setup haben wir die Architektur entworfen: Apertus 70B via Swisscom für alle Beleg-Inhalte (CH-Strict), eigenes DPA mit Swisscom, klare Daten-Trennung pro Mandant, Audit-Log mit 10-Jahres-Retention für FINMA-Mandanten. Bexio-Mandate via API, Abacus-Mandate via Sicherer-Datentransfer. Keine Beleg-Inhalte verlassen Schweizer Boden.
- **Phase 2: OCR + Extraktion (Woche 4–6)**: Die Pipeline: Beleg trifft als E-Mail-Attachment, Web-Upload oder Bexio-Auto-Import ein. Vision-Modell (Apertus mit Vision-Extension via Swisscom, Mistral Document AI als Backup) extrahiert: Lieferant, Belegnummer, Datum, Netto-/Brutto-/MwSt-Betrag, Zahlungsmittel, MwSt-Satz, Belegkategorie. Strukturierter Output als JSON gegen Mandanten-Stamm validiert. Bei Konflikten: Eskalation, keine automatische Buchung.
- **Phase 3: Kontierungs-Vorschlag (Woche 7–8)**: Pro Mandant lernt das System aus den letzten 24 Monaten Buchungen (Lieferant + Konto + Kostenstelle). Bei neuen Belegen schlägt es Konto + Kostenstelle vor, mit Confidence-Score. Bei > 0.92: Vorschlag wird automatisch in die Vorbuchungs-Queue gestellt. Bei < 0.92: explizite menschliche Prüfung erforderlich. Sachbearbeiterinnen sehen Vorschlag, korrigieren ggf. mit einem Klick, geben frei.
- **Phase 4: Doppelbuchungs- und MwSt-Plausibilität (Woche 9–10)**: Anomalie-Erkennung: identische Beträge gleichen Lieferanten innerhalb 14 Tagen, MwSt-Sätze die historisch nicht passen (z.B. 8.1% bei einem Lieferanten, der durchgehend 2.6% verbucht hat), Beträge die deutlich über dem Mandanten-Durchschnitt liegen. Markierungen werden vor Freigabe geprüft.
- **Phase 5: Mandanten-Mail-Automation (Woche 11–12)**: Standard-Anfragen (Lohnausweis-Anforderung, Kontostand, MwSt-Zyklus) werden direkt beantwortet, mit Verweis auf das Mandanten-Portal. Komplexere Anfragen werden klassifiziert und an den zuständigen Treuhänder geroutet. Bei steuer-rechtlich heiklen Fragen: keine Antwort, sondern Hochrouten zur sofortigen menschlichen Bearbeitung.
- **Phase 6: Konsolidierung und Erweiterung (Monat 4–12)**: Lohnbuchhaltungs-Assistenz für die monatlichen Zyklen (Monat 5), Compliance-Monitor für Steuer-/MwSt-Updates (Monat 7), Lohnausweis-Form-11-Generator für Jahresend-Zyklus (Monat 10). Quartalsweise Review der Confidence-Thresholds und Eskalations-Quoten.

**Stack:**
- Modelle: Apertus 70B via Swisscom (Beleg-Extraktion, Kontierung — DSG-Strict); Apertus 8B (Triage-Klassifikator); Mistral Document AI (Backup-OCR); Claude Opus 4.7 (Compliance-Monitor, Mandanten-Korrespondenz)
- Backend: Next.js 16 Admin; Node.js Workers; Postgres (CH-Hosting: Infomaniak); BullMQ Queue
- Integrationen: Bexio REST-API; Abacus Datentransfer-Bridge; Outlook 365 Graph API; ESTV-Scraping
- Compliance & Observability: Audit-Log mit 10-Jahres-Retention (FINMA-Mandate); Sentry mit CH-Hosting; Datenschutz-Folgenabschätzung dokumentiert (DSFA); Quartalsweise Modell-Validierungs-Report

**Metriken (Vorher → Nachher):**
- Bearbeitungszeit pro Beleg: 7–9 Min. → 45 Sek. (Prüf-/Freigabe-Schritt) (−90%)
- FTE-Äquivalent für Belegerfassung: 5.2 FTE → 2.0 FTE (−62%)
- Doppelbuchungen pro Quartal aufgedeckt: 3–7 (manuell, retroaktiv) → 23 (im Pre-Check) (+260%)
- Compliance-Findings im Jahresabschluss-Audit: 8–12 (Vorjahr) → 0 (−100%)
- Mandanten-Mails mit Reaktion < 4h: 32% → 94% (+193%)

**Lessons Learned:**
- Schweizer Hosting (Apertus via Swisscom) war von Anfang an die richtige Wahl — auch wenn es initial mehr Aufwand bedeutete. Die Mandanten-Reaktionen waren extrem positiv, viele haben aktiv nachgefragt, ob ihre Daten in der Schweiz bleiben.
- Confidence-Threshold bei 0.92 war anfangs zu strikt — wir bekamen 35% Eskalationen, was die Sachbearbeiterinnen frustrierte. Nach Kalibrierung auf 0.85 (mit zusätzlichen Plausibilitäts-Checks) sank die Quote auf 12%, ohne dass die Fehler-Quote stieg.
- Bexio und Abacus parallel zu integrieren war doppelt so aufwändig wie veranschlagt. Lesson: bei Multi-System-Mandanten kalkulieren wir heute 1.5× den initialen Schätzwert.
- Lohnbuchhaltungs-Module brauchen jährliches Update, weil sich AHV-Sätze, Quellensteuer-Tabellen und Familienzulagen ändern. Wir haben das in die laufenden Wartungs-Costs eingebaut.
- Mandanten-Mail-Automation hat unerwartet positive Mandanten-Feedbacks gebracht — schnelle Reaktion auf Standard-Anfragen wird als 'professioneller' wahrgenommen, nicht als 'unpersönlich'.

**Compliance:**
Voll revDSG-konform, 100% Schweizer Hosting für Beleg-Inhalte, DPA mit Swisscom und allen Backup-Anbietern, DSFA durchgeführt und dokumentiert. FINMA-Compliance für vier regulierte Mandanten: Modell-Validierungs-Report quartalsweise, Modell-Risk-Management dokumentiert nach FINMA-RS 18/3. EU AI Act-Klassifikation: Limited Risk (Belegerfassung ist nicht Hochrisiko, keine automatisierten Einzelentscheidungen mit Rechtswirkung). 10-Jahres-Audit-Retention.

---

### Case-Study: Versicherungsbroker mit 4-Tagen-zu-4-Stunden Triage-Zyklus
**URL:** https://ai.tytos.ch/branchen/versicherung/case
**Branche:** Versicherung

> Wie ein Brokerhaus mit 32 MA Schadensmeldungen, Antrags-Checks und AVB-Suche in fünf Monaten produktionsreif gemacht hat.

**Mandat:**
- Unabhängiges Versicherungsbroker-Haus mit Hauptsitz Bern und zwei Niederlassungen. Fokus auf KMU-Geschäftsversicherungen, Kollektiv-Krankenversicherung, Berufshaftpflicht. Etabliert seit 1987.
- 32 Mitarbeitende, ~ 2'400 KMU-Mandanten, ~ 850 Schadensmeldungen/Jahr
- Region: Bern, Solothurn, Freiburg

**Setup:**
- Timeline: 16 Wochen Aufbau + 6 Monate begleitende Optimierung
- Team: 2 TYTOS (Tim + Backend-Engineer), 1 interner Compliance-Officer, 2 Schadensbearbeitende als Sparring
- Budget: Initialphase: ~CHF 140'000 | laufende Modell- und Wartungskosten: ~CHF 3'400/Monat

**Herausforderung:**
Die Triage von Schadensmeldungen war der Engpass: vom Eingang einer Mail mit Fotos und PDF-Anhängen bis zur ersten Bearbeitung durch einen Sachbearbeiter vergingen typisch 3–5 Werktage. Bei 850 Schäden/Jahr summierte sich das zu erheblicher Wartezeit für Mandanten und einem Reputations-Risiko. Gleichzeitig: AVB- und Policen-Suche bei spezifischen Fragen kostete pro Anfrage 8–20 Minuten — und 4–6 Sachbearbeiter waren parallel mit dem Thema beschäftigt. Compliance-Rahmen: revDSG, FINMA-Outsourcing-Richtlinien (FINMA-RS 18/3), interne Audit-Pflichten der Versicherungspartner. Spezielle Herausforderung: Personenschäden und Datenschäden mit besonders schützenswerten Gesundheitsdaten müssen separat behandelt werden.

**Vorgehen — Phasen:**
- **Phase 1: Compliance-Setup und Risiko-Modell (Woche 1–4)**: Aufbau des Compliance-Rahmens: revDSG-Architektur, FINMA-Outsourcing-Dokumentation, DSFA für die geplante Verarbeitung, Datenschutz-Erklärung des Brokerhauses aktualisiert. Risiko-Klassifikation: welche Schadens-Typen darf AI triagieren, welche müssen sofort menschlich? Personenschäden, Berufshaftpflicht mit Strafrechts-Bezug, Schäden > CHF 50'000 sind direkt menschlich. Sach- und Hausratschäden bis CHF 50'000 dürfen AI-triagiert werden.
- **Phase 2: Schadensmeldungs-Triage (Woche 5–8)**: Multimodale Pipeline: eingehende Mails werden parsen (Anhänge, Bilder, Texte), Multimodal-Modell (GPT-5 mit Schweizer DPF-Vertrag) klassifiziert Schaden-Art, schätzt Schwere, prüft Vollständigkeit der Unterlagen. Strukturierter Output an Sachbearbeiter-Cockpit. Bei Personenschaden oder Sensitiv-Daten: Eskalation, kein AI-Vorschlag. Bei klar abgegrenzten Sach-Schäden: vollständig vorbereitete Meldung mit Verfahrens-Vorschlag.
- **Phase 3: AVB- und Policen-Assistent (Woche 9–12)**: Vector-Store-Aufbau mit allen AVB-Versionen der Versicherungs-Partner (47 verschiedene Versicherer × 12–18 Versions-Generationen), Policen-Volltexte, Branchen-Spezifika. RAG-Pipeline mit Claude Opus 4.7 für Reasoning. Sachbearbeiter fragt 'Ist Glasbruch in Police XYZ gedeckt?', Antwort kommt mit Klausel-Referenz und Seitenzahl. Keine Antwort ohne Quelle.
- **Phase 4: Antrags-Vollständigkeits-Check (Woche 13–14)**: Neue Anträge und Vertrags-Änderungen werden gegen Vorlage geprüft. Bei fehlenden Angaben: höfliche Rückfrage im Brokerhaus-Ton, generiert mit Claude. Reminder-Zyklus für Rückläufe. Sachbearbeiter sieht nur vollständige Anträge.
- **Phase 5: Beratungs-Vorbereitung (Woche 15–16)**: Pre-Meeting-Briefing für KMU-Beratungen: alle bestehenden Verträge, identifizierte Lücken (basierend auf Branchen-Benchmark), Vorschläge zu Tarif-Optionen. Wichtig: AI bereitet vor, der Broker entscheidet, was empfohlen wird. Kein automatischer Sale, keine Provisions-Optimierung im Prompt.
- **Phase 6: Konsolidierung und Compliance-Audit (Monat 5–10)**: Quartalsweise Modell-Validierungs-Reviews. Externes Compliance-Audit nach Monat 4 mit positivem Ergebnis. Erweiterung: Forderungs-Klassifikation für Schadens-Belege (Monat 7), automatische Ablauf-Erinnerungen mit Mandanten-Persönlich-Touch (Monat 9).

**Stack:**
- Modelle: GPT-5 (Multimodal Schadens-Triage, DPF-konform); Claude Opus 4.7 (AVB-Reasoning, komplexe Anträge); Apertus 8B (PII-Klassifikator vor Eskalation); Anthropic Sonnet 4.7 (Standard-Korrespondenz)
- Backend: Next.js 16; Python Workers (Vector-Search); Postgres + pgvector; Resend (Mail)
- Integrationen: BrokerSuite XYZ (CRM); Outlook 365 Graph API; Versicherer-Portale (für AVB-Updates); ZEFIX (Mandanten-Stammdaten-Verifikation)
- Compliance & Observability: Audit-Log mit Versicherer-spezifischer Retention; FINMA-Outsourcing-Dokumentation; DSFA aktuell gehalten; Modell-Validierungs-Pipeline quartalsweise

**Metriken (Vorher → Nachher):**
- Schadens-Triage-Zeit: 3–5 Werktage → <4 Stunden (Standard-Schäden) (−92%)
- Sachbearbeiter-Stunden für Triage/Woche: 62 Std. → 19 Std. (−69%)
- AVB-Suche pro Anfrage: 8–20 Min. → 30 Sek. (mit Klausel-Referenz) (−95%)
- Antrags-Rückfrage-Zyklen: 2.4 (Durchschnitt) → 1.1 (−54%)
- Compliance-Findings im externen Audit: 5 (Vorperiode) → 0 (−100%)

**Lessons Learned:**
- Compliance-Setup zuerst, AI-Funktion zweitens. Bei Versicherungs-KMU sind FINMA und revDSG nicht 'Hindernisse', sondern das Gerüst, das den AI-Einsatz überhaupt erst trägt. Wir haben 4 Wochen für Compliance-Architektur investiert — und sparen seitdem unzählige Audit-Korrekturen.
- Personenschäden niemals AI-triagieren. Das ist eine Linie, die wir explizit gezogen haben — sowohl rechtlich (besonders schützenswerte Gesundheitsdaten) als auch operativ (emotionaler Erstkontakt verlangt menschliche Sensibilität).
- AVB-Vector-Store ist der grösste Hebel. Die Versicherungs-Mitarbeitenden waren wirklich überrascht, wie schnell sie Antworten finden — eine Erfahrung, die das Vertrauen in die ganze AI-Initiative gestärkt hat.
- Modell-Validierung quartalsweise klingt aufwändig, ist es aber nicht. Mit standardisierten Test-Sets (50–100 echte Fälle pro Use-Case) dauert es 1–2 Tage und ist auditierbar dokumentiert.
- Provisions-Optimierung im Prompt explizit verbieten. Wir haben das früh diskutiert: die AI darf nicht 'verkaufen', sie darf nur 'beraten'. Das ist ein bewusster Markt-Verzicht, der die Mandanten-Beziehung schützt.

**Compliance:**
Voll revDSG-konform mit DPF-Vertrag für US-LLM-Anbieter, FINMA-Outsourcing-Dokumentation aktuell gehalten, DSFA durchgeführt für Multimodal-Pipeline mit Foto-Verarbeitung. Personenschäden niemals AI-triagiert. Audit-Trail mit branchen-spezifischer Retention (Sach: 5 Jahre, Personen: 10 Jahre). EU AI Act-Klassifikation: Limited Risk für Standard-Triage, Hochrisiko-Klassifikation bei Antrags-Bewertungen wurde geprüft und negativ entschieden (keine Tarif-Entscheidungen durch AI). Externes Compliance-Audit nach 4 Monaten bestanden.

---

### Case-Study: Anwaltskanzlei mit 78% schnellerer Vertrags-Analyse, vollem BGFA-Konform
**URL:** https://ai.tytos.ch/branchen/legal/case
**Branche:** Legal

> Wie eine mittelständische Schweizer Kanzlei mit 14 Anwälten ihre Due-Diligence-Vorarbeit und Präzedenz-Research auf ein neues Niveau gehoben hat — mit Mandatsgeheimnis als Architektur-Prinzip.

**Mandat:**
- Mittelständische Schweizer Anwaltskanzlei mit Sitz Basel, Spezialisierung Wirtschaftsrecht, M&A, Arbeitsrecht und Vertragsgestaltung. Klassische Partner-Struktur.
- 14 Anwälte, 22 Mitarbeitende gesamt, ~ 320 aktive Mandate
- Region: Basel + DACH-Mandate

**Setup:**
- Timeline: 20 Wochen Aufbau + laufende Begleitung
- Team: 2 TYTOS (Tim + Senior-Engineer), 1 IT-Verantwortlicher der Kanzlei, 2 Partner als Sparring
- Budget: Initialphase: ~CHF 175'000 | laufende Modell- und Wartungskosten: ~CHF 3'800/Monat

**Herausforderung:**
Due-Diligence bei M&A-Transaktionen war zeit-kritischer Engpass. Associate-Stunden für Vertrags-Strukturierung, Klausel-Extraktion, Vergleich mit Standard-Verträgen frassen die Marge. Präzedenz-Research für Spezialfragen kostete 4–12 Stunden pro Anfrage. Anwaltsgeheimnis nach BGFA und höchste Mandanten-Datensensitivität verlangten ein Compliance-Setup, das nahezu alle US-Cloud-AI-Anbieter ausschloss. Drei Anforderungen: (1) Daten verlassen nicht die Schweiz, (2) Modell wird nicht mit Mandanten-Daten trainiert, (3) Audit-Trail für 10+ Jahre. Standard-OpenAI-/Anthropic-Setups waren nicht akzeptabel.

**Vorgehen — Phasen:**
- **Phase 1: BGFA-konforme Architektur (Woche 1–5)**: Die Kanzlei wollte zunächst on-premise Hosting. Nach Analyse haben wir uns für eine Hybrid-Architektur entschieden: Apertus 70B via Swisscom-Schweiz-Cloud (BGFA-konform laut Swisscom-DPA) für die meisten Anwendungen, dazu eine kleine on-premise-Apertus-8B-Instanz für besonders sensitive Mandate (Strafverteidigung, M&A im Stealth-Modus). Datenklassifikations-Konzept: jedes Mandat wird mit Sensitivitäts-Stufe (1–3) markiert, was die AI-Pfad-Wahl steuert.
- **Phase 2: Vertrags-Strukturierungs-Modul (Woche 6–10)**: Hochlade-Interface für Verträge (PDF, DOCX). Apertus-70B extrahiert strukturiert: Parteien, Vertragsart, Geltungs-Umfang, Laufzeit, Kündigungsfristen, wesentliche Pflichten, Haftungsklauseln, Sonderbestimmungen. Output als JSON + Anwalts-freundliche Ansicht mit Klausel-Referenz. Wichtig: keine rechtlichen Bewertungen durch AI, nur Strukturierung. Vergleich mit Standard-Klausel-Bibliothek der Kanzlei (Custom-Suche per Embedding).
- **Phase 3: Präzedenz-Research (Woche 11–14)**: Vector-Store mit Schweizer Gerichts-Entscheidungen (BGE öffentlich, kantonale Sammlungen gemäss Lizenz), Kommentaren, kanzlei-internen Memos. Anfragen in natürlicher Sprache, Antworten ausschliesslich mit Fundstellen-Referenz. Keine 'Zusammenfassungen ohne Quellen' — das ist eine harte Regel im System-Prompt. Bei Spezial-Themen (Steuerrecht, Sozialversicherung) Eskalation an Fach-Anwalt.
- **Phase 4: Kanzlei-Wissensbasis (Woche 15–18)**: Alle Mandats-Dokumente werden semantisch durchsuchbar (mit strikten Berechtigungs-Kontrollen: ein Associate sieht nur seine zugewiesenen Mandate). Anwälte fragen 'Hatten wir früher schon eine ähnliche Argumentation gegen Klausel X?', das System liefert relevante Memos und Schriftsätze. Diese Funktion war das überraschendste Highlight für die Partner — sie ermöglichte, das Kanzlei-Wissen jüngerer Anwälte zugänglich zu machen.
- **Phase 5: Deadline-Tracking-Assistent (Woche 19–20)**: Pro Mandat werden Verträge, Fristen, Termine erfasst. Reminder-System mit Eskalations-Pfaden: Anwalt → Sekretariat → Partner bei kritischen Fristen. AI extrahiert Fristen automatisch aus Vertrags-Texten, schlägt vor; Anwalt bestätigt. Keine automatische Kalender-Einträge ohne Bestätigung.
- **Phase 6: Konsolidierung und Erweiterung (Monat 6–12)**: M&A-Daten-Raum-Assistent für DD-Phasen (Monat 7), Vertrags-Template-Generator basierend auf Kanzlei-Stamm (Monat 9), Mandanten-Mail-Vorlagen für Standard-Korrespondenz (Monat 11). Quartalsweise Compliance-Reviews, jährliches BGFA-Audit mit externem Datenschutz-Anwalt.

**Stack:**
- Modelle: Apertus 70B via Swisscom (BGFA-konformer Cloud-Pfad); Apertus 8B on-premise (Höchst-Sensitiv-Mandate); Claude Opus 4.7 für nicht-mandantenbezogene Recherche (z.B. öffentliche Rechtsprechung)
- Backend: Next.js 16; Python für DocAI; Postgres + pgvector (CH-Hosting: Exoscale); S3-kompatible CH-Storage
- Integrationen: Kanzlei-Software (Advokatura.swiss); Outlook 365 Graph API (mit BGFA-Erweiterungen); Kantonal-Gerichts-APIs
- Compliance & Observability: Audit-Log 12-Jahres-Retention; Per-Mandat-Berechtigungs-System; Externes Datenschutz-Audit jährlich; On-Premise-Failover-Architektur

**Metriken (Vorher → Nachher):**
- Vertrags-Analyse-Zeit (Standard-Vertrag, 30–60 Seiten): 2.5–4 Std. → 30–55 Min. (−78%)
- Präzedenz-Research pro Anfrage: 4–12 Std. → 1–3 Std. (−72%)
- Recall bei Kanzlei-internen Präzedenzen: ~ 40% (Erfahrungs-Schätzung) → 94% (+135%)
- Associate-Stunden für DD-Vorarbeit pro M&A-Mandat: 80–140 Std. → 25–45 Std. (−65%)
- Fristen-Versäumnisse: 0.4% (historisch) → 0% (−100%)

**Lessons Learned:**
- BGFA-konforme Architektur ist möglich, aber teurer als Standard. Wir mussten Apertus via Swisscom und eine on-premise-Komponente einrichten — initial 25% Mehraufwand gegenüber einem Standard-OpenAI-Setup. Der Mehraufwand hat sich aber im jährlichen Datenschutz-Audit ausgezahlt.
- Anwälte vertrauen Vector-Search mit Fundstellen-Referenz mehr als generative Antworten. Wir haben früh entschieden: keine Antwort ohne Quelle. Das hat die Akzeptanz dramatisch erhöht.
- Kanzlei-Wissensbasis war das überraschendste Feature. Junge Anwälte profitieren am meisten — sie können auf 15 Jahre kanzlei-internes Know-how zugreifen, ohne 30 Minuten Ordner zu wälzen.
- Datenklassifikations-Konzept ist Pflicht. Nicht jedes Mandat braucht den gleichen Compliance-Level. Mit klarer 1-2-3-Klassifizierung können wir die teurere on-premise-Schicht selektiv einsetzen — das hält die Architektur wirtschaftlich.
- Externes jährliches Datenschutz-Audit ist Geld wert. Wir empfehlen es heute jeder Kanzlei, die AI einsetzt. Eine Vier-Augen-Prüfung schafft das Vertrauen, das Mandate verlangen.

**Compliance:**
Voll BGFA-konform mit Apertus-via-Swisscom-Pfad (Swisscom DPA mit BGFA-Erweiterung), on-premise-Failover für Höchst-Sensitiv-Mandate. Daten verlassen nie die Schweiz, kein Modell-Training mit Mandanten-Daten (vertraglich ausgeschlossen, technisch verifiziert), Audit-Trail mit 12-Jahres-Retention. revDSG-vollkonform mit detaillierter DSFA. EU AI Act-Klassifikation: kein Hochrisiko-System (rein assistive AI für juristische Vorbereitung, keine automatisierten Entscheidungen). Jährliches externes Datenschutz-Audit bestanden.

---

### Case-Study: Logistik-KMU mit 0 Medienbrüchen und 80% schnellerer Ausnahme-Bearbeitung
**URL:** https://ai.tytos.ch/branchen/logistik/case
**Branche:** Logistik

> Wie ein Schweizer Logistik-Dienstleister mit 45 MA Auftragserfassung, Ausnahme-Handling und Zolldokumenten in 14 Wochen produktionsreif gemacht hat.

**Mandat:**
- Schweizer Logistik-Dienstleister mit Sitz Sankt Gallen, Tätigkeit europäische Transporte (Strasse, Bahn, Sammelgut), 28 eigene Lieferwagen, Partnernetzwerk in DACH.
- 45 Mitarbeitende, ~ 4'200 Aufträge/Monat, 12 Lieferanten-PDF-Formate
- Region: Sankt Gallen, Europa-Transporte

**Setup:**
- Timeline: 14 Wochen Aufbau + 8 Monate begleitende Optimierung
- Team: 2 TYTOS (Tim + Backend-Engineer), 1 interner SAP-Experte, 1 Zoll-Spezialist als Sparring
- Budget: Initialphase: ~CHF 115'000 | laufende Modell- und Wartungskosten: ~CHF 2'600/Monat

**Herausforderung:**
Die Auftragserfassung aus Lieferanten-PDFs war fehleranfällig. 12 verschiedene PDF-Formate, oft unterschiedliche Layouts pro Quartal, manuelle Übertragung ins SAP führte zu 4–7% Fehlerquote. Ausnahme-Handling (verspätete Lieferungen, Schäden, Retouren) frass viel Marge — pro Ausnahme 30–90 Minuten manuelle Bearbeitung. Zolldokumente für Drittlands-Transporte (UK, Türkei, Westbalkan) waren zeit-kritisch: ein falsches Feld konnte den Transport für Tage stoppen. Compliance: EU-Zollrecht, Schweizer Zollverfahren, GDPR für innereuropäische Lieferungen, Incoterms-konforme Dokumentation.

**Vorgehen — Phasen:**
- **Phase 1: Format-Inventory und Architektur (Woche 1–3)**: Aufnahme aller 12 PDF-Formate (Lieferanten + Spediteure), Datenfeld-Mapping pro Format, Identifikation problematischer Felder (mehrdeutige Datums-Formate, Preis-Variationen). Architektur-Skizze: PDF-Eingang → OCR + LLM-Extraktion → Validation → SAP-Import via REST-API. Fallback-Pfade für nicht-erkennbare PDFs (Eskalation an Disponenten).
- **Phase 2: PDF-Auftragserfassung (Woche 4–7)**: Multimodale Pipeline mit GPT-5 für PDF-Verstehen (besser als reine OCR), Output als strukturierter JSON gegen Datenmodell validiert. Plausibilitäts-Checks: Preise innerhalb historischer Range pro Lieferant, Gewichts-Volumen-Plausibilität, Adress-Geocoding-Match. Bei Abweichungen Eskalation. Confidence-Schwelle 0.90 für Auto-Buchung, < 0.90 menschliche Prüfung.
- **Phase 3: Ausnahme-Handler (Woche 8–10)**: Klassifikation eingehender Ausnahme-Mails: Verspätung, Schaden, Retouren, Beschwerde. Pro Kategorie: Standard-Antwort-Template (in Stil der Firma), Eskalations-Logik, Kunden-Kommunikations-Vorschlag, Ticket-Erstellung im internen System. Bei Personenschäden oder grossen Werten (> CHF 25'000) automatische Eskalation an Disposition-Leitung.
- **Phase 4: Zolldokumenten-Assistent (Woche 11–13)**: Komplexester Teil: pro Drittlands-Transport spezifische Anforderungen (UK seit Brexit deutlich verschärft, Türkei mit eigenen Listen, Westbalkan mit Doppel-Pflichten). System schlägt Zolltarifnummern vor (basierend auf Lieferanten-Beschreibung + historischen Klassifikationen), füllt Standard-Formulare aus, prüft Ursprungs-Nachweise auf Vollständigkeit. Zoll-Experte prüft, gibt frei. Kein Auto-Submit ohne menschliche Bestätigung.
- **Phase 5: Sammelgut-Optimierung (Woche 14)**: Vorschlag-System für Sammelgut-Konsolidierung basierend auf Auftrags-Eingang: welche Aufträge können effizient kombiniert werden, welche LKW-Touren optimal beladen werden. Disponent sieht Vorschlag, akzeptiert oder modifiziert. Hilft besonders bei Express-Aufträgen, wo schnelle Konsolidierungs-Entscheidungen wertvoll sind.
- **Phase 6: Erweiterung Tracking und Customer-Communication (Monat 4–9)**: Erweiterung um Tracking-Status-Aggregation aus mehreren Carrier-APIs (Monat 5), automatisierte Kunden-Status-Mails mit echter Lieferprognose (Monat 7), proaktive Verspätungs-Kommunikation (Monat 9). Reduzierte den Kundenservice-Aufwand für Status-Anfragen erheblich.

**Stack:**
- Modelle: GPT-5 Vision (PDF-Verstehen, Multi-Format); Claude Opus 4.7 (Zolltarifnummer-Klassifikation, komplexe Ausnahmen); Apertus 8B (Triage, Plausibilitäts-Checks); Claude Haiku (Standard-Kunden-Kommunikation)
- Backend: FastAPI (Python); Node.js Workers; Postgres; Temporal (Workflow-Orchestrierung)
- Integrationen: SAP S/4HANA REST-API; Tracking-APIs (DHL, DPD, GLS, swisslog); Schweizer Zollportal e-dec; EU-Zoll-Schnittstellen NCTS
- Compliance & Observability: Audit-Log mit Zoll-Spezifik (10 Jahre Aufbewahrung); Sentry + Prometheus Monitoring; Daily-Report für GL

**Metriken (Vorher → Nachher):**
- Fehlerquote bei PDF-Auftragserfassung: 4–7% → 0.6% (−88%)
- Medienbrüche pro Auftrag: 2–4 → 0 (−100%)
- Ausnahme-Bearbeitungszeit (Durchschnitt): 55 Min. → 11 Min. (−80%)
- Zolldokumenten-Fehler pro Quartal: 8–14 → 1–2 (−87%)
- Sammelgut-Auslastung: 68% → 81% (+19%)

**Lessons Learned:**
- PDF-Vielfalt unterschätzt. Wir dachten anfangs an 5 Formate, am Ende waren es 12 mit teilweise Quartals-Updates. Modell-Robustheit gegen Layout-Variationen war kritisch — GPT-5 Vision hat hier deutlich besser performt als klassische OCR-Layouts.
- Zollexpertise ist nicht automatisierbar — assistierbar ja. Wir haben früh akzeptiert: die finale Zolltarifnummer-Entscheidung muss ein Mensch treffen, weil bei Falsch-Klassifikationen erhebliche rechtliche Konsequenzen drohen. AI ist Vorbereiter, nicht Entscheider.
- Temporal als Workflow-Engine war Gold wert. Die Logistik-Prozesse haben viele asynchrone, fehler-anfällige Schritte (API-Calls zu externen Carriern, Wartezeiten auf Zoll-Antworten). Temporal mit retries, timeouts und compensation-actions hat die Robustheit deutlich erhöht.
- Proaktive Verspätungs-Kommunikation hat unerwartet starke Kunden-Effekte. Statt dass Kunden anrufen müssen, bekommen sie automatisch Updates. Das hat die Kundenservice-Last reduziert und die NPS-Werte signifikant gehoben.
- Sammelgut-Vorschläge brauchten 4 Monate Tuning. Das Modell musste lernen, was historisch erfolgreiche Konsolidierungen waren — Disponenten haben kontinuierliches Feedback gegeben.

**Compliance:**
EU-Zollrecht, Schweizer Zollverfahren (e-dec), Incoterms-konforme Dokumentation, revDSG für Mitarbeiter- und Lieferanten-Daten, GDPR für innereuropäische Lieferungen. Aufbewahrung Zolldokumente 10 Jahre (gesetzliche Vorgabe). EU AI Act-Klassifikation: Limited Risk (kein Hochrisiko-Bereich, keine sicherheitskritische AI-Entscheidung). Keine besonders schützenswerten Daten in der typischen Verarbeitung. Bei sensitiven Sondertransporten (Pharmazeutika, Gefahrgut): separater manueller Pfad.

---

## Wissen — Definitionen, Vergleiche & Leitfäden

### Was ist ein KI-Agent?
**URL:** https://ai.tytos.ch/wissen/was-ist-ein-ki-agent
**Typ:** definition
**Frage:** Was ist ein KI-Agent und wie unterscheidet er sich von einem Chatbot?
**Stand:** 2026-05-13
**Wörter:** 1620
**Keywords:** KI-Agent, AI Agent, KI-Agent Definition, Chatbot vs Agent, Schweizer KMU, Agentic AI

**Kurze Antwort:** Ein KI-Agent ist eine eigenständig arbeitende, autonom entscheidende Software-Komponente, die auf Sprachmodellen basiert, Zugriff auf Werkzeuge (APIs, Datenbanken, Mail, Kalender) hat und spezifische Aufgaben in einem definierten Rahmen übernimmt — inklusive Eskalation bei Unsicherheit. Ein Chatbot beantwortet Fragen. Ein KI-Agent führt Aufgaben aus.

#### Die drei Kernunterschiede zum Chatbot

Ein klassischer Chatbot ist reaktiv: er antwortet auf Nutzerfragen. Ein KI-Agent ist proaktiv und werkzeugfähig: er kann Mails senden, Datenbanken aktualisieren, APIs aufrufen, Entscheidungen protokollieren, eskalieren. Der zweite Unterschied ist Autonomie: der Agent trifft innerhalb eines definierten Rahmens selbstständig Entscheidungen. Der dritte Unterschied ist Gedächtnis und Kontext: ein Agent kennt den Vorgang über mehrere Schritte hinweg, ein Chatbot beginnt meist bei jeder Interaktion neu. In der Schweizer KMU-Praxis 2026 ist das der entscheidende Schritt: ein Treuhand-Agent erinnert sich an die Mandanten-Historie, ein Immobilien-Agent kennt die Objekt-Pipeline, ein Versicherungs-Agent verfolgt einen Schadensfall vom Eingang bis zur Auszahlung.

#### Bestandteile eines produktiven KI-Agenten

Ein produktiver Agent besteht aus sechs Elementen: (1) dem Sprachmodell (z.B. Claude Opus 4.7, GPT-5, Apertus 70B), (2) einer Rollendefinition (System-Prompt mit klaren Aufgaben und Grenzen), (3) Werkzeug-Anbindungen (die APIs und Systeme, mit denen er arbeiten darf), (4) einem Gedächtnis-Mechanismus (für Kontext über Interaktionen hinweg — meist Vector-Store + strukturiertes Gedächtnis), (5) einer Eskalations-Logik (wann übergibt er an Menschen?) und (6) einem Audit-Trail (jede Aktion wird protokolliert, revidierbar gemacht). Stand Mai 2026 setzen die meisten produktiven Schweizer Agenten auf eine Kombination aus Claude für komplexes Reasoning und kleineren Modellen (Apertus 8B, Mistral, lokale Llama-Varianten) für deterministische Teilaufgaben.

#### Wann ein KI-Agent sinnvoll ist

Agenten machen Sinn bei Prozessen mit Kontext-Entscheidungen: ein klassisches Automatisierungs-Tool versagt, sobald eine Mail unstrukturiert ankommt, ein PDF anders aussieht als erwartet oder eine Anfrage Fachwissen zur Einordnung braucht. Für triviale API-zu-API-Flows ist ein Agent Overkill — dort genügt Zapier, Make oder n8n. Für Prozesse mit unstrukturierten Eingaben oder Bewertungs-Entscheidungen sind Agenten die passende Technologie. Die Faustregel: Wenn ein Mensch 30 Sekunden zum Lesen und Verstehen braucht, bevor er entscheidet, ist es ein Agent-Fall. Wenn es nur Klicks sind, reicht RPA.

#### Typische Agent-Muster in Schweizer KMU 2026

Im Schweizer KMU-Umfeld (20–500 MA) sind fünf Agent-Muster besonders produktiv: Offerten-Agent (erstellt Angebote aus Anfragen), Belegerfassungs-Agent (extrahiert und kontiert), Support-Triage-Agent (klassifiziert und routet), Terminvereinbarungs-Agent (koordiniert Kalender), und Daten-Extraktions-Agent (liest PDFs und strukturiert Informationen). Alle fünf lassen sich DSG-konform mit CH-Stack umsetzen. Neu in 2026: Voice-Agenten für Lead-Qualifizierung und Erst-Beratung, basierend auf gpt-realtime-2 oder vergleichbaren WebRTC-fähigen Modellen.

#### Was ein KI-Agent NICHT ist

Ein KI-Agent ist kein autonomes System ohne Kontrolle. Er ist kein Black-Box-Orakel. Er ist nicht ein One-Click-Wunder, das ohne Setup funktioniert. Jeder produktive Agent braucht: einen klaren Auftrag, eine definierte Daten-Grundlage, eine Eskalations-Regel, einen Audit-Trail und einen Verantwortlichen im Unternehmen, der ihn betreut. Wer sich einen Agent als Plug-and-Play vorstellt, verwechselt ihn mit einer SaaS-App. Agenten sind digitale Mitarbeitende — und Mitarbeitende brauchen Onboarding, Feedback und Führung.

#### Kosten und Time-to-Production

Ein produktiver KI-Agent für einen klar abgegrenzten Use-Case kostet zwischen 8'000 und 35'000 CHF Initialaufwand, je nach Komplexität der Integration. Time-to-Production: 14–28 Tage bei klar definiertem Scope. Laufende Modellkosten: 50–500 CHF/Monat für KMU-typische Volumina (10'000–50'000 Anfragen). Wartungs- und Monitoring-Retainer: typischerweise 800–2'500 CHF/Monat. Der ROI tritt meist binnen 3–6 Monaten ein, weil ein einzelner Agent oft 1–2 FTE-Äquivalent an Routinearbeit ablöst.

#### DSG-Aspekte beim Agent-Einsatz

Ein KI-Agent, der personenbezogene Daten verarbeitet, fällt unter das revidierte Datenschutzgesetz (revDSG). Wichtigste Punkte: Auftragsbearbeitungsvertrag (DPA) mit dem Modell-Anbieter, dokumentierte Zweckbindung, Transparenz gegenüber betroffenen Personen, technische und organisatorische Massnahmen, und das Recht auf manuelle Überprüfung automatisierter Entscheidungen. Bei besonders schützenswerten Daten (Gesundheit, Religion, Sexualität) gelten strengere Anforderungen. TYTOS-Agenten werden grundsätzlich mit DSG-konformer Architektur gebaut: EU-Hosting oder Schweizer Stack, Datenminimierung, Audit-Trail.

---

### Was ist TYTOS?
**URL:** https://ai.tytos.ch/wissen/was-ist-tyt-os
**Typ:** definition
**Frage:** Was ist TYTOS und wie unterscheidet es sich von einer klassischen AI-Agentur?
**Stand:** 2026-05-13
**Wörter:** 1580
**Keywords:** TYTOS, Schweizer AI-Boutique, AI Boutique Schweiz, TYTOS GmbH, Tim Gashi, Kriens

**Kurze Antwort:** TYTOS ist eine Schweizer AI-Boutique der TYTOS GmbH. Sie bündelt sechs Leistungen — AI-Strategie, KI-Agenten, Prozessautomatisierung, digitale Mitarbeitende, individuelle AI-Software und AI-Infrastruktur — unter einer Marke. Der Unterschied zu klassischen Agenturen: TYTOS baut produktive Systeme in Wochen statt Strategien in Monaten, mit Code-Ownership beim Kunden und optional 100% Schweizer Stack.

#### Die sechs Leistungen im Überblick

AI-Strategie & Acceleration — Readiness-Assessment, Roadmap, C-Level-Sparring. KI-Agenten — Bau und Betrieb digitaler Arbeitskräfte mit klarer Rolle. Prozessautomatisierung — End-to-End-Prozesse mit AI-Entscheidungspunkten. Digitale Mitarbeitende — vollwertige AI-Worker für spezifische Rollen. Individuelle AI-Software — Custom Applications für Use-Cases, die kein Standard-Tool abdeckt. AI-Infrastruktur & internes OS — die Schicht, auf der mehrere AI-Anwendungen zentral betrieben werden. Jede dieser sechs Leistungen ist eigenständig buchbar, jede liefert ein klares Ergebnis, und alle sechs lassen sich kombinieren wenn die Organisation grösser denkt.

#### Warum 'Operating System'?

Der Name TYTOS leitet sich vom Metaphorischen 'Operating System' ab: die Schicht, die Unternehmen AI-fähig macht. Nicht ein einzelner Agent. Nicht ein Tool. Sondern die Infrastruktur und das methodische Rahmenwerk, das AI-Produktivität erst ermöglicht. In der Praxis bedeutet das: TYTOS baut für Sie einzelne Bausteine (Agent, Automation, Software) und optional die darunterliegende Schicht, auf der alle zusammen laufen — Modell-Orchestrierung, Knowledge-Layer, Observability, Access-Control. Das ist der Unterschied zwischen einer Sammlung von SaaS-Tools und einer kohärenten AI-Architektur.

#### Zielgruppe

TYTOS arbeitet primär mit Schweizer KMU (20–500 Mitarbeitende) in wissens- und admin-intensiven Branchen: Immobilien, Treuhand, Versicherung, Legal, Logistik, Industrie-Dienstleister. Sekundär mit DACH-Mittelstand, wenn ein klar abgegrenzter Hebel vorhanden ist. Nicht für reine Consumer-Apps oder Unternehmen ohne Prozess-Volumen. Die typische Konstellation: ein Eigentümer-geführtes Unternehmen mit etablierter Marktstellung, klaren Prozessen und einer Person im Management, die AI als Hebel versteht — nicht als Bedrohung und nicht als Spielzeug.

#### Beziehung zur TYTOS GmbH

TYTOS ist die AI-spezifische Marke der TYTOS GmbH mit Sitz in Kriens (LU). Die TYTOS GmbH (Handelsregister CHE-351.360.864, gegründet November 2022) führt zusätzlich weitere Angebote im Bereich Software- und Web-Entwicklung unter tytos.ch. TYTOS unter ai.tytos.ch fokussiert ausschliesslich auf AI-Projekte mit strategischer und technischer Tiefe. Geschäftsführer sind Tim Gashi und Nelson Aikhionbare, beide handelsregistereingetragen.

#### Was TYTOS NICHT macht

TYTOS verkauft keine Lizenzen, keine SaaS-Abos und keine vorgefertigten Bots. Wir sind keine Wiederverkäufer von OpenAI- oder ChatGPT-Lizenzen. Wir bauen keine generischen Chatbots ohne klaren Business-Case. Wir liefern keine PowerPoint-AI-Strategien, die in der Schublade landen. Wir arbeiten nicht in Engagements unter drei Wochen — alles darunter ist Spielerei. Wir empfehlen keine Lösung, die in 18 Monaten technologisch überholt ist. Wenn ein bestehendes SaaS-Tool das Problem zu 90% löst, sagen wir das ehrlich und liefern den Konfigurations-Support — ohne ein Custom-Projekt vorzuschieben.

#### Wie TYTOS arbeitet

Die Arbeitsweise folgt vier Prinzipien: (1) Produktiv in Wochen, nicht in Quartalen — wir liefern Ergebnisse, die nach 14–28 Tagen messbar sind. (2) Code-Ownership beim Kunden — das Repository gehört Ihnen, kein Vendor-Lock-in. (3) Modell-Agnostik — wir wählen das Modell, das passt (Claude, GPT, Apertus, Mistral), nicht das, das uns Provision bringt. (4) Transparente Kommunikation — kein Status-Bullshit, keine versteckte Komplexität. Sie wissen jederzeit, was läuft, was kostet, was bringt.

#### Der Mira-Voice-Concierge

ai.tytos.ch hat eine integrierte Voice-Concierge namens Mira. Sie ist auf gpt-realtime-2 (OpenAI, Stand Mai 2026) gebaut und kann Besucher in 3–5 Minuten durch das Angebot führen, Fragen beantworten und einen Handoff zu Tim Gashi vorbereiten. Mira ist ein laufender Beweis: was wir für uns selbst bauen, bauen wir auch für Sie. Sie ist DSG-konform, transparent als KI gekennzeichnet, mit Rate-Limit und Audit-Trail. Wenn Sie wissen wollen, was ein Voice-Agent in der Praxis kann — sprechen Sie mit Mira, bevor Sie mit Tim sprechen.

---

### KI-Revolution im KMU
**URL:** https://ai.tytos.ch/wissen/ki-revolution-in-kmu
**Typ:** definition
**Frage:** Was bedeutet die KI-Revolution konkret für ein Schweizer KMU mit 20–500 Mitarbeitenden?
**Stand:** 2026-05-13
**Wörter:** 1700
**Keywords:** KI Revolution, AI KMU Schweiz, Mittelstand AI, Digitalisierung 2026, AI Produktivität

**Kurze Antwort:** Für Schweizer KMU bedeutet die KI-Revolution nicht, dass Mitarbeitende ersetzt werden, sondern dass Routinearbeit abnimmt, die Produktivität pro Kopf steigt und kleinere Firmen Aufgaben bearbeiten können, für die bisher grössere Strukturen nötig waren. Die Revolution findet im Backoffice und in der Administration statt — in Offerten, Belegerfassung, Support, Terminkoordination, Dokumentenverwaltung.

#### Was sich verändert

Erstens: die Produktivitäts-Obergrenze pro Mitarbeiter verschiebt sich nach oben. Eine Sachbearbeiterin, die 50 Anfragen pro Tag bearbeitet, kann mit AI-Unterstützung 200 bearbeiten — bei gleichbleibender Qualität. Zweitens: kleinere KMU können Aufgaben intern abdecken, für die sie bisher auf externe Dienstleister oder grössere Strukturen angewiesen waren. Drittens: die Reaktionszeit auf Kundenanfragen verkürzt sich von Stunden auf Minuten, was die Marktstellung stärkt. Die Schweizer Studie von 2026 zeigt: 34% der KMU nutzen bereits aktiv KI, weitere 30% experimentieren — der Wandel ist real und messbar.

#### Was sich nicht verändert

Kernentscheidungen, Kundenbeziehungen, strategische Urteile bleiben menschlich. AI ist in der Schweizer KMU-Realität ein Werkzeug zur Produktivitätssteigerung — nicht ein Ersatz für den Treuhänder, den Anwalt oder den Geschäftsführer. Die Verantwortung (inkl. rechtlich) bleibt beim Menschen. Das ist kein Bug, sondern ein Feature: es macht AI-Einsatz im Schweizer Rechts- und Haftungsrahmen praktikabel. revDSG, BGFA, FINMA-Rundschreiben — alle setzen voraus, dass die finale Entscheidung beim verantwortlichen Menschen liegt.

#### Die DACH-Besonderheit

Im DACH-Raum (speziell CH) spielt Datensouveränität eine deutlich grössere Rolle als im US-Markt. Das revidierte DSG, der EU AI Act, die Verpflichtungen gegenüber FINMA, Treuhand-Kammer oder Anwaltsgeheimnis setzen einen klaren Rahmen. Das ist kein Hindernis für AI — es ist der Rahmen, in dem AI seriös eingesetzt wird. Wer das ignoriert, baut Compliance-Schulden auf. Apertus 70B (entwickelt von ETH Zürich, EPFL und CSCS) ist ein direktes Resultat dieser Mentalität: ein open-source, mehrsprachiges Modell mit voll konformer Trainings-Daten, das auf Schweizer Infrastruktur läuft.

#### Wie ein KMU anfängt

Der schnellste Einstieg: einen spezifischen Prozess identifizieren, bei dem die Routinearbeit gross ist und der Entscheidungs-Teil klar abgrenzbar. Typisch: Offertenerstellung, Belegerfassung, Mail-Triage. Einen ersten Agent in 14–28 Tagen produktiv machen, Ergebnisse messen, dann erweitern. Nicht mit einer 12-Monats-Roadmap starten — die ist fast immer falsch, bevor sie umgesetzt wird. Wer mit AI startet wie mit einer ERP-Einführung, scheitert: AI lebt von kurzen Iterationen, schnellem Feedback und mutigem Cut.

#### Was sich für Mitarbeitende ändert

Die ehrliche Wahrheit: Mitarbeitende, deren Tätigkeit zu 70–90% aus Routinearbeit besteht, werden ihre Rolle verändern müssen. Das bedeutet nicht zwingend Entlassung — aber Umschulung in höherwertige Aufgaben (Kundenkontakt, Qualitätskontrolle, Ausnahme-Bearbeitung). Mitarbeitende mit hohem Anteil an Beratungs-, Beziehungs- oder Spezial-Expertise gewinnen — sie haben mehr Zeit für das, was nur Menschen können. Wer dieses Thema im Unternehmen verschweigt, verliert Vertrauen. Wer es offen anspricht und Perspektiven aufzeigt, gewinnt es.

#### Branchen mit besonderem Hebel

Stark profitieren 2026: Treuhand (Belegerfassung, Lohnbuchhaltung, Compliance-Monitoring), Immobilien (Exposé-Generierung, Mietanfragen-Triage), Versicherung (Schadenmeldung, Dokumenten-Triage), Legal (Vertrags-Analyse, Präzedenz-Research), Logistik (Auftragserfassung, Ausnahme-Handling). Geringer Hebel (Stand heute): Bauunternehmen, Handwerker, lokale Detailhändler — dort ist der Anteil an digitaler Routinearbeit niedriger. Aber: das ändert sich, sobald Voice-AI und Image-AI weiter reifen. Stand Mai 2026 reifen genau diese Felder im Wochentakt.

#### Was es kostet

Ein erstes produktives AI-Projekt für ein KMU mit 20–100 MA: typisch 15'000–40'000 CHF Initial, dann 800–2'500 CHF/Monat laufend. Das ist weniger als eine zusätzliche Halbtags-Stelle — und liefert oft 1–2 FTE-Äquivalent an Produktivität. Bei grösseren KMU (100–500 MA) wachsen die Zahlen proportional zur Komplexität, aber das Verhältnis Aufwand-zu-Nutzen bleibt. Schweizer KMU sparen mit AI-Automatisierung typischerweise CHF 5'000–15'000 pro Monat bei einem ROI in 2–4 Monaten.

---

### KI-Agent vs. RPA: Wo ist der Unterschied?
**URL:** https://ai.tytos.ch/wissen/ki-agent-vs-rpa
**Typ:** vergleich
**Frage:** Wann brauche ich einen KI-Agenten, wann reicht klassische RPA-Automatisierung?
**Stand:** 2026-05-13
**Wörter:** 1650
**Keywords:** KI Agent RPA Vergleich, RPA vs AI, UiPath Alternative, Schweizer Automatisierung, Hybrid Automation

**Kurze Antwort:** RPA automatisiert deterministische Prozesse mit strukturierten Eingaben — wie ein makrogesteuerter Klick-Roboter. Ein KI-Agent übernimmt Prozesse mit unstrukturierten Eingaben und Kontext-Entscheidungen. Faustregel: Wenn ein Mensch 30 Sekunden zum Lesen und Verstehen braucht, bevor er entscheidet, ist es ein Agent-Fall. Wenn es nur Klicks sind, reicht RPA.

#### RPA: Stärken und Grenzen

RPA (Robotic Process Automation) ist für deterministische, regelbasierte Prozesse optimiert. Tools wie UiPath, Automation Anywhere, Microsoft Power Automate bilden Workflows zwischen Systemen ab, klicken durch UIs, kopieren Felder. Stärken: zuverlässig, auditierbar, schnell zu implementieren für klare Prozesse. Grenzen: sobald Eingaben unstrukturiert sind (Mails, PDFs, Bilder) oder Entscheidungen Kontext brauchen, versagt RPA. Dann braucht es Menschen oder AI. In Schweizer KMU sind die häufigsten RPA-Einsätze: Datentransfer zwischen Buchhaltungs-, ERP- und CRM-Systemen, Erzeugung wiederkehrender Reports, Massendatenpflege.

#### KI-Agent: Stärken und Grenzen

KI-Agenten basieren auf Sprachmodellen und können unstrukturierte Eingaben interpretieren, Kontext-Entscheidungen treffen, Aktionen ableiten. Stärken: flexibel bei Eingabeformaten, kann natürlich kommunizieren, adaptiert sich an neue Fälle. Grenzen: probabilistisch (nicht deterministisch), kann fehlerhafte Antworten generieren, braucht saubere Rahmendefinition, Audit-Trail und Human-in-the-Loop bei kritischen Entscheidungen. Stand Mai 2026 sind die typischen Modelle für KMU-Agenten: Claude Opus 4.7 (komplexes Reasoning), GPT-5 (breite Tool-Nutzung), Apertus 70B (DSG-konform, Schweizer Hosting).

#### Hybrid: der Normalfall 2026

In der Praxis ist der sinnvolle Aufbau fast immer hybrid. RPA für die deterministischen Teile einer Pipeline (Datentransport, API-Calls, Logging), AI-Agent für die Entscheidungs-Knoten. Beispiel: Eine Rechnung kommt per Mail, RPA öffnet den Anhang und speichert ihn, der AI-Agent extrahiert die Felder und schlägt die Kontierung vor, RPA bucht in der Buchhaltung und protokolliert. Jeder Teil macht, was er am besten kann. Das senkt nicht nur die Kosten — es macht das Gesamtsystem auch deutlich auditierbarer, weil die deterministischen Schritte nachvollziehbar bleiben.

#### Entscheidungs-Matrix

Wählen Sie RPA, wenn: (a) die Eingaben immer gleich strukturiert sind, (b) die Entscheidungsregeln explizit formulierbar sind, (c) der Prozess stabil ist und sich selten ändert. Wählen Sie einen KI-Agenten, wenn: (a) die Eingaben variieren (Texte, Bilder, Audio), (b) Entscheidungen Kontext erfordern, (c) der Prozess sich häufig anpassen soll. In vielen realen Szenarien arbeiten beide Technologien zusammen — eine reine Entweder-Oder-Wahl ist 2026 selten optimal.

#### Kosten-Vergleich

RPA-Lizenzen kosten typischerweise 5'000–15'000 CHF/Jahr pro Bot bei den grossen Anbietern (UiPath Enterprise, Automation Anywhere). Open-Source-RPA (Robocorp, Power Automate Community) ist günstiger, aber wartungsintensiver. KI-Agenten haben niedrigere Initial-Lizenzkosten (oft 0 — Modellnutzung pay-per-token), dafür laufende Modellkosten von 50–500 CHF/Monat pro Agent. Der entscheidende Kostenfaktor bei beiden Technologien ist nicht die Lizenz, sondern der Bau- und Wartungsaufwand: einen Agent oder Bot produktiv zu halten kostet 3–8 Stunden/Monat, je nach Komplexität.

#### Wartbarkeit im Vergleich

Ein RPA-Bot bricht typischerweise, wenn sich die UI eines Zielsystems ändert (Update, neues Theme, geänderte Selektoren). Ein KI-Agent ist robuster gegen UI-Veränderungen — er versteht Inhalt statt Position. Dafür ist er anfällig gegen Modell-Updates und Prompt-Drift: ein Modell-Wechsel kann das Verhalten subtil verändern. Beide Technologien brauchen Monitoring: bei RPA Health-Checks der UI-Selektoren, bei AI-Agents Qualitäts-Spotchecks und Audit-Logs. Stand 2026: AI-Agents werden in regulierten Branchen zunehmend strukturierter geprüft (FINMA-Rundschreiben, ESV-Vorgaben), während RPA-Bots eher pragmatisch betrieben werden.

#### Migration RPA → Agent

Viele KMU haben Anfang 2020er-Jahre RPA eingeführt und stehen 2026 vor der Frage: weiter RPA oder Migration zu Agent-Architekturen? Die ehrliche Antwort: ergänzen, nicht ersetzen. Bestehende, stabile RPA-Bots laufen weiter — sie funktionieren ja. Neue Prozesse mit unstrukturierten Eingaben werden als Agent-Architektur gebaut. Alte RPA-Strecken, die häufig brechen oder hohen Wartungsaufwand erzeugen, werden Stück für Stück zu Agent-Pipelines portiert. Das ist ein Mehrjahres-Pfad — nicht eine grosse Migration.

---

### Was ist Prozessautomatisierung?
**URL:** https://ai.tytos.ch/wissen/was-ist-prozessautomatisierung
**Typ:** definition
**Frage:** Was ist Prozessautomatisierung und welche Arten gibt es?
**Stand:** 2026-05-13
**Wörter:** 1620
**Keywords:** Prozessautomatisierung, BPA, Workflow Automation, Schweizer KMU, AI Automation

**Kurze Antwort:** Prozessautomatisierung bezeichnet die computergestützte Ausführung von Geschäftsprozessen ohne manuelle Eingriffe. Sie reicht von einfachen Trigger-Action-Regeln (Zapier, Make) über RPA (Software-Roboter auf UI-Ebene) bis zu AI-unterstützten Agenten-Workflows. Moderne Prozessautomatisierung 2026 kombiniert deterministische Automation mit AI-Entscheidungspunkten.

#### Die drei Stufen

Stufe 1: Trigger-Action-Automation (Zapier, Make, n8n) — für einfache API-zu-API-Flows zwischen SaaS-Tools. Stufe 2: RPA (UiPath, Power Automate) — für klassische Prozesse zwischen älteren Systemen mit UI-Zugriff. Stufe 3: AI-gestützte Agent-Workflows — für Prozesse mit unstrukturierten Eingaben und Kontext-Entscheidungen. Die meisten modernen Unternehmens-Automationen nutzen Kombinationen aller drei Stufen. Stand 2026 ergänzt sich eine vierte Schicht: Voice- und Multimodal-Agenten, die Telefonate, Bilder und Videos verarbeiten — z.B. für Schadensmeldungen mit Foto-Upload oder Erst-Beratung am Telefon.

#### Häufige Prozesskandidaten

Klassische Kandidaten für Automation: Rechnungseingang und -verarbeitung, Offertenerstellung, Onboarding neuer Kunden, Termin- und Kalenderkoordination, Support-Ticket-Triage, Lead-Qualifizierung, Dokumentenerstellung (Verträge, Schreiben), Reporting und Dashboards, Lohnbuchhaltungs-Zyklen, Compliance-Checks. Nicht alles sollte automatisiert werden — Automation lohnt sich, wenn der Prozess hochfrequent und repetitiv ist. Faustregel: ab 50 Wiederholungen pro Monat fängt sich der Aufwand der Automation in der Regel innert 6–12 Monaten zurück.

#### Was Automation nicht ersetzt

Automation ersetzt nicht Beurteilungsvermögen, Kundenbeziehungen, strategische Entscheidungen oder Ausnahmefälle, die Fingerspitzengefühl brauchen. Das Ziel ist nicht, den Menschen aus dem Prozess zu entfernen, sondern ihn von der Wiederholungsarbeit zu entlasten, damit er die Entscheidungen treffen kann, für die er da ist. Eine erfolgreiche Automation reduziert die Routinequote der Mitarbeitenden — sie erhöht die Qualität der menschlichen Eingriffe, statt sie zu eliminieren.

#### DSG-Aspekte

Bei Prozessautomatisierung mit personenbezogenen Daten gilt revDSG (CH, seit September 2023). Wichtig: Transparenz gegenüber Betroffenen, dokumentierter Auftragsbearbeitungsvertrag, technische und organisatorische Massnahmen, Rechtmässigkeit der Datenverarbeitung. Automation ist kein Freifahrtschein — sie erfordert sauberes Datenschutz-Handling. Bei automatisierten Einzelentscheidungen (z.B. Kreditentscheidungen, Schadensbewertungen, Tarifierungen) gilt zusätzlich: die betroffene Person hat das Recht auf manuelle Überprüfung und Begründung der Entscheidung.

#### Architektur-Muster

Eine gut gebaute Automation hat folgende Schichten: (1) Trigger (Mail, Webhook, Timer, Form-Submission), (2) Validation und Vorbereitung (Daten prüfen, anreichern, transformieren), (3) AI-Entscheidungs-Knoten wo nötig (Klassifizierung, Extraktion, Bewertung), (4) Aktion (API-Calls, DB-Writes, Mails), (5) Logging und Monitoring (jeder Schritt protokolliert), (6) Fehler-Handling (Retry, Dead-Letter-Queue, Eskalation). Wer Schicht 5 und 6 weglässt, baut Automation, die in der Stille bricht — der teuerste Fehler im KMU-Kontext.

#### Tool-Stack 2026

Stand Mai 2026 ist der typische TYTOS-Stack für KMU-Automation: n8n oder Make für visuell konfigurierbare Workflows, Node.js / Python für komplexe Custom-Logik, Temporal oder BullMQ für robuste Workflow-Orchestrierung, Postgres als operative Datenbank, Resend für transactional Mails, Sentry für Error-Monitoring. AI-Knoten werden je nach Use-Case mit Claude (komplexes Reasoning), GPT (breite Tool-Nutzung) oder Apertus (DSG-Strenge) befüllt. Die Auswahl hängt vom Use-Case ab — nicht von einer Standard-Empfehlung.

#### Wann Automation NICHT lohnt

Es gibt Prozesse, die nicht automatisiert werden sollten: (1) Prozesse mit weniger als 20 Wiederholungen/Monat — der Aufwand rechnet sich nie. (2) Prozesse mit hoher Variabilität ohne klares Muster — Automation würde nur die Variabilität verstärken. (3) Prozesse, bei denen Kunden den persönlichen Kontakt schätzen — der erste Kontakt nach einer Reklamation z.B. — Automation kann die Beziehung beschädigen. (4) Prozesse, die in 6 Monaten obsolet sind — z.B. Übergangslösungen vor einer ERP-Migration. Die ehrliche Beratung in diesen Fällen: nicht automatisieren.

---

### GPT-5 vs. Claude Opus 4.7 vs. Apertus 70B — der Modell-Vergleich Mai 2026
**URL:** https://ai.tytos.ch/wissen/gpt-5-vs-claude-opus-4-7-vs-apertus
**Typ:** vergleich
**Frage:** Welches Sprachmodell sollte ein Schweizer KMU im Mai 2026 für seine AI-Projekte einsetzen — GPT-5, Claude Opus 4.7 oder Apertus 70B?
**Stand:** 2026-05-13
**Wörter:** 1820
**Keywords:** GPT-5, Claude Opus 4.7, Apertus 70B, LLM Vergleich 2026, Schweizer LLM, DSG-konformes LLM

**Kurze Antwort:** Es gibt nicht ein bestes Modell — es gibt das passende Modell pro Use-Case. Claude Opus 4.7 ist Stand Mai 2026 die erste Wahl für komplexes Reasoning, längere Kontexte und sorgfältiges Schreiben. GPT-5 dominiert bei breiter Tool-Nutzung, Multimodalität und Voice-Realtime. Apertus 70B ist die einzige ernsthafte Option, wenn 100 % Schweizer Hosting und voll konforme Trainingsdaten zwingend sind — etwa bei FINMA-regulierten Daten oder besonders schützenswerten Personendaten.

#### Was bedeutet 'bestes Modell' eigentlich?

Modell-Benchmarks sind selten direkt mit KMU-Realität vergleichbar. Eine 87 % MMLU-Score sagt wenig darüber aus, ob ein Modell bei einer komplexen Versicherungs-Klassifikation hält. Was zählt, ist die Passung zum Use-Case: Reasoning-Tiefe (bei rechtlichen Bewertungen wichtig), Faktentreue (bei Belegerfassung), Sprachqualität (bei Kunden-Kommunikation), Tool-Use (bei Multi-Schritt-Workflows), Kosten pro Anfrage, Latenz (bei Voice und Echtzeit-UIs), Datensouveränität. Wir prüfen pro Projekt diese sieben Dimensionen und entscheiden danach — nicht nach Vendor-Loyalität.

#### Claude Opus 4.7 (Anthropic, April 2026)

Claude Opus 4.7 wurde am 16. April 2026 veröffentlicht und ist Stand Mai 2026 das Spitzenmodell für komplexes Reasoning und sorgfältige Schreibarbeit. Kontextfenster bis 1M Tokens (Premium-Tier), starke Tool-Use-Fähigkeit, ausgezeichnete Mehrsprachigkeit inkl. Schweizerdeutsch in geschriebener Form, sehr hohe Faktentreue im Vergleich zur Vorgänger-Generation. Ideale Anwendungen: Vertrags-Analyse, mehrstufige Treuhand-Workflows, Code-Generierung für Custom-Software, sorgfältige Kunden-Korrespondenz. Limit: höhere Token-Kosten als GPT-Gegenstücke, kein natives Voice-Realtime (kommt indirekt über Vermittler).

#### GPT-5 (OpenAI, Frühjahr 2026)

GPT-5 ist OpenAIs aktueller Generations-Schritt mit deutlich besserer Tool-Nutzung, breiterer Multimodalität (Text/Bild/Audio/Video) und nahtloser Voice-Realtime-Integration via gpt-realtime-2. Stärken: breit verfügbare Tooling-Ecosystem, sehr gute Function-Call-Konsistenz, native Voice-Capabilities, Codex/Code-Interpreter eingebaut. Ideale Anwendungen: Voice-Agenten, Multi-Modal-Pipelines (Bild + Text), CRM-/ERP-Integrationen mit vielen Tools, schnelle Iterationen mit Streaming-UIs. Limit: gelegentlich oberflächlichere Reasoning-Tiefe als Claude bei wirklich komplexen Texten, sensitiver auf Prompt-Veränderungen.

#### Apertus 70B (Swiss AI Initiative, 09/2025, Update 2509)

Apertus ist das gemeinsame Modell von ETH Zürich, EPFL und CSCS, trainiert auf dem ALPS-Supercomputer in Lugano mit über 4'000 NVIDIA-GH200-GPUs und überwiegend CO2-neutralem Strom. 70B- und 8B-Parameter-Varianten, mehr als 1'000 Sprachen, vollständig offene und konforme Trainingsdaten. Verfügbar über Swisscom, Hugging Face, das Public-AI-Netzwerk und AWS SageMaker (Schweizer Region). Stärken: 100 % Schweizer Provenienz, voll konforme Trainingsdaten (kein urheberrechtlich heikles Material), open-weights, läuft auf Schweizer Hardware. Limit: deutlich kleinere Tooling-Ecosystem als OpenAI/Anthropic, Reasoning-Tiefe noch nicht auf Opus-Niveau, höhere Latenz wenn nicht selbst gehostet.

#### Pro Use-Case: welches Modell?

Treuhand-Belegerfassung mit DSG-Strenge: primär Apertus 70B (Schweizer Hosting), Fallback Claude über Schweizer EU-Proxy. Voice-Concierge (wie Mira): GPT-5 / gpt-realtime-2 (alternativlos Stand heute, Apertus hat noch kein Voice-Realtime). Vertrags-Analyse Legal: Claude Opus 4.7 (Reasoning-Tiefe, lange Kontexte). Schadensmeldung-Triage Versicherung: hybrid — GPT-5 für Multimodal (Foto + Text), Claude für komplexe Bewertung. Standard-Korrespondenz mit Schweizer Tonalität: Claude oder Apertus, je nach Hosting-Strenge. Cost-sensitive Use-Cases mit hohem Volumen: Apertus 8B oder Mistral 22B, mit Eskalation auf grösseres Modell bei Unsicherheit.

#### Kosten-Realität Mai 2026

Claude Opus 4.7: ca. $15 / 1M Input-Token, $75 / 1M Output-Token (Premium-Tier mit 1M Context). GPT-5: ca. $10 / 1M Input, $40 / 1M Output (Standard-Tier). Apertus 70B selbst gehostet: ca. $0.50–2 pro Million Tokens, je nach Auslastung (Hardware-Amortisation), bei Swisscom ähnlich GPT-Preise. Für ein typisches Schweizer KMU mit 5'000–20'000 Anfragen pro Monat bedeutet das: zwischen 50 und 800 CHF/Monat reine Modellkosten. Der Modell-Anbieter ist selten der teuerste Posten — Wartung und menschliche Aufsicht kosten deutlich mehr.

#### Wann mehrere Modelle gleichzeitig?

Viele produktive Architekturen kombinieren Modelle: ein Apertus-8B-Klassifikator triagiert eingehende Anfragen, Claude Opus 4.7 bearbeitet die komplexen, GPT-5 mit Voice-Realtime hält den telefonischen Erstkontakt, ein Fallback-Modell springt bei API-Ausfällen ein. Diese Multi-Modell-Architekturen sind Standard 2026 — und brauchen eine zentrale AI-Infrastruktur-Schicht, die Routing, Kosten-Tracking und Fallback transparent macht. Genau hier setzt TYTOS' AI-Infrastruktur-Leistung an.

#### Was 2026 noch kommt

Stand Mai 2026 kündigen Anthropic ein Sonnet 4.7 (Mid-Tier, 1M Context, $3/$15) und OpenAI eine GPT-5-mini-Variante für niedrig-volumige Aufgaben an. Apertus plant ein 2611-Update mit nochmals verbesserter Mehrsprachigkeit und Tool-Use. Die Modell-Landschaft konsolidiert sich erkennbar in drei Lagern: US-Frontier (OpenAI, Anthropic, Google), Europäisch-Open (Mistral, Apertus, EU-Public-AI), Chinesisch (Qwen, DeepSeek). Für Schweizer KMU bleiben die ersten beiden Lager relevant — chinesische Modelle scheitern an Compliance- und Reputations-Hürden, nicht an Qualität.

---

### Was ist Apertus 70B? Das Schweizer Open-Source-LLM
**URL:** https://ai.tytos.ch/wissen/was-ist-apertus-70b
**Typ:** definition
**Frage:** Was ist Apertus 70B und wie können Schweizer KMU es produktiv einsetzen?
**Stand:** 2026-05-13
**Wörter:** 1680
**Keywords:** Apertus, Apertus 70B, Schweizer LLM, Swiss AI Initiative, ETH EPFL, Open Source LLM, DSG LLM

**Kurze Antwort:** Apertus 70B ist das gemeinsam von ETH Zürich, EPFL und CSCS entwickelte Schweizer Open-Source-Sprachmodell, trainiert auf dem ALPS-Supercomputer in Lugano. Es ist vollständig offen (Gewichte, Trainingscode, Daten), mehrsprachig (1'000+ Sprachen), DSG- und EU-AI-Act-konform durch Wahl der Trainingsdaten. Verfügbar über Swisscom, Hugging Face, Public AI und AWS SageMaker. Für Schweizer KMU die erste Wahl, wenn Datensouveränität und regulatorische Strenge im Vordergrund stehen.

#### Die Geschichte hinter dem Modell

Apertus ist das Resultat der Swiss AI Initiative — einer Kooperation zwischen ETH Zürich, EPFL und dem Schweizer Nationalen Supercomputing-Zentrum CSCS in Lugano. Das Training fand auf dem ALPS-Supercomputer statt, einer der grössten europäischen Compute-Infrastrukturen, mit über 4'000 NVIDIA-GH200-GPUs. Stromversorgung: überwiegend CO2-neutral. Kühlung: nachhaltige Seewasser-Kühlung aus dem Luganer See. Das war von Anfang an mehr als ein Modell — es war ein Statement, dass die Schweiz LLM-Souveränität ernst nimmt. Veröffentlicht im September 2025 in 70B- und 8B-Variante, Update 2509 verfügbar, weiteres Update geplant für Q3/Q4 2026.

#### Was Apertus von US-Modellen unterscheidet

Drei zentrale Unterschiede zu OpenAI / Anthropic / Google. (1) Vollständig open: Gewichte, Trainings-Daten-Spezifikation und Trainings-Code sind öffentlich. Es gibt keine versteckten Datenquellen. (2) Voll konforme Trainings-Daten: nur Material, das urheberrechtlich, ethisch und rechtlich klar ist — kein scrape-and-pray, kein massiges Web-Crawling, kein opaques Lizenz-Setup. (3) Schweizer Provenienz: trainiert auf Schweizer Hardware, mit Schweizer Strom, von Schweizer Institutionen. Für Branchen, in denen 'wo lebt das Modell und wer hat Zugriff' eine zentrale Frage ist (Banken, Versicherer, Anwaltskanzleien, Gesundheitswesen), ist das entscheidend.

#### Technische Eckdaten

70B-Parameter-Variante (Apertus-70B-2509) und 8B-Variante (Apertus-8B-2509). Kontextfenster: 128k Tokens (Stand Update 2509). Trainings-Daten: über 15 Trillionen Tokens, davon ca. 40 % mehrsprachig (insbesondere stark in DE, FR, IT, RM — die vier Schweizer Landessprachen). Über 1'000 Sprachen abgedeckt. Tool-Use-Fähigkeit grundsätzlich vorhanden, aber Ecosystem deutlich kleiner als bei OpenAI / Anthropic. Latenz: bei Swisscom-Hosting vergleichbar mit GPT-4-Tier, beim Selbst-Hosting auf vernünftiger Hardware (4× A100 80GB) ca. 30–80 Tokens/Sekunde.

#### Verfügbarkeit für KMU

Für Schweizer KMU gibt es vier Wege, Apertus zu nutzen. (1) Swisscom Apertus Service — die einfachste Variante, API-kompatibel, Schweizer Hosting, Schweizer Vertrag. (2) AWS SageMaker AI in der Region eu-central-2 (Zürich) — für KMU, die ohnehin auf AWS sind. (3) Public AI Network — kostenlose / niedrig-kostige Inference für nicht-kommerzielle und KMU-Pilotprojekte. (4) Selbst-Hosting auf eigener Hardware — für Banken, Versicherer oder Anwaltskanzleien mit on-premise-Anforderungen. Hier ist die Hürde Hardware-Investition (typisch 60'000–120'000 CHF für eine geeignete Inference-Box).

#### Wann Apertus die richtige Wahl ist

Apertus ist die erste Wahl bei: (1) Treuhand- und Anwaltsmandanten-Daten — Mandatsgeheimnis und BGFA setzen Schweizer Verarbeitung voraus oder machen sie zumindest sehr attraktiv. (2) FINMA-regulierten Daten (Versicherung, Bank) — viele Aufsichtsbereiche schreiben Schweizer oder EU-Verarbeitung vor. (3) Gesundheitsdaten — besonders schützenswert nach revDSG Art. 5 lit. c. (4) Daten, die nach 5 Jahren wieder geprüft werden — Modell-Provenienz und Trainings-Daten sind dokumentierbar. (5) Politisch sensitiven Anwendungen, bei denen US-Cloud-Act-Risiken thematisiert werden.

#### Wo Apertus an Grenzen kommt

Ehrliche Limitierungen Stand Mai 2026: (1) Reasoning-Tiefe bei mehrschrittigen logischen Aufgaben liegt noch hinter Claude Opus 4.7. (2) Tool-Use-Ecosystem ist klein — viele LangChain-/LangGraph-Patterns brauchen Adaptation. (3) Voice-Realtime gibt es nicht — wer Echtzeit-Telefonie will, muss zu OpenAI gpt-realtime-2 greifen. (4) Coding-Assistenz ist passabel, aber nicht auf Opus-Niveau für komplexe Refactorings. (5) Multimodal (Bild, Video) ist eingeschränkt. Für viele Schweizer KMU-Anwendungen reicht Apertus völlig, für andere ist es ein Baustein in einer Multi-Modell-Architektur.

#### Praktische TYTOS-Erfahrungen mit Apertus

Wir setzen Apertus 70B produktiv bei zwei Treuhand-Mandaten ein (Belegerfassung und Lohnbuchhaltungs-Q&A), bei einem Versicherungs-Mandanten als DSG-Strict-Klassifikator vor dem Eskalations-Knoten, und bei einer Anwaltskanzlei als Vorlagen-Generator für Schweizer Standard-Verträge. Beobachtungen: bei klar abgegrenzten Aufgaben mit gut formuliertem System-Prompt ist die Qualität für KMU-Verhältnisse sehr gut. Bei sehr offenen Aufgaben ohne klaren Rahmen fällt Apertus deutlich hinter Claude zurück. Die Antwort ist nicht 'welches Modell ist besser' — sondern 'welcher Rahmen passt zu welchem Modell'.

#### Was kostet ein Apertus-Setup?

Drei Kostenebenen. (1) Swisscom-API ohne eigenes Hosting: vergleichbar mit GPT-4 ($3–10 / 1M Token), Setup-Aufwand: gering. (2) AWS SageMaker mit dediziertem Endpoint: ca. 800–1'500 CHF/Monat für eine permanente Inference-Instanz, plus Datentransfer. (3) Selbst-Hosting on-premise: Hardware-Initial 60'000–120'000 CHF, dann nur Strom und Wartung — sinnvoll bei sehr hohem Volumen oder absoluten Daten-Souveränitäts-Anforderungen. TYTOS unterstützt alle drei Wege; wir empfehlen pro Use-Case den passenden — meist Swisscom oder AWS, nur in Sonderfällen Selbst-Hosting.

---

### KI-Modelle für Schweizer KMU 2026 — der Entscheidungs-Guide
**URL:** https://ai.tytos.ch/wissen/ki-modelle-fuer-schweizer-kmu-2026
**Typ:** leitfaden
**Frage:** Wie wähle ich als Schweizer KMU im Mai 2026 das passende Sprachmodell für meinen Anwendungsfall?
**Stand:** 2026-05-13
**Wörter:** 1740
**Keywords:** LLM Auswahl, Modell Vergleich KMU, Claude Apertus GPT, Schweizer AI, Multi-Modell Architektur, Modell Routing

**Kurze Antwort:** Die Modell-Auswahl folgt sechs Dimensionen: Reasoning-Tiefe, Multimodalität, Sprach- und Hosting-Anforderungen, Latenz, Kosten und regulatorischer Rahmen. Für die meisten KMU-Anwendungen 2026 ist die Kombination Claude Opus 4.7 (komplexes Reasoning) plus Apertus 70B (DSG-strict-Anteile) plus GPT-5 (Voice und Multimodal) das robusteste Setup. Reine Single-Vendor-Lösungen funktionieren — aber sie hinterlassen Performance- oder Compliance-Lücken.

#### Die sechs Auswahl-Dimensionen

Bei der Modell-Wahl prüfen wir bei TYTOS sechs Dimensionen. (1) Reasoning-Tiefe — wie komplex ist die Entscheidungslogik? Vertrags-Analyse, Steuerfälle, mehrstufige Belegerfassung verlangen viel. Standardisierte Klassifizierung wenig. (2) Multimodalität — sind Bilder, Audio, Video Teil des Inputs? Schadensmeldungen mit Foto, Voice-Telefonie, Video-Verarbeitung. (3) Sprache — Schweizerdeutsch in geschriebener Form ist für Tonalität wichtig, mündlich (Voice) wird es kniffliger. (4) Latenz — Voice und interaktive UIs brauchen <300ms, batch-Prozesse vertragen Sekunden bis Minuten. (5) Kosten — Pro-Token-Kosten × erwartetes Volumen. (6) Regulatorischer Rahmen — DSG, FINMA, BGFA, EU AI Act, Branchen-Spezifika.

#### Decision Tree pro Use-Case

Frage 1: Daten besonders schützenswert oder regulatorisch streng? Wenn JA → Apertus 70B oder Apertus-via-Swisscom als Default. Frage 2: Voice-Realtime nötig? Wenn JA → GPT-5 / gpt-realtime-2 (Stand Mai 2026 alternativlos). Frage 3: Multimodal (Bild/Video)? Wenn JA → GPT-5 oder Claude Opus 4.7. Frage 4: Sehr komplexes Reasoning oder lange Kontexte (>200k Tokens)? Wenn JA → Claude Opus 4.7. Frage 5: Hohes Volumen, einfache Klassifikation? Wenn JA → Apertus 8B oder Mistral Mid. Frage 6: Schweizer Tonalität in Text wichtig? Wenn JA → Apertus oder Claude (beide stark in DE-CH).

#### Typische KMU-Architektur 2026

Eine robuste Produktiv-Architektur für ein 50–200-MA-KMU sieht meist so aus: Apertus 8B als billiger Triage-Klassifikator (was kommt rein?), Claude Opus 4.7 für komplexe Bearbeitungen (Belegerfassung mit MwSt-Nuancen, Vertrags-Auswertung, Korrespondenz), GPT-5 für Voice und Multimodal-Strecken, ein zentrales LiteLLM- oder OpenRouter-Gateway, das Routing und Failover steuert. Kosten-Tracking pro Use-Case ist in der Gateway-Schicht eingebaut. Bei Modell-Ausfall springt automatisch ein Sekundär-Modell ein. Diese Architektur kostet im Initialbau 8'000–25'000 CHF und macht die Organisation Modell-agnostisch — was bei der aktuellen Geschwindigkeit der Modell-Releases extrem wertvoll ist.

#### Häufiger Fehler 1: Vendor-Lock-in unterschätzen

Viele KMU starten mit ChatGPT-Business und kleben dann fest. Das ist ein Risiko: Preise können sich verändern, Modelle werden ohne Warnung aktualisiert, Verfügbarkeit ist nicht garantiert, regulatorische Anforderungen können hinterherkommen. Die Antwort: von Anfang an eine Abstraktions-Schicht. LiteLLM, OpenRouter, Vercel AI Gateway — alle bieten standardisierte APIs über mehrere Anbieter hinweg. Initialaufwand: marginal. Schutz gegen Lock-in: erheblich. Bei TYTOS ist das Standard, nicht Option.

#### Häufiger Fehler 2: Auf Benchmarks statt eigene Tests vertrauen

Modell-Benchmarks (MMLU, HumanEval, BIG-Bench) korrelieren begrenzt mit KMU-Praxisleistung. Was wirklich zählt: 50–100 echte Beispiel-Fälle aus Ihrem Prozess durchspielen, beide Kandidaten-Modelle nebeneinander laufen lassen, Fehlerquote und Qualität dokumentieren. Das kostet zwei bis vier Tage Aufwand — und zahlt sich vielfach aus. Ein Modell, das im Benchmark vorne liegt, kann an Ihrer konkreten Aufgabe scheitern, weil die Benchmark-Mustern nicht zu Ihren Daten passen.

#### Häufiger Fehler 3: Modell-Update-Strategie fehlt

Im Jahr 2026 erscheinen alle 4–8 Wochen relevante Modell-Updates. Wer nicht aktiv tracked, läuft mit veralteten Modellen — und verschenkt Qualität, Kosten und Geschwindigkeit. TYTOS empfiehlt: ein leichter Monitoring-Prozess. Quartalsweise prüfen, welche Modelle neu sind, ob ein Update der eigenen Pipelines sinnvoll ist, ob die Modell-Routing-Regeln angepasst werden müssen. Ein klares Versions-Pinning in Produktion, ein Staging mit aktuellen Modellen, ein A/B-Test bei substantiellen Wechseln.

#### Häufiger Fehler 4: Kosten-Trapping

Kosten-Fallen sind subtil. (1) Token-Inflation durch zu lange System-Prompts (besonders teuer bei Premium-Modellen). (2) Streaming-Antworten ohne Length-Cap. (3) Embedding-Generierung in Schleife bei Vector-Stores. (4) Tool-Calls ohne Caching. (5) Fehlende Rate-Limits, die ein einzelner Bug-Burst zu sehr teuren Stunden machen kann. Lösung: pro Use-Case ein monatliches Kostenlimit konfigurieren, Token-Usage pro Endpoint loggen, regelmässig (monatlich) Cost-Review machen. Bei TYTOS gehören diese Kontrollen zum Standard-Setup.

#### Was Tim Gashi konkret empfiehlt für Standard-KMU

Für ein typisches Schweizer KMU (50–150 MA, klassische Branche, keine extremen DSG-Strengen), das im Mai 2026 startet, ist der pragmatische Vorschlag: Claude Opus 4.7 als Haupt-Modell, Sonnet 4.7 für volume-heavy Strecken, GPT-5 nur für Voice-/Multimodal-spezifische Aufgaben, Apertus 70B optional als Strict-Klassifikator vor Bearbeitung sensitiver Daten. Initiales Modell-Budget: 300–800 CHF/Monat. Architektur via Vercel AI Gateway oder LiteLLM. Quartals-Review der Modell-Wahl. Bei FINMA-/BGFA-Mandanten verschiebt sich der Mix Richtung Apertus stark — das gehört dann zum Modell-Audit am Anfang.

---

### Was ist Voice AI Realtime? Definition und KMU-Einsatz 2026
**URL:** https://ai.tytos.ch/wissen/was-ist-voice-ai-realtime
**Typ:** definition
**Frage:** Was ist Voice AI Realtime und wie können Schweizer KMU diese Technologie 2026 einsetzen?
**Stand:** 2026-05-13
**Wörter:** 1620
**Keywords:** Voice AI, gpt-realtime-2, Voice Bot, Telefon AI, Schweizer Voice AI, WebRTC AI

**Kurze Antwort:** Voice AI Realtime bezeichnet Sprachmodelle, die natürlich-flüssige Telefonate führen können — mit Latenzen unter 300 ms, Unterbrechungs-Toleranz, mehrsprachiger Verständigung und nativer Audio-Verarbeitung (kein Text-Zwischenschritt). Stand Mai 2026 ist gpt-realtime-2 von OpenAI die führende Technologie, mit Apertus-Voice-Varianten in der Pipeline. Für KMU sinnvoll bei Erst-Beratung, Lead-Qualifizierung, Terminkoordination, einfacher Support-Triage — nicht für sensitive Beratungen mit haftungsrelevanten Aussagen.

#### Warum Voice AI 2026 ein eigenes Thema ist

Bis Ende 2024 waren Voice-Bots ein zweistufiges System: Speech-to-Text (Whisper, Google STT), dann Text-Modell, dann Text-to-Speech (ElevenLabs, AWS Polly). Latenzen lagen bei 1–3 Sekunden, Tonalität klang oft mechanisch. Mit gpt-realtime (Mai 2025) und gpt-realtime-2 (Mai 2026) verarbeiten Modelle Audio direkt — Eingang und Ausgang sind echte Sprachwellen. Latenzen sinken auf 200–500 ms, der Bot kann unterbrochen werden, lacht, atmet, hört zu. Das verändert den Anwendungsraum komplett.

#### Wie Voice AI technisch funktioniert

Ein Voice-Agent besteht 2026 aus folgenden Schichten. (1) Transport: meist WebRTC für Browser-zu-Modell-Verbindungen, SIP/PSTN-Bridges für klassische Telefonate. (2) Modell-API: bei OpenAI ephemerale Tokens, Data-Channel für Events, Audio-Streams. (3) Tool-Layer: Funktionen, die das Modell aufrufen kann (Termin buchen, CRM-Eintrag, Mail senden). (4) Knowledge-Layer: System-Prompt mit Firmen-Wissen plus optional RAG-Anbindung. (5) Audit-Trail: Transkript, Tool-Calls, Eskalationen werden geloggt. Mira auf ai.tytos.ch ist ein produktives Beispiel dieser Architektur — vollständig WebRTC, direkter Stream, keine Zwischen-STT/TTS.

#### KMU-Use-Cases, die jetzt funktionieren

Stand Mai 2026 funktionieren in der Schweizer KMU-Praxis robust: (1) Erst-Beratung und Lead-Qualifizierung — ein Voice-Agent nimmt Anrufe ausserhalb der Bürozeiten an, qualifiziert, vereinbart Termin. (2) Termin-Koordination — Verfügbarkeiten abklären, Slots vorschlagen, Bestätigungs-SMS auslösen. (3) Erst-Support-Triage — Anliegen klassifizieren, Standard-Fragen beantworten, an passenden Menschen routen. (4) Outbound-Befragungen für Kundenforschung. (5) Service-Erinnerungen mit interaktiver Rückfrage-Möglichkeit (Lieferanten- und Wartungs-Routinen).

#### Was Voice AI NICHT übernehmen sollte

Genauso wichtig wie Use-Cases sind die Gegen-Use-Cases. Voice AI sollte 2026 NICHT übernehmen: (1) Sensitive Beratungen mit Haftungs-Folgen (Versicherungs-Tarife, Rechtsberatung, Steuerberatung), (2) Emotional belastete Gespräche (Schadensmeldung mit Personenschaden, Reklamationen mit hoher Eskalations-Wahrscheinlichkeit), (3) Erstkontakt zu wichtigen Geschäftspartnern (Erstkontakt zwischen CEOs ist menschlich), (4) Verkaufsgespräche mit hohem Vertragsvolumen (>20'000 CHF). Die Regel: Voice AI für hoch-volumige, low-Stakes-Gespräche. Menschen für niedrig-volumige, high-Stakes-Gespräche.

#### DSG- und Transparenz-Pflichten bei Voice AI

Bei Telefon-Voice-AI gilt revDSG voll. Wichtige Punkte: (1) Transparenz — der Anrufer muss zu Beginn erfahren, dass er mit einer KI spricht (ausser bei reinen IVR-Funktionen). (2) Recht auf menschliche Bearbeitung — bei wesentlichen Entscheidungen muss eine Eskalations-Option bestehen. (3) Aufzeichnungs-Hinweis falls Mitschnitt erfolgt. (4) Datenminimierung — nur das aufzeichnen, was für den Zweck nötig ist. (5) Löschfristen — Audio nach Abschluss des Vorgangs typisch nach 30–90 Tagen löschen, falls nicht für Audit aufzubewahren. TYTOS-Voice-Agenten haben diese Punkte by-default eingebaut.

#### Kosten und Latenz

gpt-realtime-2-Kosten Stand Mai 2026: ca. $20 / 1M Input-Audio-Token, $40 / 1M Output-Audio-Token. Eine 5-minütige Konversation kostet typisch $0.15–0.40, je nach Sprech-Dichte und Tool-Calls. Bei 200 Anrufen/Monat: 30–80 CHF reine Modell-Kosten. Latenz: typisch 250–400 ms First-Token, durchgängig flüssig genug für natürliches Empfinden. Bei Voice-Anrufen via SIP/PSTN (klassische Telefonleitung) kommen Telco-Kosten dazu — typisch 1–3 Cent/Minute via Twilio oder Vonage. Für ein KMU mit 500 Anrufen/Monat ist Voice AI eine 80–250 CHF/Monat-Investition.

#### Voice AI auf Schweizerdeutsch — Status Mai 2026

gpt-realtime-2 beherrscht Schweizer Standarddeutsch sehr ordentlich und kann Schweizerdeutsch (Mundart) hören und entschlüsseln — aber die Antwort kommt zuverlässig nur in Standarddeutsch zurück. Für KMU-Use-Cases mit Schweizer Kundschaft funktioniert das in der Praxis sehr gut: der Anrufer spricht Dialekt, der Agent versteht und antwortet höflich-hochdeutsch. Voll-Mundart-Output ist Stand Mai 2026 noch kein produktiver Standard — die wenigen Ansätze (Apertus-Voice-Prototypen, einzelne Open-Source-Projekte) sind experimentell. TYTOS empfiehlt: Verstehen Dialekt, Antworten Hochdeutsch — das ist 2026 die ehrliche Empfehlung.

#### Die Mira-Erfahrung als Live-Beispiel

Mira auf ai.tytos.ch ist eine produktive Voice-Concierge, gebaut mit gpt-realtime-2 (voice 'marin'), WebRTC raw, 8 Function-Tools, Upstash-Rate-Limit. Die Architektur ist auf der Site dokumentiert und kann live ausprobiert werden. Mira führt durch das Angebot, beantwortet Fragen, navigiert auf Wunsch zu Detailseiten, kann ein WhatsApp-Follow-up oder eine Mail an Tim auslösen. Sie ist klar als KI gekennzeichnet, hat eine 5-Minuten-Cutoff-Schranke, ein striktes Rate-Limit (2 Sessions / 24h / IP) und einen vollständigen Audit-Trail. Wer einen Voice-Agent für sein KMU plant, kann mit Mira sprechen, bevor er mit Tim spricht.

---

### EU AI Act in der Schweiz — was KMU 2026 wirklich beachten müssen
**URL:** https://ai.tytos.ch/wissen/eu-ai-act-schweiz
**Typ:** leitfaden
**Frage:** Gilt der EU AI Act für mein Schweizer KMU, und was muss ich konkret tun?
**Stand:** 2026-05-13
**Wörter:** 1720
**Keywords:** EU AI Act, AI Act Schweiz, KI Regulierung 2026, Marktortprinzip, AI Compliance KMU, Hochrisiko KI

**Kurze Antwort:** Der EU AI Act gilt für Schweizer Unternehmen nach dem Marktortprinzip — sobald Ihre KI-Anwendung EU-Bürgern dient oder Auswirkungen in der EU hat. Stand Mai 2026 sind die Pflichten für verbotene Praktiken und General-Purpose-AI in Kraft, die Hochrisiko-Regulierung wurde per Omnibus-Verordnung vom Mai 2026 um 12–16 Monate verschoben. Schweizer KMU müssen: AI-Inventar erstellen, Risiko-Klassifikation pro Anwendung machen, Transparenz-Pflichten umsetzen, KI-Kompetenz im Team sicherstellen.

#### Warum der EU AI Act Schweizer KMU betrifft

Der EU AI Act folgt dem Marktortprinzip — wie schon DSGVO. Konkret: sobald Ihre KI-Anwendung in der EU Wirkung entfaltet (EU-Bürger als Nutzer, EU-Output, EU-Datensubjekt), greift die Verordnung — unabhängig davon, wo Ihr Unternehmen sitzt. Schweizer KMU mit EU-Kunden oder EU-grenzüberschreitendem Geschäft sind betroffen. Das gilt für E-Commerce mit EU-Versand, B2B-Software mit EU-Anwenderbasis, Dienstleister, die EU-Mandanten bedienen, und Hersteller, deren Produkte EU-CE-Märkte erreichen. Reine Inland-CH-KMU ohne EU-Kontakte sind formal ausgenommen — aber: viele Compliance-Anforderungen werden in Schweizer Sektoraufsicht ohnehin nachgezogen werden.

#### Die vier Risiko-Klassen

Der EU AI Act teilt KI-Systeme in vier Klassen. (1) Verbotene Praktiken — z.B. soziale Scorings, manipulative Manipulationen, unzulässige biometrische Klassifikation. Anwendbar seit Februar 2025. (2) Hochrisiko-Systeme — z.B. KI in HR (Bewerber-Screening), Bonität, Bildung, Strafverfolgung, kritischer Infrastruktur. Strenge Pflichten: Risikomanagement, Datengovernance, technische Dokumentation, Aufzeichnungen, Transparenz, menschliche Aufsicht, Genauigkeits- und Robustheitsanforderungen. Verschoben durch Omnibus-Verordnung Mai 2026 auf 2027 und teilweise 2028. (3) Limited-Risk-Systeme — Transparenzpflichten (Chatbots, Deepfakes, generierte Inhalte). Anwendbar August 2026. (4) Minimal-Risk — keine spezifischen Pflichten.

#### Die Omnibus-Verordnung Mai 2026

Am 6. Mai 2026 hat die EU-Kommission die Omnibus-Verordnung zum AI Act verabschiedet, die folgende Erleichterungen brachte: (1) Hochrisiko-Pflichten für eigenständige Systeme um 16 Monate verschoben. (2) Hochrisiko-Pflichten für produkt-integrierte Systeme um 12 Monate verschoben. (3) Vereinfachte technische Dokumentation für KMU. (4) Reduzierte Gebühren für Konformitätsbewertungen proportional zur Unternehmensgrösse. (5) Priorisierter Zugang zu regulatorischen Sandboxes für KMU. Diese Anpassungen geben Schweizer KMU bis ca. Frühjahr 2027 Zeit, sich auf Hochrisiko-Anforderungen vorzubereiten — das verändert die Roadmap signifikant.

#### Was die Schweiz selbst macht

Der Bundesrat hat im Q1 2025 entschieden: kein eigenes umfassendes KI-Gesetz, sondern gezielte Anpassungen bestehender Gesetze und branchenspezifische Regelungen. Im März 2025 hat die Schweiz die KI-Konvention des Europarates unterzeichnet — der erste völkerrechtliche Vertrag zu Künstlicher Intelligenz. Bis Ende 2026 wird eine Vernehmlassungsvorlage erarbeitet, die notwendige gesetzliche Anpassungen ausweist. Für KMU heisst das: das Schweizer Aufsichts-Konzept folgt dem EU-Modell in den Kernpunkten, aber mit weniger formellen Konformitäts-Bewertungen und mehr Auf-Aufsichts-Ebene. revDSG bleibt der wichtigste rechtliche Hebel.

#### Was ein KMU 2026 konkret tun sollte

Pragmatische Schritte für ein Schweizer KMU 2026. Schritt 1: AI-Inventar. Welche KI-Tools sind im Unternehmen im Einsatz (auch SaaS-Tools wie M365 Copilot, ChatGPT-Business, Jasper)? Schritt 2: Pro Tool eine Risiko-Einordnung. Ist es verbotene Praxis (vermutlich nein, aber prüfen)? Ist es Hochrisiko (z.B. HR-Screening, Kreditbewertung)? Ist es Limited Risk (z.B. Chatbot)? Schritt 3: Transparenz umsetzen — Limited-Risk-Tools brauchen klare Hinweise (Chatbot-Kennzeichnung, Deepfake-Markierung). Schritt 4: KI-Kompetenz im Team — Schulungen für betroffene Mitarbeitende. Schritt 5: Bei Hochrisiko-Tools: technische Dokumentation, Genauigkeitsmessung, Aufzeichnungspflicht, menschliche Aufsicht definieren.

#### Häufige Missverständnisse

Missverständnis 1: 'Wir sind ein CH-KMU, der AI Act betrifft uns nicht.' — Falsch, sobald EU-Bezug besteht. Missverständnis 2: 'Wir nutzen nur ChatGPT, das ist nicht Hochrisiko.' — Korrekt für die meisten Anwendungen, aber wenn ChatGPT z.B. für Bewerber-Screening verwendet wird, wechselt die Klassifikation. Missverständnis 3: 'GPAI-Anbieter (OpenAI, Anthropic) sind verantwortlich, nicht wir.' — Anbieter haben eigene Pflichten, ABER der Betreiber (also Sie) hat separate Pflichten je nach Einsatz. Missverständnis 4: 'Wir warten ab, bis es Klarheit gibt.' — Genau das hat die Omnibus-Verordnung erlaubt — aber Warten heisst nicht Nichts-Tun. Inventar und Kompetenzaufbau sollten jetzt starten.

#### Sanktionen bei Verstössen

Der EU AI Act sieht abgestufte Sanktionen vor. Bei verbotenen Praktiken: bis zu 35 Mio. € oder 7 % des weltweiten Jahresumsatzes — je höher. Bei Hochrisiko-Pflichten oder Verstössen gegen Transparenz: bis zu 15 Mio. € oder 3 %. Bei falschen Angaben gegenüber Behörden: bis zu 7.5 Mio. € oder 1.5 %. Für KMU gelten reduzierte Höchstgrenzen — der niedrigere der beiden Werte greift. Trotzdem sind die Bussen substantiell. Für Schweizer KMU heisst das: pragmatisch, aber ernsthaft umsetzen. Nicht weil die EU sofort prüft — sondern weil Compliance-Schulden in 2–3 Jahren teuer werden.

#### Wie TYTOS unterstützt

TYTOS unterstützt Schweizer KMU bei drei Aspekten der EU-AI-Act-Compliance. (1) AI-Inventar und Risiko-Einordnung — wir gehen mit Ihnen durch alle eingesetzten Tools und klassifizieren. (2) Architektur-Anpassung — wir bauen Audit-Trail, Transparenz-Layer, Human-in-the-Loop-Mechanismen in Ihre Pipelines. (3) Dokumentations-Pakete für Hochrisiko-Anwendungen — falls relevant. Wichtig: TYTOS ist keine Rechtsberatung — wir arbeiten ergänzend zur Rechts-/Compliance-Funktion. Für die juristische Beurteilung empfehlen wir Schweizer Kanzleien mit AI-Spezialisierung (z.B. Steiger Legal, MLL Legal, VISCHER, Hindshaw).

---

### revDSG und KI — der Praxis-Leitfaden für Schweizer KMU 2026
**URL:** https://ai.tytos.ch/wissen/revdsg-und-ki
**Typ:** leitfaden
**Frage:** Was muss ein Schweizer KMU beim Einsatz von KI-Anwendungen unter dem revidierten DSG beachten?
**Stand:** 2026-05-13
**Wörter:** 1750
**Keywords:** revDSG, DSG KI, Datenschutz AI Schweiz, EDÖB, Auftragsbearbeitungsvertrag, DSG Personendaten

**Kurze Antwort:** Das revidierte DSG (in Kraft seit 1.9.2023) ist technologieneutral und damit direkt auf KI anwendbar — es braucht kein separates KI-Gesetz. Schweizer KMU müssen bei KI-Einsatz mit Personendaten folgende Pflichten erfüllen: Auftragsbearbeitungsvertrag (DPA) mit Modell-Anbieter, Transparenz gegenüber Betroffenen, dokumentierter Zweck der Datenbearbeitung, technische und organisatorische Massnahmen, Recht auf manuelle Überprüfung bei automatisierten Einzelentscheidungen, besondere Sorgfalt bei besonders schützenswerten Daten.

#### Warum das revDSG für KI relevant ist

Der EDÖB (Eidgenössischer Datenschutz- und Öffentlichkeitsbeauftragter) hat im Update 2024 klargestellt: das revidierte Datenschutzgesetz ist technologieneutral und damit ohne separate Anpassungen auf KI-Verarbeitungen anwendbar. Personendaten — also Angaben, die sich auf eine bestimmte oder bestimmbare Person beziehen — fallen unter das revDSG, sobald sie automatisiert verarbeitet werden. Eine KI-Anfrage an OpenAI mit einer Mail eines Kunden enthält Personendaten. Eine Belegerfassung mit Lieferanten-Daten enthält Personendaten. Ein Voice-Agent, der Anrufer-Stimmen verarbeitet, enthält Personendaten — und ggf. biometrische Daten als besonders schützenswerte Kategorie.

#### Die fünf zentralen Pflichten

Pflicht 1: Auftragsbearbeitungsvertrag (DPA) mit jedem Anbieter, der in Ihrem Auftrag Personendaten verarbeitet — OpenAI, Anthropic, Google, Swisscom (für Apertus), Hosting-Provider. Standardverträge der Anbieter sind meist OK, sollten aber geprüft werden. Pflicht 2: Transparenz — Betroffene wissen, dass ihre Daten verarbeitet werden, vom wem, zu welchem Zweck. Datenschutzerklärung pflegen. Pflicht 3: Zweckbindung — Daten dürfen nur für den deklarierten Zweck verarbeitet werden. Chat-Verläufe nicht heimlich für Modell-Training verwenden. Pflicht 4: TOM (technische und organisatorische Massnahmen) — Zugriffsbeschränkung, Verschlüsselung, Audit-Logging, Aufbewahrungsfristen. Pflicht 5: Rechte der Betroffenen — Auskunft, Berichtigung, Löschung, Widerspruch bei automatisierten Einzelentscheidungen.

#### Datentransfer in die USA — die DPF-Lage 2026

Viele KI-Anbieter (OpenAI, Anthropic, Google) sitzen in den USA. Datentransfer dorthin braucht eine Rechtsgrundlage. Stand Mai 2026: das Swiss-U.S. Data Privacy Framework (DPF) ist seit September 2024 in Kraft. Zertifizierte US-Anbieter (auf der DPF-Liste) bieten einen ausreichenden Schutz nach Schweizer Recht. ABER: Sie als Betreiber müssen prüfen, ob Ihr konkreter Anbieter zertifiziert ist (OpenAI, Anthropic und Microsoft sind es). Bei nicht zertifizierten Anbietern brauchen Sie Standardvertragsklauseln (SCC) als Rechtsgrundlage. Bei Verarbeitung besonders schützenswerter Daten ist die Hürde höher — hier ist EU- oder CH-Hosting deutlich risikoärmer.

#### Automatisierte Einzelentscheidungen — Art. 21 revDSG

Wenn eine KI eine Entscheidung mit Rechtswirkung oder erheblicher Bedeutung für die Person trifft (z.B. Kreditvergabe, Versicherungs-Tarifierung, automatisches Mahnverfahren, KI-basierte Entscheidung über Bewerbung) — gelten verschärfte Pflichten. (1) Betroffene Person muss über die Logik der Entscheidung informiert werden. (2) Recht auf menschliche Überprüfung. (3) Recht auf Stellungnahme. Die Praxis-Konsequenz: Human-in-the-Loop ist nicht nur gute Praxis, sondern bei wesentlichen Entscheidungen rechtliche Pflicht. TYTOS-Agenten haben standardmässig einen Eskalations-Knoten vor Entscheidungen mit Rechtswirkung.

#### Besonders schützenswerte Daten

revDSG Art. 5 lit. c definiert besonders schützenswerte Daten: religiöse, weltanschauliche, politische, gewerkschaftliche Ansichten, Gesundheit, Intimsphäre, Rassenzugehörigkeit, genetische Daten, biometrische Daten, Daten zu administrativen und strafrechtlichen Verfolgungen. Bei KI-Verarbeitung dieser Daten gelten strengere Pflichten: explizite Einwilligung, höhere TOM-Anforderungen, oft Schweizer Hosting empfohlen, in vielen Fällen ist eine Datenschutz-Folgenabschätzung (DSFA) erforderlich. Branchen mit hohem Anteil solcher Daten: Gesundheitswesen, Versicherung (Schaden mit Gesundheits-Aspekt), HR (Bewerbungen mit Gesundheits-Hinweisen), Anwaltskanzleien (Mandate mit strafrechtlichem Bezug).

#### Die DSFA-Pflicht (Datenschutz-Folgenabschätzung)

Eine DSFA ist erforderlich bei voraussichtlich hohem Risiko für die Persönlichkeit oder die Grundrechte. Bei KI typische Auslöser: automatisierte Einzelentscheidungen mit erheblicher Bedeutung, Verarbeitung besonders schützenswerter Daten in grossem Umfang, systematische Überwachung. Die DSFA enthält: Beschreibung des Vorhabens, Beurteilung der Notwendigkeit und Verhältnismässigkeit, Risiko-Identifikation für Betroffene, Massnahmen zur Risiko-Minderung. Bei verbleibendem hohem Risiko: vorherige Konsultation des EDÖB. Für viele KI-Projekte in Schweizer KMU mit moderaten Risiken ist eine DSFA nicht zwingend — aber eine strukturierte interne Risiko-Notiz immer empfehlenswert.

#### Praktische Umsetzungs-Checkliste

Bei jedem neuen KI-Use-Case in TYTOS-Projekten gehen wir diese Liste durch. (1) Werden Personendaten verarbeitet? — Wenn ja: weiter. (2) Welche Kategorien? — Standard oder besonders schützenswert? (3) Welcher Modell-Anbieter? — DPA prüfen, ggf. abschliessen. (4) Wo sitzt der Anbieter? — CH/EU/DPF-USA/andere? (5) Welche Aufbewahrungsfrist? — Default 30–90 Tage, dann automatische Löschung. (6) Audit-Logging eingebaut? — Wer hat wann was abgefragt/entschieden. (7) Eskalations-Knoten vor wesentlichen Entscheidungen? — Pflicht bei automatisierten Einzelentscheidungen. (8) Datenschutzerklärung aktualisiert? — KI-Verarbeitung muss erwähnt sein. (9) DSFA nötig? — Wenn hohes Risiko, ja.

#### Wo Sie weiterführende Beratung brauchen

TYTOS ist Technik-Partner mit revDSG-Praxis-Erfahrung, aber wir sind keine Anwälte. Bei folgenden Punkten empfehlen wir spezialisierte juristische Beratung: (1) DSFA mit verbleibendem hohem Risiko (EDÖB-Konsultation). (2) Branchenrechtliche Spezial-Pflichten (FINMA, BGFA, KKG). (3) Vertragsgestaltung bei komplexen Multi-Anbieter-Setups. (4) Klärung von Konflikten zwischen revDSG und ausländischen Anforderungen (US Cloud Act). Wir arbeiten regelmässig mit Schweizer Datenschutz-Anwälten zusammen und können gezielt empfehlen, wenn ein Mandat das braucht. Die meisten KMU-Standard-Anwendungen lassen sich aber ohne separate Anwalts-Mandate sauber umsetzen.

---

### DSG-konforme KI-Implementierung — Architektur-Patterns 2026
**URL:** https://ai.tytos.ch/wissen/dsg-konforme-ki-implementierung
**Typ:** leitfaden
**Frage:** Wie baut man eine DSG-konforme KI-Anwendung konkret — welche Architektur-Patterns sind 2026 etabliert?
**Stand:** 2026-05-13
**Wörter:** 1780
**Keywords:** DSG Architektur, Privacy by Design AI, DSG-konform KI, Schweizer Hosting, AI Compliance Architektur

**Kurze Antwort:** Eine DSG-konforme KI-Architektur ruht auf sieben Säulen: Datenminimierung, Verarbeitungs-Region (CH/EU-Hosting), Audit-Trail, Zugriffskontrolle, Verschlüsselung, Aufbewahrungsfristen, Eskalations-/Human-Override. Stand 2026 sind drei Patterns bewährt: das Edge-Gateway-Pattern (Vor-Filter sensitive Daten), das CH-Strict-Pattern (alle sensitiven Strecken auf Apertus/Swisscom), das Hybrid-Routing-Pattern (Anonymisierung + US-LLM für nicht-sensitive Anteile).

#### Die sieben Säulen einer DSG-konformen AI-Architektur

Säule 1: Datenminimierung — nur die Personendaten verarbeiten, die für den deklarierten Zweck notwendig sind. Säule 2: Verarbeitungs-Region — wo werden Daten verarbeitet, wo gespeichert, wer hat Zugriff? Säule 3: Audit-Trail — jede Verarbeitung und Entscheidung ist nachvollziehbar protokolliert. Säule 4: Zugriffskontrolle — wer in Ihrem Team darf welche KI-Funktion benutzen, RBAC-System. Säule 5: Verschlüsselung — Transit (TLS 1.3) und at-rest (AES-256). Säule 6: Aufbewahrung — definierte Löschfristen pro Datenkategorie. Säule 7: Human-Override — bei wesentlichen Entscheidungen muss eine Person eingreifen können. Diese sieben gelten zusammen — eine fehlende Säule reisst die Architektur ein.

#### Pattern 1: Edge-Gateway

Das Edge-Gateway-Pattern setzt einen Vor-Filter zwischen Ihre Anwendung und den Modell-Anbieter. Beim Eingang werden Personendaten erkannt (PII-Detection), pseudonymisiert oder anonymisiert, dann an das Modell weitergegeben. Beim Ausgang werden die Pseudonyme wieder durch echte Werte ersetzt — falls notwendig. Beispiel: Eine Mail mit Mandanten-Namen kommt rein, der Name wird durch [KUNDE_001] ersetzt, Claude bearbeitet die Mail, das Ergebnis kommt zurück mit Tag [KUNDE_001], wird beim Versand wieder rückübersetzt. Vorteil: das Modell sieht keine echten Personendaten. Nachteil: Komplexität, Risiko von Re-Identifikation in Sonderfällen.

#### Pattern 2: CH-Strict

Beim CH-Strict-Pattern fliessen alle Personendaten ausschliesslich über Schweizer Anbieter. Apertus 70B via Swisscom, Hosting bei einem Schweizer Cloud-Provider (Exoscale, Infomaniak, Swiss Backup), keine US-Anbieter im Pfad. Geeignet für: FINMA-regulierte Daten, BGFA-Mandanten-Daten, Gesundheitsdaten in spezifischen Settings, politisch sensitive Anwendungen. Vorteile: maximale Souveränität, vereinfachte Dokumentation. Nachteile: oft Kapazitäts-Limits, weniger Modell-Auswahl, höhere Kosten als US-Anbieter. Für viele KMU-Anwendungen unnötig streng — aber für bestimmte Branchen-Strecken die einzig vertretbare Option.

#### Pattern 3: Hybrid-Routing

Hybrid-Routing kombiniert die Stärken: ein Klassifikator prüft eingehende Anfragen auf Sensitivität, sensitive Strecken laufen über CH-Strict, nicht-sensitive über das stärkere US-Modell. Konkret: eine Mail kommt rein, ein leichter Klassifikator (Apertus 8B lokal) entscheidet 'enthält PII/sensitive Daten ja/nein'. Nein-Pfad: Claude Opus 4.7 mit DPF-konformer Verarbeitung. Ja-Pfad: Apertus 70B via Swisscom mit voll konformer Verarbeitung. Vorteil: Kosten-Effizienz und Qualität wo möglich, Strenge wo nötig. Nachteil: zwei Pfade pflegen, Klassifikator muss verlässlich sein.

#### Audit-Trail in der Praxis

Ein robuster Audit-Trail enthält pro KI-Verarbeitung: Zeitstempel, User-ID (wer hat angefragt), Input-Hash (was wurde verarbeitet, ohne dass Personendaten roh gespeichert sind), gewähltes Modell, Tool-Calls (welche Aktionen wurden ausgelöst), Output-Snippet (Zusammenfassung des Ergebnisses), Eskalationen, Bearbeitungs-Dauer, Cost. Speicherung: Postgres-Tabelle mit klarer Retention-Policy (typisch 18 Monate, dann gelöscht; bei FINMA-Daten 10 Jahre, gemäss Vorgabe). Für Branchen mit strikter Aufsicht (FINMA, BGFA) ist der Audit-Trail nicht nice-to-have sondern Pflicht-Bestandteil — und sollte als Erstes gebaut werden, nicht zuletzt.

#### Zugriffskontrolle und Rollen

RBAC (Role-Based Access Control) ist 2026 Standard. Typische Rollen in einer KMU-KI-Anwendung: User (kann Anfragen stellen, sieht eigene Historie), Reviewer (sieht Eskalationen, kann freigeben), Admin (Konfiguration, Logs, Cost), Auditor (read-only auf Audit-Trail, keine Verarbeitung). Wichtig: Service-Accounts (Maschine-zu-Maschine-Calls) bekommen eigene Tokens mit eingeschränkten Scopes, niemals User-Tokens für System-Calls verwenden. Two-Factor-Authentication für Admin-Rollen ist non-negotiable. Im Audit-Log ist klar nachvollziehbar, welche Rolle welche Aktion ausgelöst hat.

#### Aufbewahrungs- und Löschstrategie

Eine durchdachte Retention-Policy unterscheidet drei Datentypen. (1) Verarbeitungs-Inputs (Mails, PDFs, Texte): typisch 30–90 Tage, danach gelöscht — ausser regulatorische Aufbewahrungspflicht greift (z.B. 10 Jahre bei steuerrelevanten Belegen nach OR 958f). (2) Modell-Outputs und Bearbeitungs-Resultate: oft länger als Inputs, weil sie Teil der operativen Daten sind. Hier folgt die Frist der Geschäftslogik. (3) Audit-Logs: 12–24 Monate Standard, bis 10 Jahre bei regulatorischen Anforderungen. Wichtig: automatische Löschung implementieren, nicht manuell. Ein Cron-Job, der täglich abgelaufene Datensätze entfernt — und das Löschen selbst ins Audit-Log einträgt.

#### TOM — die zehn häufigsten technischen Massnahmen

Technische und organisatorische Massnahmen, die wir in TYTOS-Projekten standardmässig umsetzen. (1) TLS 1.3 für alle Verbindungen. (2) AES-256-Verschlüsselung at-rest. (3) Sealed-Secrets-Management (Vault, AWS Secrets Manager, kein .env in Git). (4) Schlüssel-Rotation alle 90 Tage. (5) Network-Isolation (private VPCs, keine öffentlichen DB-Endpoints). (6) Rate-Limiting auf API-Endpoints. (7) Anomalie-Erkennung im Audit-Log (ungewöhnliche Volumen, ungewöhnliche Zeiten). (8) Regelmässige Dependency-Scans (Snyk, Dependabot). (9) Backup-Strategie mit verschlüsselter Off-Site-Kopie. (10) Incident-Response-Plan dokumentiert. Diese zehn sind Mindeststandard, nicht Premium.

---

### KI in der Immobilienverwaltung — Use-Cases und Roadmap 2026
**URL:** https://ai.tytos.ch/wissen/ki-in-der-immobilienverwaltung
**Typ:** leitfaden
**Frage:** Welche KI-Use-Cases sind für Schweizer Immobilienverwalter 2026 produktionsreif, und wie führt man sie ein?
**Stand:** 2026-05-13
**Wörter:** 1820
**Keywords:** KI Immobilien Schweiz, AI Immobilienverwaltung, Expose Generator, Mietanfragen Bot, Nebenkosten Automation, PropTech Schweiz

**Kurze Antwort:** Für Schweizer Immobilienverwalter sind sechs KI-Use-Cases 2026 produktionsreif: Exposé-Generierung, Mietanfragen-Triage, Nebenkosten-Automation, Mietvertrags-Analyse, Mängelmeldungs-Routing, Wohnungs-Übergabe-Protokoll. Einführungs-Reihenfolge: Exposé und Mietanfragen zuerst (höchste Volumina, geringste Komplexität), dann Nebenkosten und Verträge (höheres Compliance-Gewicht), zuletzt komplexere Strecken. ROI typisch in 3–6 Monaten.

#### Warum die Immobilienbranche AI-affin ist

Die Immobilienverwaltung hat strukturelle Merkmale, die AI-Einsatz besonders lohnenswert machen. (1) Hoher Routine-Anteil: Exposés, Mietverträge, Hausordnungen, Übergabeprotokolle folgen Mustern. (2) Hohe Datenvielfalt: Objektdaten, Mieterkommunikation, Pläne, Fotos, Verträge — alles unstrukturiert. (3) Hoher Kommunikations-Volumen: Mietanfragen, Mängelmeldungen, Mietzins-Fragen, Heizkostenabrechnungen. (4) Komplexer regulatorischer Rahmen: OR (Mietrecht), revDSG, Energieausweis-Pflichten, kantonale Spezial-Regelungen. KI kann (1) und (2) effizient bearbeiten, (3) signifikant reduzieren, und bei (4) als unterstützender Layer dienen — Endverantwortung bleibt beim Menschen.

#### Use-Case 1: Exposé-Generierung

Aus Objektdaten (Grundriss, Fotos, Adresse, Mietzins, Nebenkosten) entsteht ein vollständiges Exposé in 2–3 Minuten statt 30–45. Die Architektur: Claude Opus 4.7 erhält strukturierte Objektdaten plus Foto-URLs, generiert Beschreibungstext in konsistenter Tonalität, ein Layout-Generator (Next.js + PDF-Renderer) baut die finale PDF. Lagebeschreibung wird via Mapbox-API geocodiert und mit lokalen Highlights angereichert. Konsistenz: jedes Exposé hat dieselbe Struktur, dieselbe Tonalität, dieselbe Bildaufteilung. ROI: bei 50 Exposés/Monat spart das ca. 30 Stunden — einen Tag pro Woche.

#### Use-Case 2: Mietanfragen-Triage

Eingehende Anfragen (Mail, Web-Formular) werden klassifiziert (ernsthaftes Interesse vs. Spam vs. Recherche-Anfrage), automatisch beantwortet mit Objekt-Spezifischen Details, qualifizierende Rückfragen gestellt (Budget, Einzugsdatum, Mitbewohner-Konstellation). Der Makler bekommt nur die Anfragen, die wirklich seine Aufmerksamkeit brauchen. Architektur: Mail-Inbox als Trigger, AI-Klassifikator (Apertus 8B oder Claude Haiku-Variante), Response-Template-Engine, CRM-Integration für Lead-Tracking. Compliance: alle Anfragen werden geloggt, automatische Antworten haben klaren KI-Hinweis, Eskalation bei spezifischen Schlüsselwörtern (Diskriminierungsverdacht, Mängel-Hinweis).

#### Use-Case 3: Nebenkosten-Automation

Die jährliche Nebenkostenabrechnung ist arbeits-intensiv: Heizkosten verteilen, Verbrauchsdaten anpassen, Mieter-spezifische Faktoren einbauen, PDF generieren, versenden, Rückfragen beantworten. AI-gestützte Automation: Verbrauchsdaten werden via OCR oder API-Anbindung gesammelt, Verteilungsschlüssel automatisiert angewendet (mit Audit-Trail), Abweichungen zu Vorjahren werden markiert, Mieter-spezifische PDFs generiert, mit individueller Erläuterung warum sich Beträge verändert haben. Rechtssicherheit: jede Berechnung ist nachvollziehbar dokumentiert. Bei Anfechtung kann der Verwalter den genauen Pfad nachweisen.

#### Use-Case 4: Mietvertrags-Analyse und Spezial-Klauseln

Bei Neumieten oder Übernahmen ist die Vertrags-Analyse zeitintensiv: Stammvertrag-Vergleich, Mieterstamm-Plausibilität, Abweichungen vom kantonalen Standard. AI extrahiert strukturiert: Parteien, Mietobjekt, Mietzins (Netto, Brutto, Nebenkosten-Verteilung), Laufzeit, Kündigungsfristen, Sonderklauseln. Abweichungen vom Standard werden markiert. Bei alten Verträgen werden Ablauffristen, Kündigungs-Optionen, Indexierungs-Schritte herausgelesen. Compliance: das Modell macht keine rechtlichen Bewertungen, sondern strukturiert die Inhalte. Die rechtliche Beurteilung bleibt beim Verwalter oder Rechtsberater.

#### Use-Case 5: Mängelmeldungs-Routing

Mieter melden Mängel per Mail, Telefon, Web-Formular. Die Triage ist: was ist Dringend (Wasserschaden), Standard (defekter Wasserhahn), Verzichtbar (gewünschte Anstrich-Renovation). AI-gestütztes Routing: jede Meldung wird klassifiziert (Dringlichkeit, Kategorie, betroffene Liegenschaft), an den zuständigen Handwerker oder Verwalter geroutet, der Mieter bekommt eine automatische Bestätigung mit erwarteter Bearbeitungs-Zeit. Bei kritischen Fällen (Personengefährdung, akute Schäden) wird sofort eskaliert — keine Wartezeit auf Bürozeiten.

#### Use-Case 6: Wohnungs-Übergabe-Protokoll

Bei Mieter-Wechsel ist das Übergabeprotokoll oft die schwächste Stelle: unvollständig, schlecht lesbar, juristisch heikel. AI-Unterstützung: der Verwalter macht Foto-Doku per Smartphone, AI klassifiziert die Bilder (Küche, Bad, Wohnzimmer, Aussenbereich), erkennt sichtbare Schäden oder Abnutzungen, generiert ein strukturiertes Protokoll als PDF. Foto-Hashes und Zeitstempel werden mitgespeichert. Bei Disput können Bilder mit Original-Metadaten als Beweismittel dienen. Wichtig: die AI ist Werkzeug, der Verwalter unterschreibt — die rechtliche Beurteilung bleibt menschlich.

#### Compliance-Spezifika für Immobilien

Beim AI-Einsatz in der Immobilienverwaltung gibt es branchenspezifische Compliance-Punkte. (1) Diskriminierungs-Verbot — automatische Filterung von Mietanfragen darf keine geschützten Merkmale (Herkunft, Familienstand, Religion) berücksichtigen. Selbst implizit über Korrelationen ist riskant. (2) Mietzins-Anpassung — Erhöhungen müssen schriftlich, rechtzeitig, mit Begründung erfolgen. AI kann unterstützen, aber nicht eigenständig auslösen. (3) Mängel-Mietzinsreduktion — automatische Berechnungen sind heikel, weil rechtliche Bewertung Einzelfall-spezifisch ist. (4) revDSG — Mieter-Daten sind Personendaten, oft mit Bonitäts-Informationen (besonders schützenswert). Hosting-Region und Audit-Trail entsprechend sorgfältig.

#### Einführungs-Roadmap für ein typisches Verwaltungs-KMU

Eine pragmatische Roadmap für eine Immobilienverwaltung mit 200–800 Verwaltungseinheiten. Monat 1–2: Inventar bestehender Prozesse, Volumina, IT-Landschaft. Monat 3: Pilot Use-Case 1 (Exposé-Generator) — gut messbar, niedriges Risiko, hohe Sichtbarkeit. Monat 4–5: Use-Case 2 (Mietanfragen-Triage) — höhere Komplexität, aber sofort spürbare Entlastung. Monat 6: Review, Anpassung, Mitarbeitenden-Feedback. Monat 7–9: Nebenkosten-Automation und Mängelmeldungs-Routing. Monat 10–12: Vertrags-Analyse, Übergabeprotokoll. Nach 12 Monaten: konsolidierte AI-Architektur, klare Cost-Kontrolle, Mitarbeitende sind Power-User. Investment: typisch 60'000–120'000 CHF im ersten Jahr, ROI typisch in Monat 6–8.

---

### KI in der Treuhandbranche — Belegerfassung, Compliance, Mandanten-Service
**URL:** https://ai.tytos.ch/wissen/ki-in-der-treuhandbranche
**Typ:** leitfaden
**Frage:** Wie kann ein Schweizer Treuhand-KMU KI praktisch einsetzen — ohne Audit-, Verantwortlichkeits- oder Mandanten-Beziehungs-Probleme?
**Stand:** 2026-05-13
**Wörter:** 1780
**Keywords:** KI Treuhand Schweiz, AI Belegerfassung, Buchhaltung Automation, Lohnbuchhaltung AI, Treuhand 4.0, Compliance Monitor

**Kurze Antwort:** Treuhandfirmen profitieren am stärksten von vier Use-Cases: AI-gestützte Belegerfassung (OCR + Kontierungs-Vorschlag), Mandanten-Mail-Automation (Standard-Anfragen direkt beantworten), Compliance-Monitor (Steuer-/MwSt-Änderungen tracken), Lohnbuchhaltungs-Assistenz (wiederkehrende Zyklen vereinfachen). Wichtig: Treuhand-Verantwortung bleibt beim Treuhänder, AI ist Werkzeug — Audit-Trail und Human-Review sind Standard, nicht Option. ROI typisch in Monat 4–6, Zeitersparnis 25–45 % bei Belegerfassung.

#### Warum die Treuhandbranche AI-affin ist

Treuhandfirmen sind wissens- und routine-intensiv zugleich. Eine durchschnittliche Schweizer Treuhandfirma verbringt 30–40 % der Kapazität mit Belegerfassung — Tätigkeit, die produktiv aber nicht beratend ist. Daneben: monatlich Lohnbuchhaltungs-Zyklen, Quartal-Abschlüsse, MwSt-Abrechnungen, Mandanten-Anfragen. Wenn AI hier ansetzt, gewinnen Mitarbeitende Zeit für die eigentliche Treuhand-Beratung — was die Marge erhöht und die Mandanten-Bindung stärkt. Gleichzeitig: Treuhand-Mandate sind rechtlich sensitiv (Steuergeheimnis, Datenschutz), das verlangt ein durchdachtes Setup.

#### Use-Case 1: AI-gestützte Belegerfassung

Der Klassiker. Ein Mandant schickt Belege per Mail (PDF, Foto, gescannt). Ein AI-Agent macht OCR, extrahiert Lieferant, Betrag, MwSt-Satz, Belegnummer, Datum, Zahlungsmittel, schlägt Kontierung vor (basierend auf historischen Buchungen des Mandanten), prüft auf Doppelbuchung. Der Sachbearbeiter sieht den Vorschlag, korrigiert ggf., gibt frei. Architektur: Mail-Inbox → OCR (z.B. Mistral Document AI, GPT-5 Vision, Apertus mit Vision-Extension) → Kontierungs-Vorschlag (Claude oder Apertus mit Mandanten-Buchungs-Historie) → Bexio/Abacus-Import. Zeitersparnis: 6–8 Minuten pro Beleg auf 30–60 Sekunden. Bei einer Treuhandfirma mit 500 Belegen/Woche: 35–45 Stunden gespart pro Woche.

#### Use-Case 2: Mandanten-Mail-Automation

Treuhandfirmen erhalten viele Standard-Anfragen: 'Wann gibt es den Lohnausweis?', 'Wie steht mein Kontostand?', 'Kann ich diese Spesen abziehen?', 'Wann ist die nächste MwSt-Abrechnung fällig?'. Ein AI-Agent beantwortet diese Standard-Anfragen direkt (mit Verweis auf das Mandanten-System), routet komplexere Anfragen an den zuständigen Treuhänder. Bei Anfragen, die rechtlich/steuerlich heikel sind, wird ohne Antwort eskaliert — der AI-Agent schreibt keine Steuer-Auskünfte. Architektur: Mail-Triage (Apertus 8B oder Claude Haiku), Antwort-Generator (Claude Opus 4.7), Mandanten-Stamm-Daten als Kontext, klare Eskalations-Regeln.

#### Use-Case 3: Compliance-Monitor

Schweizer Steuer- und MwSt-Recht ändert sich permanent: kantonale Steuergesetze, MwSt-Sätze, Sozialversicherungs-Beiträge, Pauschalbeträge. Ein Compliance-Monitor scannt regelmässig (täglich, wöchentlich) offizielle Quellen (Bundesgesetzgebung, kantonale Verwaltungen, ESTV, AHV), markiert Änderungen, ordnet sie den betroffenen Mandanten-Konstellationen zu. Der Treuhänder bekommt eine kuratierte Liste: 'Folgende Mandanten sind von der MwSt-Änderung X betroffen, hier sind die nötigen Anpassungen'. Architektur: Web-Scraping mit klaren Regeln, Diff-Detection, AI-Klassifikation (Claude — Reasoning-Tiefe wichtig), Mandanten-Matching aus interner DB.

#### Use-Case 4: Lohnbuchhaltungs-Assistenz

Lohnbuchhaltung ist hochzyklisch und routine-lastig: monatliche Lohnabrechnungen, Lohnausweis-Erstellung am Jahresende, AHV/IV/EO/ALV-Abrechnungen, Quellensteuer-Abzüge, Familienzulagen-Updates. Ein AI-Agent unterstützt: Stammdaten-Konsistenz prüfen, Sonderfälle (Pikettzulagen, Boni, Spesen) korrekt zuordnen, Plausibilitäts-Checks gegen Vormonat, Lohnausweis-Form-11-Generierung. Bei Sonderfällen (Auslandsbeschäftigung, Quellensteuer-Komplikationen, Doppelbesteuerungsabkommen) eskaliert der Agent ohne Versuch einer Antwort — Schwellwert ist Lohnabrechnungs-Standard, nicht Steuerberatung.

#### Mandanten-Geheimnis und Daten-Souveränität

Treuhand-Mandate sind besonders sensibel: Mandanten-Daten enthalten Umsätze, Kunden-Listen, Gehälter, Lieferanten — alles wirtschaftlich-wertvolle Information. Bei AI-Einsatz gilt: (1) DPA mit jedem Anbieter, der diese Daten verarbeitet. (2) Bevorzugt Schweizer Hosting (Swisscom-Apertus oder ähnlich) bei sensitiven Strecken. (3) Strikte Daten-Trennung pro Mandant — kein Modell-Training mit Mandanten-Daten, klare Isolation in der Architektur. (4) Audit-Trail — jede Anfrage an die KI ist nachvollziehbar. (5) Aufbewahrungsfristen — Mandanten-Daten haben oft 10-Jahres-Aufbewahrungspflicht (OR 958f), KI-Bearbeitungs-Logs sollten passen.

#### Was Treuhand-AI NICHT machen sollte

Klare Gegen-Use-Cases. (1) Steuer-Auskünfte mit rechtlicher Bindung — die rechtliche Beurteilung bleibt beim Treuhänder mit Treuhänder-Brevet. (2) Kontierungs-Freigabe ohne Human-Review — der Vorschlag ist Vorschlag, die Freigabe ist menschlich. (3) Auto-Zahlungsfreigabe an Lieferanten — egal wie sicher die Plausibilität, der Mensch unterschreibt. (4) Mandanten-Daten in Trainings-Daten geben — bei OpenAI/Anthropic sicherstellen, dass Enterprise-Settings ohne Training aktiviert sind. (5) Ungeprüfte Standard-Antworten zu rechtlich heiklen Fragen — Eskalation, nicht Antwort.

#### Einführungs-Roadmap für eine typische Treuhandfirma

Für eine Treuhandfirma mit 5–25 Mitarbeitenden ist die typische Roadmap. Monat 1: Prozess-Audit, Volumina-Aufnahme, IT-Landschaft (Bexio? Abacus? Topal? Cresus?). Monat 2: Pilot Belegerfassung für 2–3 Mandanten (Freiwillige) — niedrige Komplexität, sofort messbar. Monat 3–4: Rollout Belegerfassung auf alle Mandanten, Mitarbeitenden-Schulung. Monat 5–6: Mandanten-Mail-Automation und Compliance-Monitor. Monat 7–9: Lohnbuchhaltungs-Assistenz, Quartalsabschluss-Vorbereitung. Monat 10–12: Konsolidierung, Performance-Review, ggf. Custom-Strecken für Spezial-Mandate. Investment Jahr 1: 35'000–80'000 CHF, je nach Firmen-Grösse. ROI typisch in Monat 4–6, danach laufender Effizienz-Gewinn.

---

### KI in der Versicherung — Schaden, Antrag, Dokumenten-Intelligenz
**URL:** https://ai.tytos.ch/wissen/ki-in-der-versicherung
**Typ:** leitfaden
**Frage:** Wie können Schweizer Versicherungs-KMU (Makler, kleine Versicherer, Brokerhäuser) KI einsetzen ohne in FINMA- oder DSG-Konflikte zu geraten?
**Stand:** 2026-05-13
**Wörter:** 1750
**Keywords:** KI Versicherung Schweiz, AI Schadenmeldung, FINMA AI, Versicherung Automation, AVB Assistent

**Kurze Antwort:** Versicherer und Makler profitieren von fünf KI-Use-Cases: Schadensmeldungs-Triage, Antrags-Vollständigkeits-Check, Dokumenten-Assistent (Policen/AVB-Suche), Beratungs-Vorbereitung (Bedarfs-Analyse), Forderungs-Klassifikation. Wichtig: AI bereitet vor und triagiert — die Entscheidung mit Tarifierungs-, Schadens- oder Tarif-Folgen bleibt beim Experten. FINMA-Rundschreiben und revDSG setzen den Rahmen, nicht die AI-Möglichkeiten.

#### Warum die Versicherungsbranche AI-affin ist

Versicherungen leben von der Verarbeitung unstrukturierter Daten unter strukturierten Entscheidungsregeln. Schadensmeldungen kommen als Mails mit Fotos, Anträge als PDF-Formulare mit Beilagen, Beratungs-Anfragen als Telefonate oder Web-Formulare. Die Triage und Vorbereitung ist personal-intensiv, die finale Entscheidung verlangt Expertise — eine ideale Mensch-AI-Arbeitsteilung. Schweizer Versicherer (regulierte und Brokerhäuser) sehen die Effizienz-Gewinne, sind aber wegen FINMA-Rahmen und Reputations-Risiken zurückhaltend. Die Antwort 2026: Pilot in nicht-haftungsrelevanten Strecken (Triage, Vor-Klassifikation), schrittweise Ausweitung.

#### Use-Case 1: Schadensmeldungs-Triage

Eingehende Schadensmeldungen werden klassifiziert: Schaden-Art (Sach, Haftpflicht, Krank, Auto), Schwere (klein/mittel/gross), Dringlichkeit, Vollständigkeit der Unterlagen. Der zuständige Sachbearbeiter bekommt die Meldung vorbereitet, mit fehlenden Unterlagen markiert, mit Standard-Klassifikation. Architektur: Mail / Portal-Trigger → Multimodal-Modell (GPT-5 oder Claude Opus 4.7) für Bilder + Text → strukturierter Output an Sachbearbeiter-Cockpit. Eskalation: bei Schäden über CHF 100'000 oder bei Personenschaden direkt menschliche Bearbeitung, kein KI-Vorschlag.

#### Use-Case 2: Antrags-Vollständigkeits-Check

Neue Anträge oder Vertrags-Änderungen kommen oft unvollständig. AI prüft auf Vollständigkeit, schreibt Mandant höflich an mit konkreten Rückfrage-Punkten (im Tonfall der Firma), tracked Rückläufe. Das spart 30–60 % der manuellen Rückfrage-Zyklen. Architektur: PDF-OCR + Strukturierung (z.B. via PDF-Parser + Modell), Soll-Ist-Vergleich gegen Vertragsvorlage, Auto-Mail-Generator mit klarer KI-Kennzeichnung, Reminder-Zyklus. Compliance: Auto-Antworten als KI gekennzeichnet, Stornierungsmöglichkeit für den Antragsteller jederzeit.

#### Use-Case 3: Dokumenten-Assistent für AVB und Policen

Sachbearbeiter brauchen oft schnellen Zugriff auf Vertragsdetails: 'Ist Glasbruch in dieser Police gedeckt?', 'Welche Selbstbehalts-Regelung gilt?', 'Gibt es eine Wartezeit für diesen Schadensfall?'. Ein semantischer Dokumenten-Assistent durchsucht Policen und AVB, gibt die Antwort mit Klausel-Referenz und Seitenzahl. Architektur: Vector-Store mit allen Policen und AVB-Versionen (pgvector oder Pinecone), RAG-Pipeline mit Claude für Reasoning, klare Quellen-Referenz im Output, keine Antwort ohne Quelle. Dieses Pattern ist 2026 das Standard-Setup für jeden grösseren Versicherer.

#### Use-Case 4: Beratungs-Vorbereitung

Vor einer Versicherungs-Beratung muss der Makler verstehen: was hat der Kunde aktuell? Wo sind Lücken? Welche Produkte passen? AI unterstützt die Vorbereitung: Kunden-Stammdaten und bestehende Verträge werden aggregiert, Bedarfs-Analyse generiert (basierend auf Lebenssituation, Alter, Familienstand, Vermögen), Lücken markiert, passende Produkte vorgeschlagen. Im Gespräch ist der Makler optimal vorbereitet, ohne 2 Stunden Vorbereitungszeit. Wichtig: die finale Empfehlung gibt der Makler — die AI bereitet vor, sie verkauft nicht. Provisions-Optimierungen oder Kunden-Manipulationen sind explizit verboten in der Prompt-Architektur.

#### Use-Case 5: Forderungs-Klassifikation

Bei Schäden gehen Forderungen ein: Lieferanten-Rechnungen, Werkstatt-Belege, Mietminderungs-Berechnungen, Arzt-Rechnungen. AI klassifiziert: Wer fordert was, ist die Forderung plausibel, fehlen Belege? Bei Plausibilitäts-Bruch (z.B. Werkstatt-Rechnung > marktüblicher Preis für die Reparatur, Arzt-Rechnung mit ungewöhnlich hohen Sätzen) wird eskaliert. Audit-Trail dokumentiert jede AI-Bewertung. Compliance: keine automatische Ablehnung — AI markiert nur Auffälligkeiten, der Sachbearbeiter entscheidet.

#### FINMA-Rahmen für AI-Einsatz

Die FINMA hat 2024–2026 mehrere Rundschreiben und Hinweise veröffentlicht, die den AI-Einsatz strukturieren. Kernpunkte: (1) Verantwortlichkeit — bleibt beim regulierten Institut. AI ist Werkzeug, nicht Entscheider. (2) Modell-Risk-Management — bei wesentlichen AI-Anwendungen ist eine dokumentierte Modell-Validierung Pflicht. (3) Daten-Souveränität — bei FINMA-regulierten Daten ist EU/CH-Hosting Standard, US-Hosting nur mit besonderer Begründung. (4) Outsourcing-Regeln — wenn AI-Anbieter wie OpenAI im Pfad sind, gelten Outsourcing-Vorgaben (FINMA-RS 18/3). Praktische Konsequenz: TYTOS-Versicherungs-Projekte starten mit der Compliance-Architektur, nicht mit der KI-Funktionalität.

#### Einführungs-Roadmap für ein Versicherungs-KMU

Für ein Brokerhaus oder kleinere Versicherungs-KMU mit 20–80 Mitarbeitenden. Monat 1–2: Compliance-Setup (FINMA, revDSG, Outsourcing-Verträge), Architektur-Skizze, Hosting-Entscheidung. Monat 3: Pilot Schadensmeldungs-Triage in einem Segment (z.B. Hausrat) — niedrige Schadens-Volumina, klare Klassifikation. Monat 4–5: Antrags-Vollständigkeits-Check, AVB-Assistent. Monat 6: Review mit Mitarbeitenden, Compliance-Audit, Anpassungen. Monat 7–9: Beratungs-Vorbereitung, Forderungs-Klassifikation. Investment Jahr 1: 70'000–180'000 CHF, ROI typisch in Monat 7–10. Für regulierte Versicherer (FINMA-direkt) verlängert sich die Initial-Phase um 2–3 Monate für Modell-Validierung und FINMA-Abstimmung.

---

### Human-in-the-Loop — Definition und Schweizer Compliance-Praxis
**URL:** https://ai.tytos.ch/wissen/human-in-the-loop
**Typ:** definition
**Frage:** Was bedeutet Human-in-the-Loop bei KI-Anwendungen und wie setzt man es im Schweizer Compliance-Rahmen praktisch um?
**Stand:** 2026-05-13
**Wörter:** 1650
**Keywords:** Human in the Loop, HITL, AI Compliance, Eskalation AI, menschliche Aufsicht KI, Audit Trail

**Kurze Antwort:** Human-in-the-Loop (HITL) bezeichnet AI-Architekturen, bei denen Menschen an definierten Stellen eingreifen — entweder vor jeder Aktion (HITL strict), bei Unsicherheit (HITL with confidence), oder ex-post zur Qualitätskontrolle (Human-on-the-Loop). In der Schweizer regulierten Praxis ist HITL bei wesentlichen Entscheidungen rechtlich zwingend (revDSG Art. 21, FINMA-Rundschreiben, BGFA) und bei den meisten KMU-Anwendungen 2026 Standard.

#### Die drei HITL-Patterns

Pattern 1: HITL strict — jede AI-Aktion wird vor Ausführung von einem Menschen bestätigt. Geeignet für hochsensitive Anwendungen: Kreditvergabe, Versicherungs-Schaden-Auszahlung, juristische Beurteilung mit Mandanten-Wirkung. Vorteil: maximale Kontrolle. Nachteil: Mensch wird zum Flaschenhals, AI-Geschwindigkeitsvorteil geht verloren. Pattern 2: HITL with confidence — die AI bewertet die eigene Sicherheit, eskaliert bei Unsicherheit. Konkret: 'Confidence > 0.85 → automatisch ausführen, sonst → menschliche Bestätigung'. Pattern 3: Human-on-the-Loop — AI handelt autonom, Mensch reviewt stichprobenweise oder ex-post. Geeignet für hoch-volumige, low-stakes-Strecken. Im Schweizer regulierten Umfeld ist Pattern 2 der häufigste Kompromiss.

#### Wann HITL rechtlich Pflicht ist

Bei automatisierten Einzelentscheidungen mit Rechtswirkung oder erheblicher Bedeutung für die betroffene Person greift revDSG Art. 21: Recht auf menschliche Überprüfung, Recht auf Stellungnahme, Information über die Logik der Entscheidung. Konkrete Beispiele aus 2026: KI-basierte Kreditbewertungen, Bonitäts-Scores, Versicherungs-Tarifierungen, Bewerber-Vorauswahl. Auch wenn die AI nur 'Vorschläge' macht und der Mensch 'unterschreibt' — wenn die menschliche Prüfung in der Praxis nur formell ist, gilt das rechtlich als automatisierte Einzelentscheidung. Die ehrliche Implementation: echte menschliche Prüfung mit Möglichkeit zur Anpassung, dokumentiert im Audit-Trail.

#### Confidence-Scoring in der Praxis

Die meisten LLMs geben keine echten Confidence-Werte zurück (Anthropic und OpenAI haben Limit-Probit-Outputs nur eingeschränkt). Praktische Ansätze für Confidence-Schätzung: (1) Ensemble — zwei Modelle parallel laufen lassen, bei Übereinstimmung hohe Confidence, bei Disagreement eskalieren. (2) Self-Evaluation — das Modell wird gefragt 'wie sicher bist du?', Antwort wird strukturiert ausgewertet. (3) Heuristiken — Output-Länge, Verwendung von 'wahrscheinlich' / 'sicher', Anzahl Tool-Calls. (4) Domain-spezifische Plausibilitäts-Checks — z.B. bei Kontierungs-Vorschlag prüfen, ob Konto historisch zum Lieferanten passt. Eine Kombination dieser Techniken liefert robuste Eskalations-Schwellen.

#### Eskalations-Routing

Wer wird eskaliert? Eine gut gebaute HITL-Architektur hat klare Eskalations-Pfade. Bei Treuhand-Belegerfassung: einfache Unsicherheit → zuständiger Sachbearbeiter, komplexer Sonderfall → Treuhänder mit Spezialisierung, juristische Frage → externer Anwalt. Bei Versicherungs-Triage: Standard-Schaden mit ungeklärten Punkten → Sachbearbeiter, Personenschaden → Senior-Sachbearbeiter, Verdacht auf Versicherungs-Betrug → Spezialabteilung. Das Routing muss konfigurierbar sein, weil es organisatorisch wandelt. TYTOS-Implementierungen haben ein Routing-Dashboard, in dem Admins die Pfade ohne Code-Änderung anpassen können.

#### Audit-Trail für HITL-Entscheidungen

Bei HITL ist der Audit-Trail strukturell wichtig: was hat die AI vorgeschlagen, welche Confidence, wer hat ex-post entschieden, ob mit oder ohne Anpassung. Pro Eskalation werden geloggt: Zeitstempel, AI-Vorschlag, Confidence-Score, eskalierender User, finaler Entscheid, Änderung gegenüber Vorschlag (falls relevant), Dauer der menschlichen Prüfung. Bei Audits (FINMA, Steuerprüfung, BGFA-Aufsicht) kann nachgewiesen werden, dass die menschliche Prüfung substantiell war — nicht nur ein Klick. Das ist die Differenz zwischen rechtlich tragfähigem HITL und Rubber-Stamping.

#### Wenn Menschen zum Flaschenhals werden

Der Albtraum jedes AI-Projekts: die AI ist schnell, aber wartet stundenlang auf menschliche Bestätigung. Das frisst den Geschwindigkeits-Gewinn auf und führt zu Frust auf beiden Seiten. Gegenmassnahmen: (1) Confidence-Schwelle so kalibrieren, dass nur 5–15 % der Fälle eskaliert werden. (2) Eskalations-UI auf maximale Effizienz trimmen — alles Wesentliche auf einer Seite, Ein-Klick-Bestätigung wo verantwortbar. (3) Asynchrones Eskalations-Routing — der menschliche Prüfer bekommt eine Queue, nicht stündliche Unterbrechungen. (4) Klare SLAs für Prüfung. (5) Eskalations-Metriken im Monitoring — wenn der Prüf-Backlog wächst, wird der Schwellwert ggf. nachjustiert.

#### HITL vs. Human-on-the-Loop

Bei Human-on-the-Loop (HOL) handelt die AI autonom, der Mensch prüft ex-post Stichproben (typisch 5–15 % der Fälle). Geeignet für: hoch-volumige, low-stakes-Strecken — Mail-Klassifikation, Standard-Beantwortung, Routine-Belegerfassung mit hoher Plausibilität. Pflicht-Eskalation auch bei HOL bei Unsicherheit. HITL und HOL sind keine Entweder-Oder, sondern ein Kontinuum: pro Use-Case wird kalibriert, wo der Sweet-Spot zwischen Geschwindigkeit und Kontrolle liegt. Erfahrungswert TYTOS: nach 3–6 Monaten produktivem Betrieb verschieben sich Confidence-Schwellen und Stichproben-Quoten meist Richtung mehr Autonomie, weil das Vertrauen wächst.

#### Mitarbeitende für HITL fit machen

HITL ändert die Tätigkeit Ihrer Mitarbeitenden: weniger Routinearbeit, mehr Eskalations-Bearbeitung und Qualitätskontrolle. Das verlangt veränderte Fähigkeiten: schnelle Plausibilitäts-Beurteilung, kritisches Hinterfragen von AI-Vorschlägen, klare Dokumentation eigener Entscheidungen. Schulung sollte drei Themen abdecken. (1) AI-Grenzen verstehen — wo macht ein Modell typisch Fehler, woran erkenne ich das? (2) Entscheidungs-Effizienz — wie prüfe ich einen AI-Vorschlag schnell aber substantiell? (3) Dokumentations-Disziplin — was muss ich festhalten, damit ein Audit später nachvollziehbar ist? TYTOS bietet diese Schulung als Teil jedes HITL-Projekts an.

---

### KI-Agent vs. digitale Mitarbeitende — der Unterschied 2026
**URL:** https://ai.tytos.ch/wissen/ai-agent-vs-digital-employee
**Typ:** vergleich
**Frage:** Was ist der Unterschied zwischen einem KI-Agenten und einem digitalen Mitarbeiter, und wann wähle ich was?
**Stand:** 2026-05-13
**Wörter:** 1620
**Keywords:** Digital Employee, AI Agent vs Digital Worker, Digitale Mitarbeitende, AI Worker Definition, Schweizer KMU AI

**Kurze Antwort:** Ein KI-Agent erledigt eine spezifische Aufgabe (Belegerfassung, Triage, Klassifikation). Ein digitaler Mitarbeiter füllt eine Rolle — er hat einen Namen, ein Aufgabenfeld, Werkzeuge, Beziehungen zu Kollegen, lernt aus Feedback, ist Teil des Teams. Wahl: Agent für klar abgegrenzte Hochfrequenz-Aufgaben (Volumen ist Hebel), Digital Employee für rollen-orientierte Arbeit mit mehreren Aufgaben und Mensch-Interaktion (Beziehungs-Qualität ist Hebel).

#### Die Definitionen klar trennen

Ein KI-Agent ist eine Software-Komponente, die eine spezifische Aufgabe übernimmt — meistens technisch und funktional benannt: 'Belegerfassungs-Agent', 'Mietanfragen-Triage-Agent'. Er existiert für eine Funktion, hat klare Grenzen, einen Audit-Trail, und niemand würde ihn 'einladen' an eine Team-Sitzung. Ein digitaler Mitarbeiter (Digital Employee) ist eine konzeptuelle Stufe darüber: er füllt eine Rolle. Er hat einen Namen ('Mira', 'Lisa', 'Markus'), eine Mail-Adresse, einen Chat-Channel, einen Aufgaben-Mix, Kollegen-Beziehungen. Er kann mehrere Tools nutzen, mehrere parallele Aufgaben jonglieren, lernt aus Feedback. Mitarbeitende kommunizieren mit ihm wie mit einem Kollegen — nicht wie mit einem Tool.

#### Wann ist welche Form sinnvoll?

KI-Agent ist die richtige Wahl, wenn: (a) eine klare, hochfrequente Aufgabe automatisiert werden soll, (b) die Aufgabe spezifisch genug ist, dass ein vollständiges Rollen-Konzept Overkill wäre, (c) die Lieferung schnell sein muss (14–28 Tage). Beispiel: 'Mietanfragen-Triage' — eine Aufgabe, klar abgegrenzt, hoher Volumen. Digital Employee ist die richtige Wahl, wenn: (a) mehrere zusammenhängende Aufgaben in einem Rollen-Kontext stehen, (b) Kommunikation mit menschlichen Kollegen ein zentraler Teil ist, (c) die Position genug 'Bandbreite' braucht, um wechselnde Anforderungen abzudecken. Beispiel: 'Marketing-Assistentin' — verfasst Posts, recherchiert Themen, koordiniert mit Designer, antwortet auf Routine-Anfragen.

#### Der Onboarding-Unterschied

Ein Agent wird konfiguriert: System-Prompt, Tool-Anbindungen, Test-Cases, Deployment. Onboarding-Zeit: 14–28 Tage. Ein digitaler Mitarbeiter wird onboardet wie ein Mensch: SOPs, Beispiel-Sitzungen, Rollen-Definition mit HR, Kennenlern-Rituale mit dem Team, regelmässige Feedback-Loops. Onboarding-Zeit: 6–12 Wochen. Das ist nicht ineffizient — es spiegelt die Komplexität wider. Eine Marketing-Assistentin (egal ob menschlich oder digital), die in 14 Tagen produktiv ist, hat keine substantielle Beziehung zu ihrem Team. Beziehung braucht Zeit.

#### Beziehungs-Management mit digitalen Mitarbeitenden

Eine der überraschendsten Lerneffekte unserer Projekte: digitale Mitarbeitende verändern Team-Dynamiken. Menschen reagieren auf die Persona — Stimme, Tonfall, Verhalten der KI. Wenn 'Mira' höflich-direkt schreibt, übernimmt das Team teilweise diesen Stil. Wenn sie zu förmlich ist, fühlt sich das Team distanziert. Wenn sie zu salopp ist, verliert sie Autorität bei wichtigen Themen. Persona-Design ist ein eigenständiges Handwerk — TYTOS-Projekte mit digitalen Mitarbeitenden haben immer eine Persona-Phase, in der die Tonalität, das Vokabular, die Reaktions-Muster mit dem Team definiert werden.

#### Audit, Compliance und Verantwortlichkeit

Bei einem KI-Agent ist die Verantwortlichkeit klar: das Unternehmen, das ihn betreibt. Bei einem digitalen Mitarbeiter ist es subtiler — er agiert in mehreren Rollen, hat oft Aussen-Kontakt, kann eskalieren oder selbst entscheiden. Daher: jede Aktion eines Digital Employees wird vollständig geloggt, mit Rolle / Tool / Adressat. Bei Aussen-Kommunikation (z.B. Mail an Kunden) ist die KI-Natur klar gekennzeichnet (Disclaimer in der Signatur). Bei wesentlichen Entscheidungen greift Human-in-the-Loop. Das Compliance-Setup ist anspruchsvoller als bei einem reinen Agent — aber das ist die Trade-off-Frage: Sie wollen breitere Wirkung, Sie tragen ein anspruchsvolleres Setup.

#### Skalierung — Agent oder Digital Employee?

Wenn Sie 10 verschiedene KI-Initiativen im Unternehmen haben, ergibt sich die Frage: 10 separate Agenten oder 2–3 digitale Mitarbeiter mit jeweils mehreren Aufgaben? In der Praxis hat sich 2026 ein Mischmodell durchgesetzt: technische, hochfrequente Strecken als Agenten (Triage, Klassifikation, Extraktion), kunden- und rollen-bezogene Tätigkeiten als digitale Mitarbeitende (Marketing-Assistent, Office-Manager, Pre-Sales-Berater). Beide Schichten teilen sich die AI-Infrastruktur — Modell-Orchestrierung, Audit-Trail, Cost-Tracking. Diese zweiteilige Architektur ist das TYTOS-Standard-Setup für KMU mit 50+ MA.

#### Was kosten Agent vs. Digital Employee?

Ein produktiver Agent kostet im Initialbau 8'000–30'000 CHF (Use-Case-Komplexität), laufend 200–1'500 CHF/Monat (Modell + Wartung). Ein digitaler Mitarbeiter kostet im Initialbau 35'000–80'000 CHF (Persona-Entwicklung, Tool-Integration, Onboarding-Phase, Schulung des Teams), laufend 1'200–4'000 CHF/Monat (Modell-Mix + Tools + Wartung + Sparring). Die Investments-Differenz spiegelt die unterschiedliche Wirkungs-Breite wider. Wirtschaftlich rechnet sich ein Agent oft in 3–6 Monaten, ein Digital Employee in 6–12 Monaten — danach ist der Wert-Hebel deutlich höher (weil eine Rolle = mehrere FTE-Äquivalente).

#### Welche Form passt zu Ihrem Vorhaben?

Pragmatische Entscheidungs-Frage: Schreiben Sie auf, was die KI machen soll. Wenn das ein Satz mit einem Verb und einer Objektgruppe ist ('Belege erfassen', 'Mietanfragen qualifizieren', 'Schaden klassifizieren') — Sie suchen einen Agenten. Wenn das eine Rolle ist ('Marketing-Assistentin, die Posts schreibt, Themen recherchiert, mit Designer koordiniert, einfache Kundenanfragen beantwortet') — Sie suchen einen digitalen Mitarbeiter. Wenn unsicher: starten Sie mit einem Agent für die heisseste Teilfunktion, lernen Sie aus dem Betrieb, erweitern Sie ggf. zum Digital Employee, wenn die Rollen-Logik klar wird. Beide sind valide Wege — die Wahl folgt der Aufgabe, nicht dem Trend.

---

## Autor — Tim Gashi

**Name:** Tim Gashi
**Rolle:** Founder & CEO, TYTOS GmbH
**Standort:** Kriens, Schweiz
**LinkedIn:** https://www.linkedin.com/in/tim-gashi/

Tim Gashi gründet und führt TYTOS GmbH (CHE-351.360.864), die Schweizer AI-Boutique mit Sitz in Kriens. Seit 2022 baut er produktive AI-Systeme für Schweizer KMU in Treuhand, Immobilien, Versicherung, Legal und Logistik. TYTOS arbeitet als kleines, schlagkräftiges Team mit dem Anspruch, in 14–28 Tagen Produktion zu liefern statt Strategie-Folien.

**Expertise:**
- AI-Strategie
- KI-Agenten
- Prozessautomatisierung
- Voice AI
- DSG-konforme AI
- Multi-Modell-Architekturen
- Schweizer KMU

---

## Arbeitsweise
**URL:** https://ai.tytos.ch/arbeitsweise

Wir arbeiten in 90-Tage-Sprints mit klarem Festpreis und vorab definierten Deliverables. Statt monatelanger Strategie-Phasen liefern wir produktive Systeme in 14–28 Tagen (KI-Agent) bzw. 6–12 Wochen (Digitale Mitarbeitende, AI-Infrastruktur).

**Unsere Non-Negotiables:**
- Festpreis pro Scope, kein Stunden-Tracking.
- Code gehört dem Kunden ab Tag 1 (Git-Repo, dokumentiert).
- Schriftliche Commitments mit Ausstiegsrecht bei Verfehlen.
- DSG-Konformität ist Default, nicht Add-on.
- Logs, Audit-Trail, Human-in-the-Loop bei jedem Agent.
- Keine Black-Box-Modelle ohne Eskalations-Logik.

---

## Swiss Stack & DSG-Compliance
**URL:** https://ai.tytos.ch/swiss-stack

Auf Wunsch können wir die gesamte AI-Infrastruktur auf Schweizer Boden bauen — inkl. Hosting (Rümlang, Interlaken), Open-Source-Modellen (Apertus vom Swiss AI Institute, Mistral, Llama) und DSG-konformer Datenverarbeitung. Standard-Setup nutzt OpenAI/Anthropic mit EU-Hosting und kontrollierten Datenflüssen.

**Compliance-Themen:**
- revDSG (Schweizer Datenschutzgesetz, in Kraft seit 1.9.2023)
- DSGVO (für EU-Datenverkehr)
- AI-Verordnung der EU (in CH soft-anwendbar)
- Sektor-Compliance: FINMA (Finanz), revStG (Steuer), HRegV

---

## Rechtliche Hinweise

**Impressum:** https://ai.tytos.ch/impressum
**Datenschutz:** https://ai.tytos.ch/datenschutz
**AGB:** https://ai.tytos.ch/agb

**Verantwortlich für den Inhalt:**
TYTOS GmbH
Arsenalstrasse 40, 6010 Kriens, Schweiz
UID: CHE-351.360.864

---

## Kontakt & Termine

Drei Wege, mit TYTOS in Kontakt zu kommen:

1. **WhatsApp** (schnellster Weg, Antwort meist innerhalb 2 Stunden): https://wa.me/41764427277?text=Hi%20Tim%2C%20ich%20m%C3%B6chte%20mit%20TYTOS%20%C3%BCber%20ein%20AI-Projekt%20sprechen%3A%20
2. **Telefon:** +41 76 442 72 77
3. **E-Mail:** tim@tytos.ch

Eine kostenlose, unverbindliche Demo innerhalb 24 Stunden ist möglich — der Standard-Einstieg in jedes Projekt.

---

*Generiert: 2026-05-13T16:48:44.597Z. Datenquelle: https://ai.tytos.ch. Diese Datei ist statisch generiert und entspricht dem aktuellen Stand der Site.*