PILOT

MCP-Server für einen AI-Assistenten

SaaS für die Buchungsautomatisierung über Instagram Direct

⏱ 2 Jahre👤 Solo full-stack + AI🌍 SaaS · Booking automationDemo auf Anfrage

Kontext

Pilot — SaaS für Unternehmen, die Buchungen über Instagram Direct entgegennehmen: Beauty-Salons, Barbershops, Kliniken, Trainer, Berater, Tutoren, Spezialisten. Inhaber verbinden ihren Instagram, der AI-Assistent fängt DMs von Kunden ab — chattet, berät, bucht Termine, legt Kunden im CRM an, verschiebt, storniert.

Die Plattform unterstützt Netzwerke mit mehreren Standorten und dutzende Mitarbeiter mit eigenen Service-Sets.

Meine Rolle: solo full-stack + AI — von der Architektur bis in die Produktion. Ein Entwickler für den ganzen Stack: Backend, MCP-Layer, Integrationen mit CRM/Instagram/Google Calendar/Telegram, Infrastruktur, Deployment.

Problem

Vor Pilot habe ich als Media Buyer gearbeitet und sah dasselbe Problem bei Business-Kunden: Manager verlieren Leads.

Für Kleinunternehmen rechnet sich das oft nicht. Der Inhaber zahlt entweder für einen mittelmäßigen Service oder sitzt selbst im Direct, statt sich um sein Geschäft zu kümmern.

Fähigkeiten

Technisch — ein MCP-Server mit 8 Production-Tools, die der LLM-Agent für echte Aktionen im CRM aufruft.

Deployment-Flexibilität

Das System skaliert von einem einzelnen Spezialisten bis zu einem Salon-Netzwerk — mit derselben Codebase.

Solo-Mitarbeiter im Salon

Hat seinen eigenen persönlichen Instagram. Kunden schreiben direkt dem Mitarbeiter, der Bot trägt sie ins Salon-CRM ein.

Solo-Freelancer (kein Salon)

Selbstständiger, der allein arbeitet. CRM ist nicht nötig — der Bot bucht direkt in Google Calendar, der mit Apple Kalender synchronisiert.

Ein Salon

Integration mit CRM + Kalendern aller Mitarbeiter. Der Bot kennt die Pläne und das Skill-Set jedes Einzelnen.

Salon-Netzwerk

Mehrere Standorte unter einer Marke, eigenes CRM, eigene Mitarbeiter, eigene Preise pro Standort. Selbst bei großem Volumen behält der Assistent alle Spezialisten jedes Standorts im Kopf, welche Services jeder von ihnen anbietet, Pläne und Preise — und navigiert flüssig dank intelligentem Kontext.

// system

Architektur

live
Instagram Direct
customer DM
webhook
Meta Graph API
Multi-tenant Backend
FastAPI · Flask · async
Per-tenant
storage
LLM Agent
function calling · vision
MCP Server
8 production tools
CRM
booking
Google Calendar
slots
Telegram Bot
escalation
final testing

Harte Probleme

01

Multimodalität im lebendigen Dialog

Kunden schicken nicht nur Text — ein Referenzfoto, eine Sprachnachricht „buch mich für morgen", ein Video vom letzten Haarschnitt. AI muss das alles zusammen verstehen und sinnvoll antworten.

Lösung → Async-Media-Verarbeitungspipeline auf Basis eines vision-fähigen LLM — für den Agent sieht der Eingabestrom wie ein einziger multimodaler Feed aus.

02

Multi-Tenant mit dynamischem Kontext pro Kunde

Ein einziges Backend bedient dutzende unabhängige Unternehmen. Ein universeller Agent muss für einen Barbershop, ein Nagelstudio und ein Salon-Netzwerk gleichzeitig funktionieren — mit ihrem realen Katalog von Services, Mitarbeitern und Preisen.

Lösung → Volle State-Isolation per Tenant + Tool-Schema-Generator, der für jeden Kunden ein kontextuelles MCP-Tools-Schema aus aktuellen CRM-Daten baut.

03

Lebendiger Mensch übernimmt den Dialog

Manchmal öffnet der Inhaber Instagram manuell und beginnt selbst, dem Kunden zu antworten. Wenn AI parallel weitermacht — Katastrophe: zwei Antworten, Verwirrung, Kunde weg.

Lösung → „Mensch hat übernommen"-Detektor — der Bot pausiert vorübergehend für diesen Chat und kehrt mit aktualisiertem Kontext zurück, sobald der Mensch wieder geht.

04

Eine Antwort auf eine Serie kurzer Nachrichten

Echte Menschen schreiben keine eine lange Nachricht. Sie schicken „Hi", dann ein Foto, dann „ich möchte einen Termin", dann „für morgen" — innerhalb von 15 Sekunden, in einzelnen Blasen. Die meisten Bots antworten auf jede einzeln — der Dialog wird schizophren.

Lösung → Pilot wartet, bis der Kunde fertig getippt hat, gruppiert die ganze Serie (Text + Medien + mehr Text) in einen logischen Zug und antwortet mit einer klaren Nachricht — wie es ein Mensch tun würde.

Tech Stack

Backend / runtime

Python 3.11FastAPIFlaskUvicornGunicornasyncio + uvloopaiohttphttpxPydantic

AI / LLM

LLM with function callingMultimodal vision APIMCP Protocol (Anthropic SDK)Cloud AI provider

Frontend

React 19TypeScriptViteTailwind 4shadcn/uireact-day-pickermobile-firstiOS-Optimierung

Integrationen

Meta Graph APIAltegio API + webhooksGoogle Calendar APITelegram Bot APIOAuth 2.0JWT (PyJWT)

Infrastruktur

SQLite (per tenant)DockerNginxWebSocketsMQTTcryptography

Was es dem Business gibt vs. einem Live-Manager

Das Produkt ist gerade in der finalen Testphase — unten ist das Wertversprechen vs. einen Menschen einzustellen.

Monatliche Kosten
Mensch
$600-1800 für 1-3 Manager pro Standort
Pilot
$120 pro Salon
Antwortzeit
Mensch
30 Min – 2 Stunden
Pilot
< 5 Sekunden
Parallelität
Mensch
1 Konversation gleichzeitig
Pilot
unbegrenzt parallel
Arbeitszeit
Mensch
8-12 Stunden, 5 Tage
Pilot
24/7 ohne Pausen
Skript-Qualität
Mensch
schwankt, hängt von der Stimmung ab
Pilot
stabil, wird zentral aktualisiert
Burnout / Kündigungen
Mensch
hohe Fluktuation, ständige Einarbeitung
Pilot
keine
Kundenerinnerung
Mensch
vergisst
Pilot
volle Besuchs- und Zusatzleistungs-Historie
Skalierung
Mensch
+1 Standort → +1 Manager
Pilot
+1 Standort → 0 zusätzliche Kosten

Preise

$120/Monat pro SalonVolle CRM-Integration, alle Mitarbeiter, Multi-Location. Bis zu 100 Konversationen pro Tag inklusive.
$12/Monat pro SpezialistFür Solo-Spezialisten und Freelancer.
Individuelle PreiseFür große Netzwerke und >100 Konversationen/Tag.

Was kommt als Nächstes?

Das ist einer meiner Cases. Der Rest ist auf der Hauptseite.