PILOT

MCP-Server für einen AI-Assistenten

SaaS für die Buchungsautomatisierung über Instagram Direct

⏱ 2 Jahre👤 Solo full-stack + AI🌍 SaaS · Booking automationDemo auf Anfrage

Kontext

Pilot — SaaS für Unternehmen, die Buchungen über Instagram Direct entgegennehmen: Beauty-Salons, Barbershops, Kliniken, Trainer, Berater, Tutoren, Spezialisten. Inhaber verbinden ihren Instagram, der AI-Assistent fängt DMs von Kunden ab — chattet, berät, bucht Termine, legt Kunden im CRM an, verschiebt, storniert.

Die Plattform unterstützt Netzwerke mit mehreren Standorten und dutzende Mitarbeiter mit eigenen Service-Sets.

Meine Rolle: solo full-stack + AI — von der Architektur bis in die Produktion. Ein Entwickler für den ganzen Stack: Backend, MCP-Layer, Integrationen mit CRM/Instagram/Google Calendar/Telegram, Infrastruktur, Deployment.

Problem

Vor Pilot habe ich als Media Buyer gearbeitet und sah dasselbe Problem bei Business-Kunden: Manager verlieren Leads.

→Antworten in 30 Min – 2 Stunden → der Kunde hat schon andere gefunden
→Werden müde, brennen aus, verlieren den Überblick im Plan
→Ein guter Manager ist teuer — ab $600/Monat. Für einen Standort braucht es oft 1–3 Manager je nach Volumen, also realistisch $600–1800/Monat

Für Kleinunternehmen rechnet sich das oft nicht. Der Inhaber zahlt entweder für einen mittelmäßigen Service oder sitzt selbst im Direct, statt sich um sein Geschäft zu kümmern.

Fähigkeiten

Technisch — ein MCP-Server mit 8 Production-Tools, die der LLM-Agent für echte Aktionen im CRM aufruft.

Kunde im CRM registrieren
Verfügbare Termine finden (nach Datum / Mitarbeiter / Standort)
Termine erstellen, verschieben, stornieren
Besuchshistorie des Kunden (für Upsell von Haupt- und Zusatzleistungen)
Top der beliebten Services und Mitarbeiter
Eskalation an einen Manager via Telegram in kritischen Situationen — der Manager geht direkt in den Chat und antwortet selbst
Kill-Switch für den Bot bei Ausfall oder Beschwerde

Deployment-Flexibilität

Das System skaliert von einem einzelnen Spezialisten bis zu einem Salon-Netzwerk — mit derselben Codebase.

Solo-Mitarbeiter im Salon

Hat seinen eigenen persönlichen Instagram. Kunden schreiben direkt dem Mitarbeiter, der Bot trägt sie ins Salon-CRM ein.

Solo-Freelancer (kein Salon)

Selbstständiger, der allein arbeitet. CRM ist nicht nötig — der Bot bucht direkt in Google Calendar, der mit Apple Kalender synchronisiert.

Ein Salon

Integration mit CRM + Kalendern aller Mitarbeiter. Der Bot kennt die Pläne und das Skill-Set jedes Einzelnen.

Salon-Netzwerk

Mehrere Standorte unter einer Marke, eigenes CRM, eigene Mitarbeiter, eigene Preise pro Standort. Selbst bei großem Volumen behält der Assistent alle Spezialisten jedes Standorts im Kopf, welche Services jeder von ihnen anbietet, Pläne und Preise — und navigiert flüssig dank intelligentem Kontext.

// system

Architektur

data flow

DM → CRM

live

Instagram Direct

customer DM

webhook

Meta Graph API

Multi-tenant Backend

FastAPI · Flask · async

Per-tenant

storage

LLM Agent

function calling · vision

MCP Server

8 production tools

CRM

booking

Google Calendar

slots

Telegram Bot

escalation

final testing

Harte Probleme

Multimodalität im lebendigen Dialog

Kunden schicken nicht nur Text — ein Referenzfoto, eine Sprachnachricht „buch mich für morgen", ein Video vom letzten Haarschnitt. AI muss das alles zusammen verstehen und sinnvoll antworten.

Lösung → Async-Media-Verarbeitungspipeline auf Basis eines vision-fähigen LLM — für den Agent sieht der Eingabestrom wie ein einziger multimodaler Feed aus.

Multi-Tenant mit dynamischem Kontext pro Kunde

Ein einziges Backend bedient dutzende unabhängige Unternehmen. Ein universeller Agent muss für einen Barbershop, ein Nagelstudio und ein Salon-Netzwerk gleichzeitig funktionieren — mit ihrem realen Katalog von Services, Mitarbeitern und Preisen.

Lösung → Volle State-Isolation per Tenant + Tool-Schema-Generator, der für jeden Kunden ein kontextuelles MCP-Tools-Schema aus aktuellen CRM-Daten baut.

Lebendiger Mensch übernimmt den Dialog

Manchmal öffnet der Inhaber Instagram manuell und beginnt selbst, dem Kunden zu antworten. Wenn AI parallel weitermacht — Katastrophe: zwei Antworten, Verwirrung, Kunde weg.

Lösung → „Mensch hat übernommen"-Detektor — der Bot pausiert vorübergehend für diesen Chat und kehrt mit aktualisiertem Kontext zurück, sobald der Mensch wieder geht.

Eine Antwort auf eine Serie kurzer Nachrichten

Echte Menschen schreiben keine eine lange Nachricht. Sie schicken „Hi", dann ein Foto, dann „ich möchte einen Termin", dann „für morgen" — innerhalb von 15 Sekunden, in einzelnen Blasen. Die meisten Bots antworten auf jede einzeln — der Dialog wird schizophren.

Lösung → Pilot wartet, bis der Kunde fertig getippt hat, gruppiert die ganze Serie (Text + Medien + mehr Text) in einen logischen Zug und antwortet mit einer klaren Nachricht — wie es ein Mensch tun würde.

Tech Stack

Backend / runtime

Python 3.11FastAPIFlaskUvicornGunicornasyncio + uvloopaiohttphttpxPydantic

AI / LLM

LLM with function callingMultimodal vision APIMCP Protocol (Anthropic SDK)Cloud AI provider

Frontend

React 19TypeScriptViteTailwind 4shadcn/uireact-day-pickermobile-firstiOS-Optimierung

Integrationen

Meta Graph APIAltegio API + webhooksGoogle Calendar APITelegram Bot APIOAuth 2.0JWT (PyJWT)

Infrastruktur

SQLite (per tenant)DockerNginxWebSocketsMQTTcryptography

Was es dem Business gibt vs. einem Live-Manager

Das Produkt ist gerade in der finalen Testphase — unten ist das Wertversprechen vs. einen Menschen einzustellen.

Parameter	Mensch	Pilot
Monatliche Kosten	$600-1800 für 1-3 Manager pro Standort	$120 pro Salon
Antwortzeit	30 Min – 2 Stunden	< 5 Sekunden
Parallelität	1 Konversation gleichzeitig	unbegrenzt parallel
Arbeitszeit	8-12 Stunden, 5 Tage	24/7 ohne Pausen
Skript-Qualität	schwankt, hängt von der Stimmung ab	stabil, wird zentral aktualisiert
Burnout / Kündigungen	hohe Fluktuation, ständige Einarbeitung	keine
Kundenerinnerung	vergisst	volle Besuchs- und Zusatzleistungs-Historie
Skalierung	+1 Standort → +1 Manager	+1 Standort → 0 zusätzliche Kosten

Monatliche Kosten

Mensch

$600-1800 für 1-3 Manager pro Standort

Pilot

$120 pro Salon

Antwortzeit

Mensch

30 Min – 2 Stunden

Pilot

< 5 Sekunden

Parallelität

Mensch

1 Konversation gleichzeitig

Pilot

unbegrenzt parallel

Arbeitszeit

Mensch

8-12 Stunden, 5 Tage

Pilot

24/7 ohne Pausen

Skript-Qualität

Mensch

schwankt, hängt von der Stimmung ab

Pilot

stabil, wird zentral aktualisiert

Burnout / Kündigungen

Mensch

hohe Fluktuation, ständige Einarbeitung

Pilot

keine

Kundenerinnerung

Mensch

vergisst

Pilot

volle Besuchs- und Zusatzleistungs-Historie

Skalierung

Mensch

+1 Standort → +1 Manager

Pilot

+1 Standort → 0 zusätzliche Kosten

Preise

$120/Monat pro SalonVolle CRM-Integration, alle Mitarbeiter, Multi-Location. Bis zu 100 Konversationen pro Tag inklusive.

$12/Monat pro SpezialistFür Solo-Spezialisten und Freelancer.

Individuelle PreiseFür große Netzwerke und >100 Konversationen/Tag.

Was kommt als Nächstes?

Das ist einer meiner Cases. Der Rest ist auf der Hauptseite.

Zur Hauptseite Andere Cases anschauen