AI Feature Sprint

Ein AI-Feature, sauber gebaut,
in 2–4 Wochen. Festpreis.

Eine Suche, die wirklich die richtige Antwort findet. Ein Chatbot, der nichts erfindet. Eine Zusammenfassung, die tatsächlich nützlich ist.

Projekt anfragen Varianten ansehen

Was wir bauen

Smart Search

Eine Suche, die versteht was User meinen — nicht nur was sie tippen. Findet die richtige Antwort, auch wenn die Worte anders sind.

pgvector · Cohere Reranker · BM25

Document QA / Chat-with-PDF

Ein Chatbot, der aus euren eigenen Dokumenten antwortet — und zeigt, wo jede Antwort herkommt. Keine erfundenen Antworten.

LangGraph · Vercel AI SDK · pgvector

AI Insights / Summary

Automatische Zusammenfassungen und Insights für eure Dashboards. Regelmäßig aktualisiert, strukturiert dargestellt.

OpenAI · Anthropic · Promptfoo

Smart Onboarding

Ein AI-Assistent, der neue User durch das Setup begleitet — angepasst an das, was sie wirklich brauchen.

Vercel AI SDK · OpenAI

Varianten

Feature	Light €5.500	Full €12.000	Multi-Agent (Custom)
Anzahl Features	1 Feature	1 Feature	Komplex
Antwort erscheint live (Wort für Wort)	✓	✓	✓
Zeigt, woher die Antwort kommt	✓	✓	✓
Hochwertige Suche	optional	✓ Standard	✓
Qualitätsmess-System	✗	✓	✓ Workflow-Level
Test-Set mit echten Fragen	✗	✓	✓
Automatische Qualitätsprüfungen	✗	✓	✓
Schutz gegen Ausfälle	Basis	Vollständig	Vollständig
Kosten-Tracking	✗	✓	✓
Einblick wie die AI sich verhält	✗	✓	✓
Bug-Fix-Garantie	14 Tage	30 Tage	30 Tage
Übergabe-Meeting	—	90 Min	90 Min
Zeitrahmen	2 Wochen	3–4 Wochen	4–6 Wochen
Preis	€5.500	€12.000	€22.000–35.000

Die Multi-Agent-Option ist ein Custom-Build — wir starten mit einem Audit oder Strategy Sprint, damit wir sauber scopen können.

Für euren CTO — was wir einsetzen

Standard-Stack: Next.js, TypeScript, OpenAI oder Anthropic als AI-Gehirn, Postgres mit pgvector für die Speicherung, optional Cohere oder BGE Reranker für hochwertigere Suche, Vercel für Hosting. Qualitätsmessung: RAGAS oder Promptfoo, mit LangSmith oder OpenTelemetry für Tracing. Bei Multi-Agent-Setups wählen wir das Framework passend zu eurem Stack: Mastra oder das Vercel AI SDK für TypeScript-Teams, Pydantic AI oder LangGraph für Python, AWS Strands für AWS-native Teams — plus eine Durability-Schicht (Temporal oder Vercel Workflows), wenn ein Workflow Minuten oder länger läuft. Je nach Use Case, nie von der Stange.

Warum das in 6 Monaten nicht kaputtgeht

Die meisten AI-Projekte liefern eine Demo, die am Dienstag funktioniert und am Freitag spinnt. Modelle ändern sich, Preise ändern sich, eure Daten ändern sich — und keiner merkt's, bis User sich beschweren.

Wir machen das anders.

Bevor wir auch nur eine Zeile Code schreiben, einigen wir uns auf eine Liste echter Fragen, die eure User stellen würden — und die Antworten, die sie bekommen sollten. Gegen diese Liste testen wir während der Entwicklung. Nach dem Launch laufen dieselben Tests automatisch weiter — jedes Mal, wenn sich die AI ändert, jedes Mal, wenn das Modell aktualisiert wird.

Wenn die Qualität fällt, wisst ihr es am Tag eins — nicht erst nach der ersten genervten Kunden-E-Mail.

Ablauf

Woche 1

Planung. Einigung darauf, was "gut" heißt — mit einem echten Test-Set.

Woche 2

Das Kern-Feature bauen.

Woche 3

Qualitätsprüfungen, Kosten-Tracking, Schutz vor Ausfällen.

Woche 4

Polishen, übergeben, alles dokumentieren.

Was NICHT enthalten ist

Per-Kunde Qualitäts-Tests wenn ihr ein Multi-Tenant-Produkt habt (separates Add-On)
Custom Model Fine-Tuning
On-Prem Deployment (separates Self-Hosted Add-On, +€3.500)
Rebuilds von bestehenden Non-AI Features (siehe MVP Sprint)

Self-Hosted Add-On

Müsst ihr die AI auf eigenen Servern hosten — wegen DSGVO, Compliance, oder weil eure Enterprise-Kunden das fordern? Wir bauen das als Add-On für €3.500 dazu. 1–2 Wochen zusätzlich.

Projekt anfragen