AI Feature Sprint

Ein AI-Feature, sauber gebaut,
in 2–4 Wochen. Festpreis.

Eine Suche, die wirklich die richtige Antwort findet. Ein Chatbot, der nichts erfindet. Eine Zusammenfassung, die tatsächlich nützlich ist.

Was wir bauen

Smart Search

Eine Suche, die versteht was User meinen — nicht nur was sie tippen. Findet die richtige Antwort, auch wenn die Worte anders sind.

pgvector · Cohere Reranker · BM25

Document QA / Chat-with-PDF

Ein Chatbot, der aus euren eigenen Dokumenten antwortet — und zeigt, wo jede Antwort herkommt. Keine erfundenen Antworten.

LangGraph · Vercel AI SDK · pgvector

AI Insights / Summary

Automatische Zusammenfassungen und Insights für eure Dashboards. Regelmäßig aktualisiert, strukturiert dargestellt.

OpenAI · Anthropic · Promptfoo

Smart Onboarding

Ein AI-Assistent, der neue User durch das Setup begleitet — angepasst an das, was sie wirklich brauchen.

Vercel AI SDK · OpenAI

Varianten
FeatureLight €5.500Full €12.000Multi-Agent (Custom)
Anzahl Features1 Feature1 FeatureKomplex
Antwort erscheint live (Wort für Wort)
Zeigt, woher die Antwort kommt
Hochwertige Sucheoptional✓ Standard
Qualitätsmess-System✓ Workflow-Level
Test-Set mit echten Fragen
Automatische Qualitätsprüfungen
Schutz gegen AusfälleBasisVollständigVollständig
Kosten-Tracking
Einblick wie die AI sich verhält
Bug-Fix-Garantie14 Tage30 Tage30 Tage
Übergabe-Meeting90 Min90 Min
Zeitrahmen2 Wochen3–4 Wochen4–6 Wochen
Preis€5.500€12.000€22.000–35.000

Die Multi-Agent-Option ist ein Custom-Build — wir starten mit einem Audit oder Strategy Sprint, damit wir sauber scopen können.

Für euren CTO — was wir einsetzen
Für euren CTO — was wir einsetzen

Standard-Stack: Next.js, TypeScript, OpenAI oder Anthropic als AI-Gehirn, Postgres mit pgvector für die Speicherung, optional Cohere oder BGE Reranker für hochwertigere Suche, Vercel für Hosting. Qualitätsmessung: RAGAS oder Promptfoo, mit LangSmith oder OpenTelemetry für Tracing. Bei Multi-Agent-Setups wählen wir das Framework passend zu eurem Stack: Mastra oder das Vercel AI SDK für TypeScript-Teams, Pydantic AI oder LangGraph für Python, AWS Strands für AWS-native Teams — plus eine Durability-Schicht (Temporal oder Vercel Workflows), wenn ein Workflow Minuten oder länger läuft. Je nach Use Case, nie von der Stange.

Warum das in 6 Monaten nicht kaputtgeht

Die meisten AI-Projekte liefern eine Demo, die am Dienstag funktioniert und am Freitag spinnt. Modelle ändern sich, Preise ändern sich, eure Daten ändern sich — und keiner merkt's, bis User sich beschweren.

Wir machen das anders.

Bevor wir auch nur eine Zeile Code schreiben, einigen wir uns auf eine Liste echter Fragen, die eure User stellen würden — und die Antworten, die sie bekommen sollten. Gegen diese Liste testen wir während der Entwicklung. Nach dem Launch laufen dieselben Tests automatisch weiter — jedes Mal, wenn sich die AI ändert, jedes Mal, wenn das Modell aktualisiert wird.

Wenn die Qualität fällt, wisst ihr es am Tag eins — nicht erst nach der ersten genervten Kunden-E-Mail.

Ablauf
Woche 1

Planung. Einigung darauf, was "gut" heißt — mit einem echten Test-Set.

Woche 2

Das Kern-Feature bauen.

Woche 3

Qualitätsprüfungen, Kosten-Tracking, Schutz vor Ausfällen.

Woche 4

Polishen, übergeben, alles dokumentieren.

Was NICHT enthalten ist
  • Per-Kunde Qualitäts-Tests wenn ihr ein Multi-Tenant-Produkt habt (separates Add-On)
  • Custom Model Fine-Tuning
  • On-Prem Deployment (separates Self-Hosted Add-On, +€3.500)
  • Rebuilds von bestehenden Non-AI Features (siehe MVP Sprint)
Self-Hosted Add-On

Müsst ihr die AI auf eigenen Servern hosten — wegen DSGVO, Compliance, oder weil eure Enterprise-Kunden das fordern? Wir bauen das als Add-On für €3.500 dazu. 1–2 Wochen zusätzlich.