Systembau & Backtesting bei Sportwetten: Regeln testen ohne Selbstbetrug

Ein System ist reproduzierbar, messbar, killbar. Backtesting ist Pflicht – aber nur sauber.

Was ist ein Wett-System (wirklich)?

Ein Wett-System ist keine Meinung und kein „ich hab ein Gefühl“. Ein System ist eine Menge von Regeln, die aus Inputs (Quoten/Daten/Infos) reproduzierbare Entscheidungen erzeugt. Reproduzierbar heißt: Zwei Wochen später, unter denselben Bedingungen, würdest du dieselbe Entscheidung wieder treffen – ohne neue Story.

Wenn du ein System nicht erklären, simulieren und auswerten kannst, ist es keine Strategie. Dann ist es Entertainment mit Einsatz. Backtesting ist der Prozess, der diese Grenze erzwingt.

Warum Backtesting nötig ist (und warum es oft lügt)

Backtesting beantwortet eine einzige Frage: Wären deine Regeln über viele Entscheidungen robust gewesen? Nicht „hätte ich damals gewonnen“, sondern: „liefert das Regelwerk im Erwartungswert (EV) eine stabile Kante?“ Ohne Backtest kannst du jeden Glücksrun als „System“ verkaufen. Mit Backtest musst du liefern.

Warum lügen Backtests oft? Weil Menschen sie unbewusst so bauen, dass sie gut aussehen: Datenlecks, nachträgliche Anpassungen, Survivorship, falsche Marktdefinition, ignorierte Marge/Slippage. Ein Backtest ist nur so gut wie seine Disziplin.

Die 6 Bausteine eines Systems

Ein System ist minimal vollständig, wenn diese Punkte klar sind:

  • 1) Markt & Universum: Welche Ligen/Markets überhaupt (und welche nie)?
  • 2) Entry-Regel: Wann wird gespielt, wann nicht?
  • 3) Preislogik: Wie entsteht Value (Quote vs Wahrscheinlichkeit)?
  • 4) Execution-Regel: Timing, Book, Limits, Slippage – wie wird ausgeführt?
  • 5) Sizing: Einsatzgröße, Caps, Drawdown-Logik.
  • 6) Auswertung: EV/CLV/ROI pro Segment + Fehlerklassen.

Wenn einer dieser Bausteine fehlt, hast du kein System. Du hast ein Fragment.

Daten & Marktdefinition: woran Backtests scheitern

Der häufigste Backtest-Fail ist nicht Mathematik, sondern Definition. Wenn du Märkte falsch vergleichst, testest du Müll. Du brauchst klare Antworten auf:

  • Welche Quote? Opening, Zeitpunkt X, Closing? (und aus welcher Quelle?)
  • Welche Regeln? Push/Void, OT/Penalties, Asian Lines, Settlement-Regeln.
  • Welche Time-Stamp-Logik? „Info“ darf nur zählen, wenn sie vor dem Bet-Zeitpunkt verfügbar war.
  • Welche Segmente? Pre-Match ≠ Live. Hohe Quoten ≠ niedrige Quoten. Alles getrennt.

Wenn du das nicht sauber definierst, bekommst du scheinbar „geile“ Ergebnisse, die in live sofort zerfallen. Backtests sterben nicht an fehlender Intelligenz, sondern an sloppy Messung.

Backtesting Ablauf: Schritt-für-Schritt

So sieht ein Backtest aus, der nicht nach Wunschdenken riecht:

  1. Regeln fixieren: Entry, Exit (falls relevant), Sizing, Universum, Timing.
  2. Daten vorbereiten: Quotes + Zeitstempel + Marktdefinition + Settlement.
  3. Simulation: Regelwerk über alle Events laufen lassen (ohne „nachbessern“).
  4. Auswertung: ROI, Drawdown, Hit Rate, aber vor allem: EV/CLV/Segment-ROI.
  5. Segment-Check: Welche Ligen/Markets tragen? Welche sind toxisch?
  6. Stresstest: Slippage, schlechtere Quoten, Limits (Edge muss übrig bleiben).
  7. Freeze: Regelwerk einfrieren, dann erst validieren.

Wenn du während des Backtests „noch kurz“ an Regeln drehst, testest du keine Strategie. Du kuratierst ein Ergebnis.

Overfitting, Lookahead, Selection Bias: die Killer

Die drei Klassiker, die Backtests schön machen und live töten:

  • Overfitting: Du optimierst Regeln so lange, bis sie genau auf die Vergangenheit passen.
  • Lookahead Bias: Du nutzt Information, die zum Bet-Zeitpunkt nicht verfügbar war (direkt oder indirekt).
  • Selection Bias: Du testest nur die „schönen“ Segmente (Ligen/Zeiträume/Quoten), die zufällig gut liefen.

Gegenmittel, die wirklich funktionieren:

  • Holdout / Out-of-Sample: Ein Teil der Daten wird nicht zum Bauen benutzt.
  • Walk-Forward: Regeln auf Periode A bauen, auf B testen, dann weiterrollen.
  • Einfachheit: Jede zusätzliche Regel ist eine Overfit-Steuer.
  • Regeln vorher festlegen: nicht nach Ergebnis „erklären“.

Limits & Slippage: Backtest vs Realität

Die brutalste Wahrheit: Der beste Backtest bringt dir nichts, wenn du ihn nicht exekutieren kannst. Live bekommst du nicht immer die Quote, die im Datensatz steht. Limits drücken die Einsatzhöhe, Slippage verschlechtert den Preis, und Timing verändert deine Edge.

Deshalb gehört Execution in den Test:

  • Slippage-Modell: simuliere systematisch 0.5–2 Ticks schlechtere Preise.
  • Limit-Realität: prüfe, ob das System nur bei Mini-Stakes „gut“ aussieht.
  • Markt-Filter: illiquide Segmente raus, wenn du skalieren willst.

Edge im Excel ist nett. Edge im Konto ist das Ziel.

Validierung: Paper, Live, Kill-Kriterien

Nach dem Backtest kommt die Validierung. Nicht um „zu hoffen“, sondern um Abweichungen zu messen: Live ist nicht Vergangenheit. Märkte ändern sich. Deine Ausführung ist real. Deshalb:

  • Paper/Shadow: gleiche Regeln, echte Quotes, ohne Risiko (kurz, kontrolliert).
  • Live klein: gleiche Regeln, kleine Stakes, Execution messen.
  • Kill-Kriterien: vorher definieren, wann du stopst (z.B. CLV dauerhaft negativ, Segment kippt, Slippage frisst Edge).

Wichtig: Nicht nach 10 Wetten den Glauben verlieren. Aber auch nicht monatelang „durchhalten“, wenn die Qualitätsmetriken klar kippen. Systeme sterben. Das ist normal. Unnormal ist, es nicht zu merken.

Fehlerklassen statt Ausreden

Backtesting und Systembau funktionieren nur, wenn du Fehler sauber klassifizierst. Sonst landet alles im selben Topf („Pech“). Drei Klassen reichen, um 90% der Probleme zu finden:

  • Model/Signal-Fehler: p-Schätzung/Regelwerk ist falsch oder overfitted.
  • Execution-Fehler: Quote/Timing/Slippage/Limits zerstören den realen EV.
  • Disziplin-Fehler: Regelbruch durch Tilt, Overtrading, Einsatzsprünge.

Ein System ohne Fehlerklassen ist nicht „stabil“. Es ist nur unmessbar.

Weiterdenken & Vertiefen

Vertiefung (Paid)

System-Framework in der Praxis: Datenstruktur, Marktdefinition, Walk-Forward-Tests, Slippage-/Limit-Modell, Segment-Filter, CLV/EV-Kontrolle, Fehlerklassen und eine „Kill-Rule“-Logik, die Systeme beendet, bevor sie Konten beenden. Keine Tipps. Nur Mechanik.

Systeme sauber bauen

INHALT