V
Veritasreports.io
KU
METHODOLOGIE

Wie wir vorgehen

Wir bauen Berichte aus drei Schichten: Daten, Mustererkennung und Sprache. Dieser Text erklaert in Klartext, was die Engine tut, was sie nicht tut und welche Grenzen die Methode hat.

1. Datenschicht

Pro Run ziehen wir Daten aus mehreren oeffentlichen und kommerziellen APIs. Jede Quelle hat eine klare Rolle:

  • Marktdaten ueber Financial Modeling Prep — Preise, Sektoren, Insider-Trades, Optionen.
  • Makro ueber FRED — CPI, Zinsen, Yield-Curve, HY-Spreads, M2, Lead-Indikatoren.
  • Geopolitik ueber GDELT 2.0 — Theme-Volumen plus CAMEO-Eventcodes plus bilaterale Tone-Momentum-Klassifikation.
  • Physische Logistik ueber Baltic Dry, Drewry-Container-Index, optional Tanker-Raten (Power-Tier).
  • Stimmung ueber Reddit-Wochen-Top, HackerNews, GitHub-Trending.
  • FDA-Pipeline fuer Health-Outbreak-Signale.
  • Fear-and-Greed-Index als zusaetzlicher Sentiment-Proxy.

Faellt ein Provider aus, faellt der Run nicht — fehlende Daten landen im Bericht-Abschnitt Data-quality notes.

2. Aggregations- und Signalschicht

Aus den Rohdaten bauen wir strukturierte Signale.

Theme-Detector + Mega-Merge

News-Volumen, Sektor-Bewegungen und Insider-Trades werden zu einer kanonischen Theme-Liste verschmolzen. Doppelte Themen werden konsolidiert; hot und extreme Themen erhalten einen Z-Score.

Pre-Pattern, Theme-Resonance, Cross-Insider

Pure-Python-Module, die ohne externe Calls aus dem Mega-Merge weitere Signale ableiten. Pre-Pattern erkennt formierende Setups, Theme-Resonance bewertet Themenkonsens, Cross-Insider verbindet Insider-Bewegung mit Theme-Aktivitaet.

Market-Regime

VIX, Yield-Curve, HY-Spread, Marktbreite, Fear-Greed plus Shipping- und Goldstein-Composite klassifizieren das Marktumfeld in bull, bear_stress, risk_off, late_cycle_transition u.a. mit numerischem Risk-Level 1-5.

Scenario-Engine

Das Herzstueck — ein Katalog historischer Episoden mit Trigger-Bedingungen, Watch-Liste und Invalidations-Bedingung. Wenn genug Trigger erfuellt sind, feuert die Episode; der Confidence-Score ist der Anteil erfuellter Trigger.

Hit-Rate-Loop

Jede gefeuerte Episode persistiert ihre Watch-Liste als ConvictionRecord. 30 und 90 Tage spaeter checkt der Daily-Resolver die tatsaechlichen Preise gegen den SPY-Benchmark. Aus den Resultaten wird pro Episode eine Win-Rate, die als Confidence-Multiplikator (0.7..1.2) im naechsten Match einfliesst. Das System lernt Tenant-spezifisch.

Watchlist-Risk

Deine Watchlist wird gegen jede aktive Episode gecheckt. Direct-Hits (dein Ticker in der Episoden-Liste) und Sector-Hits (dein Sektor ist betroffen) werden in ALERT/WARNUNG/CHANCE/WATCH klassifiziert.

3. Sprachschicht — Claude

Aus dem signalreichen Mega-Merge plus aktiven Episoden bauen wir einen strukturierten Prompt fuer die Anthropic Claude API. Der Prompt ist auf institutionelle Research-Sprache eingestellt:

  • Hedging-Sprache ("is historically associated with", nicht "will").
  • Sektionsfest: Executive-Snapshot, Active-Themes, Macro/Shipping, Conviction-Stack, Risk-and-Crowding, Scenario-Watch, Active-Scenarios, Data-Quality-Notes.
  • Output durchlaeuft den Output-Guard mit PII-Scan und Compliance-Pruefung (kein Buy/Sell-Imperativ).
  • Compliance-Zeile am Ende jedes Reports.

Was wir nicht tun

  • Keine "Kauf X / Verkauf Y"-Empfehlungen.
  • Keine personalisierten Anlageentscheidungen.
  • Wir handeln nicht in deinem Namen.
  • Wir erfinden keine Zahlen — fehlende Daten werden ausgewiesen.
  • Keine Garantien fuer historische Episoden.

Grenzen der Methode

  • Historische Episoden sind nicht vollstaendig. Wir ergaenzen den Katalog laufend.
  • Confidence-Score 80% bedeutet nicht 80% Treffer-Wahrscheinlichkeit. Es bedeutet, 80% der Trigger sind erfuellt.
  • Hit-Rate-Statistiken brauchen Zeit; bei wenig Sample ist das Confidence-Gewicht neutral 1.0.
  • News-Daten haben Latenz.
  • Externe Provider koennen ausfallen — das landet in den Data-Quality-Notes.

Transparenz

  • Im Glossar jeden Fachbegriff nachschlagen.
  • Im Daten-Explorer die Rohsignale des juengsten Runs ansehen.
  • Auf der Scenario-History-Page die Win-Rate jeder Episode pro Tenant einsehen.
  • Active Scenarios als CSV oder JSON exportieren.