Lernen/Methodik
Methodik

Wie OKR Orca dein OKR bewertet.

Sieben Qualitaetskriterien, sechs Anti-Pattern-Checks. Jedes Kriterium zielt auf einen spezifischen Fehlermodus. Die Bewertung ist automatisch; die Logik dahinter ist sichtbar, damit du sie hinterfragen, lehren und gegen sie verbessern kannst.

Der Rubric ist meinungsstark. Er markiert auch wirklich anstaendige OKRs als unvollstaendig, wenn eine Baseline fehlt oder eine Alignment-Referenz nicht genannt wird. Das ist gewollt. Das Ziel sind nicht perfekte OKRs nach einem abstrakten Standard, sondern OKRs, die tatsaechlich Outcomes veraendern statt gut formatiertes Planungstheater zu produzieren.

Die 7 Kriterien

O1Klarheit

Nennt das Objective einen spezifischen Kunden und einen spezifischen Scope?

Vage Beneficiaries produzieren vage KRs. Wenn das Objective nicht sagt, wer profitiert oder wovon, kann das Team nicht zwischen den vielen Wegen priorisieren.

Besteht (2 Punkte)
"Interne Backend-Engineers verlieren keine Zeit mehr durch Environment-Fehler" nennt Kunde und Scope.
Faellt (0 Punkte)
"Developer Experience verbessern" koennte interne Engineers, externe API-Consumer oder beide meinen.
O2Zeitrahmen

Gibt es ein explizites Datum oder Quartal?

Ein Objective ohne Zeitrahmen kann nicht nachverfolgt werden. Teams schieben das harte Gespraech auf, weil es kein Datum gibt.

Besteht (2 Punkte)
"Bis Ende Q3 2026" ist eine explizite Referenz.
Faellt oder teilweise
"Dieses Jahr" gibt 1. "Bald" und Objectives ohne Zeitreferenz geben 0.
O3Strategie

Ist das Objective problem-gerahmt, ohne Loesung im Text?

Ein Team, das loesungsgetriebene Objectives schreibt, hat meist den Problemdefinitions-Schritt uebersprungen.

Besteht (2 Punkte)
"Zeit kuerzen, bis Kunden ihre erste Bestellung abschliessen" nennt Problem und Richtung ohne Features.
Faellt (0 Punkte)
"Self-Service-Checkout-Portal launchen, damit Kunden schneller bestellen koennen" bettet das Portal als Antwort ein.
KROutcome-Form

Folgt das Key Result der Struktur "wer macht was um wie viel"?

Output-Verben (launchen, migrieren, liefern, bauen) geben 0. Eine Metrik mit vagem Akteur gibt 1. Volle "wer + macht was + um wie viel"-Struktur gibt 2.

Besteht (2 Punkte)
"Neue Kunden schliessen Checkout ohne Support-Kontakt ab, von 34% auf 52%" hat Akteur, Verhalten und Range.
Faellt (0 Punkte)
"Checkout-Verbesserungen bis Ende Q3 launchen" ist Arbeit, kein Ergebnis.
KRMessbarkeit

Enthaelt das KR Baseline und Zielwert?

Eines vorhanden, eines fehlt: 1 Punkt. Beides plus Datenquelle: 2 Punkte. Keine Baseline = Wunsch, kein Ergebnis.

Besteht (2 Punkte)
"Session-zu-Signup-Conversion von 2,1% auf 3,5% (Quelle: GA4, 30-Tage rollend)" hat Zustand, Ziel, Quelle.
Teilweise (1 Punkt)
"Conversion-Rate auf 3,5% erhoehen" hat keine Baseline.
A1Alignment

Referenziert das OKR-Set sein Parent-Objective oder die Strategie?

Alignment ist nicht nur Governance-Overhead; es ist der Mechanismus, der Team-Arbeit mit Organisations-Outcomes verbindet.

Besteht (2 Punkte)
"Traegt zum Company-OKR bei: Reibungsloseste Checkout-Erfahrung der Kategorie" macht die Verbindung explizit.
Faellt (0 Punkte)
Ein OKR-Set ohne Referenz nach oben gibt 0, egal wie gut die KRs sind.
C1Vollstaendigkeit

Sind Platzhalter im OKR-Set?

Alles markiert mit X%, TBD, (Owner), (tbc) gibt 0. Ein Platzhalter ist eine vertagte Entscheidung.

Besteht (2 Punkte)
Jedes Feld mit echten Zahlen, echten Ownern, echten Datenquellen.
Faellt (0 Punkte)
"NPS von X auf Y (Owner: TBD)" schafft den Schein von Messbarkeit ohne Substanz.

Die 6 Anti-Patterns

Output-als-KR

Ein KR, das Arbeit deines Teams beschreibt statt einer Veraenderung in der Welt. Das Verb ist das Tell: migrieren, launchen, liefern, bauen.

"100% der Orders bis Q3 auf das neue OMS migrieren." Schreib das Outcome (Geschwindigkeit, Zuverlaessigkeit) stattdessen.
Impact-als-KR

Ein KR so hoch und nachlaufend, dass kein einzelnes Team es kontrollieren kann.

"Jahresumsatz um 20% steigern." Umsatz ist das Ergebnis vieler Teams. Finde das spezifische Verhalten eine Ebene tiefer.
Vanity Metric

Eine plausible Zahl ohne Verbindung zu Akteur oder Verhalten. Leicht zu bewegen, ohne das Wesentliche zu bewegen.

"Engagement um 25% steigern." Engagement von was, von wem? Nenne den Akteur: "E-Mail-Subscriber, die eine Produktkarte klicken, von 6% auf 11%."
Platzhalter

Ein KR mit unbekannten Zahlen, das aussieht, als waeren sie bekannt. Ist die Baseline unbekannt, ist das KR ein Wunsch.

"Ladezeit von X% auf Y% reduzieren." Keine Baseline, kein Ziel.
Binaerer Milestone

Ein Pass/Fail-Meilenstein, der dir sagt, ob etwas geschehen ist, nicht ob es funktioniert hat.

"100% der Teams im neuen Framework onboarded." Wenn das Onboarding Planning-Cycle-Time reduzieren sollte, miss das.
Task-Liste-im-Disguise

Drei oder mehr KRs, die in Wahrheit ein Projektplan sind. Inputs, keine Ergebnisse.

"Zwei Engineers zuweisen. Mapping-Dokument erstellen. Legal-Sign-off einholen." Das sind Aufgaben. Komprimiere zu einem KR ueber das Outcome.

Der "So-was?"-Test

Stelle drei Fragen vor jedem Commit. Jedes "Nein" bedeutet, das KR braucht eine Ueberarbeitung.

Frage 1
Wenn alle KRs gruen werden, ist das Objective offensichtlich erreicht? Wenn nein, sind die KRs nicht eng genug ans Objective gekoppelt.
Frage 2
Wenn dieses KR rot wird, signalisiert es ein echtes Problem, auf das das Team reagieren muss? Wenn "wir wuerden es bemerken, aber weitermachen", ist es nicht wichtig genug.
Frage 3
Kontrolliert das Team diese Metrik tatsaechlich? Wenn sie sich durch Faktoren ausserhalb der Kontrolle bewegen kann, ist sie ein schwaches Signal fuer Team-Leistung.

Der Test legt die Luecke zwischen Aktivitaet und Outcome offen.

Wie der Score berechnet wird

Jedes der 7 Kriterien gibt 0, 1 oder 2 Punkte. KR-Kriterien (Outcome-Form, Messbarkeit) gelten pro Key Result. Der rohe Score wird auf 0-100 normalisiert.

Score-RangeStufeBedeutung
0-20RewriteStrukturelle Kernfehler. Das OKR kann so nicht nachverfolgt werden. Neu starten.
21-40ReframePraemisse stimmt nicht. Mehrere Kriterien fallen. Objective oder KR-Set neu rahmen statt feinjustieren.
41-60RefineTragfaehige Form, aber Luecken werden mitten im Quartal Probleme machen. Einzelne KRs schaerfen.
61-80SolidSolide Basis. Wenige Kriterien brauchen Schaerfung.
81-100ShipAlle Kriterien erfuellt oder fast. Commitbar wie geschrieben.

Stufen sind diagnostische Signale, keine Noten. Ein Score von 42 zeigt, welche Kriterien das Set runterziehen.

Bereit, den Rubric auf dein OKR anzuwenden?
OKR einfuegen, Bewertung in 60 Sekunden.
Diagnose →
OKR Orca von Frederik Metz. Quellcode. Kein Backend. Kein Tracking.