Methodik

Wie OKR Orca dein OKR bewertet.

Sieben Qualitätskriterien, sechs Anti-Pattern-Checks. Jedes Kriterium zielt auf ein bestimmtes Fehlermuster. Die Bewertung läuft automatisch; die Logik hinter jeder Punktzahl ist sichtbar, damit du mit ihr streiten, von ihr lernen und dich an ihr verbessern kannst.

Das Raster hat eine Meinung. Es markiert manche wirklich brauchbaren OKRs als unvollständig, weil ein Ausgangswert fehlt oder kein Bezug zur übergeordneten Stimmigkeit genannt ist. Das ist Absicht. Das Ziel sind nicht perfekte OKRs nach irgendeinem abstrakten Maßstab. Es sind OKRs, die tatsächlich Ergebnisse verändern, statt sauber formatiertes Planning Theatre zu produzieren.

Die 7 Kriterien

O1Klarheit

Nennt das Objective einen konkreten Kunden und einen konkreten Umfang?

Vage Nutznießer erzeugen weiter unten vage Key Results. Wenn das Objective nicht sagt, wer wovon profitiert, kann das Team nicht zwischen den vielen Wegen zur genannten Richtung priorisieren.

Besteht (2 Punkte)

"Interne Backend-Engineers verlieren keine Zeit mehr durch Umgebungsfehler" nennt einen Kunden und einen Umfang. Keine Unklarheit, wer profitiert.

Fällt durch (0 Punkte)

"Die Developer Experience verbessern" könnte interne Engineers, externe API-Nutzer oder beide meinen. "Experience" deckt alles ab und beschreibt nichts.

O2Frist

Gibt es ein ausdrückliches Datum oder Quartal?

Ein Objective ohne Frist lässt sich nicht nachverfolgen. Teams schieben das harte Gespräch darüber auf, ob sie im Plan liegen, weil es kein Datum gibt, gegen das man im Plan liegen könnte.

Besteht (2 Punkte)

"Bis Ende Q3 2026" ist ein ausdrücklicher Bezug, der einen Review-Moment und eine Deadline schafft.

Fällt durch oder teilweise

"Dieses Jahr" gibt 1 Punkt. "Bald" und Objectives ohne Zeitbezug geben 0 Punkte.

O3Strategie

Ist das Objective problemorientiert formuliert, ohne dass im Text eine Lösung vorgeschrieben wird?

Ein Team, das lösungsgetriebene Objectives schreibt, hat meist den Schritt der Problemdefinition übersprungen. Ändert sich die Lösung mitten im Quartal, wird das Objective falsch. Problemorientierte Objectives überstehen Pivots.

Besteht (2 Punkte)

"Die Zeit verkürzen, die Kunden bis zur ersten abgeschlossenen Bestellung brauchen" nennt ein Problem und eine Richtung, ohne Features, Plattformen oder Methoden festzulegen.

Fällt durch (0 Punkte)

"Das Self-Service-Checkout-Portal launchen, damit Kunden schneller bestellen können" baut das Portal als Antwort ein, bevor irgendeine Arbeit begonnen hat.

KRErgebnisform

Folgt das Key Result der Struktur "wer tut was um wie viel"?

Output-Verben (launchen, migrieren, liefern, erstellen, bauen, implementieren) geben 0 Punkte. Eine Metrik mit vagem Akteur gibt 1 Punkt. Die vollständige Struktur "wer + tut was + um wie viel" gibt 2 Punkte. Wird pro Key Result angewendet.

Besteht (2 Punkte)

"Neukunden schließen den Checkout ohne Kontakt zum Support ab, von 34% auf 52%" hat einen benannten Akteur, ein konkretes Verhalten und eine messbare Spanne.

Fällt durch (0 Punkte)

"Checkout-Verbesserungen bis Ende Q3 launchen" ist Arbeit, kein Ergebnis. Die Ergebnisversion fragt, was sich für Kunden nach dem Launch ändert.

KRMessbarkeit

Enthält das KR sowohl einen Ausgangswert als auch einen Zielwert?

Einer vorhanden, einer fehlt: 1 Punkt. Keiner: 0 Punkte. Beide, plus eine implizite oder benannte Datenquelle: 2 Punkte. Ist der Ausgangswert unbekannt, lautet das richtige OKR, die Metrik zuerst messbar zu machen, nicht sie zu verbessern.

Besteht (2 Punkte)

"Die Conversion von Session zu Anmeldung steigt von 2,1% auf 3,5% (Quelle: GA4, gleitender 30-Tage-Durchschnitt)" nennt den Ist-Zustand, den Zielwert und wo die Zahl zu finden ist.

Teilweise (1 Punkt)

"Die Conversion-Rate auf 3,5% erhöhen" hat keinen Ausgangswert, also kannst du nicht wissen, ob der Markt die Zahl einfach von selbst bewegt hat.

A1Stimmigkeit

Verweist das OKR-Set auf sein übergeordnetes Objective oder die Strategie, zu der es beiträgt?

Interne Stimmigkeit ist nicht bloß Governance-Aufwand; sie ist der Mechanismus, der Team-Einsatz mit den Ergebnissen der Organisation verbindet. Die Arbeit kann gut gemeint sein und trotzdem das Falsche optimieren.

Besteht (2 Punkte)

"Trägt zum Unternehmens-OKR bei: Das reibungsärmste Checkout-Erlebnis in unserer Kategorie werden" benennt den Bezug ausdrücklich, statt ihn vorauszusetzen.

Fällt durch (0 Punkte)

Ein OKR-Set ohne jeden Bezug zu etwas Übergeordnetem gibt 0 Punkte, egal wie gut die KRs gebaut sind.

C1Vollständigkeit

Gibt es Platzhalter im OKR-Set?

Alles, was mit X%, TBD, (Owner), (tbc) oder "Zahlen tbd" markiert ist, gibt 0 Punkte. Ein Platzhalter ist eine aufgeschobene Entscheidung. Ein OKR mit Platzhaltern einzureichen heißt, einen Entwurf als Commitment einzureichen.

Besteht (2 Punkte)

Jedes Feld mit echten Zahlen, echten Ownern und echten Datenquellen gefüllt.

Fällt durch (0 Punkte)

"NPS von X auf Y erhöhen (Owner: TBD)" erzeugt den Anschein von Messbarkeit ohne die Substanz.

Die 6 Anti-Patterns

Output-as-KR

Ein KR, das die Arbeit deines Teams beschreibt statt einer Veränderung, die in der Welt eintritt. Das Verb verrät es: migrieren, launchen, liefern, bauen, implementieren.

"100% der Bestellungen bis Q3 ins neue OMS migrieren." Das Ergebnis der Migration könnte Geschwindigkeit, Zuverlässigkeit oder weniger Fehler sein. Schreib das KR stattdessen darüber.

Impact-as-KR

Ein KR, das so hochaggregiert und nachlaufend ist, dass kein einzelnes Team es steuern kann. Ein Team, das so ein KR schreibt, kann in Woche 6 nicht erkennen, ob es beiträgt oder nur zusieht.

"Den Jahresumsatz um 20% steigern." Umsatz ist das Ergebnis der Arbeit vieler Teams. Finde das konkrete Verhalten eine Ebene tiefer.

Vanity Metric

Eine plausibel klingende Zahl, die sich an keinen konkreten Akteur und kein konkretes Verhalten knüpft. Leicht zu bewegen, ohne das zu bewegen, worauf es ankommt.

"Das Engagement um 25% steigern." Engagement von was, durch wen, auf welcher Oberfläche? Benenne den Akteur: "Newsletter-Abonnenten, die auf eine Produktkarte klicken, von 6% auf 11%."

Placeholder

Ein KR mit unbekannten Zahlen, das als Commitment festgeschrieben wird, als wären sie bekannt. Ist der Ausgangswert unbekannt, ist das KR ein Wunsch. Mach die Metrik zuerst messbar.

"Die Ladezeit von X% auf Y% reduzieren." Kein Ausgangswert, kein Zielwert. Das ist eine Richtung, kein Ergebnis.

Binary Milestone

Ein Ja/Nein-Meilenstein, der dir sagt, ob etwas passiert ist, nicht ob es gewirkt hat. Meist ein Output-as-KR in Verkleidung.

"100% der Teams auf das neue Framework onboarded." Wenn das Onboarding die Planungs-Zykluszeit senken sollte, miss das.

Task-list-in-disguise

Drei oder mehr KRs, die in Wahrheit ein einziger Projektplan sind. Inputs, keine Ergebnisse. Ein Set mit sieben KRs, in dem zwei die Hauptarbeit leisten und fünf nur zur Abdeckung dabei sind, ist ein Set mit fünf versteckten Aufgaben.

"Zwei Engineers zuweisen. Das Mapping-Dokument erstellen. Freigabe von Legal einholen." Das beschreibt Aufwand. Verdichte es auf ein oder zwei KRs über das Ergebnis.

Der "und was bringt's?"-Test

Stell bei jedem KR drei Fragen, bevor du dich festlegst. Jedes "nein" heißt, das KR muss neu geschrieben werden.

Frage 1

Wenn alle KRs auf grün gehen, ist das Objective dann offensichtlich erreicht? Falls nicht, sind die KRs nicht eng genug an das Objective gekoppelt. Etwas fehlt.

Frage 2

Wenn dieses KR auf rot geht, signalisiert es dann ein echtes Problem, auf das das Team reagieren muss? Lautet die Antwort "wir würden es bemerken, aber einfach weitermachen", ist das KR nicht wichtig genug, um im Set zu sein.

Frage 3

Hat das Team diese Metrik tatsächlich in der Hand? Wenn sie sich durch Faktoren bewegen kann, die völlig außerhalb des Einflusses des Teams liegen, ist sie ein schwaches Signal für die Team-Leistung.

Der Test legt die Lücke zwischen Aktivität und Ergebnis offen. Die meisten OKR-Probleme werden in dem Moment sichtbar, in dem du diese drei Fragen stellst.

Wie die Punktzahl berechnet wird

Jedes der 7 Kriterien gibt 0, 1 oder 2 Punkte. KR-Kriterien (Ergebnisform, Messbarkeit) werden pro Key Result angewendet. Die rohe Gesamtpunktzahl wird auf einen Prozentwert von 0 bis 100 normalisiert.

Punktebereich	Stufe	Was es bedeutet
0-20	Neu schreiben	Strukturelle Kernmängel. Das OKR lässt sich so, wie es dasteht, nicht nachverfolgen. Von vorne anfangen.
21-40	Neu fassen	Die Prämisse stimmt nicht. Mehrere Kriterien fallen durch. Forme das Objective oder das KR-Set neu, bevor du nachjustierst.
41-60	Schärfen	Tragfähige Form, aber die Lücken beißen mitten im Quartal. Schärfe einzelne KRs nach.
61-80	Solide	Solides Fundament. Ein paar Kriterien müssen vor dem Commitment noch geschärft werden.
81-100	Startklar	Alle Kriterien erfüllt oder nahezu erfüllt. Das ist ein commitfähiges OKR.

Stufen sind diagnostische Signale, keine Schulnoten. Ein Wert von 42 heißt, dass bestimmte Kriterien das Set nach unten ziehen. Die Aufschlüsselung pro Kriterium zeigt, welche und warum.

Eines ist diese Punktzahl nicht: ein Maß dafür, wie viel von dem OKR du erreichen solltest. Sie bewertet, wie gut das OKR geschrieben ist. Ein gutes ambitioniertes OKR ist darauf ausgelegt, bis Quartalsende bei 60 bis 80 Prozent Zielerreichung zu landen, nicht bei 100 Prozent. Die Ausnahme ist ein committed OKR, ein Muss-Liefern, das du voll erfüllen erwartest. Sag der Diagnose mit dem Schalter über dem Eingabefeld, welche Art du bewertest, und koppel Zielerreichung nie an Bezahlung, sonst geht jedes OKR auf grün und keines bedeutet mehr etwas.

Bereit, das Raster an deinem OKR auszuprobieren?Füg es in die Diagnose ein, bekomm in 60 Sekunden eine Punktzahl.

OKR bewerten