Files
task-queue-proof/README.de.md
T
Mortdecai b6d42d3237 Add 10 translations: ES, TH, FR, EO, PL, DE, PT, AR, TL, ZH
Complete translations of the full paper into:
- Spanish (README.es.md)
- Thai (README.th.md)
- French (README.fr.md)
- Esperanto (README.eo.md)
- Polish (README.pl.md)
- German (README.de.md)
- Portuguese/Brazilian (README.pt.md)
- Arabic/MSA (README.ar.md)
- Tagalog/Filipino (README.tl.md)
- Simplified Chinese (README.zh.md)

All translations preserve mathematical notation, LaTeX formulas,
citation numbers, and markdown formatting. Reference citations kept
in English with translated annotations.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-29 00:36:57 -04:00

1365 lines
60 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Die ungewichtete durchschnittliche Abschlusszeit ist keine faire Metrik fuer die Aufgabenplanung
Ein mathematischer Beweis, dass die ungewichtete durchschnittliche
Aufgabenabschlusszeit eine verzerrte Statistik ist, die das gezielte
Herauspicken einfacher Aufgaben belohnt, und dass jeder Planungsvorteil,
den sie scheinbar aufdeckt, ein Artefakt der Metrik ist — keine
Widerspiegelung tatsaechlichen Durchsatzes oder tatsaechlicher
Servicequalitaet.
---
## 1. Einfuehrung
Viele Organisationen messen die Aufgabenausfuehrungsleistung anhand der
**ungewichteten mittleren Abschlusszeit**: der durchschnittlichen Anzahl
von Stunden (oder Tagen) zwischen Aufgabeneinreichung und
Aufgabenabschluss, wobei jede Aufgabe unabhaengig von Groesse oder
Prioritaet gleich gezaehlt wird.
Diese Arbeit beweist, dass diese Metrik nicht lediglich ungenau, sondern
strukturell verzerrt ist. Sie kann durch Umordnung der Arbeit verbessert
werden, ohne zusaetzliche Arbeit zu leisten (Satz 1), waehrend eine
ordnungsgemaess gewichtete Alternative vollstaendig immun gegen
Manipulationen durch die Reihenfolgeplanung ist (Satz 2). In Kombination
mit einem Prioritaetssystem widerspricht die Metrik aktiv den eigenen
Prioritaetsklassifikationen der Organisation (Satz 9).
Die Argumentation gliedert sich in vier Teile:
- **Teil I** (Abschnitte 24) legt das mathematische Fundament:
Der ungewichtete Mittelwert ist durch Shortest Processing Time (SPT)-
Planung manipulierbar, der arbeitsgewichtete Mittelwert ist
planungsinvariant, und die daraus resultierenden Konsequenzen fuer die
Servicequalitaet sind nachweislich negativ.
- **Teil II** (Abschnitte 56) erweitert das Modell auf
prioritaetsklassifizierte Aufgaben, beweist, dass die Metrik
gegenueber dem Prioritaetssystem adversarial wird, und schlaegt
gewichtete Alternativen vor, mit einem durchgerechneten Beispiel
eines IT-Service-Desks.
- **Teil III** (Abschnitte 79) untersucht die organisatorische Dynamik:
Was geschieht, wenn die Metrik an Kunden berichtet wird
(Informationsasymmetrie), was mit Teammitgliedern geschieht, die ihre
Maengel verstehen (psychischer Schaden), und was ein einzelner
informierter Manager dagegen tun kann (eingeschraenkte Optimierung mit
spieltheoretischer Stabilitaetsanalyse).
- **Teil IV** (Abschnitte 1012) praesentiert ehrliche Gegenargumente,
ordnet die Arbeit in die bestehende Literatur ein und schliesst ab.
Die Kernergebnisse bauen auf Smiths (1956) grundlegender
Ablaufplanungstheorie [1] auf, erweitert durch Spieltheorie [9, 10],
organisatorische Messtheorie [18, 19] und Psychologie [1117], um eine
vollstaendige Kette von einem mathematischen Beweis ueber eine bestimmte
Metrik bis hin zu organisatorischen Auswirkungen nachzuzeichnen.
---
# Teil I: Mathematisches Fundament
## 2. Definitionen
Es seien **n** Aufgaben mit Bearbeitungszeiten $p_1, p_2, \ldots, p_n$ gegeben.
Ein **Ablaufplan** $\sigma$ ist eine Permutation von $\{1, 2, \ldots, n\}$,
die Aufgaben einer Ausfuehrungsreihenfolge auf einem einzelnen Ausfuehrer
zuweist.
Die **Abschlusszeit** der Aufgabe $\sigma(k)$ unter Ablaufplan $\sigma$ ist:
$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$
Die **ungewichtete mittlere Abschlusszeit** ist:
$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$
Die **arbeitsgewichtete mittlere Abschlusszeit** ist:
$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$
---
## 3. Kernergebnisse
### 3.1 Der ungewichtete Mittelwert ist manipulierbar
**Satz 1** (Smith, 1956 [1])**.** Der Ablaufplan, der
$\bar{C}(\sigma)$ minimiert, ist Shortest Processing Time first (SPT):
Sortiere die Aufgaben so, dass
$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$.
**Beweis (Austauschmethode [1, 2]).**
Betrachte einen beliebigen Ablaufplan $\sigma$, in dem zwei benachbarte
Aufgaben $i, j$ die Bedingung $p_i > p_j$ erfuellen, wobei Aufgabe $i$
unmittelbar vor Aufgabe $j$ eingeplant ist. Sei $t$ die Startzeit von
Aufgabe $i$.
| | Aufgabe $i$ endet | Aufgabe $j$ endet | Summe |
|---|---|---|---|
| **Vor dem Tausch** ($i$ dann $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ |
| **Nach dem Tausch** ($j$ dann $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ |
Die Aenderung der Summe der Abschlusszeiten betraegt:
$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$
Jeder Tausch eines laenger-vor-kuerzer-Paares benachbarter Aufgaben
reduziert die Gesamtsumme strikt. Jeder Nicht-SPT-Ablaufplan enthaelt ein
solches Paar. Wiederholte Tauschoperationen konvergieren zu SPT. Daher
minimiert SPT $\bar{C}(\sigma)$ eindeutig. $\blacksquare$
### 3.2 Der arbeitsgewichtete Mittelwert ist planungsinvariant
**Satz 2.** Die arbeitsgewichtete mittlere Abschlusszeit $\bar{C}_w(\sigma)$
ist fuer jeden Ablaufplan $\sigma$ identisch.
**Beweis.**
Expandiere den Zaehler:
$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$
Reindiziere, indem $a = \sigma(k)$ und $b = \sigma(j)$ gesetzt wird. Die
Doppelsumme zaehlt jedes geordnete Paar $(a, b)$, bei dem $b$ nicht
spaeter als $a$ eingeplant ist:
$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$
Fuer jedes Paar $(a, b)$ mit $a \ne b$ gilt genau eine der Beziehungen
$\{b \preceq_\sigma a\}$ oder $\{a \prec_\sigma b\}$. Die Diagonalterme
($a = b$) tragen $p_a^2$ bei, unabhaengig von der Reihenfolge. Daher:
$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$
Zusammen mit der komplementaeren Summe decken die beiden
Nebendiagonalsummen alle ungeordneten Paare ab:
$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$
Die rechte Seite ist planungsunabhaengig. Aufgrund der Symmetrie von
$p_a p_b$ sind beide Nebendiagonalsummen gleich:
$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$
Daher:
$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$
Dieser Ausdruck enthaelt keinen Bezug auf $\sigma$. Da der Nenner
$\sum p_a$ ebenfalls planungsunabhaengig ist:
$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$
ist **ueber alle Ablaufplaene konstant**. $\blacksquare$
Dies ist ein Beispiel der Erhaltungssaetze in der Ablaufplanung, die von
Coffman, Shanthikumar und Yao [20] identifiziert wurden. Die Invarianz
entspricht der Messung, wie lange eine Einheit *Arbeit* wartet, anstatt
wie lange eine *Aufgabe* wartet — die ungewichtete Statistik zaehlt
Abschluesse statt Arbeit, weshalb sie manipulierbar ist. (Siehe auch
Little [3, 4] fuer den warteschlangentheoretischen Kontext, mit dem
Vorbehalt, dass Littles Gesetz direkt nur auf stationaere Systeme
anwendbar ist, nicht auf den hier analysierten Batch-Fall.)
### 3.3 Anschauliches Beispiel
Zwei Aufgaben: $A$ mit $p_A = 1$ Stunde, $B$ mit $p_B = 10$ Stunden.
| Ablaufplan | $C_A$ | $C_B$ | Ungewichteter Mittelwert | Arbeitsgewichteter Mittelwert |
|----------|-------|-------|-----------------|-------------------|
| SPT (A zuerst) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 |
| Umgekehrt (B zuerst) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 |
SPT erscheint **4,5 Stunden besser** bei der ungewichteten Metrik, bietet
aber **keinerlei Verbesserung** bei der arbeitsgewichteten Metrik. Der
scheinbare Vorteil existiert nur, weil die ungewichtete Statistik einer
1-Stunden-Aufgabe das gleiche „Stimmrecht" einraeumt wie einer
10-Stunden-Aufgabe.
---
## 4. Konsequenzen fuer die Servicequalitaet
### 4.1 Aushungerung grosser Aufgaben
**Satz 3 (Metrik-Verzerrung).** Jede Planungsstrategie, die die
ungewichtete mittlere Abschlusszeit minimiert, maximiert zwangslaeufig
die Abschlusszeit der groessten Aufgabe.
**Beweis.** SPT platziert die groesste Aufgabe an letzter Stelle. Ihre
Abschlusszeit entspricht der gesamten Bearbeitungszeit $\sum p_i$, was
die maximal moegliche Abschlusszeit fuer jede einzelne Aufgabe darstellt.
Unter jedem Ablaufplan, der die groesste Aufgabe nicht an die letzte
Stelle setzt, wird diese Aufgabe strikt frueher abgeschlossen.
$\blacksquare$
Dies schafft einen **Anreiz zur Aushungerung**: Rationale Akteure, die
die ungewichtete Statistik optimieren, werden grosse Aufgaben zugunsten
kleiner auf unbestimmte Zeit zurueckstellen. Austin [18] identifizierte
dieses allgemeine Muster — dass unvollstaendige Messung Anreize schafft,
die gemessene Dimension auf Kosten der ungemessenen zu optimieren — im
Kontext des organisatorischen Leistungsmanagements. Satz 3 liefert den
spezifischen Mechanismus fuer die Aufgabenplanung.
### 4.2 Maximale Abschlusszeit fuer die groesste Aufgabe
**Satz 4 (SPT maximiert eindeutig die Abschlusszeit der groessten Aufgabe).**
Unter allen Ablaufplaenen ist SPT die einzige Strategie, die der groessten
Aufgabe die maximal moegliche Abschlusszeit ($\sum p_i$) zuweist.
**Beweis.** SPT sortiert Aufgaben in aufsteigender Reihenfolge von $p_i$
und platziert die groesste Aufgabe $p_{\max}$ an die letzte Position. Die
letzte Aufgabe in jedem Ablaufplan hat die Abschlusszeit
$\sum_{i=1}^{n} p_i$, was das Maximum ist, das eine einzelne Aufgabe
erhalten kann. Unter jedem Ablaufplan, der $p_{\max}$ nicht an die letzte
Stelle setzt, wird sie strikt vor $\sum p_i$ abgeschlossen.
$\blacksquare$
**Korollar 4.1.** Ein Team, das die ungewichtete mittlere Abschlusszeit
optimiert, wird systematisch die schlechteste Erfahrung fuer Kunden mit
den komplexesten Beduerfnissen liefern. Dies ist kein Nebeneffekt — es ist
der *Mechanismus*, durch den sich die Metrik verbessert.
**Anmerkung zu Verlangsamungsverhaeltnissen.** SPT *komprimiert*
tatsaechlich die Verlangsamungsverhaeltnisse ($S_i = C_i / p_i$), da
groessere Aufgaben in spaeteren Positionen grosse Nenner haben, die die
akkumulierte Summe absorbieren. Zum Beispiel bei den Aufgaben $[1, 5, 10]$:
SPT ergibt Verlangsamungen $[1, 1.2, 1.6]$ (niedrige Varianz), waehrend
LPT $[1, 3, 16]$ ergibt (hohe Varianz). Der Schaden von SPT fuer Kunden
mit grossen Aufgaben ist nicht im Verlangsamungsverhaeltnis sichtbar — er
ist in der **absoluten Abschlusszeit** sichtbar. Diese Unterscheidung ist
wichtig: Die Literatur zur Fairness in der Ablaufplanung [21, 22, 23] hat
die Unfairness von SPT/SRPT primaer anhand verlangsamungsbasierter Masse
diskutiert, die die absolute Verzoegerungslast, die unten bewiesen wird,
verschleiern koennen.
### 4.3 Verzoegerungskonzentration
**Satz 5 (SPT konzentriert Verzoegerung auf die groesste Aufgabe).** Unter
SPT traegt die groesste Aufgabe mehr absolute Verzoegerung als unter jedem
anderen Ablaufplan.
**Beweis.** Definiere die absolute Verzoegerung als $\Delta_i = C_i - p_i$
(Wartezeit, unabhaengig von der eigenen Groesse). Unter SPT befindet sich
die groesste Aufgabe an Position $n$ mit:
$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$
Dies ist die Summe der Bearbeitungszeiten aller anderen Aufgaben — die
maximal moegliche Verzoegerung fuer eine einzelne Aufgabe. Unter jedem
Ablaufplan, in dem die groesste Aufgabe nicht an letzter Stelle steht, ist
ihre Verzoegerung strikt geringer. Gleichzeitig gibt SPT der kleinsten
Aufgabe eine Verzoegerung von null ($\Delta_1^{\text{SPT}} = 0$). Die
gesamte Warteschlangenlast wird von kleinen auf grosse Aufgaben
verlagert. $\blacksquare$
SPT minimiert die *gesamte* Verzoegerung (gut fuer die aggregierte
Effizienz), indem es die Verzoegerung auf die Aufgaben konzentriert, die
sie in Bezug auf das Verlangsamungsverhaeltnis am besten absorbieren
koennen. Aber in absoluten Zahlen — Stunden des Wartens — traegt die
groesste Aufgabe die volle Last.
### 4.4 Durchsatzinvarianz
**Satz 6 (Durchsatzinvarianz).** Die ueber einen beliebigen Zeithorizont
$T$ geleistete Gesamtarbeit ist unter allen Planungsstrategien identisch.
**Beweis.** Der Ausfuehrer verarbeitet Arbeit mit einer festen Rate. Ueber
einen beliebigen Horizont $T \ge \sum p_i$ ist die geleistete
Gesamtarbeit genau $\sum p_i$, unabhaengig von der Reihenfolge. Fuer den
stationaeren Fall mit laufenden Ankuenften wird der langfristige Durchsatz
durch die Bedienrate $\mu$ bestimmt und ist vollstaendig unabhaengig von
der Ablaufplanung:
$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{fuer alle Ablaufplaene } \sigma$$
$\blacksquare$
**Korollar 6.1.** Ein Team, das von einer beliebigen Planungsstrategie
auf SPT umstellt, wird eine Verbesserung der ungewichteten mittleren
Abschlusszeit beobachten — bei **keinerlei Aenderung des tatsaechlichen
Durchsatzes**. Die Metrik verbessert sich. Die Leistung nicht.
### 4.5 Der kombinierte Effekt
Zusammenfassung der Saetze 4, 5 und 6:
| Kenngroesse | Auswirkung der Optimierung des ungewichteten Mittelwerts |
|---------|--------------------------------------|
| Durchsatz (Arbeit/Zeit) | Keine Aenderung (Satz 6) |
| Verzoegerung fuer kleine Aufgaben | Minimiert — naehert sich null (SPT) |
| Verzoegerung fuer grosse Aufgaben | **Maximiert** — traegt die gesamte Warteschlangenlast (Satz 5) |
| Abschlusszeit der groessten Aufgabe | **Maximal moeglich**: $\sum p_i$ (Satz 4) |
Der Nettoeffekt auf die wahrgenommene Qualitaet ist negativ, weil:
1. **Verlustaversion ist asymmetrisch** [8]. Ein Kunde, dessen
100-Stunden-Aufgabe deprioritisiert wird, erlebt ein grosses, auffaelliges
Negativ. Ein Kunde, dessen 1-Stunden-Aufgabe beschleunigt wird, erlebt
ein kleines, oft unbemerktes Positiv.
2. **Aufwaendige Aufgaben korrelieren mit wertvollen Kunden.** Grosse
Aufgaben stammen ueberproportional haeufig von Grosskunden, komplexen
Vertraegen oder kritischen Geschaeftsanforderungen.
3. **Aushungerung kumuliert sich.** In einem kontinuierlichen System
(Satz 3) koennen grosse Aufgaben **unbegrenzt aufgeschoben** werden,
da staendig neue kleine Aufgaben eintreffen.
**Satz 7 (Das Kernergebnis).** Fuer ein Team, das Aufgaben
unterschiedlicher Groesse bearbeitet, bewirkt die Einfuehrung der
ungewichteten mittleren Abschlusszeit als Leistungsmetrik:
(a) **Keinerlei Produktivitaetsgewinn** (Satz 6), waehrend
(b) der groessten Aufgabe die **maximal moegliche Abschlusszeit zugewiesen
wird** (Satz 4), und
(c) **die gesamte Warteverzoegerung auf die groessten Aufgaben konzentriert
wird**, waehrend die Verzoegerung fuer die kleinsten eliminiert wird
(Satz 5).
Dies ist kein Kompromiss. Die Metrik erzeugt einen reinen Transfer von
Servicequalitaet von aufwandsintensiven Kunden zu aufwandsarmen Kunden,
ohne jeglichen Nettoarbeitsgewinn. $\blacksquare$
---
# Teil II: Prioritaetssysteme
## 5. Versagen unter Prioritaetsklassifikation
Die vorangegangenen Abschnitte haben bewiesen, dass die ungewichtete
mittlere Abschlusszeit verzerrt ist, wenn Aufgaben in ihrer Groesse
variieren. Wir zeigen nun, dass die Einfuehrung eines
**Prioritaetssystems** — wie es praktisch alle realen Teams verwenden —
dazu fuehrt, dass die Metrik nicht nur verzerrt, sondern **aktiv
adversarial** gegenueber den erklaerten Zielen der Organisation wird.
### 5.1 Erweitertes Modell: Aufgaben mit Prioritaet
Jede Aufgabe $i$ habe eine Bearbeitungszeit $p_i$ und eine
Prioritaetsklasse $q_i \in \{1, 2, 3, 4\}$, wobei 1 die hoechste
Prioritaet (kritisch) und 4 die niedrigste (kosmetisch/Erweiterung)
darstellt. Prioritaetsgewichte werden wie folgt zugewiesen:
$$w(q) = \begin{cases} 8 & q = 1 \text{ (Kritisch)} \\ 4 & q = 2 \text{ (Hoch)} \\ 2 & q = 3 \text{ (Mittel)} \\ 1 & q = 4 \text{ (Niedrig)} \end{cases}$$
Die spezifischen Gewichte sind illustrativ; die Ergebnisse gelten fuer
jede streng monoton fallende Gewichtsfunktion. Die entscheidende
Eigenschaft ist, dass die Prioritaet nach **Geschaeftsauswirkung**
vergeben wird, nicht nach Aufgabengroesse.
### 5.2 Die Metrik widerspricht dem Prioritaetssystem
**Satz 8 (Prioritaets-Groessen-Inversion).** Wenn die Prioritaet
unabhaengig von der Aufgabengroesse ist, wird der Ablaufplan, der die
ungewichtete mittlere Abschlusszeit minimiert (SPT), im Erwartungswert
Aufgaben niedriger Prioritaet vor Aufgaben hoher Prioritaet mit groesserer
Bearbeitungszeit abschliessen.
**Beweis.** SPT ordnet Aufgaben nach $p_i$ aufsteigend, unabhaengig von
$q_i$. Betrachte zwei Aufgaben:
- Aufgabe A: $p_A = 40$ Stunden, $q_A = 1$ (Kritisch — z.B. Serverausfall)
- Aufgabe B: $p_B = 0.5$ Stunden, $q_B = 4$ (Niedrig — z.B. kosmetische UI-Korrektur)
SPT plant B vor A ein. Der ungewichtete Mittelwert fuer dieses Paar:
$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$
Die Metrik erklaert SPT fuer fast **doppelt so gut** — obwohl eine
kosmetische Korrektur bearbeitet wird, waehrend ein Serverausfall
andauert.
Im Allgemeinen hat die SPT-Reihenfolge, wenn $q_i$ statistisch
unabhaengig von $p_i$ ist, eine **Korrelation von null** mit der
Prioritaet. In der Praxis erfordern kritische Aufgaben (Ausfaelle,
Sicherheitsvorfaelle, Datenverlust) oft mehr Arbeit als Aufgaben
niedriger Prioritaet, sodass die Metrik plausiblerweise
**anti-korreliert** mit dem Prioritaetssystem ist. $\blacksquare$
### 5.3 Informationsvernichtung
Der ungewichtete Mittelwert reduziert eine dreidimensionale Aufgabe
$(p_i, q_i, C_i)$ auf ein eindimensionales Signal ($C_i$) und mittelt
dann gleichfoermig. Dabei wird die Prioritaet vollstaendig verworfen und
die Groesse implizit invertiert.
**Satz 9 (Informationsvernichtung).** Sei $I(\sigma)$ die
Transinformation zwischen der impliziten Prioritaetsrangfolge des
Ablaufplans (Position) und der tatsaechlichen Prioritaetszuweisung $q_i$.
Fuer SPT gilt:
$$I(\sigma_{\text{SPT}}) = 0 \quad \text{wenn } p_i \perp q_i$$
**Beweis.** SPT weist Positionen ausschliesslich basierend auf $p_i$ zu.
Wenn $p_i$ und $q_i$ unabhaengig sind, liefert die Kenntnis der Position
einer Aufgabe im SPT-Ablaufplan keinerlei Information ueber ihre
Prioritaet. $\blacksquare$
**Korollar 9.1.** Ein Team, das die ungewichtete mittlere Abschlusszeit
optimiert, betreibt ein Planungssystem, das keinerlei Information ueber
seine eigene Prioritaetsklassifikation traegt. Das Prioritaetsfeld in
ihrem Ticketsystem ist hinsichtlich der Ausfuehrungsreihenfolge
dekorativ.
Dies ist ein Beispiel dessen, was Austin [18] als das grundlegende Problem
unvollstaendiger Messung bezeichnet: Wenn das Messsystem nur eine
Teilmenge der relevanten Dimensionen erfasst, verschlechtert die
Optimierung der Messung systematisch die nicht gemessenen Dimensionen.
### 5.4 Prioritaetsgewichtete Verzoegerungskosten
Definiere die **prioritaetsgewichteten Verzoegerungskosten** eines
Ablaufplans:
$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$
**Satz 10 (SPT und prioritaetsgewichtete Verzoegerungskosten).** Der
optimale Ablaufplan zur Minimierung von $D(\sigma)$ ist WSJF: Ordnung
nach $w(q_i)/p_i$ absteigend [1, 5]. Die SPT-Ordnung — nach $1/p_i$
absteigend — ignoriert die Prioritaet vollstaendig und erzeugt hoehere
$D$-Werte als prioritaetsrespektierende Alternativen, wenn Prioritaet mit
der Aufgabengroesse korreliert.
**Beweis.** Durch die Austauschmethode veraendert das Vertauschen
benachbarter Aufgaben $i, j$ den Wert von $D$ um:
$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$
Der Tausch verbessert $D$, wenn $w(q_j)/p_j > w(q_i)/p_i$, aber $j$
nach $i$ eingeplant ist. Daher ist die optimale Reihenfolge absteigendes
$w(q_i)/p_i$ — die WSJF-Regel. SPT entspricht WSJF nur dann, wenn
$w(q_i) = \text{const}$ (alle Aufgaben haben gleiche Prioritaet).
**Beispiel.** Kritisch ($w = 8$, $p = 3$) und Niedrig ($w = 1$, $p = 2$):
- SPT (Niedrig zuerst): $D = 1 \cdot 2 + 8 \cdot 5 = 42$
- WSJF (Kritisch zuerst): $D = 8 \cdot 3 + 1 \cdot 5 = 29$
SPT verursacht 45% mehr prioritaetsgewichtete Verzoegerung. In der Praxis
sind kritische Aufgaben tendenziell groesser (Ausfaelle,
Sicherheitsvorfaelle), was die Divergenz systematisch macht.
$\blacksquare$
---
## 6. Loesungsvorschlaege
### 6.1 Prioritaetsgewichtete Metriken
Ersetze die ungewichtete mittlere Abschlusszeit durch den
**Priority-Weighted Completion Score (PWCS)**:
$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$
Dies ist das prioritaetsgewichtete mittlere Verlangsamungsverhaeltnis. Es
misst, wie lange jede Aufgabe relativ zu ihrer Groesse gewartet hat,
gewichtet danach, wie wichtig diese Aufgabe war. Niedrigere Werte sind
besser.
**Eigenschaften:**
1. **Prioritaetsrespektierend.** Verzoegerungen bei kritischen Aufgaben
kosten 8-mal mehr als Verzoegerungen bei Aufgaben niedriger Prioritaet.
2. **Groessenfair.** Verwendet das Verlangsamungsverhaeltnis $C_i / p_i$,
sodass grosse Aufgaben nicht dafuer bestraft werden, dass sie gross
sind.
3. **Nicht durch SPT manipulierbar.** Eine Umordnung nach
Bearbeitungszeit verbessert den Wert nicht systematisch.
4. **Reduziert sich auf den ungewichteten Mittelwert bei uniformen
Aufgaben.** Eine strikte Verallgemeinerung.
### 6.2 Optimale Strategie: WSJF
**Satz 11.** Der Ablaufplan, der die prioritaetsgewichtete Abschlusszeit
$\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ minimiert,
bearbeitet Aufgaben in der Reihenfolge absteigender $w(q_i)/p_i$ — die
**Weighted Shortest Job First (WSJF)**-Regel [1, 5].
**Beweis.** Durch die Austauschmethode (wie in Satz 10) verbessert der
Tausch benachbarter Aufgaben $i, j$ den PWCT-Wert, wenn
$w(q_j)/p_j > w(q_i)/p_i$, aber $j$ nach $i$ eingeplant ist. Die
optimale Reihenfolge ist daher absteigendes $w(q_i)/p_i$.
$\blacksquare$
Innerhalb einer Prioritaetsklasse reduziert sich dies auf SPT (kuerzeste
zuerst). Ueber Klassen hinweg schlaegt eine kritische 4-Stunden-Aufgabe
($w/p = 2.0$) eine niedrigprioritaere 1-Stunden-Aufgabe ($w/p = 1.0$).
**Praktischer Vorbehalt.** Reines WSJF kann winzige Aufgaben niedriger
Prioritaet vor grosse kritische Aufgaben setzen (eine 15-Minuten-Aufgabe
niedriger Prioritaet hat $w/p = 1/0.25 = 4.0$ und schlaegt eine
6-stuendige kritische Aufgabe mit $w/p = 8/6 = 1.33$). In der Praxis wird
dies durch die Durchsetzung einer **strikten Prioritaetsklassenordnung**
und die Anwendung von WSJF nur *innerhalb* jeder Klasse abgemildert.
### 6.3 Anwendungsbeispiel: IT-Service-Desk
Betrachte ein IT-Team mit der folgenden Ticket-Warteschlange:
| Ticket | Prioritaet | Typ | Gesch. Stunden |
|--------|----------|------|-----------|
| T1 | P1 (Kritisch) | E-Mail-Server ausgefallen | 6 |
| T2 | P2 (Hoch) | VPN fuer Remote-Team fehlerhaft | 4 |
| T3 | P3 (Mittel) | Laptop-Einrichtung fuer neuen Mitarbeiter | 2 |
| T4 | P4 (Niedrig) | Desktop-Hintergrundrichtlinie aktualisieren | 0,5 |
| T5 | P3 (Mittel) | Softwarelizenz installieren | 1 |
| T6 | P1 (Kritisch) | Datenbank-Backup fehlerhaft | 3 |
| T7 | P2 (Hoch) | Druckerflotte offline | 2 |
| T8 | P4 (Niedrig) | Alten gemeinsamen Laufwerksordner archivieren | 0,25 |
**SPT-Reihenfolge** (Optimierung des ungewichteten Mittelwerts): T8, T4, T5, T3, T7, T6, T2, T1
| Pos | Ticket | Prioritaet | Stunden | Abschluss | Verlangsamung |
|-----|--------|----------|-------|------------|----------|
| 1 | T8 (Ordner archivieren) | P4 Niedrig | 0,25 | 0,25 | 1,0 |
| 2 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 0,75 | 1,5 |
| 3 | T5 (Software) | P3 Mittel | 1 | 1,75 | 1,75 |
| 4 | T3 (Laptop) | P3 Mittel | 2 | 3,75 | 1,875 |
| 5 | T7 (Drucker) | P2 Hoch | 2 | 5,75 | 2,875 |
| 6 | T6 (Backups) | P1 Krit. | 3 | 8,75 | 2,917 |
| 7 | T2 (VPN) | P2 Hoch | 4 | 12,75 | 3,188 |
| 8 | T1 (E-Mail) | P1 Krit. | 6 | 18,75 | 3,125 |
**Praktisches WSJF** (Prioritaetsklasse zuerst, SPT innerhalb der Klasse):
| Pos | Ticket | Prioritaet | Stunden | Abschluss |
|-----|--------|----------|-------|------------|
| 1 | T6 (Backups) | P1 Krit. | 3 | 3 |
| 2 | T1 (E-Mail) | P1 Krit. | 6 | 9 |
| 3 | T7 (Drucker) | P2 Hoch | 2 | 11 |
| 4 | T2 (VPN) | P2 Hoch | 4 | 15 |
| 5 | T5 (Software) | P3 Mittel | 1 | 16 |
| 6 | T3 (Laptop) | P3 Mittel | 2 | 18 |
| 7 | T8 (Archiv) | P4 Niedrig | 0,25 | 18,25 |
| 8 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 18,75 |
**Vergleich:**
| Metrik | SPT | Praktisches WSJF | Gewinner |
|--------|-----|----------------|--------|
| Ungewichteter mittlerer Abschluss | **6,56 Std.** | 13,63 Std. | SPT |
| P1 mittlere Loesungszeit | 13,75 Std. | **6 Std.** | WSJF |
| P2 mittlere Loesungszeit | 9,25 Std. | **13 Std.** | SPT |
| Zeit zur Reparatur des E-Mail-Servers | 18,75 Std. | **9 Std.** | WSJF |
| Zeit zur Reparatur der Datenbank-Backups | 8,75 Std. | **3 Std.** | WSJF |
| Zeit zur Aktualisierung des Hintergrunds | **0,75 Std.** | 18,75 Std. | SPT |
Die aggregierten prioritaetsgewichteten Abschlusszeiten sind nahezu
identisch (PWCT: 10,2 vs. 10,17), da die Aggregation den
Verteilungsschaden verbirgt. Der eigentliche Unterschied liegt in der
**Aufschluesselung nach Prioritaetsklasse**: Der E-Mail-Server ist unter
SPT 18,75 Stunden ausgefallen, gegenueber 9 Stunden unter WSJF. Die
Datenbank-Backups versagen 8,75 Stunden gegenueber 3.
Die ungewichtete Metrik berichtet zuversichtlich, dass SPT **mehr als
doppelt so effizient** ist (6,56 vs. 13,63), und belohnt das Team, das
Desktop-Hintergruende aktualisiert hat, waehrend der E-Mail-Server
brannte.
### 6.4 Empfohlenes Metrik-Set
Selbst prioritaetsgewichtete aggregierte Metriken koennen gute von
schlechten Ablaufplaenen nicht unterscheiden, da die Aggregation
Verteilungsschaeden verbirgt. Keine einzelne Metrik genuegt. Ein
vollstaendiges Messsystem sollte erfassen:
| Metrik | Was sie misst | Formel |
|--------|-----------------|---------|
| **Mittlerer Abschluss nach Prioritaetsklasse** | Reaktionsfaehigkeit pro Klasse | $\bar{C}$ gefiltert nach $q$ |
| **P1 mittlere Loesungszeit** | Reaktion auf kritische Vorfaelle | $\bar{C}$ fuer $q = 1$ |
| **Durchsatz** | Rohe Arbeitskapazitaet | Geleistete Arbeitsstunden / Kalenderzeit |
| **Alterungsverletzungen** | Verhinderung von Aushungerung | Aufgaben, die SLA nach Prioritaet ueberschreiten |
| **Maximale Abschlusszeit (P1/P2)** | Schlechtester kritischer Reaktionsfall | $\max(C_i)$ fuer $q \le 2$ |
Die zentrale Erkenntnis: **Metriken pro Prioritaetsklasse** decken
Planungsfehler auf, die aggregierte Metriken verbergen.
---
# Teil III: Organisatorische Dynamik
## 7. Wenn die Metrik das Produkt ist
Die Abschnitte 26 setzen voraus, dass die Kundenzufriedenheit eine
Funktion der *erlebten Servicequalitaet* ist. Es gibt jedoch ein
Szenario, in dem diese Annahme versagt und das gesamte Argument in sich
zusammenfaellt.
### 7.1 Die selbstreferenzielle Metrik
Angenommen, der Anbieter berichtet den ungewichteten Mittelwert direkt
an den Kunden — auf einem Dashboard, in einem SLA-Bericht, auf einer
Marketingseite — und die Zufriedenheit des Kunden leitet sich primaer
aus *dieser Zahl* ab:
$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$
Unter diesem Modell maximiert SPT tatsaechlich die Kundenzufriedenheit
(Satz 1). Der Durchsatz bleibt unveraendert (Satz 6). Das
Geschaeftsergebnis verbessert sich: gleiche Arbeit erledigt, zufriedenerer
Kunde.
**Jeder Satz in dieser Arbeit bleibt mathematisch korrekt. Aber die
Schlussfolgerung invertiert sich.** Die Metrik ist nicht laenger ein Proxy,
der manipuliert werden kann — sie *ist* die Servicequalitaet, weil der
Kunde zugestimmt hat, die Qualitaet anhand der aggregierten Zahl zu
bewerten.
### 7.2 Die Oekonomie
Dies erzeugt ein kohaerentes, stabiles Gleichgewicht:
| Akteur | Verhalten | Ergebnis |
|-------|----------|---------|
| Anbieter | Optimiert ungewichteten Mittelwert (SPT) | Metrik verbessert sich, keine Mehrarbeit |
| Kunde | Liest Dashboard, sieht niedrigen Durchschnitt | Meldet Zufriedenheit |
| Management | Sieht zufriedenen Kunden + gute Metrik | Belohnt das Team |
Der Anbieter erzeugt Zufriedenheit zu null Grenzkosten, indem er eine
Zahl optimiert, die der Kunde als Proxy fuer Qualitaet akzeptiert hat.
### 7.3 Die Fragilitaet
Dieses Gleichgewicht ist nur stabil, solange der Kunde seine eigene
Erfahrung nie ueberprueft. Es bricht zusammen, wenn:
1. **Der Kunde sein eigenes Ticket ueberprueft.** Ein CTO, dessen
E-Mail-Server 18,75 Stunden ausgefallen war, wird sich nicht durch
„Durchschnittliche Loesungszeit: 6,56 Stunden" beruhigen lassen. Die
Kunden, die am ehesten ueberprueft, sind genau diejenigen, die den
schlechtesten Service erhalten (Satz 4).
2. **Ein Wettbewerber SLAs pro Ticket anbietet.** „P1 innerhalb von
4 Stunden geloest" schlaegt „durchschnittliche Loesungszeit unter
7 Stunden" fuer jeden Kunden mit kritischen Beduerfnissen.
3. **Das Team die Metrik verinnerlicht.** Wenn das Team glaubt, die
Metrik spiegle die tatsaechliche Leistung wider, verliert es die
Faehigkeit zu erkennen, wenn kritische Arbeit vernachlaessigt wird.
Die Metrik wird zu einer epistemischen Gefahr.
### 7.4 Das allgemeine Muster
Dieses Muster — Proxy ersetzt Qualitaet, Proxy wird optimiert, Qualitaet
divergiert, System ist stabil bis es von der Realitaet getestet wird —
wiederholt sich in verschiedenen Domaenen. Muller [19] dokumentiert es
ausfuehrlich als „Metrik-Fixierung"; Campbell [24] formalisierte den
korrumpierenden Effekt der Verwendung von Indikatoren als Ziele.
| Domaene | Proxy-Metrik | Zugrunde liegende Qualitaet | Divergenz |
|--------|-------------|-------------------|------------|
| IT-Support | Durchschn. Loesungszeit | Verfuegbarkeit kritischer Systeme | Server 19 Std. ausgefallen, Durchschnitt sagt 6,5 |
| Bildung | Testergebnisse | Tatsaechliches Lernen | Lehren fuer den Test |
| Gesundheitswesen | Patientendurchsatz | Patientenergebnisse | Schnellere Entlassungen, hoehere Wiederaufnahme |
| Finanzen | Quartalsergebnisse | Langfristiger Wert | Kostensenkung blaest EPS auf, erodiert Faehigkeiten |
| Software | Velocity (Story Points) | Produktqualitaet | Punkteinflation, halbfertige Features |
### 7.5 Informationsasymmetrie
Modelliere das System als Spiel zwischen Anbieter (A) und Kunde (K). A
beobachtet die einzelnen $\{C_i\}$ und waehlt $\sigma$; K beobachtet nur
$\bar{C}(\sigma)$. Dies ist ein **Moral-Hazard**-Problem [10]: Die
optimale Strategie von A ist, das beobachtbare Signal zu minimieren,
unabhaengig von der nicht beobachtbaren Verteilung.
Das Gleichgewicht ist ein **Pooling-Gleichgewicht** [9]: Die berichtete
Metrik von A sieht unabhaengig von der zugrunde liegenden
prioritaetsgewichteten Leistung identisch aus. Es ist stabil, bis K
Zugang zu den einzelnen $C_i$-Werten erhaelt — ueber ein Kundenportal,
die Transparenz eines Wettbewerbers oder einen hinreichend schmerzhaften
Vorfall.
### 7.6 Die unbequeme Schlussfolgerung
Die ehrliche Antwort auf „Schadet die Optimierung des ungewichteten
Mittelwerts dem Geschaeft?" lautet: **Nicht unbedingt, solange der Kunde
nie hinter die Zahl schaut.** Die ehrliche Antwort auf „Ist das
nachhaltig?" lautet: Es ist genau so nachhaltig wie jedes System, in dem
der Verkaeufer mehr weiss als der Kaeufer — stabil ueber laengere
Zeitraeume, dann rapider Zusammenbruch, wenn die Asymmetrie durchbrochen
wird.
---
## 8. Die psychologischen Kosten des Wissens
Abschnitt 7 modellierte den Anbieter als einheitlichen Akteur. Aber Teams
bestehen aus Individuen. Wenn ein Teammitglied den Beweis versteht — wenn
es *weiss*, dass die Metrik synthetisch ist, dass das Dashboard Theater
ist, dass der E-Mail-Server immer noch ausgefallen ist, waehrend es
Hintergrund-Tickets schliesst — entsteht ein neuer Kostenfaktor, den das
Gleichgewichtsmodell ausgelassen hat.
### 8.1 Die verborgene Variable: Teamwissen
| Akteur | Beobachtet einzelne $C_i$ | Beobachtet $\bar{C}$ | Versteht den Beweis |
|-------|--------------------------|--------------------|-----------------------|
| Management | Moeglicherweise | Ja | Variiert |
| Teammitglied | **Ja** | Ja | **Ja** (in diesem Szenario) |
| Kunde | Nein | Ja | Nein |
Das Teammitglied hat vollstaendige Information. Es sieht die
Ticket-Warteschlange. Es weiss, dass der E-Mail-Server seit 7 Uhr
ausgefallen ist. Es weiss, dass es ein Hintergrund-Ticket schliesst, weil
es die Zahl verbessert. Und es weiss *warum*.
### 8.2 Kognitive Dissonanz unter vollstaendiger Information
Kognitive Dissonanz [11] entsteht, wenn ein Individuum widerspruechliche
Kognitionen hat. Ohne zu verstehen *warum*, kann der Widerspruch
rationalisiert werden: „Das Management weiss es besser." Das Verstaendnis
des Beweises beseitigt die Ambiguitaet. Das Teammitglied haelt nun:
- **Kognition A:** „Ich bin ein kompetenter Fachmann. Meine Aufgabe ist
es, wichtige Probleme zu loesen."
- **Kognition B:** „Ich schliesse ein Hintergrund-Ticket, waehrend der
E-Mail-Server ausgefallen ist, weil die Metrik mathematisch verzerrt
ist (Satz 1), die Umordnung keinen Durchsatz erzeugt (Satz 6), und
der einzige Nutzniesser das Dashboard ist (Abschnitt 7). Ich kann
dies beweisen."
Die Dissonanz ist nun *tragend*. Die verfuegbaren Loesungen — berufliche
Identitaet aufgeben, den Beweis ablehnen, fuer Veraenderung eintreten
oder kuendigen — verursachen jeweils Kosten, die vorher nicht existierten.
### 8.3 Selbstbestimmungstheorie: Drei verletzte Beduerfnisse
Decis und Ryans Selbstbestimmungstheorie [12, 13] identifiziert drei
Beduerfnisse, die intrinsische Motivation vorhersagen:
**Autonomie.** Die Metrik schraenkt Entscheidungen in einer Weise ein, die
das Teammitglied als mathematisch suboptimal erkennt. Ein Mitarbeiter, der
versteht, dass der Prozess nachweislich kontraproduktiv ist, kann sich bei
dessen Befolgung nicht autonom fuehlen.
**Kompetenz.** Die Metrik belohnt *scheinbare* Effektivitaet (niedriges
$\bar{C}$), waehrend sie gegenueber *tatsaechlicher* Effektivitaet
invariant ist (Satz 6). Echte Kompetenz — den E-Mail-Server zuerst zu
reparieren — wird von der Metrik *bestraft*.
**Soziale Eingebundenheit.** Das Teammitglied weiss, dass der
E-Mail-Server des Kunden ausgefallen ist. Es koennte helfen. Stattdessen
aktualisiert es Hintergruende — nicht weil es jemandem hilft, sondern weil
es einer Zahl hilft. Die Verbindung zwischen Arbeit und menschlicher
Wirkung ist gekappt, und das Teammitglied kann die getrennten Enden sehen.
### 8.4 Moralische Verletzung
Moralische Verletzung [16, 17] ist der dauerhafte Schaden, der durch
„Begehen, Nicht-Verhindern, Bezeugen oder Erfahren von Handlungen, die
tief verwurzelte moralische Ueberzeugungen verletzen" [17] verursacht
wird. Das Konzept wurde seitdem auf geschaeftliche Kontexte erweitert
[25]. Die entscheidende Unterscheidung zu Burnout: **Burnout ist
Erschoepfung durch zu viel Arbeit. Moralische Verletzung ist Schaden
durch das Tun des Falschen.**
Ein Teammitglied, das weiss, dass der E-Mail-Server ausgefallen ist, das
weiss, dass es ihn reparieren sollte, stattdessen ein Hintergrund-Ticket
schliesst und dies tut, weil die Metrik es verlangt, erlebt die
strukturellen Bedingungen fuer moralische Verletzung.
### 8.5 Erlernte Hilflosigkeit und Metrik-Fatalismus
Seligmans erlernte Hilflosigkeit [14, 15] beschreibt, wie die
Konfrontation mit unkontrollierbaren negativen Ergebnissen zu Passivitaet
fuehrt. Die Abfolge:
1. Die Metrik ist fehlerhaft (Beweis verstanden).
2. Fuer Veraenderung eintreten.
3. Abgelehnt („die Zahlen sind gut, mach keine Wellen").
4. Wiederholung mit abnehmender Ueberzeugung.
5. Endzustand: „Die Metrik ist wie sie ist. Ich schliesse einfach Tickets."
Dies ist keine Faulheit. Es ist die rationale Reaktion auf ein System, das
korrektes Verhalten bestraft und inkorrektes Verhalten belohnt, wenn das
Individuum keine Macht hat, das System zu aendern.
### 8.6 Die adversariale Selektionsspirale
Kombination des Gleichgewichts aus Abschnitt 7 mit der
Fluktuationsdynamik:
1. Organisation fuehrt ungewichteten Mittelwert ein. Metrik sieht gut aus
(SPT).
2. Bewusste, kompetente Teammitglieder erleiden psychologische Kosten
(8.28.5).
3. Diese Mitglieder gehen. Sie werden durch Mitglieder ersetzt, die die
Maengel der Metrik nicht verstehen oder denen sie gleichgueltig sind.
4. Die Metrik sieht weiterhin gut aus — sie tut dies unter SPT immer,
unabhaengig von der Teamkompetenz (Korollar 6.1).
5. Die tatsaechliche Servicequalitaet verschlechtert sich, aber die Metrik
kann dies nicht erkennen (Korollar 9.1).
6. Zurueck zu Schritt 1.
Die Metrik selektiert *gegen* die Personen, die das System verbessern
wuerden, und *fuer* die Personen, die es nicht in Frage stellen werden.
Das System stabilisiert sich auf einem niedrigeren Kompetenzniveau,
unsichtbar fuer seinen eigenen Messapparat.
### 8.7 Das vollstaendige Kostenmodell
| Abschnitt 7 (sichtbar) | Abschnitt 8 (verborgen) |
|---------------------|---------------------|
| Kunde zufrieden (gute Zahl) | Team unzufrieden (schlechte Realitaet) |
| Durchsatz unveraendert | Freiwilliges Engagement zurueckgezogen |
| Metrik verbessert sich | Kompetente Mitglieder gehen |
| Geschaeftsoekonomie stabil | Institutionelle Kompetenz degeneriert |
Diese wirken auf unterschiedlichen Zeitskalen: Das Gleichgewicht ist
quartalsweise sichtbar; die Kompetenzdegradation wird ueber Jahre
sichtbar. Das vollstaendige Modell lautet: **Die Metrik funktioniert, und
sie ist destruktiv, und die Destruktion ist fuer die Metrik unsichtbar.**
Die Metrik ist frischer Anstrich auf korrodiertem Bewehrungsstahl.
---
## 9. Manager-Internalisierung: Die umsetzbare Loesung
Die Abschnitte 26 sagen: Lehne die Metrik ab. Abschnitt 7 sagt: Die
Metrik funktioniert (fuer das Geschaeft). Abschnitt 8 sagt: Sie
zerstoert das Team. In der Praxis koennen die meisten Manager die Metrik
nicht einseitig aendern. Die beste Loesung ist eine unternehmensweite
Metrikreform. Die *umsetzbare* Loesung ist, was ein einzelner informierter
Manager jetzt tun kann.
### 9.1 Die Strategie
Ein Manager, der den Beweis versteht, kann **die Limitierungen der
Metrik internalisieren, ohne sie an das Team weiterzugeben**:
1. **Primaer nach Prioritaet planen.** Das Team bearbeitet kritische
Aufgaben zuerst.
2. **Taktisch kleine Aufgaben einstreuen.** Wenn eine kleine Aufgabe
niedriger Prioritaet abgeschlossen werden kann, ohne die
hochprioritaere Arbeit wesentlich zu verzoegern, erledige sie. Nicht
weil die Metrik es verlangt, sondern weil sie ebenfalls erledigt werden
muss und fast nichts kostet.
3. **Niemals die Metrik als Motivation offenlegen.** „Erledige diese
schnelle Aufgabe, waehrend wir auf den Rueckruf des Lieferanten zum
P1 warten" — nicht „Wir muessen unseren Durchschnitt senken." Die
intrinsische Motivation des Teams bleibt intakt (Abschnitt 8). Der
Manager absorbiert die Last des Metrik-Managements.
### 9.2 Formalisierung
Das Optimierungsproblem des Managers ist eine eingeschraenkte Optimierung:
$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{unter der Nebenbedingung} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$
**Satz 12 (Begrenzte Metrikkosten der Prioritaetsplanung).** Ein Manager,
der SPT *innerhalb* jeder Prioritaetsklasse und Prioritaetsordnung
*zwischen* den Klassen anwendet, wird eine Metrik nahe dem
SPT-optimalen Wert erzielen — die Luecke entsteht nur durch
zwischenklassige Inversionen.
**Beweisskizze.** Innerhalb jeder Prioritaetsklasse ist SPT kostenlos
(alle Aufgaben haben gleiche Prioritaet). Die einzige Abweichung vom
globalen SPT ist die Ordnung zwischen den Klassen. Jede
klassenuebergreifende Inversion kostet hoechstens
$p_{\text{large}} - p_{\text{small}}$ in der ungewichteten Summe, und
diese Inversionen sind durch die Anzahl der Klassen begrenzt. In der
Praxis liegt die Luecke typischerweise innerhalb von 1020% des
SPT-Optimums. $\blacksquare$
### 9.3 Der Manager als Informationsbarriere
| Ebene | Sieht Metrik | Sieht Prioritaeten | Sieht Beweis |
|-------|-----------|----------------|------------|
| Organisation | Ja | Nominell | Nein |
| Manager | Ja | Ja | **Ja** |
| Team | Nein (abgeschirmt) | Ja | Irrelevant |
| Kunde | Ja (Dashboard) | Ueber SLA | Nein |
Der Manager ist der einzige Akteur, der alle drei Informationsstuecke
besitzt. Dies ist keine Manipulation — er erledigt die richtige Arbeit in
der richtigen Reihenfolge, und die Metrik ist akzeptabel, weil SPT
innerhalb der Klassen kostenlos ist.
### 9.4 Der Zusammenbruch im Wettbewerb
Diese Strategie versagt, wenn die Metrik **wettbewerblich zwischen Teams**
eingesetzt wird.
**Fall 1: Kooperativ** — Teams werden auf Paritaet gemessen, nicht auf
Rangfolge. Jeder Manager wendet unabhaengig die Internalisierungsstrategie
an. Die Metrik ist dekorativ, aber harmlos. Dies ist ein
**Koordinationsspiel** mit einem stabilen kooperativen Gleichgewicht.
**Fall 2: Wettbewerblich** — Teams werden nach $\bar{C}$ rangiert. Dies
ist ein **Gefangenendilemma**:
| | Team B: Prioritaet zuerst | Team B: SPT |
|---|---|---|
| **Team A: Prioritaet zuerst** | (Gute Arbeit, Gute Arbeit) | (A sieht schlecht aus, B sieht gut aus) |
| **Team A: SPT** | (A sieht gut aus, B sieht schlecht aus) | (Beide sehen gut aus, beide machen falsche Arbeit) |
Das Nash-Gleichgewicht ist (SPT, SPT). Die Internalisierungsstrategie ist
ein kooperatives Gleichgewicht, das **unter Wettbewerb nicht stabil** ist.
### 9.5 Geltungsbereich
| Bedingung | Tragfaehigkeit |
|-----------|-----------|
| Metrik zur Gesundheitspruefung / Paritaet verwendet | **Tragfaehig** |
| Metrik sichtbar, aber nicht rangiert | **Tragfaehig** |
| Metrik teamuebergreifend rangiert | **Fragil** — erfordert Kooperation aller Manager |
| Metrik an Verguetung / Ressourcen gekoppelt | **Nicht tragfaehig** — Gefangenendilemma dominiert |
| Metrikreform auf Organisationsebene moeglich | **Unnoetig** — behebe stattdessen die Metrik |
**Die beste Loesung ist unternehmensweit. Die umsetzbare Loesung ist ein
Manager, der diesen Beweis versteht, sein Team vor der Metrik abschirmt,
nach Prioritaet plant und SPT nur innerhalb von Prioritaetsklassen
einsetzt, um die Zahl in einem akzeptablen Rahmen zu halten.**
---
# Teil IV: Bewertung
## 10. Advocatus Diaboli
Intellektuelle Ehrlichkeit erfordert die Anerkennung der Grenzen der
Argumentation.
### 10.1 Einfachheit hat einen realen Wert
**Argument.** Der ungewichtete Mittelwert erfordert keine
Prioritaetsgewichte, keine Aufgabengroessenschaetzungen, keine
Kalibrierung.
**Bewertung: Korrekt.** Aber die ungewichtete Metrik vermeidet keine
Annahmen — sie *verbirgt* sie, indem sie implizit alle Gewichte auf 1 und
alle Groessen auf 1 setzt. Eine bekannt ungenaue Schaetzung der
Aufgabengroesse ist immer noch informativer als die implizite Annahme,
dass alle Groessen gleich sind.
### 10.2 Minimierung der Anzahl wartender Personen
**Argument.** SPT minimiert die gesamten Personen-Stunden des Wartens.
Wenn jede Aufgabe einen Kunden repraesentiert, ist dies optimal.
**Bewertung: Mathematisch korrekt.** Wenn Sie eine Zulassungsstelle
betreiben und die Zeit jeder Person gleich wertvoll ist, ist SPT die
richtige Strategie. Sie versagt, wenn Aufgaben nicht im Verhaeltnis 1:1
zu Kunden stehen, die Wartekosten nicht einheitlich sind oder die Metrik
zur Bewertung von Teams statt zur Bedienung einer buchstaeblichen
Warteschlange verwendet wird.
### 10.3 SPT als Triage-Heuristik
**Argument.** Wenn sich Aufgabengroessen eng buendeln, approximiert SPT
FIFO und der ungewichtete Mittelwert approximiert den gewichteten
Mittelwert.
**Bewertung: Korrekt.** Der Variationskoeffizient $CV = \sigma_p / \bar{p}$ bestimmt das Ausmass der Verzerrung:
| $CV$ | Aufgabengroessenverteilung | Verzerrung |
|------|----------------------|------------|
| < 0,3 | Eng (Callcenter) | Vernachlaessigbar |
| 0,3 1,0 | Moderat (gemischte IT) | Moderat |
| > 1,0 | Breit (typische IT-Warteschlange) | Schwerwiegend |
Ein typischer IT-Desk umfasst 15 Minuten bis 40+ Stunden ($CV > 2$). Die
Verzerrung ist kein Grenzfall — sie ist der Normalfall.
### 10.4 Manipulation erfordert boeswillige Absicht
**Argument.** Die Saetze zeigen, dass die Metrik manipuliert werden
*kann*, nicht dass sie manipuliert *wird*.
**Bewertung: Dies ist das staerkste Gegenargument.** Wenn die Metrik
rein informativ ist und niemals Verhalten beeinflusst, fehlt der
Manipulationsanreiz. Allerdings wird jede Metrik, die dem Management
berichtet, an OKRs gekoppelt oder in Retrospektiven diskutiert wird,
Verhalten beeinflussen. Dies ist Goodharts Gesetz [6, 7] — und es gilt
fuer gut gemeinte Teams ebenso zuverlaessig wie fuer zynische. Die
Verschiebung geschieht organisch: Drei einfache Tickets abzuschliessen
„fuehlt sich produktiv an", waehrend die Metrik das Gefuehl bestaetigt.
### 10.5 Wann der ungewichtete Mittelwert vertretbar ist
Die Metrik ist **nur dann vertretbar, wenn alle vier Bedingungen
gleichzeitig gelten**:
1. Aufgabengroessen sind annaehernd einheitlich ($CV < 0,3$)
2. Keine Prioritaetsdifferenzierung (alle Aufgaben gleich wichtig)
3. Jede Aufgabe repraesentiert genau einen Kunden
4. Die Metrik wird nicht zur Bewertung, Belohnung oder Verhaltenssteuerung
eingesetzt
Diese Bedingungen sind in den Systemen, in denen die Metrik am haeufigsten
eingesetzt wird, selten erfuellt.
---
## 11. Verwandte Arbeiten
Diese Arbeit steht an der Schnittstelle mehrerer Literaturbereiche, die
zuvor nicht miteinander verbunden wurden.
### 11.1 Ablaufplanungstheorie und Fairness
Smith [1] etablierte das SPT-Optimalitaetsergebnis und die WSJF-Regel im
Jahr 1956. Conway, Maxwell und Miller [2] lieferten die umfassende
Lehrbuchdarstellung. Die Fairness groessenbasierter Planungsstrategien
wurde in der Ablaufplanung fuer Computersysteme diskutiert: Bansal und
Harchol-Balter [22] untersuchten die SRPT-Unfairness; Wierman und
Harchol-Balter [23] formalisierten Fairness-Klassifikationen gegenueber
Processor-Sharing; Angel, Bampis und Pascual [21] massen die
SPT-Ablaufplanqualitaet anhand fairer Optimalitaetskriterien.
Diese frueheren Arbeiten analysieren Fairness in der CPU- und
Server-Ablaufplanung. Die vorliegende Arbeit wendet dieselben
mathematischen Ergebnisse auf *organisatorisches Aufgabenmanagement* an,
bei dem der „Scheduler" ein menschliches Team ist, die „Jobs"
Kundenanfragen mit geschaeftsrelevanten Prioritaeten sind und die
„Zielfunktion" eine Management-Metrik ist. Der Mechanismus ist identisch;
die Konsequenzen unterscheiden sich, weil organisatorische Ablaufplanung
Prioritaetssysteme, Kundenbeziehungen und psychologische Kosten hat, die
CPU-Ablaufplanung nicht hat.
### 11.2 Messdysfunktion
Austin [18] bewies, dass unvollstaendige Messung — die Messung nur einer
Teilmenge der relevanten Dimensionen — Anreize schafft, die gemessenen
Dimensionen auf Kosten der ungemessenen zu optimieren, und dass dieser
Effekt nicht nur moeglich, sondern *unvermeidlich* ist, wenn die Messung
an Belohnungen gekoppelt wird. Sein Rahmen der Informationsasymmetrie
entspricht eng Abschnitt 7. Die vorliegende Arbeit liefert den
spezifischen mathematischen Mechanismus (Saetze 12) fuer den Fall der
Aufgabenplanung und erweitert die Argumentation durch Psychologie
(Abschnitt 8), um die vollstaendige Kette organisatorischen Schadens
nachzuzeichnen.
Muller [19] dokumentierte „Metrik-Fixierung" in Bildung,
Gesundheitswesen, Polizei und Finanzen und lieferte umfangreiche
empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster.
Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung
von Indikatoren als Ziele und ergaenzte damit Goodharts urspruengliche
Beobachtung [6] und Stratherns Verallgemeinerung [7].
Bevan und Hood [26] dokumentierten empirisch Manipulationsverhalten im
englischen oeffentlichen Gesundheitssystem — einschliesslich genau der
Muster des „Ziel getroffen und den Sinn verfehlt", die in unserem
Abschnitt 5.2 beschrieben werden.
### 11.3 Psychologische Kosten von Metrikdysfunktion
Die Anwendung moralischer Verletzung (Shay [16], Litz et al. [17]) auf
geschaeftliche Kontexte hat juengere Vorlaeufer: Eine Studie im *Journal
of Business Ethics* von 2024 [25] erweiterte das Konstrukt explizit auf
gewinnorientierte Arbeitsplaetze und fand strukturelle Bedingungen, die
den in Abschnitt 8.4 beschriebenen aehneln. Moore [27] analysierte
moralisches *Disengagement* — die kognitive Umstrukturierung, die
unethisches Verhalten unter organisatorischem Druck ermoeglicht. Die
vorliegende Arbeit behandelt das komplementaere Phaenomen: den Schaden
fuer Individuen, die sich *weigern*, sich zu distanzieren.
### 11.4 Was ist neu
Die einzelnen Komponenten — SPT-Optimalitaet, Goodharts Gesetz,
Messdysfunktion, moralische Verletzung — haben alle Vorlaeufer. Die
Beitraege dieser Arbeit sind:
1. **Der Erhaltungssatz (Satz 2) praeskriptiv verwendet** — als
konstruktives Argument, dass arbeitsgewichtete Abschlusszeit *nicht*
manipuliert werden kann, anstatt als theoretisches
Ablaufplanungsergebnis.
2. **Der spezifische Beweis, dass Prioritaetsklassen die Metrik
algebraisch adversarial machen** (Saetze 89) — nicht lediglich
empirisch schlecht, sondern strukturell widerspruechlich, mit null
Transinformation zwischen Ablaufplan und Prioritaetssystem.
3. **Die integrierte Kette** vom mathematischen Beweis ueber
Informationsasymmetrie ueber psychologischen Schaden zur adversarialen
Selektionsspirale — die Verfolgung einer einzelnen Metrik von Smith
(1956) bis zur organisatorischen Aushoelung.
4. **Die Manager-Internalisierungsstrategie** (Abschnitt 9) mit formaler
spieltheoretischer Analyse ihrer Stabilitaet und
Zusammenbruchbedingungen unter teamuebergreifendem Wettbewerb.
5. **Die Anwendung der Ablaufplanungstheorie auf organisatorische
Managementkritik** — der Beweis, dass eine gaengig verwendete
Team-Metrik spezifische, quantifizierbare Pathologien aufweist,
anstatt anekdotisch oder aus allgemeinen Prinzipien zu argumentieren.
---
## 12. Schlussfolgerung
Die ungewichtete durchschnittliche Abschlusszeit ist eine **verzerrte
Statistik**, die:
1. Durch Planungsstrategie **manipuliert werden kann** (Satz 1), im
Gegensatz zur arbeitsgewichteten Abschlusszeit, die planungsinvariant
ist (Satz 2).
2. Die **Aushungerung** grosser Aufgaben **incentiviert** (Satz 3).
3. Die **Kundenzufriedenheit verschlechtert**, ohne kompensierenden
Produktivitaetsgewinn (Satz 7).
4. **Prioritaetssystemen aktiv widerspricht**, indem sie keinerlei
Information ueber die Geschaeftsauswirkungsklassifikation traegt
(Satz 9).
5. **Prioritaet vollstaendig ignoriert** in ihrer Planungsempfehlung und
suboptimale prioritaetsgewichtete Verzoegerung erzeugt, wann immer
Prioritaet und Groesse nicht perfekt invers korreliert sind (Satz 10).
Eine Metrik, die durch Umordnung der Arbeit verbessert werden kann — ohne
zusaetzliche Arbeit zu leisten — misst die Planungsstrategie, nicht die
Kapazitaet des Systems. In Kombination mit einem Prioritaetssystem
empfiehlt sie den Ablaufplan, der den groessten Schaden an der
hoechstprioritaeren Arbeit anrichtet.
Wenn die Metrik an Kunden berichtet wird, erzeugt sie eine
Informationsasymmetrie (Abschnitt 7), deren Geschaeftsgleichgewicht
profitabel, aber fragil ist. Wenn Teammitglieder ihre Maengel verstehen,
verletzt sie deren intrinsische Motivation und selektiert fuer den
Weggang der kompetentesten Personen (Abschnitt 8). Ein einzelner
informierter Manager kann diese Effekte durch eingeschraenkte Optimierung
teilweise abmildern (Abschnitt 9), aber diese kooperative Strategie ist
unter teamuebergreifendem Wettbewerb nicht stabil.
Der ungewichtete Mittelwert ist nur unter engen Bedingungen vertretbar
(Abschnitt 10.5): einheitliche Aufgabengroessen, keine Prioritaeten,
Eins-zu-eins-Zuordnung von Kunden zu Aufgaben und kein
Verhaltenseinfluss. Diese Bedingungen sind selten erfuellt.
**Die ungewichtete durchschnittliche Abschlusszeit ist kein faires oder
genaues Mass fuer die Aufgabenausfuehrungsleistung. Ihre Einfuehrung als
Team-Metrik wird rational zur Aushungerung komplexer Arbeit, zur
Verletzung erklaerter Prioritaeten, zu ungerechten Kundenergebnissen und
zur Illusion von Produktivitaet fuehren, wo keine existiert.**
Die beste Loesung ist eine organisatorische Metrikreform. Die umsetzbare
Loesung ist ein Manager, der diesen Beweis versteht.
---
## Literaturverzeichnis
### Ablaufplanungstheorie
[1] Smith, W. E. (1956). Various optimizers for single-stage production.
*Naval Research Logistics Quarterly*, 3(12), 5966.
doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106)
> Ursprung des SPT-Optimalitaetsergebnisses (Satz 1), der Regel fuer die
> gewichtete Abschlusszeit $w_i/p_i$ absteigend (WSJF, Satz 11) und der
> Beweistechnik des paarweisen Austauschs benachbarter Aufgaben
> (Austauschmethode), die durchgehend verwendet wird.
[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of
Scheduling*. Addison-Wesley.
> Standardlehrbuch zur Einmaschinenablaufplanungstheorie, das Smiths
> Ergebnisse erweitert.
[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW.
*Operations Research*, 9(3), 383387.
doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383)
> Erster rigoroser Beweis von Littles Gesetz. Referenziert in Abschnitt 3.2
> fuer den warteschlangentheoretischen Kontext.
[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th
anniversary. *Operations Research*, 59(3), 536549.
doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941)
> Rueckblick mit Diskussion von Umfang, Einschraenkungen und haeufigen
> Fehlanwendungen.
[5] Reinertsen, D. G. (2009). *The Principles of Product Development
Flow: Second Generation Lean Product Development*. Celeritas Publishing.
ISBN: 978-0-9844512-0-8.
> Popularisierte WSJF und „Cost of Delay / Duration" in agilen/schlanken
> Kontexten. Die mathematische Grundlage ist Smith (1956) [1].
### Messung und Anreize
[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K.
experience. In *Monetary Theory and Practice* (pp. 91121). Macmillan.
> Quelle von Goodharts Gesetz: „Jede beobachtete statistische
> Regelmaessigkeit wird dazu neigen zusammenzubrechen, sobald Druck auf
> sie zu Kontrollzwecken ausgeuebt wird."
[7] Strathern, M. (1997). 'Improving ratings': Audit in the British
university system. *European Review*, 5(3), 305321.
doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4)
> Verallgemeinerung von Goodharts Gesetz: „Wenn ein Mass zum Ziel wird,
> hoert es auf, ein gutes Mass zu sein."
### Verhaltensoekonomie
[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of
decision under risk. *Econometrica*, 47(2), 263292.
doi:[10.2307/1914185](https://doi.org/10.2307/1914185)
> Etablierte die Verlustaversion. Referenziert in Abschnitt 4.5.
### Spieltheorie und Vertragstheorie
[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty
and the market mechanism. *The Quarterly Journal of Economics*, 84(3),
488500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431)
> Informationsasymmetrie und adverse Selektion. Das Pooling-Gleichgewicht
> in Abschnitt 7.5 ist strukturell analog.
[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell
Journal of Economics*, 10(1), 7491.
doi:[10.2307/3003320](https://doi.org/10.2307/3003320)
> Formale Behandlung von Moral Hazard. Das Metrik-Berichtsszenario in
> Abschnitt 7.5 ist ein Moral-Hazard-Problem.
### Psychologie
[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford
University Press. ISBN: 978-0-8047-0131-0.
> Grundlegende Theorie. Referenziert in Abschnitt 8.2.
[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and
Self-Determination in Human Behavior*. Plenum Press.
ISBN: 978-0-306-42022-1.
> Originaldarstellung der Selbstbestimmungstheorie. Referenziert in
> Abschnitt 8.3.
[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and
the facilitation of intrinsic motivation, social development, and
well-being. *American Psychologist*, 55(1), 6878.
doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68)
> SDT-Ueberblick, der Beduerfnisbefriedigung mit intrinsischer Motivation
> und Wohlbefinden verknuepft.
[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape
traumatic shock. *Journal of Experimental Psychology*, 74(1), 19.
doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514)
> Urspruengliche Demonstration der erlernten Hilflosigkeit. Referenziert
> in Abschnitt 8.5.
[15] Seligman, M. E. P. (1975). *Helplessness: On Depression,
Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3.
> Erweiterte Darstellung, die erlernte Hilflosigkeit mit menschlicher
> Depression und institutionellem Verhalten verbindet.
[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing
of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.
> Einfuehrung des Konzepts der moralischen Verletzung. Referenziert in
> Abschnitt 8.4.
[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P.,
Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war
veterans: A preliminary model and intervention strategy. *Clinical
Psychology Review*, 29(8), 695706.
doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003)
> Formalisierte moralische Verletzung als klinisches Konstrukt. Definition
> zitiert in Abschnitt 8.4.
### Organisatorische Messung
[18] Austin, R. D. (1996). *Measuring and Managing Performance in
Organizations*. Dorset House. ISBN: 978-0-932633-36-1.
> Bewies, dass unvollstaendige Messung unvermeidlich Anreize schafft, die
> gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren. Der
> Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Der
> wichtigste einzelne Vorlaeufer der Argumentation dieser Arbeit.
[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University
Press. ISBN: 978-0-691-17495-2.
> Umfassende Behandlung der „Metrik-Fixierung" in Bildung,
> Gesundheitswesen, Polizei und Finanzen. Umfangreiche empirische Belege
> fuer die in Abschnitt 7.4 theoretisierten Muster.
### Fairness in der Ablaufplanung
[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992).
Multiclass queueing systems: Polymatroid structure and optimal scheduling
control. *Operations Research*, 40(S2), S293S299.
> Erhaltungssaetze in der Ablaufplanung. Die Planungsinvarianz der
> arbeitsgewichteten Abschlusszeit (Satz 2) ist ein Beispiel dieser
> Erhaltungssaetze.
[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT
schedules for fair optimality criteria? *Annals of Operations Research*,
159(1), 5364. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0)
> Misst direkt die Qualitaet von SPT-Ablaufplaenen anhand von
> Fairness-Kriterien. Naechster Vorlaeufer in der Ablaufplanungstheorie
> zur Fairness-Analyse in Abschnitt 4.
[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT
scheduling: Investigating unfairness. *ACM SIGMETRICS Performance
Evaluation Review*, 29(1), 279290.
doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792)
> Untersucht die Ueberzeugung, dass SRPT grosse Auftraege in der
> Computerablaufplanung unfair benachteiligt. Argumentiert, dass die
> Unfairness geringer ist als angenommen, erkennt aber die
> Grundspannung an.
[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling
policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS
Performance Evaluation Review*, 31(1), 238249.
> Formalisiert Fairness-Definitionen fuer Planungsstrategien durch
> Vergleich mit Processor-Sharing.
### Weitere Referenzen
[24] Campbell, D. T. (1979). Assessing the impact of planned social
change. *Evaluation and Program Planning*, 2(1), 6790.
doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X)
> Campbells Gesetz: „Je mehr ein quantitativer sozialer Indikator fuer
> soziale Entscheidungsfindung verwendet wird, desto mehr wird er
> Korruptionsdruck ausgesetzt sein und desto eher wird er die sozialen
> Prozesse, die er ueberwachen soll, verzerren und korrumpieren."
> Ergaenzt Goodharts Gesetz [6].
[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study
of moral injury in business settings. *Journal of Business Ethics*.
doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0)
> Erweitert moralische Verletzung auf gewinnorientierte Arbeitsplaetze.
> Validiert die Anwendung von Shay/Litz in Abschnitt 8.4 ueber
> militaerische und Gesundheitskontexte hinaus.
[26] Bevan, G., & Hood, C. (2006). What's measured is what matters:
Targets and gaming in the English public health care system. *Public
Administration*, 84(3), 517538.
doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x)
> Dokumentiert empirisch Manipulationsverhalten einschliesslich „Ziel
> getroffen und den Sinn verfehlt". Liefert reale Belege fuer den
> Prioritaets-Metrik-Widerspruch in Abschnitt 5.2.
[27] Moore, C. (2012). Why employees do bad things: Moral disengagement
and unethical organizational behavior. *Personnel Psychology*, 65(1),
148. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x)
> Analysiert moralisches *Disengagement* — die kognitive Umstrukturierung,
> die unethisches Verhalten ermoeglicht. Abschnitt 8 behandelt das
> komplementaere Phaenomen: den Schaden fuer Individuen, die sich
> *weigern*, sich zu distanzieren.
---
*Dieser Beweis wurde im Gespraech entwickelt und am 28.03.2026 formalisiert.*