Files
task-queue-proof/README.pl.md
T
Mortdecai b6d42d3237 Add 10 translations: ES, TH, FR, EO, PL, DE, PT, AR, TL, ZH
Complete translations of the full paper into:
- Spanish (README.es.md)
- Thai (README.th.md)
- French (README.fr.md)
- Esperanto (README.eo.md)
- Polish (README.pl.md)
- German (README.de.md)
- Portuguese/Brazilian (README.pt.md)
- Arabic/MSA (README.ar.md)
- Tagalog/Filipino (README.tl.md)
- Simplified Chinese (README.zh.md)

All translations preserve mathematical notation, LaTeX formulas,
citation numbers, and markdown formatting. Reference citations kept
in English with translated annotations.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-29 00:36:57 -04:00

1321 lines
59 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Nieważony średni czas realizacji nie jest sprawiedliwą miarą szeregowania zadań
Dowód matematyczny, że nieważony średni czas realizacji zadań jest obciążoną
statystyką, która zachęca do selektywnego wybierania łatwych zadań, oraz że
wszelka przewaga szeregowania, jaką wydaje się ona ujawniać, jest artefaktem
metryki — a nie odzwierciedleniem rzeczywistej przepustowości czy jakości
obsługi.
---
## 1. Wprowadzenie
Wiele organizacji mierzy wydajność realizacji zadań za pomocą **nieważonego
średniego czasu realizacji**: średniej liczby godzin (lub dni) od zgłoszenia
zadania do jego rozwiązania, traktując każde zadanie jednakowo, niezależnie
od rozmiaru czy priorytetu.
Niniejsza praca dowodzi, że ta metryka jest nie tylko nieprecyzyjna, ale
strukturalnie obciążona. Można ją poprawić przez zmianę kolejności pracy
bez wykonywania jakiejkolwiek dodatkowej pracy (Twierdzenie 1), podczas
gdy odpowiednio ważona alternatywa jest całkowicie odporna na manipulację
kolejnością (Twierdzenie 2). W połączeniu z systemem priorytetów metryka
aktywnie przeczy własnym klasyfikacjom priorytetów organizacji
(Twierdzenie 9).
Argumentacja przebiega w czterech częściach:
- **Część I** (Rozdziały 24) ustanawia fundament matematyczny:
nieważona średnia jest podatna na manipulację przez szeregowanie
metodą najkrótszego czasu przetwarzania (SPT), średnia ważona pracą
jest niezmienna względem kolejności, a wynikające z tego konsekwencje
dla jakości obsługi są dowodliwie negatywne.
- **Część II** (Rozdziały 56) rozszerza model o zadania z przypisanym
priorytetem, dowodzi, że metryka staje się adwersaryczna wobec
systemu priorytetów, oraz proponuje ważone alternatywy wraz
z rozpatrzonym przykładem działu obsługi IT.
- **Część III** (Rozdziały 79) analizuje dynamikę organizacyjną: co się
dzieje, gdy metryka jest raportowana klientom (asymetria informacji),
co się dzieje z członkami zespołu, którzy rozumieją jej wady (szkoda
psychologiczna), oraz co może zrobić pojedynczy świadomy menedżer
(optymalizacja z ograniczeniami z analizą stabilności
teoriogrową).
- **Część IV** (Rozdziały 1012) przedstawia uczciwe kontrargumenty,
osadza pracę w istniejącej literaturze i formułuje wnioski.
Główne wyniki opierają się na fundamentalnej teorii szeregowania Smitha
(1956) [1], rozszerzonej przez teorię gier [9, 10], teorię pomiarów
organizacyjnych [18, 19] oraz psychologię [1117], tworząc kompletny
łańcuch od dowodu matematycznego dotyczącego konkretnej metryki do
wyników organizacyjnych.
---
# Część I: Fundament matematyczny
## 2. Definicje
Niech będzie danych **n** zadań o czasach przetwarzania $p_1, p_2, \ldots, p_n$.
**Harmonogram** $\sigma$ jest permutacją $\{1, 2, \ldots, n\}$ przypisującą
zadania do kolejności wykonania na pojedynczym wykonawcy.
**Czas realizacji** zadania $\sigma(k)$ w harmonogramie $\sigma$ wynosi:
$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$
**Nieważony średni czas realizacji** wynosi:
$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$
**Średni czas realizacji ważony pracą** wynosi:
$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$
---
## 3. Wyniki główne
### 3.1 Nieważona średnia jest podatna na manipulację
**Twierdzenie 1** (Smith, 1956 [1])**.** Harmonogramem minimalizującym
$\bar{C}(\sigma)$ jest metoda najkrótszego czasu przetwarzania (SPT):
posortuj zadania tak, aby
$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$.
**Dowód (argument wymiany [1, 2]).**
Rozważmy dowolny harmonogram $\sigma$, w którym dwa sąsiednie zadania
$i, j$ spełniają $p_i > p_j$, przy czym zadanie $i$ jest zaplanowane
bezpośrednio przed zadaniem $j$. Niech $t$ będzie czasem rozpoczęcia
zadania $i$.
| | Zadanie $i$ kończy się | Zadanie $j$ kończy się | Suma |
|---|---|---|---|
| **Przed zamianą** ($i$ potem $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ |
| **Po zamianie** ($j$ potem $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ |
Zmiana w sumie czasów realizacji wynosi:
$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$
Każda zamiana pary sąsiedniej typu dłuższy-przed-krótszym ściśle redukuje
sumę. Każdy harmonogram niebędący SPT zawiera taką parę. Powtarzane zamiany
zbiegają do SPT. Zatem SPT jednoznacznie minimalizuje $\bar{C}(\sigma)$. $\blacksquare$
### 3.2 Średnia ważona pracą jest niezmienna względem harmonogramu
**Twierdzenie 2.** Średni czas realizacji ważony pracą $\bar{C}_w(\sigma)$
jest taki sam dla każdego harmonogramu $\sigma$.
**Dowód.**
Rozwiń licznik:
$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$
Przeindeksuj, niech $a = \sigma(k)$ i $b = \sigma(j)$. Podwójna suma
zlicza każdą uporządkowaną parę $(a, b)$, w której $b$ jest zaplanowane
nie później niż $a$:
$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$
Dla dowolnej pary $(a, b)$ z $a \ne b$ zachodzi dokładnie jeden
z warunków: $\{b \preceq_\sigma a\}$ lub $\{a \prec_\sigma b\}$. Wyrazy
diagonalne ($a = b$) wnoszą $p_a^2$ niezależnie od kolejności. Zatem:
$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$
Razem z sumą komplementarną obie sumy pozadiagonalne pokrywają wszystkie
pary nieuporządkowane:
$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$
Prawa strona jest niezależna od harmonogramu. Z symetrii $p_a p_b$
obie sumy pozadiagonalne są równe:
$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$
Zatem:
$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$
Wyrażenie to nie zawiera odwołania do $\sigma$. Ponieważ mianownik
$\sum p_a$ jest również niezależny od harmonogramu:
$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$
jest **stały dla wszystkich harmonogramów**. $\blacksquare$
Jest to przypadek praw zachowania w szeregowaniu zidentyfikowanych przez
Coffmana, Shanthikumara i Yao [20]. Niezmienniczość odpowiada pomiarowi
tego, jak długo jednostka *pracy* czeka, a nie jak długo *zadanie*
czeka — statystyka nieważona zlicza realizacje, a nie pracę, dlatego jest
podatna na manipulację. (Zob. także Little [3, 4] w kontekście
teorii kolejek, z zastrzeżeniem, że prawo Little'a stosuje się
bezpośrednio tylko do systemów w stanie ustalonym, a nie do przypadku
wsadowego analizowanego tutaj.)
### 3.3 Przykład ilustracyjny
Dwa zadania: $A$ z $p_A = 1$ godzina, $B$ z $p_B = 10$ godzin.
| Harmonogram | $C_A$ | $C_B$ | Średnia nieważona | Średnia ważona pracą |
|----------|-------|-------|-----------------|-------------------|
| SPT (A najpierw) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 |
| Odwrotny (B najpierw) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 |
SPT wydaje się **lepszy o 4,5 godziny** według metryki nieważonej, ale
zapewnia **zerową poprawę** według metryki ważonej pracą. Pozorna przewaga
istnieje wyłącznie dlatego, że statystyka nieważona pozwala zadaniu
1-godzinnemu „głosować" na równi z zadaniem 10-godzinnym.
---
## 4. Konsekwencje dla jakości obsługi
### 4.1 Zagłodzenie dużych zadań
**Twierdzenie 3 (Obciążenie metryki).** Każda polityka szeregowania
minimalizująca nieważony średni czas realizacji z konieczności maksymalizuje
czas realizacji największego zadania.
**Dowód.** SPT umieszcza największe zadanie na końcu. Jego czas realizacji
równa się całkowitemu czasowi przetwarzania $\sum p_i$, co stanowi
maksymalny możliwy czas realizacji dla dowolnego pojedynczego zadania.
W każdym harmonogramie, który nie umieszcza największego zadania na końcu,
to zadanie kończy się ściśle wcześniej. $\blacksquare$
Tworzy to **zachętę do zagłodzenia**: racjonalni agenci optymalizujący
statystykę nieważoną będą w nieskończoność odraczać duże zadania na rzecz
małych. Austin [18] zidentyfikował ten ogólny wzorzec — że niekompletny
pomiar tworzy zachęty do optymalizacji mierzonego wymiaru kosztem
wymiarów niemierzonych — w kontekście zarządzania wydajnością
organizacyjną. Twierdzenie 3 dostarcza konkretny mechanizm dla
szeregowania zadań.
### 4.2 Maksymalny czas realizacji największego zadania
**Twierdzenie 4 (SPT jednoznacznie maksymalizuje czas realizacji
największego zadania).** Spośród wszystkich harmonogramów SPT jest
jedyną polityką, która przypisuje maksymalny możliwy czas realizacji
($\sum p_i$) największemu zadaniu.
**Dowód.** SPT sortuje zadania rosnąco według $p_i$, umieszczając
największe zadanie $p_{\max}$ na ostatniej pozycji. Ostatnie zadanie
w dowolnym harmonogramie ma czas realizacji $\sum_{i=1}^{n} p_i$, co
jest maksimum, jakie może otrzymać dowolne pojedyncze zadanie. W każdym
harmonogramie, który nie umieszcza $p_{\max}$ na końcu, kończy się ono
ściśle przed $\sum p_i$. $\blacksquare$
**Wniosek 4.1.** Zespół optymalizujący nieważony średni czas realizacji
będzie systematycznie dostarczał najgorsze doświadczenie klientom
o najbardziej złożonych potrzebach. Nie jest to efekt uboczny — jest to
*mechanizm*, dzięki któremu metryka się poprawia.
**Uwaga o współczynnikach spowolnienia.** SPT w rzeczywistości *kompresuje*
współczynniki spowolnienia ($S_i = C_i / p_i$), ponieważ większe zadania
na późniejszych pozycjach mają duże mianowniki, które absorbują
skumulowaną sumę. Na przykład dla zadań $[1, 5, 10]$: SPT daje
spowolnienia $[1, 1{,}2, 1{,}6]$ (niska wariancja), podczas gdy LPT daje
$[1, 3, 16]$ (wysoka wariancja). Szkoda SPT dla klientów z dużymi
zadaniami nie jest widoczna we współczynniku spowolnienia — jest widoczna
w **bezwzględnym czasie realizacji**. To rozróżnienie jest istotne:
w literaturze dotyczącej sprawiedliwości szeregowania [21, 22, 23]
debatowano nad niesprawiedliwością SPT/SRPT głównie poprzez miary oparte
na spowolnieniu, które mogą zaciemniać obciążenie bezwzględnym opóźnieniem
udowodnione poniżej.
### 4.3 Koncentracja opóźnień
**Twierdzenie 5 (SPT koncentruje opóźnienie na największym zadaniu).**
W ramach SPT największe zadanie ponosi większe opóźnienie bezwzględne niż
w jakimkolwiek innym harmonogramie.
**Dowód.** Zdefiniuj opóźnienie bezwzględne jako $\Delta_i = C_i - p_i$
(czas spędzony na oczekiwaniu, niezależny od własnego rozmiaru). W ramach
SPT największe zadanie zajmuje pozycję $n$ z:
$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$
Jest to suma czasów przetwarzania wszystkich pozostałych zadań — maksymalne
możliwe opóźnienie dla dowolnego pojedynczego zadania. W każdym
harmonogramie, w którym największe zadanie nie jest ostatnie, jego
opóźnienie jest ściśle mniejsze. Jednocześnie SPT przyznaje najmniejszemu
zadaniu zerowe opóźnienie ($\Delta_1^{\text{SPT}} = 0$). Całe obciążenie
kolejkowe jest przeniesione z małych zadań na duże. $\blacksquare$
SPT minimalizuje *łączne* opóźnienie (co jest dobre dla zagregowanej
efektywności) poprzez koncentrację opóźnienia na zadaniach najlepiej
zdolnych do jego absorpcji pod względem współczynnika spowolnienia.
Ale w wartościach bezwzględnych — godzinach spędzonych na oczekiwaniu —
największe zadanie ponosi pełne obciążenie.
### 4.4 Niezmienniczość przepustowości
**Twierdzenie 6 (Niezmienniczość przepustowości).** Całkowita praca
wykonana w dowolnym horyzoncie czasowym $T$ jest identyczna dla
wszystkich polityk szeregowania.
**Dowód.** Wykonawca przetwarza pracę ze stałą szybkością. W dowolnym
horyzoncie $T \ge \sum p_i$ całkowita wykonana praca wynosi dokładnie
$\sum p_i$, niezależnie od kolejności. W przypadku stanu ustalonego
z ciągłymi napływami długookresowa przepustowość jest zdeterminowana
przez szybkość obsługi $\mu$ i jest całkowicie niezależna od
szeregowania:
$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{dla wszystkich harmonogramów } \sigma$$
$\blacksquare$
**Wniosek 6.1.** Zespół, który przechodzi z dowolnej polityki szeregowania
na SPT, zaobserwuje poprawę nieważonego średniego czasu realizacji przy
**zerowej zmianie rzeczywistej przepustowości**. Metryka się poprawia.
Wynik nie.
### 4.5 Efekt złożony
Łącząc Twierdzenia 4, 5 i 6:
| Miara | Efekt optymalizacji nieważonej średniej |
|---------|--------------------------------------|
| Przepustowość (praca/czas) | Bez zmian (Twierdzenie 6) |
| Opóźnienie małych zadań | Zminimalizowane — zbliża się do zera (SPT) |
| Opóźnienie dużych zadań | **Zmaksymalizowane** — ponosi całe obciążenie kolejkowe (Twierdzenie 5) |
| Czas realizacji największego zadania | **Maksymalny możliwy**: $\sum p_i$ (Twierdzenie 4) |
Wynikowy efekt netto na postrzeganą jakość jest negatywny, ponieważ:
1. **Awersja do strat jest asymetryczna** [8]. Klient, którego zadanie
100-godzinne zostaje depriorytetyzowane, doświadcza dużego, wyrazistego
negatywu. Klient, którego zadanie 1-godzinne zostaje przyspieszone,
doświadcza małego, często niezauważonego pozytywu.
2. **Zadania wymagające dużego nakładu pracy korelują z klientami o wysokiej
wartości.** Duże zadania nieproporcjonalnie często pochodzą od głównych
klientów, złożonych kontraktów lub krytycznych potrzeb biznesowych.
3. **Zagłodzenie kumuluje się.** W systemie ciągłym (Twierdzenie 3) duże
zadania mogą być **odraczane w nieskończoność**, ponieważ wciąż
napływają nowe małe zadania.
**Twierdzenie 7 (Wynik główny).** Dla zespołu przetwarzającego zadania
o niejednorodnym rozmiarze przyjęcie nieważonego średniego czasu realizacji
jako metryki wydajnościowej:
(a) Zapewnia **zerowy zysk produktywności** (Twierdzenie 6), jednocześnie
(b) **Przypisując maksymalny możliwy czas realizacji** największemu zadaniu
(Twierdzenie 4), oraz
(c) **Koncentrując całe opóźnienie kolejkowe** na największych zadaniach,
eliminując opóźnienie dla najmniejszych (Twierdzenie 5).
Nie jest to kompromis. Metryka tworzy czysty transfer jakości obsługi
od klientów z zadaniami wymagającymi dużego nakładu pracy do klientów
z zadaniami o małym nakładzie pracy, bez żadnego zysku netto w postaci
wykonanej pracy. $\blacksquare$
---
# Część II: Systemy priorytetów
## 5. Rozpad w warunkach klasyfikacji priorytetowej
Poprzednie rozdziały dowiodły, że nieważony średni czas realizacji jest
obciążony, gdy zadania różnią się rozmiarem. Teraz pokażemy, że
wprowadzenie **systemu priorytetów** — stosowanego przez praktycznie
wszystkie rzeczywiste zespoły — powoduje, że metryka staje się nie tylko
obciążona, ale **aktywnie adwersaryczna** wobec deklarowanych celów
organizacji.
### 5.1 Model rozszerzony: zadania z priorytetem
Niech każde zadanie $i$ ma czas przetwarzania $p_i$ oraz klasę priorytetu
$q_i \in \{1, 2, 3, 4\}$, gdzie 1 jest najwyższym priorytetem (krytyczny),
a 4 najniższym (kosmetyczny/ulepszenie). Przypisz wagi priorytetów:
$$w(q) = \begin{cases} 8 & q = 1 \text{ (Krytyczny)} \\ 4 & q = 2 \text{ (Wysoki)} \\ 2 & q = 3 \text{ (Średni)} \\ 1 & q = 4 \text{ (Niski)} \end{cases}$$
Konkretne wagi mają charakter ilustracyjny; wyniki obowiązują dla dowolnej
ściśle malejącej funkcji wagowej. Kluczową właściwością jest to, że
priorytet jest przypisywany na podstawie **wpływu biznesowego**, a nie
rozmiaru zadania.
### 5.2 Metryka przeczy systemowi priorytetów
**Twierdzenie 8 (Inwersja priorytetrozmiar).** Gdy priorytet jest
niezależny od rozmiaru zadania, harmonogram minimalizujący nieważony
średni czas realizacji (SPT) będzie, w wartości oczekiwanej, realizował
zadania o niskim priorytecie przed zadaniami o wysokim priorytecie
i większym rozmiarze.
**Dowód.** SPT porządkuje zadania rosnąco według $p_i$, niezależnie
od $q_i$. Rozważmy dwa zadania:
- Zadanie A: $p_A = 40$ godzin, $q_A = 1$ (Krytyczne — np. awaria serwera)
- Zadanie B: $p_B = 0{,}5$ godziny, $q_B = 4$ (Niskie — np. kosmetyczna
poprawka interfejsu)
SPT planuje B przed A. Nieważona średnia dla tej pary:
$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$
Metryka deklaruje SPT jako prawie **dwukrotnie lepsze** — mimo że
realizowana jest kosmetyczna poprawka, podczas gdy serwer nie działa.
Ogólnie, gdy $q_i$ jest statystycznie niezależne od $p_i$, porządek
SPT ma **zerową korelację** z priorytetem. W praktyce zadania krytyczne
(awarie, incydenty bezpieczeństwa, utrata danych) często wymagają więcej
pracy niż zadania o niskim priorytecie, więc metryka jest
prawdopodobnie **antykorelowana** z systemem priorytetów. $\blacksquare$
### 5.3 Destrukcja informacji
Nieważona średnia redukuje trójwymiarowe zadanie $(p_i, q_i, C_i)$ do
jednowymiarowego sygnału ($C_i$), a następnie uśrednia równomiernie.
Priorytet jest w ten sposób całkowicie odrzucany, a rozmiar niejawnie
odwracany.
**Twierdzenie 9 (Destrukcja informacji).** Niech $I(\sigma)$ będzie
informacją wzajemną między niejawnym rankingiem priorytetów harmonogramu
(pozycją) a rzeczywistym przypisaniem priorytetu $q_i$. Dla SPT:
$$I(\sigma_{\text{SPT}}) = 0 \quad \text{gdy } p_i \perp q_i$$
**Dowód.** SPT przypisuje pozycje wyłącznie na podstawie $p_i$. Gdy
$p_i$ i $q_i$ są niezależne, znajomość pozycji zadania w harmonogramie
SPT dostarcza zerowej informacji o jego priorytecie. $\blacksquare$
**Wniosek 9.1.** Zespół optymalizujący nieważony średni czas realizacji
prowadzi system szeregowania, który nie niesie żadnej informacji o własnej
klasyfikacji priorytetowej. Pole priorytetu w systemie zgłoszeń jest,
w odniesieniu do kolejności realizacji, dekoracyjne.
Jest to przypadek tego, co Austin [18] nazywa fundamentalnym problemem
niekompletnego pomiaru: gdy system pomiarowy obejmuje tylko podzbiór
istotnych wymiarów, optymalizacja pomiaru systematycznie degraduje
wymiary niemierzone.
### 5.4 Koszt opóźnienia ważony priorytetem
Zdefiniuj **koszt opóźnienia ważony priorytetem** harmonogramu:
$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$
**Twierdzenie 10 (SPT a koszt opóźnienia ważony priorytetem).** Optymalnym
harmonogramem minimalizującym $D(\sigma)$ jest WSJF: porządkuj według
$w(q_i)/p_i$ malejąco [1, 5]. Porządek SPT — według $1/p_i$ malejąco —
całkowicie ignoruje priorytet i daje wyższe $D$ niż alternatywy
respektujące priorytet, gdy priorytet jest skorelowany z rozmiarem zadania.
**Dowód.** Z argumentu wymiany zamiana sąsiednich zadań $i, j$ zmienia
$D$ o:
$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$
Zamiana poprawia $D$, gdy $w(q_j)/p_j > w(q_i)/p_i$, ale $j$ jest
zaplanowane po $i$. Zatem optymalny porządek to malejący $w(q_i)/p_i$
— reguła WSJF. SPT odpowiada WSJF tylko wtedy, gdy
$w(q_i) = \text{const}$ (wszystkie zadania mają równy priorytet).
**Przykład.** Krytyczne ($w = 8$, $p = 3$) i Niskie ($w = 1$, $p = 2$):
- SPT (Niskie najpierw): $D = 1 \cdot 2 + 8 \cdot 5 = 42$
- WSJF (Krytyczne najpierw): $D = 8 \cdot 3 + 1 \cdot 5 = 29$
SPT generuje o 45% wyższy koszt opóźnienia ważony priorytetem. W praktyce
zadania krytyczne bywają większe (awarie, incydenty bezpieczeństwa), co
czyni tę rozbieżność systematyczną. $\blacksquare$
---
## 6. Proponowane rozwiązania
### 6.1 Metryki ważone priorytetem
Zastąp nieważony średni czas realizacji **Wynikiem Realizacji Ważonym
Priorytetem (PWCS)**:
$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$
Jest to średnia współczynnika spowolnienia ważona priorytetem. Mierzy,
jak długo każde zadanie czekało w stosunku do swojego rozmiaru, z wagą
proporcjonalną do jego ważności. Im mniej, tym lepiej.
**Właściwości:**
1. **Respektuje priorytety.** Opóźnienia zadań krytycznych kosztują 8x
więcej niż opóźnienia zadań o niskim priorytecie.
2. **Sprawiedliwa wobec rozmiaru.** Używa współczynnika spowolnienia
$C_i / p_i$, więc duże zadania nie są karane za to, że są duże.
3. **Niepodatna na manipulację przez SPT.** Zmiana kolejności według
czasu przetwarzania nie poprawia systematycznie wyniku.
4. **Redukuje się do nieważonej średniej, gdy zadania są jednorodne.**
Ścisłe uogólnienie.
### 6.2 Polityka optymalna: WSJF
**Twierdzenie 11.** Harmonogram minimalizujący priorytetowo ważony czas
realizacji $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$
przetwarza zadania w kolejności malejącego $w(q_i)/p_i$ — reguła
**Weighted Shortest Job First (WSJF)** [1, 5].
**Dowód.** Z argumentu wymiany (jak w Twierdzeniu 10) zamiana
sąsiednich zadań $i, j$ poprawia PWCT, gdy $w(q_j)/p_j > w(q_i)/p_i$,
ale $j$ jest zaplanowane po $i$. Optymalny porządek to zatem malejący
$w(q_i)/p_i$. $\blacksquare$
W ramach klasy priorytetowej sprowadza się to do SPT (najkrótsze
najpierw). Między klasami 4-godzinne zadanie krytyczne ($w/p = 2{,}0$)
ma pierwszeństwo przed 1-godzinnym zadaniem o niskim priorytecie
($w/p = 1{,}0$).
**Zastrzeżenie praktyczne.** Czyste WSJF może umieścić drobne zadania
o niskim priorytecie przed dużymi zadaniami krytycznymi (15-minutowe
zadanie o niskim priorytecie ma $w/p = 1/0{,}25 = 4{,}0$, przewyższając
6-godzinne zadanie krytyczne przy $w/p = 8/6 = 1{,}33$). W praktyce
łagodzi się to, narzucając **ścisłą kolejność klas priorytetowych**
i stosując WSJF tylko *w ramach* każdej klasy.
### 6.3 Przykład zastosowany: dział obsługi IT
Rozważmy zespół IT z następującą kolejką zgłoszeń:
| Zgłoszenie | Priorytet | Typ | Szac. godziny |
|--------|----------|------|-----------|
| T1 | P1 (Krytyczny) | Awaria serwera pocztowego | 6 |
| T2 | P2 (Wysoki) | Awaria VPN dla zespołu zdalnego | 4 |
| T3 | P3 (Średni) | Konfiguracja laptopa nowego pracownika | 2 |
| T4 | P4 (Niski) | Aktualizacja polityki tapet pulpitu | 0,5 |
| T5 | P3 (Średni) | Instalacja licencji oprogramowania | 1 |
| T6 | P1 (Krytyczny) | Awaria kopii zapasowej bazy danych | 3 |
| T7 | P2 (Wysoki) | Flota drukarek offline | 2 |
| T8 | P4 (Niski) | Archiwizacja starego folderu współdzielonego | 0,25 |
**Kolejność SPT** (optymalizacja nieważonej średniej): T8, T4, T5, T3, T7, T6, T2, T1
| Poz. | Zgłoszenie | Priorytet | Godziny | Realizacja | Spowolnienie |
|-----|--------|----------|-------|------------|----------|
| 1 | T8 (archiwizacja folderu) | P4 Niski | 0,25 | 0,25 | 1,0 |
| 2 | T4 (tapety) | P4 Niski | 0,5 | 0,75 | 1,5 |
| 3 | T5 (oprogramowanie) | P3 Średni | 1 | 1,75 | 1,75 |
| 4 | T3 (laptop) | P3 Średni | 2 | 3,75 | 1,875 |
| 5 | T7 (drukarki) | P2 Wysoki | 2 | 5,75 | 2,875 |
| 6 | T6 (kopie zapasowe) | P1 Kryt. | 3 | 8,75 | 2,917 |
| 7 | T2 (VPN) | P2 Wysoki | 4 | 12,75 | 3,188 |
| 8 | T1 (poczta) | P1 Kryt. | 6 | 18,75 | 3,125 |
**Praktyczne WSJF** (najpierw klasa priorytetowa, SPT w ramach klasy):
| Poz. | Zgłoszenie | Priorytet | Godziny | Realizacja |
|-----|--------|----------|-------|------------|
| 1 | T6 (kopie zapasowe) | P1 Kryt. | 3 | 3 |
| 2 | T1 (poczta) | P1 Kryt. | 6 | 9 |
| 3 | T7 (drukarki) | P2 Wysoki | 2 | 11 |
| 4 | T2 (VPN) | P2 Wysoki | 4 | 15 |
| 5 | T5 (oprogramowanie) | P3 Średni | 1 | 16 |
| 6 | T3 (laptop) | P3 Średni | 2 | 18 |
| 7 | T8 (archiwizacja) | P4 Niski | 0,25 | 18,25 |
| 8 | T4 (tapety) | P4 Niski | 0,5 | 18,75 |
**Porównanie:**
| Metryka | SPT | Praktyczne WSJF | Lepsze |
|--------|-----|----------------|--------|
| Nieważona średnia realizacji | **6,56 godz.** | 13,63 godz. | SPT |
| Średni czas rozwiązania P1 | 13,75 godz. | **6 godz.** | WSJF |
| Średni czas rozwiązania P2 | 9,25 godz. | **13 godz.** | SPT |
| Czas naprawy serwera pocztowego | 18,75 godz. | **9 godz.** | WSJF |
| Czas naprawy kopii zapasowych | 8,75 godz. | **3 godz.** | WSJF |
| Czas aktualizacji tapet | **0,75 godz.** | 18,75 godz. | SPT |
Zagregowane priorytetowo ważone czasy realizacji są niemal identyczne
(PWCT: 10,2 vs 10,17), ponieważ agregacja ukrywa szkody dystrybucyjne.
Prawdziwa różnica tkwi w rozbiciu **na klasy priorytetowe**: serwer
pocztowy nie działa przez 18,75 godziny w ramach SPT wobec 9 godzin
w ramach WSJF. Kopie zapasowe bazy danych zawodzą przez 8,75 godziny
wobec 3.
Metryka nieważona z pewnością raportuje SPT jako **ponad dwukrotnie
bardziej efektywne** (6,56 vs 13,63), nagradzając zespół, który
aktualizował tapety pulpitu, gdy serwer pocztowy płonął.
### 6.4 Zalecany zestaw metryk
Nawet priorytetowo ważone metryki zagregowane mogą nie rozróżniać dobrych
od złych harmonogramów, ponieważ agregacja ukrywa szkody dystrybucyjne.
Żadna pojedyncza metryka nie wystarcza. Kompletny system pomiarowy
powinien śledzić:
| Metryka | Co mierzy | Formuła |
|--------|-----------------|---------|
| **Średnia realizacji według klasy priorytetowej** | Responsywność per klasa | $\bar{C}$ filtrowane według $q$ |
| **Średni czas rozwiązania P1** | Reakcja na incydenty krytyczne | $\bar{C}$ dla $q = 1$ |
| **Przepustowość** | Surowa zdolność robocza | Roboczogodziny wykonane / czas kalendarzowy |
| **Naruszenia starzenia** | Zapobieganie zagłodzeniu | Zadania przekraczające SLA według priorytetu |
| **Maks. czas realizacji (P1/P2)** | Najgorsza reakcja krytyczna | $\max(C_i)$ dla $q \le 2$ |
Kluczowy wniosek: **metryki per klasa priorytetowa** ujawniają awarie
szeregowania, które metryki zagregowane ukrywają.
---
# Część III: Dynamika organizacyjna
## 7. Gdy metryka jest produktem
Rozdziały 26 zakładają, że satysfakcja klienta jest funkcją
*doświadczonej jakości obsługi*. Istnieje jednak scenariusz, w którym
to założenie zawodzi i cała argumentacja się rozpada.
### 7.1 Metryka autoreferencyjne
Załóżmy, że dostawca raportuje nieważoną średnią bezpośrednio klientowi
— na pulpicie nawigacyjnym, w raporcie SLA, na stronie marketingowej —
a satysfakcja klienta wynika głównie z *tej liczby*:
$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$
W tym modelu SPT rzeczywiście maksymalizuje satysfakcję klienta
(Twierdzenie 1). Przepustowość pozostaje niezmieniona (Twierdzenie 6).
Wynik biznesowy się poprawia: ta sama praca wykonana, zadowolony klient.
**Wszystkie twierdzenia w tej pracy pozostają matematycznie poprawne.
Ale wniosek się odwraca.** Metryka nie jest już przybliżeniem, które
można manipulować — *jest* jakością obsługi, ponieważ klient zgodził się
oceniać jakość na podstawie zagregowanej liczby.
### 7.2 Ekonomia
Tworzy to spójną, stabilną równowagę:
| Aktor | Zachowanie | Wynik |
|-------|----------|---------|
| Dostawca | Optymalizuje nieważoną średnią (SPT) | Metryka się poprawia, brak dodatkowej pracy |
| Klient | Czyta pulpit nawigacyjny, widzi niską średnią | Raportuje satysfakcję |
| Zarząd | Widzi zadowolonego klienta + dobrą metrykę | Nagradza zespół |
Dostawca uzyskuje satysfakcję przy zerowym koszcie krańcowym,
optymalizując liczbę, którą klient zaakceptował jako przybliżenie jakości.
### 7.3 Kruchość
Ta równowaga jest stabilna tylko tak długo, jak klient nigdy nie zbada
własnego doświadczenia. Rozpada się, gdy:
1. **Klient sprawdza własne zgłoszenie.** Dyrektor techniczny, którego
serwer pocztowy nie działał przez 18,75 godziny, nie zostanie
uspokojony informacją „Średni czas rozwiązania: 6,56 godziny".
Klienci najbardziej skłonni do weryfikacji to dokładnie ci, którzy
otrzymują najgorszą obsługę (Twierdzenie 4).
2. **Konkurent oferuje SLA per zgłoszenie.** „P1 rozwiązane w ciągu
4 godzin" pokonuje „średnie rozwiązanie poniżej 7 godzin" dla
każdego klienta z krytycznymi potrzebami.
3. **Zespół internalizuje metrykę.** Jeśli zespół wierzy, że metryka
odzwierciedla rzeczywistą wydajność, traci zdolność rozpoznawania,
kiedy praca krytyczna jest zaniedbywana. Metryka staje się zagrożeniem
epistemicznym.
### 7.4 Ogólny wzorzec
Ten wzorzec — przybliżenie zastępuje jakość, przybliżenie jest
optymalizowane, jakość odchodzi, system jest stabilny do momentu
zderzenia z rzeczywistością — powtarza się w wielu dziedzinach.
Muller [19] dokumentuje go obszernie jako „fiksację na metrykach";
Campbell [24] sformalizował korumpujący wpływ używania wskaźników
jako celów.
| Dziedzina | Metryka zastępcza | Rzeczywista jakość | Rozbieżność |
|--------|-------------|-------------------|------------|
| Wsparcie IT | Śr. czas rozwiązania | Czas pracy systemów krytycznych | Serwer niedostępny 19 godz., średnia mówi 6,5 |
| Edukacja | Wyniki testów | Faktyczne uczenie się | Nauczanie pod test |
| Ochrona zdrowia | Przepustowość pacjentów | Wyniki leczenia pacjentów | Szybsze wypisy, wyższa readmisja |
| Finanse | Zyski kwartalne | Wartość długoterminowa | Cięcia kosztów pompują EPS, erodują zdolności |
| Oprogramowanie | Velocity (story points) | Jakość produktu | Inflacja punktów, funkcje wykonane w połowie |
### 7.5 Asymetria informacji
Modeluj system jako grę między dostawcą (D) a klientem (K). D obserwuje
indywidualne $\{C_i\}$ i wybiera $\sigma$; K obserwuje jedynie
$\bar{C}(\sigma)$. Jest to problem **pokusy nadużycia** [10]: optymalną
strategią D jest minimalizacja obserwowalnego sygnału niezależnie od
nieobserwowalnego rozkładu.
Równowaga jest **równowagą łączącą** [9]: raportowana metryka D wygląda
identycznie niezależnie od bazowej wydajności ważonej priorytetowo. Jest
stabilna, dopóki K nie uzyska dostępu do indywidualnych wartości $C_i$
— poprzez portal klienta, transparentność konkurenta lub dostatecznie
bolesny incydent.
### 7.6 Niewygodna konkluzja
Uczciwa odpowiedź na pytanie „czy optymalizacja nieważonej średniej
szkodzi biznesowi?" brzmi: **niekoniecznie, o ile klient nigdy nie zajrzy
za liczbę**. Uczciwa odpowiedź na pytanie „czy to jest zrównoważone?"
brzmi: jest to dokładnie tak zrównoważone jak każdy system, w którym
sprzedający wie więcej niż kupujący — stabilny przez dłuższy czas,
a potem gwałtowny upadek, gdy asymetria zostaje przebita.
---
## 8. Psychologiczny koszt wiedzy
Rozdział 7 modelował dostawcę jako jednolity podmiot. Ale zespoły
składają się z jednostek. Gdy członek zespołu rozumie dowód — gdy *wie*,
że metryka jest syntetyczna, że pulpit nawigacyjny jest teatrem, że
serwer pocztowy wciąż nie działa, podczas gdy on zamyka zgłoszenia
dotyczące tapet — pojawia się nowy koszt, który model równowagi pominął.
### 8.1 Ukryta zmienna: świadomość zespołu
| Aktor | Obserwuje indywidualne $C_i$ | Obserwuje $\bar{C}$ | Rozumie dowód |
|-------|--------------------------|--------------------|-----------------------|
| Zarząd | Być może | Tak | Różnie |
| Członek zespołu | **Tak** | Tak | **Tak** (w tym scenariuszu) |
| Klient | Nie | Tak | Nie |
Członek zespołu ma pełną informację. Widzi kolejkę zgłoszeń. Wie, że
serwer pocztowy nie działa od 7 rano. Wie, że zamyka zgłoszenie dotyczące
tapety, bo to poprawia liczbę. I wie *dlaczego*.
### 8.2 Dysonans poznawczy przy pełnej informacji
Dysonans poznawczy [11] powstaje, gdy jednostka utrzymuje sprzeczne
przekonania. Bez zrozumienia *dlaczego*, sprzeczność można
zracjonalizować: „zarząd wie lepiej". Zrozumienie dowodu usuwa
dwuznaczność. Członek zespołu utrzymuje teraz:
- **Przekonanie A:** „Jestem kompetentnym profesjonalistą. Moim zadaniem
jest rozwiązywanie ważnych problemów."
- **Przekonanie B:** „Zamykam zgłoszenie dotyczące tapety, podczas gdy
serwer pocztowy nie działa, ponieważ metryka jest matematycznie
obciążona (Twierdzenie 1), zmiana kolejności nie daje żadnej
przepustowości (Twierdzenie 6), a jedynym beneficjentem jest pulpit
nawigacyjny (Rozdział 7). Mogę to udowodnić."
Dysonans jest teraz *nośny*. Dostępne rozwiązania — porzucenie tożsamości
zawodowej, odrzucenie dowodu, walka o zmianę lub odejście — każde niesie
ze sobą koszty, które wcześniej nie istniały.
### 8.3 Teoria autodeterminacji: trzy naruszone potrzeby
Teoria autodeterminacji Deciego i Ryana [12, 13] identyfikuje trzy
potrzeby predykujące motywację wewnętrzną:
**Autonomia.** Metryka ogranicza wybory w sposób, który członek zespołu
wie, że jest matematycznie suboptymalny. Pracownik, który rozumie, że
proces jest dowodliwie kontraproduktywny, nie może czuć się autonomiczny,
podążając za nim.
**Kompetencja.** Metryka nagradza *pozorną* efektywność (niskie $\bar{C}$),
będąc jednocześnie niezmienna wobec *faktycznej* efektywności
(Twierdzenie 6). Autentyczna kompetencja — naprawienie serwera pocztowego
najpierw — jest *karana* przez metrykę.
**Relacyjność.** Członek zespołu wie, że serwer pocztowy klienta nie
działa. Mógłby pomóc. Zamiast tego aktualizuje tapety — nie dlatego, że
to komukolwiek pomaga, ale dlatego, że pomaga to liczbie. Połączenie
między pracą a ludzkim wpływem zostało zerwane, a członek zespołu widzi
zerwane końce.
### 8.4 Uraz moralny
Uraz moralny [16, 17] to trwała szkoda spowodowana „popełnianiem,
niezapobieżeniem, byciem świadkiem lub dowiedzeniem się o czynach,
które naruszają głęboko zakorzenione przekonania moralne" [17]. Pojęcie
to zostało od tego czasu rozszerzone na konteksty biznesowe [25]. Kluczowe
rozróżnienie od wypalenia: **wypalenie to wyczerpanie z robienia zbyt
wiele. Uraz moralny to szkoda z robienia złej rzeczy.**
Członek zespołu, który wie, że serwer pocztowy nie działa, wie, że
powinien go naprawić, zamiast tego zamyka zgłoszenie dotyczące tapety
i robi to, ponieważ metryka tego wymaga, doświadcza strukturalnych
warunków urazu moralnego.
### 8.5 Wyuczona bezradność i fatalizm metryczny
Wyuczona bezradność Seligmana [14, 15] opisuje, jak ekspozycja na
niekontrolowalne negatywne wyniki prowadzi do pasywności. Sekwencja:
1. Metryka jest wadliwa (dowód zrozumiany).
2. Postulowanie zmiany.
3. Odrzucenie („liczby są dobre, nie kołysz łódką").
4. Powtórzenie z malejącym przekonaniem.
5. Stan terminalny: „Metryka jest, jaka jest. Będę po prostu zamykał
zgłoszenia."
To nie jest lenistwo. To racjonalna odpowiedź na system, który karze
poprawne zachowanie i nagradza niepoprawne, gdy jednostka nie ma władzy,
by zmienić system.
### 8.6 Spirala selekcji adwersarycznej
Łącząc równowagę z Rozdziału 7 z dynamiką rotacji:
1. Organizacja przyjmuje nieważoną średnią. Metryka wygląda dobrze (SPT).
2. Świadomi, kompetentni członkowie zespołu doświadczają kosztów
psychologicznych (8.28.5).
3. Ci członkowie odchodzą. Zastępowani są przez osoby, które nie rozumieją
wad metryki lub nie dbają o to.
4. Metryka nadal wygląda dobrze — zawsze tak jest w ramach SPT,
niezależnie od kompetencji zespołu (Wniosek 6.1).
5. Rzeczywista jakość obsługi spada, ale metryka nie jest w stanie tego
wykryć (Wniosek 9.1).
6. Powrót do kroku 1.
Metryka selekcjonuje *przeciwko* osobom, które ulepszyłyby system,
i *na rzecz* osób, które nie będą go kwestionować. System stabilizuje
się na niższym poziomie kompetencji, niewidocznym dla własnego aparatu
pomiarowego.
### 8.7 Pełny model kosztów
| Rozdział 7 (widoczne) | Rozdział 8 (ukryte) |
|---------------------|---------------------|
| Klient zadowolony (dobra liczba) | Zespół niezadowolony (zła rzeczywistość) |
| Przepustowość bez zmian | Wysiłek uznaniowy wycofany |
| Metryka się poprawia | Kompetentni członkowie odchodzą |
| Ekonomia biznesowa stabilna | Kompetencje instytucjonalne degradują się |
Działają one w różnych skalach czasowych: równowaga jest widoczna
kwartalnie; degradacja kompetencji jest widoczna w skali lat. Pełny
model brzmi: **metryka działa i jest destrukcyjna, a destrukcja jest
niewidoczna dla metryki.** Metryka to świeża farba na skorodowanym
zbrojeniu.
---
## 9. Internalizacja menedżerska: rozwiązanie operacyjne
Rozdziały 26 mówią: odrzuć metrykę. Rozdział 7 mówi: metryka działa
(dla biznesu). Rozdział 8 mówi: niszczy zespół. W praktyce większość
menedżerów nie może jednostronnie zmienić metryki. Najlepszym
rozwiązaniem jest reforma metryki w całej firmie. *Operacyjnym*
rozwiązaniem jest to, co pojedynczy świadomy menedżer może zrobić
już teraz.
### 9.1 Strategia
Menedżer, który rozumie dowód, może **zinternalizować ograniczenia
metryki bez propagowania ich na zespół**:
1. **Szereguj głównie według priorytetu.** Zespół pracuje nad zadaniami
krytycznymi w pierwszej kolejności.
2. **Taktycznie przeplataj małe zadania.** Gdy małe zadanie o niskim
priorytecie może być zrealizowane bez istotnego opóźniania pracy
o wysokim priorytecie, wykonaj je. Nie dlatego, że metryka tego
wymaga, ale dlatego, że też musi być wykonane i kosztuje niemal nic.
3. **Nigdy nie ujawniaj metryki jako motywacji.** „Załatw to szybkie
zadanie, czekając na odpowiedź zwrotną od dostawcy w sprawie P1" —
a nie „musimy obniżyć naszą średnią". Wewnętrzna motywacja zespołu
pozostaje nienaruszona (Rozdział 8). Menedżer bierze na siebie
ciężar zarządzania metryką.
### 9.2 Formalizacja
Problem menedżera to optymalizacja z ograniczeniami:
$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{pod warunkiem} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$
**Twierdzenie 12 (Ograniczony koszt metryczny szeregowania
priorytetowego).** Menedżer, który stosuje SPT *w ramach* każdej klasy
priorytetowej i kolejność priorytetową *między* klasami, uzyska metrykę
zbliżoną do wartości optymalnej SPT — luka wynika wyłącznie z inwersji
międzyklasowych.
**Szkic dowodu.** W ramach każdej klasy priorytetowej SPT jest bezkosztowe
(wszystkie zadania mają równy priorytet). Jedynym odchyleniem od
globalnego SPT jest kolejność międzyklasowa. Każda inwersja międzyklasowa
kosztuje co najwyżej $p_{\text{large}} - p_{\text{small}}$ w sumie
nieważonej, a te inwersje są ograniczone liczbą klas. W praktyce luka
wynosi typowo 1020% wartości optymalnej SPT. $\blacksquare$
### 9.3 Menedżer jako bariera informacyjna
| Warstwa | Widzi metrykę | Widzi priorytety | Widzi dowód |
|-------|-----------|----------------|------------|
| Organizacja | Tak | Nominalnie | Nie |
| Menedżer | Tak | Tak | **Tak** |
| Zespół | Nie (osłonięty) | Tak | Nieistotne |
| Klient | Tak (pulpit nawigacyjny) | Przez SLA | Nie |
Menedżer jest jedynym aktorem posiadającym wszystkie trzy elementy
informacji. Nie jest to manipulacja — wykonuje właściwą pracę we
właściwej kolejności, a metryka okazuje się akceptowalna, ponieważ
SPT wewnątrzklasowe jest bezkosztowe.
### 9.4 Rozpad w warunkach konkurencji
Strategia ta zawodzi, gdy metryka staje się **konkurencyjna między
zespołami**.
**Przypadek 1: Kooperacyjny** — Zespoły mierzone pod kątem parytetowości,
nie rankingu. Każdy menedżer niezależnie stosuje strategię internalizacji.
Metryka jest dekoracyjna, ale nieszkodliwa. Jest to **gra koordynacyjna**
ze stabilną równowagą kooperacyjną.
**Przypadek 2: Konkurencyjny** — Zespoły rankingowane według $\bar{C}$.
Jest to **dylemat więźnia**:
| | Zespół B: Priorytet | Zespół B: SPT |
|---|---|---|
| **Zespół A: Priorytet** | (Dobra praca, Dobra praca) | (A wygląda źle, B wygląda dobrze) |
| **Zespół A: SPT** | (A wygląda dobrze, B wygląda źle) | (Oba wyglądają dobrze, oba robią złą pracę) |
Równowaga Nasha to (SPT, SPT). Strategia internalizacji jest równowagą
kooperacyjną, która **nie jest stabilna w warunkach konkurencji**.
### 9.5 Zakres stosowania
| Warunek | Wykonalność |
|-----------|-----------|
| Metryka używana do kontroli stanu / parytetowości | **Wykonalne** |
| Metryka widoczna, ale nierangowana | **Wykonalne** |
| Metryka rangowana między zespołami | **Kruche** — wymaga współpracy wszystkich menedżerów |
| Metryka powiązana z wynagrodzeniem / zasobami | **Niewykonalne** — dominuje dylemat więźnia |
| Reforma metryki możliwa na poziomie organizacji | **Zbędne** — napraw metrykę bezpośrednio |
**Najlepszym rozwiązaniem jest reforma w skali całej firmy. Operacyjnym
rozwiązaniem jest menedżer, który rozumie ten dowód, osłania swój zespół
przed metryką, szereguje według priorytetu i stosuje SPT wyłącznie
w ramach klas priorytetowych, aby utrzymać liczbę na rozsądnym poziomie.**
---
# Część IV: Ocena
## 10. Adwokat diabła
Uczciwość intelektualna wymaga uznania, gdzie argumentacja ma swoje
ograniczenia.
### 10.1 Prostota ma rzeczywistą wartość
**Argument.** Nieważona średnia nie wymaga wag priorytetowych, estymacji
rozmiaru zadania ani kalibracji.
**Ocena: Prawda.** Ale metryka nieważona nie unika założeń — *ukrywa* je,
niejawnie ustawiając wszystkie wagi na 1 i wszystkie rozmiary na 1.
Znana-niedokładna estymacja rozmiaru zadania jest wciąż bardziej
informatywna niż niejawne założenie, że wszystkie rozmiary są równe.
### 10.2 Minimalizacja liczby osób czekających
**Argument.** SPT minimalizuje łączną liczbę osobogodzin oczekiwania.
Jeśli każde zadanie reprezentuje jednego klienta, jest to optymalne.
**Ocena: Matematycznie poprawne.** Jeśli prowadzisz biuro obsługi
i czas każdej osoby jest jednakowo cenny, SPT jest właściwą polityką.
Przestaje działać, gdy zadania nie odpowiadają klientom w stosunku 1:1,
koszt oczekiwania nie jest jednolity lub metryka jest używana do
oceny zespołów, a nie obsługi dosłownej kolejki.
### 10.3 SPT jako heurystyka triażowa
**Argument.** Gdy rozmiary zadań skupiają się ciasno, SPT zbliża się
do FIFO, a nieważona średnia zbliża się do średniej ważonej.
**Ocena: Poprawne.** Współczynnik zmienności $CV = \sigma_p / \bar{p}$ determinuje nasilenie zniekształcenia:
| $CV$ | Rozkład rozmiarów zadań | Zniekształcenie |
|------|----------------------|------------|
| < 0,3 | Ciasny (centrum telefoniczne) | Pomijalne |
| 0,3 1,0 | Umiarkowany (mieszane IT) | Umiarkowane |
| > 1,0 | Szeroki (typowa kolejka IT) | Znaczne |
Typowy dział IT obejmuje zakres od 15 minut do 40+ godzin ($CV > 2$).
Zniekształcenie nie jest przypadkiem brzegowym — jest stanem domyślnym.
### 10.4 Manipulacja wymaga złej woli
**Argument.** Twierdzenia pokazują, że metryka *może* być manipulowana,
nie że *będzie* manipulowana.
**Ocena: To jest najsilniejszy kontrargument.** Jeśli metryka jest czysto
informacyjna i nigdy nie wpływa na zachowanie, zachęta do manipulacji
jest nieobecna. Jednak każda metryka raportowana zarządowi, powiązana
z OKR-ami lub omawiana na retrospektywach będzie wpływać na zachowanie.
Jest to prawo Goodharta [6, 7] — i stosuje się do zespołów o dobrych
intencjach równie niezawodnie jak do cyniczych. Dryf następuje
organicznie: zamknięcie trzech łatwych zgłoszeń „czuje się produktywne",
a metryka potwierdza to odczucie.
### 10.5 Kiedy nieważona średnia jest uzasadniona
Metryka jest uzasadniona **tylko gdy wszystkie cztery warunki są
spełnione jednocześnie**:
1. Rozmiary zadań są w przybliżeniu jednorodne ($CV < 0{,}3$)
2. Brak różnicowania priorytetów (wszystkie zadania jednakowo ważne)
3. Każde zadanie reprezentuje dokładnie jednego klienta
4. Metryka nie jest używana do oceniania, nagradzania ani kierowania
zachowaniem
Te warunki są rzadko spełniane w systemach, w których metryka jest
najczęściej stosowana.
---
## 11. Praca pokrewna
Niniejsza praca znajduje się na przecięciu kilku nurtów literaturowych,
które dotychczas nie były ze sobą powiązane.
### 11.1 Teoria szeregowania i sprawiedliwość
Smith [1] ustanowił wynik optymalności SPT i regułę WSJF w 1956 roku.
Conway, Maxwell i Miller [2] opracowali kompleksowy podręcznik.
Sprawiedliwość polityk szeregowania opartych na rozmiarze była
przedmiotem debaty w planowaniu systemów komputerowych: Bansal
i Harchol-Balter [22] zbadali niesprawiedliwość SRPT; Wierman
i Harchol-Balter [23] sformalizowali klasyfikacje sprawiedliwości
w porównaniu z Processor-Sharing; Angel, Bampis i Pascual [21]
zmierzyli jakość harmonogramów SPT w odniesieniu do kryteriów
sprawiedliwej optymalności.
Ta wcześniejsza praca analizuje sprawiedliwość w szeregowaniu CPU
i serwerów. Niniejsza praca stosuje te same wyniki matematyczne do
*zarządzania zadaniami organizacyjnymi*, gdzie „planiścią" jest
ludzki zespół, „zadaniami" są żądania klientów z priorytetami
o wpływie biznesowym, a „funkcją celu" jest metryka zarządcza.
Mechanizm jest identyczny; konsekwencje różnią się, ponieważ
szeregowanie organizacyjne posiada systemy priorytetów, relacje
z klientami i koszty psychologiczne, których szeregowanie CPU nie ma.
### 11.2 Dysfunkcja pomiarowa
Austin [18] dowiódł, że niekompletny pomiar — mierzenie tylko podzbioru
istotnych wymiarów — tworzy zachęty do optymalizacji mierzonych wymiarów
kosztem niemierzonych, oraz że efekt ten jest nie tylko możliwy, ale
*nieunikniony*, gdy pomiar jest powiązany z nagrodami. Jego ramowanie
asymetrii informacyjnej ściśle koresponduje z Rozdziałem 7. Niniejsza
praca dostarcza konkretny mechanizm matematyczny (Twierdzenia 12) dla
przypadku szeregowania zadań i rozszerza argumentację przez psychologię
(Rozdział 8), aby prześledzić pełny łańcuch szkód organizacyjnych.
Muller [19] udokumentował „fiksację na metrykach" w edukacji, ochronie
zdrowia, policji i finansach, dostarczając obszernych dowodów empirycznych
dla wzorców teoretyzowanych w Rozdziale 7.4. Campbell [24] sformalizował
korumpujący wpływ używania wskaźników jako celów, uzupełniając
oryginalną obserwację Goodharta [6] i uogólnienie Strathern [7].
Bevan i Hood [26] empirycznie udokumentowali zachowania manipulacyjne
w angielskim publicznym systemie ochrony zdrowia — w tym dokładne wzorce
„trafienia w cel i chybienia sensu" opisane w naszym Rozdziale 5.2.
### 11.3 Psychologiczne koszty dysfunkcji metrycznej
Zastosowanie urazu moralnego (Shay [16], Litz i in. [17]) do kontekstów
biznesowych ma niedawny precedens: badanie z 2024 roku opublikowane
w *Journal of Business Ethics* [25] wprost rozszerzyło ten konstrukt na
miejsca pracy nastawione na zysk, znajdując warunki strukturalne podobne
do opisanych w Rozdziale 8.4. Moore [27] przeanalizował moralne
*odłączenie* — restrukturyzację poznawczą umożliwiającą nieetyczne
zachowanie pod presją organizacyjną. Niniejsza praca zajmuje się
komplementarnym zjawiskiem: szkodą dla jednostek, które *odmawiają*
odłączenia.
### 11.4 Co jest nowe
Poszczególne składniki — optymalność SPT, prawo Goodharta, dysfunkcja
pomiarowa, uraz moralny — wszystkie mają precedens. Wkłady niniejszej
pracy to:
1. **Prawo zachowania (Twierdzenie 2) użyte preskryptywnie** — jako
konstruktywny argument, że czas realizacji ważony pracą *nie może*
być manipulowany, a nie jako teoretyczny wynik z teorii szeregowania.
2. **Konkretny dowód, że klasy priorytetowe czynią metrykę algebraicznie
adwersaryczną** (Twierdzenia 89) — nie jedynie empirycznie złą, ale
strukturalnie sprzeczną, z zerową informacją wzajemną między
harmonogramem a systemem priorytetów.
3. **Zintegrowany łańcuch** od dowodu matematycznego przez asymetrię
informacyjną przez szkodę psychologiczną po spiralę selekcji
adwersarycznej — śledzący pojedynczą metrykę od Smitha (1956) do
wydrążenia organizacyjnego.
4. **Strategia internalizacji menedżerskiej** (Rozdział 9) z formalną
analizą teoriogrową jej stabilności i warunków rozpadu w warunkach
konkurencji międzyzespołowej.
5. **Zastosowanie teorii szeregowania do krytyki zarządzania
organizacyjnego** — dowodzące, że powszechnie stosowana metryka
zespołowa posiada konkretne, wymierne patologie, zamiast argumentować
na podstawie anegdot lub ogólnych zasad.
---
## 12. Wnioski
Nieważony średni czas realizacji jest **obciążoną statystyką**, która:
1. **Może być manipulowana** przez politykę szeregowania (Twierdzenie 1),
w przeciwieństwie do czasu realizacji ważonego pracą, który jest
niezmienny względem harmonogramu (Twierdzenie 2).
2. **Zachęca do zagłodzenia** dużych zadań (Twierdzenie 3).
3. **Degraduje satysfakcję klienta** przy zerowym kompensującym zysku
produktywności (Twierdzenie 7).
4. **Aktywnie przeczy systemom priorytetów**, niosąc zerową informację
o klasyfikacji wpływu biznesowego (Twierdzenie 9).
5. **Całkowicie ignoruje priorytet** w swojej rekomendacji szeregowania,
wytwarzając suboptymalny koszt opóźnienia ważony priorytetem, ilekroć
priorytet i rozmiar nie są doskonale odwrotnie skorelowane
(Twierdzenie 10).
Metryka, którą można poprawić przez zmianę kolejności pracy — bez
wykonywania jakiejkolwiek dodatkowej pracy — mierzy politykę
szeregowania, nie zdolność systemu. W połączeniu z systemem priorytetów
rekomenduje harmonogram, który wyrządza największą szkodę pracy
o najwyższym priorytecie.
Gdy metryka jest raportowana klientom, tworzy asymetrię informacyjną
(Rozdział 7), której równowaga biznesowa jest rentowna, ale krucha.
Gdy członkowie zespołu rozumieją jej wady, narusza ich motywację
wewnętrzną i selekcjonuje na rzecz odejścia najkompetentniejszych
osób (Rozdział 8). Pojedynczy świadomy menedżer może częściowo
łagodzić te efekty poprzez optymalizację z ograniczeniami (Rozdział 9),
ale ta strategia kooperacyjna nie jest stabilna w warunkach konkurencji
międzyzespołowej.
Nieważona średnia jest uzasadniona jedynie w wąskich warunkach
(Rozdział 10.5): jednorodne rozmiary zadań, brak priorytetów,
jednoznaczne odwzorowanie klientzadanie i brak wpływu behawioralnego.
Te warunki są rzadko spełniane.
**Nieważony średni czas realizacji nie jest sprawiedliwą ani trafną miarą
wydajności realizacji zadań. Jego przyjęcie jako metryki zespołowej
w sposób racjonalny doprowadzi do zagłodzenia złożonej pracy, naruszenia
deklarowanych priorytetów, nierównych wyników dla klientów oraz iluzji
produktywności tam, gdzie jej nie ma.**
Najlepszym rozwiązaniem jest reforma metryki organizacyjnej. Operacyjnym
rozwiązaniem jest menedżer, który rozumie ten dowód.
---
## Literatura
### Teoria szeregowania
[1] Smith, W. E. (1956). Various optimizers for single-stage production.
*Naval Research Logistics Quarterly*, 3(12), 5966.
doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106)
> Źródło wyniku optymalności SPT (Twierdzenie 1), reguły ważonego czasu
> realizacji $w_i/p_i$ malejąco (WSJF, Twierdzenie 11) oraz techniki
> dowodu opartej na zamianie sąsiednich zadań (argument wymiany)
> stosowanej w całej pracy.
[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of
Scheduling*. Addison-Wesley.
> Standardowe podręcznikowe opracowanie teorii szeregowania
> jednoprocesorowego, rozszerzające wyniki Smitha.
[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW.
*Operations Research*, 9(3), 383387.
doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383)
> Pierwszy rygorystyczny dowód prawa Little'a. Przywołany w Rozdziale 3.2
> w kontekście teorii kolejek.
[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th
anniversary. *Operations Research*, 59(3), 536549.
doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941)
> Retrospektywa omawiająca zakres, ograniczenia i typowe błędy
> stosowania.
[5] Reinertsen, D. G. (2009). *The Principles of Product Development
Flow: Second Generation Lean Product Development*. Celeritas Publishing.
ISBN: 978-0-9844512-0-8.
> Spopularyzował WSJF i „Koszt opóźnienia / Czas trwania" w kontekstach
> agile/lean. Fundament matematyczny to Smith (1956) [1].
### Pomiar i zachęty
[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K.
experience. In *Monetary Theory and Practice* (pp. 91121). Macmillan.
> Źródło prawa Goodharta: „Każda zaobserwowana regularność statystyczna
> będzie miała tendencję do rozpadu, gdy tylko zostanie na nią wywarta
> presja w celach kontrolnych."
[7] Strathern, M. (1997). 'Improving ratings': Audit in the British
university system. *European Review*, 5(3), 305321.
doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4)
> Uogólnienie prawa Goodharta: „Gdy miara staje się celem, przestaje
> być dobrą miarą."
### Ekonomia behawioralna
[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of
decision under risk. *Econometrica*, 47(2), 263292.
doi:[10.2307/1914185](https://doi.org/10.2307/1914185)
> Ustanowiła awersję do strat. Przywołana w Rozdziale 4.5.
### Teoria gier i teoria kontraktów
[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty
and the market mechanism. *The Quarterly Journal of Economics*, 84(3),
488500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431)
> Asymetria informacji i selekcja negatywna. Równowaga łącząca
> z Rozdziału 7.5 jest strukturalnie analogiczna.
[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell
Journal of Economics*, 10(1), 7491.
doi:[10.2307/3003320](https://doi.org/10.2307/3003320)
> Formalne opracowanie pokusy nadużycia. Scenariusz raportowania metryki
> w Rozdziale 7.5 jest problemem pokusy nadużycia.
### Psychologia
[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford
University Press. ISBN: 978-0-8047-0131-0.
> Teoria fundamentalna. Przywołana w Rozdziale 8.2.
[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and
Self-Determination in Human Behavior*. Plenum Press.
ISBN: 978-0-306-42022-1.
> Oryginalne opracowanie teorii autodeterminacji. Przywołana
> w Rozdziale 8.3.
[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and
the facilitation of intrinsic motivation, social development, and
well-being. *American Psychologist*, 55(1), 6878.
doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68)
> Przegląd teorii autodeterminacji łączący zaspokojenie potrzeb
> z motywacją wewnętrzną i dobrostanem.
[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape
traumatic shock. *Journal of Experimental Psychology*, 74(1), 19.
doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514)
> Oryginalna demonstracja wyuczonej bezradności. Przywołana
> w Rozdziale 8.5.
[15] Seligman, M. E. P. (1975). *Helplessness: On Depression,
Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3.
> Rozszerzone opracowanie łączące wyuczoną bezradność z depresją
> u ludzi i zachowaniami instytucjonalnymi.
[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing
of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.
> Wprowadził pojęcie urazu moralnego. Przywołana w Rozdziale 8.4.
[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P.,
Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war
veterans: A preliminary model and intervention strategy. *Clinical
Psychology Review*, 29(8), 695706.
doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003)
> Sformalizowała uraz moralny jako konstrukt kliniczny. Definicja
> cytowana w Rozdziale 8.4.
### Pomiar organizacyjny
[18] Austin, R. D. (1996). *Measuring and Managing Performance in
Organizations*. Dorset House. ISBN: 978-0-932633-36-1.
> Dowiódł, że niekompletny pomiar tworzy nieuniknione zachęty do
> optymalizacji mierzonych wymiarów kosztem niemierzonych. Ramowanie
> asymetrii informacyjnej ściśle koresponduje z Rozdziałem 7.
> Najważniejszy poprzednik argumentacji niniejszej pracy.
[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University
Press. ISBN: 978-0-691-17495-2.
> Kompleksowe opracowanie „fiksacji na metrykach" w edukacji, ochronie
> zdrowia, policji i finansach. Obszerne dowody empiryczne dla wzorców
> teoretyzowanych w Rozdziale 7.4.
### Sprawiedliwość szeregowania
[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992).
Multiclass queueing systems: Polymatroid structure and optimal scheduling
control. *Operations Research*, 40(S2), S293S299.
> Prawa zachowania w szeregowaniu. Niezmienniczość czasu realizacji
> ważonego pracą (Twierdzenie 2) jest przykładem tych praw zachowania.
[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT
schedules for fair optimality criteria? *Annals of Operations Research*,
159(1), 5364. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0)
> Bezpośrednio mierzy jakość harmonogramów SPT wobec kryteriów
> sprawiedliwości. Najbliższy poprzednik w teorii szeregowania
> dla analizy sprawiedliwości z Rozdziału 4.
[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT
scheduling: Investigating unfairness. *ACM SIGMETRICS Performance
Evaluation Review*, 29(1), 279290.
doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792)
> Bada przekonanie, że SRPT niesprawiedliwie karze duże zadania
> w szeregowaniu komputerowym. Argumentuje, że niesprawiedliwość jest
> mniejsza niż sądzono, ale uznaje zasadnicze napięcie.
[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling
policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS
Performance Evaluation Review*, 31(1), 238249.
> Formalizuje definicje sprawiedliwości dla polityk szeregowania
> przez porównanie z Processor-Sharing.
### Dodatkowe źródła
[24] Campbell, D. T. (1979). Assessing the impact of planned social
change. *Evaluation and Program Planning*, 2(1), 6790.
doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X)
> Prawo Campbella: „Im bardziej jakikolwiek ilościowy wskaźnik
> społeczny jest używany do podejmowania decyzji społecznych, tym
> bardziej podlega presji korupcyjnej i tym bardziej jest skłonny
> zniekształcać i korumpować procesy społeczne, które ma monitorować."
> Uzupełnia prawo Goodharta [6].
[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study
of moral injury in business settings. *Journal of Business Ethics*.
doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0)
> Rozszerza uraz moralny na miejsca pracy nastawione na zysk. Waliduje
> zastosowanie z Rozdziału 8.4 koncepcji Shaya/Litza poza kontekstami
> wojskowymi i medycznymi.
[26] Bevan, G., & Hood, C. (2006). What's measured is what matters:
Targets and gaming in the English public health care system. *Public
Administration*, 84(3), 517538.
doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x)
> Empirycznie dokumentuje zachowania manipulacyjne, w tym „trafienie
> w cel i chybienie sensu". Dostarcza dowodów z rzeczywistości dla
> sprzeczności priorytetmetryka z Rozdziału 5.2.
[27] Moore, C. (2012). Why employees do bad things: Moral disengagement
and unethical organizational behavior. *Personnel Psychology*, 65(1),
148. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x)
> Analizuje moralne *odłączenie* — restrukturyzację poznawczą
> umożliwiającą nieetyczne zachowanie. Rozdział 8 zajmuje się
> komplementarnym zjawiskiem: szkodą dla jednostek, które *odmawiają*
> odłączenia.
---
*Niniejszy dowód został opracowany konwersacyjnie i sformalizowany 28 marca 2026 roku.*