Complete translations of the full paper into: - Spanish (README.es.md) - Thai (README.th.md) - French (README.fr.md) - Esperanto (README.eo.md) - Polish (README.pl.md) - German (README.de.md) - Portuguese/Brazilian (README.pt.md) - Arabic/MSA (README.ar.md) - Tagalog/Filipino (README.tl.md) - Simplified Chinese (README.zh.md) All translations preserve mathematical notation, LaTeX formulas, citation numbers, and markdown formatting. Reference citations kept in English with translated annotations. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
119 KiB
ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักไม่ใช่มาตรวัดที่ยุติธรรมสำหรับการจัดลำดับงาน
การพิสูจน์ทางคณิตศาสตร์ว่าค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็น สถิติที่มีอคติ ซึ่งสร้างแรงจูงใจให้เลือกทำเฉพาะงานง่ายๆ และว่าข้อได้เปรียบ ในการจัดลำดับงานที่มาตรวัดนี้ดูเหมือนจะเผยให้เห็นนั้นเป็นเพียงสิ่งประดิษฐ์ ของมาตรวัด ไม่ใช่ภาพสะท้อนของปริมาณงานจริงหรือคุณภาพการบริการ
1. บทนำ
องค์กรจำนวนมากวัดผลการปฏิบัติงานด้านการดำเนินการโดยใช้ค่าเฉลี่ยเวลา ดำเนินการแบบไม่ถ่วงน้ำหนัก: จำนวนชั่วโมง (หรือวัน) เฉลี่ยระหว่างการส่งงาน และการแก้ไขงานเสร็จสิ้น โดยนับแต่ละงานเท่าเทียมกันไม่ว่าจะมีขนาดหรือ ลำดับความสำคัญเท่าใด
บทความนี้พิสูจน์ว่ามาตรวัดนี้ไม่เพียงแต่ไม่แม่นยำ แต่มีอคติเชิงโครงสร้าง สามารถปรับปรุงได้ด้วยการเรียงลำดับงานใหม่โดยไม่ต้องทำงานเพิ่มเติมใดๆ (ทฤษฎีบท 1) ในขณะที่ทางเลือกแบบถ่วงน้ำหนักอย่างเหมาะสมนั้นไม่สามารถ ถูกบิดเบือนด้วยการจัดลำดับได้เลย (ทฤษฎีบท 2) เมื่อรวมกับระบบลำดับ ความสำคัญ มาตรวัดนี้จะขัดแย้งกับการจำแนกลำดับความสำคัญขององค์กรเอง โดยตรง (ทฤษฎีบท 9)
การอภิปรายดำเนินไปเป็นสี่ส่วน:
-
ส่วนที่ I (บทที่ 2–4) สร้างรากฐานทางคณิตศาสตร์: ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสามารถถูกบิดเบือนได้ด้วยการจัดลำดับแบบ Shortest Processing Time (SPT หรือ งานสั้นก่อน) ค่าเฉลี่ยแบบถ่วง น้ำหนักตามปริมาณงานไม่แปรผันตามลำดับการจัดตาราง และผลกระทบต่อ คุณภาพการบริการที่ตามมาเป็นลบอย่างพิสูจน์ได้
-
ส่วนที่ II (บทที่ 5–6) ขยายแบบจำลองไปสู่งานที่มีการจำแนกลำดับ ความสำคัญ พิสูจน์ว่ามาตรวัดกลายเป็นปฏิปักษ์ต่อระบบลำดับความสำคัญ และเสนอทางเลือกแบบถ่วงน้ำหนักพร้อมตัวอย่างการคำนวณจากโต๊ะบริการ ไอที
-
ส่วนที่ III (บทที่ 7–9) ตรวจสอบพลวัตขององค์กร: สิ่งที่เกิดขึ้นเมื่อ มาตรวัดถูกรายงานต่อลูกค้า (ความไม่สมมาตรของข้อมูล) สิ่งที่เกิดขึ้นกับ สมาชิกทีมที่เข้าใจข้อบกพร่องของมาตรวัด (ความเสียหายทางจิตใจ) และสิ่งที่ ผู้จัดการคนเดียวที่มีความรู้สามารถทำได้ (การเพิ่มประสิทธิภาพภายใต้ข้อจำกัด พร้อมการวิเคราะห์เสถียรภาพเชิงทฤษฎีเกม)
-
ส่วนที่ IV (บทที่ 10–12) นำเสนอข้อโต้แย้งที่ซื่อสัตย์ จัดวางงานนี้ใน วรรณกรรมที่มีอยู่ และสรุป
ผลลัพธ์หลักสร้างขึ้นบนทฤษฎีการจัดลำดับงานพื้นฐานของ Smith (1956) [1] ขยายผ่านทฤษฎีเกม [9, 10] ทฤษฎีการวัดผลองค์กร [18, 19] และจิตวิทยา [11–17] เพื่อติดตามห่วงโซ่ที่สมบูรณ์จากการพิสูจน์ทางคณิตศาสตร์เกี่ยวกับ มาตรวัดเฉพาะไปจนถึงผลลัพธ์ขององค์กร
ส่วนที่ I: รากฐานทางคณิตศาสตร์
2. นิยาม
กำหนดให้มี n งาน โดยมีเวลาประมวลผล p_1, p_2, \ldots, p_n
ตารางงาน \sigma คือการเรียงสับเปลี่ยนของ \{1, 2, \ldots, n\} ที่กำหนด
งานให้กับลำดับการดำเนินการบนผู้ปฏิบัติงานคนเดียว
เวลาดำเนินการของงาน \sigma(k) ภายใต้ตารางงาน \sigma คือ:
C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}
ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักคือ:
\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}
ค่าเฉลี่ยเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงานคือ:
\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}
3. ผลลัพธ์หลัก
3.1 ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสามารถถูกบิดเบือนได้
ทฤษฎีบท 1 (Smith, 1956 [1]). ตารางงานที่ทำให้
\bar{C}(\sigma) มีค่าน้อยที่สุดคือการจัดลำดับแบบ Shortest Processing Time
first (SPT หรือ งานสั้นก่อน): เรียงลำดับงานให้
p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}
การพิสูจน์ (อาร์กิวเมนต์การแลกเปลี่ยน [1, 2])
พิจารณาตารางงาน \sigma ใดๆ ที่งานสองงานที่อยู่ติดกัน i, j มีคุณสมบัติ
p_i > p_j โดยที่งาน i ถูกจัดก่อนงาน j ทันที ให้ t
เป็นเวลาเริ่มต้นของงาน i
งาน i เสร็จ |
งาน j เสร็จ |
ผลรวม | |
|---|---|---|---|
ก่อนสลับ (i แล้ว j) |
t + p_i |
t + p_i + p_j |
2t + 2p_i + p_j |
หลังสลับ (j แล้ว i) |
t + p_j |
t + p_j + p_i |
2t + p_i + 2p_j |
การเปลี่ยนแปลงในผลรวมของเวลาดำเนินการคือ:
(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0
การสลับคู่ที่งานยาวอยู่ก่อนงานสั้นทุกครั้งจะลดผลรวมรวมอย่างเข้มงวด
ตารางงานที่ไม่ใช่ SPT ทุกตารางจะมีคู่ดังกล่าวอยู่ การสลับซ้ำๆ จะลู่เข้าสู่ SPT
ดังนั้น SPT จึงทำให้ \bar{C}(\sigma) มีค่าน้อยที่สุดอย่างเป็นเอกลักษณ์ \blacksquare
3.2 ค่าเฉลี่ยแบบถ่วงน้ำหนักตามปริมาณงานไม่แปรผันตามตารางงาน
ทฤษฎีบท 2. ค่าเฉลี่ยเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงาน
\bar{C}_w(\sigma) มีค่าเท่ากันสำหรับทุกตารางงาน \sigma
การพิสูจน์
กระจายตัวเศษ:
\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}
เปลี่ยนดัชนีโดยให้ a = \sigma(k) และ b = \sigma(j) ผลรวมซ้อนนับทุกคู่
อันดับ (a, b) ที่ b ถูกจัดไม่ช้ากว่า a:
= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b
สำหรับคู่ (a, b) ใดๆ ที่ a \ne b จะมีเพียงหนึ่งในสอง
\{b \preceq_\sigma a\} หรือ \{a \prec_\sigma b\} ที่เป็นจริง พจน์บน
เส้นทแยงมุม (a = b) มีส่วนร่วม p_a^2 ไม่ว่าลำดับจะเป็นอย่างไร ดังนั้น:
\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b
เมื่อรวมกับผลรวมส่วนเติมเต็ม ผลรวมนอกเส้นทแยงมุมทั้งสองครอบคลุม คู่ไม่เรียงลำดับทั้งหมด:
\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b
ด้านขวามือไม่ขึ้นอยู่กับตารางงาน โดยสมมาตรของ p_a p_b
ผลรวมนอกเส้นทแยงมุมทั้งสองมีค่าเท่ากัน:
\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b
ดังนั้น:
\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2
นิพจน์นี้ไม่มีการอ้างอิงถึง \sigma เนื่องจากตัวส่วน
\sum p_a ก็ไม่ขึ้นกับตารางงานเช่นกัน:
\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}
จึงคงที่สำหรับทุกตารางงาน \blacksquare
นี่เป็นตัวอย่างหนึ่งของกฎการอนุรักษ์ในการจัดลำดับงานที่ระบุโดย Coffman, Shanthikumar, และ Yao [20] ความไม่แปรผันนี้สอดคล้องกับ การวัดว่าหน่วยงานต้องรอนานเพียงใด แทนที่จะวัดว่างานหนึ่งๆ ต้องรอ นานเพียงใด สถิติแบบไม่ถ่วงน้ำหนักนับจำนวนงานที่เสร็จสิ้นแทนที่จะนับ ปริมาณงาน ซึ่งเป็นสาเหตุที่ทำให้สามารถถูกบิดเบือนได้ (ดูเพิ่มเติม Little [3, 4] สำหรับบริบทเชิงทฤษฎีแถวคอย โดยมีข้อควรระวังว่ากฎของ Little ใช้ได้โดยตรงเฉพาะกับระบบสถานะคงตัว ไม่ใช่กรณีแบบกลุ่มที่ วิเคราะห์ในที่นี้)
3.3 ตัวอย่างประกอบ
งานสองงาน: A มี p_A = 1 ชั่วโมง, B มี p_B = 10 ชั่วโมง
| ตารางงาน | C_A |
C_B |
ค่าเฉลี่ยไม่ถ่วงน้ำหนัก | ค่าเฉลี่ยถ่วงน้ำหนักตามปริมาณงาน |
|---|---|---|---|---|
| SPT (A ก่อน) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 |
| ลำดับกลับ (B ก่อน) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 |
SPT ดูดีกว่า 4.5 ชั่วโมงในมาตรวัดแบบไม่ถ่วงน้ำหนัก แต่ให้การ ปรับปรุงเป็นศูนย์ในมาตรวัดแบบถ่วงน้ำหนักตามปริมาณงาน ข้อได้เปรียบ ที่ปรากฏนั้นมีอยู่เพียงเพราะสถิติแบบไม่ถ่วงน้ำหนักอนุญาตให้งาน 1 ชั่วโมง "ลงคะแนน" เท่ากับงาน 10 ชั่วโมง
4. ผลกระทบต่อคุณภาพการบริการ
4.1 การอดอาหารของงานขนาดใหญ่
ทฤษฎีบท 3 (อคติของมาตรวัด) นโยบายการจัดลำดับใดๆ ที่ทำให้ค่าเฉลี่ย เวลาดำเนินการแบบไม่ถ่วงน้ำหนักมีค่าน้อยที่สุด จะทำให้เวลาดำเนินการ ของงานที่ใหญ่ที่สุดมีค่ามากที่สุดอย่างหลีกเลี่ยงไม่ได้
การพิสูจน์ SPT วางงานที่ใหญ่ที่สุดไว้ลำดับสุดท้าย เวลาดำเนินการของ
งานนั้นเท่ากับเวลาประมวลผลรวม \sum p_i ซึ่งเป็นเวลาดำเนินการสูงสุด
ที่เป็นไปได้สำหรับงานใดๆ ภายใต้ตารางงานใดๆ ที่ไม่ได้วางงานที่ใหญ่ที่สุด
ไว้สุดท้าย งานนั้นจะเสร็จเร็วกว่าอย่างเข้มงวด \blacksquare
สิ่งนี้สร้างแรงจูงใจให้เกิดการอดอาหาร: ตัวแทนที่มีเหตุผลซึ่งเพิ่ม ประสิทธิภาพสถิติแบบไม่ถ่วงน้ำหนักจะเลื่อนงานขนาดใหญ่ออกไปอย่าง ไม่มีกำหนดเพื่อทำงานขนาดเล็กแทน Austin [18] ระบุรูปแบบทั่วไปนี้ ว่า การวัดผลที่ไม่สมบูรณ์สร้างแรงจูงใจให้เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละ มิติที่ไม่ได้ถูกวัด ในบริบทของการจัดการผลการปฏิบัติงานขององค์กร ทฤษฎีบท 3 ให้กลไกเฉพาะสำหรับการจัดลำดับงาน
4.2 เวลาดำเนินการสูงสุดสำหรับงานที่ใหญ่ที่สุด
ทฤษฎีบท 4 (SPT ทำให้เวลาดำเนินการของงานที่ใหญ่ที่สุดมีค่ามากที่สุดอย่างเป็นเอกลักษณ์)
ในบรรดาตารางงานทั้งหมด SPT เป็นนโยบายเดียวที่กำหนดเวลาดำเนินการ
สูงสุดที่เป็นไปได้ (\sum p_i) ให้กับงานที่ใหญ่ที่สุด
การพิสูจน์ SPT เรียงลำดับงานจากน้อยไปมากตาม p_i โดยวางงาน
ที่ใหญ่ที่สุด p_{\max} ไว้ตำแหน่งสุดท้าย งานสุดท้ายในตารางงานใดๆ มีเวลา
ดำเนินการ \sum_{i=1}^{n} p_i ซึ่งเป็นค่าสูงสุดที่งานใดๆ จะได้รับ ภายใต้
ตารางงานใดๆ ที่ไม่ได้วาง p_{\max} ไว้สุดท้าย งานนั้นจะเสร็จก่อน
\sum p_i อย่างเข้มงวด \blacksquare
ผลสืบเนื่อง 4.1 ทีมที่เพิ่มประสิทธิภาพค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วง น้ำหนักจะส่งมอบประสบการณ์ที่แย่ที่สุดอย่างเป็นระบบให้กับลูกค้าที่มีความ ต้องการซับซ้อนที่สุด นี่ไม่ใช่ผลข้างเคียง แต่เป็นกลไกที่ทำให้มาตรวัดดีขึ้น
หมายเหตุเกี่ยวกับอัตราส่วนความช้า SPT จริงๆ แล้วบีบอัดอัตราส่วน
ความช้า (S_i = C_i / p_i) เพราะงานขนาดใหญ่ในตำแหน่งหลังๆ มีตัวส่วน
ขนาดใหญ่ที่ดูดซับผลรวมสะสม ตัวอย่างเช่น งาน [1, 5, 10]: SPT ให้
อัตราส่วนความช้า [1, 1.2, 1.6] (ความแปรปรวนต่ำ) ในขณะที่ LPT ให้
[1, 3, 16] (ความแปรปรวนสูง) ความเสียหายของ SPT ต่อลูกค้าที่มีงาน
ขนาดใหญ่ไม่ปรากฏในอัตราส่วนความช้า แต่ปรากฏในเวลาดำเนินการ
สัมบูรณ์ ความแตกต่างนี้สำคัญ: วรรณกรรมเรื่องความยุติธรรมในการจัด
ลำดับงาน [21, 22, 23] ได้ถกเถียงเรื่องความไม่ยุติธรรมของ SPT/SRPT ผ่าน
มาตรวัดที่อิงอัตราส่วนความช้าเป็นหลัก ซึ่งสามารถปิดบังภาระความล่าช้า
สัมบูรณ์ที่พิสูจน์ด้านล่างได้
4.3 การกระจุกตัวของความล่าช้า
ทฤษฎีบท 5 (SPT กระจุกความล่าช้าไปที่งานที่ใหญ่ที่สุด) ภายใต้ SPT งานที่ใหญ่ที่สุดแบกรับความล่าช้าสัมบูรณ์มากกว่าตารางงานอื่นใด
การพิสูจน์ กำหนดความล่าช้าสัมบูรณ์เป็น \Delta_i = C_i - p_i (เวลาที่
ใช้ในการรอ โดยไม่ขึ้นกับขนาดของงานเอง) ภายใต้ SPT งานที่ใหญ่ที่สุดอยู่
ในตำแหน่ง n โดยมี:
\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i
นี่คือผลรวมของเวลาประมวลผลของงานอื่นทั้งหมด ซึ่งเป็นความล่าช้าสูงสุด
ที่เป็นไปได้สำหรับงานเดียว ภายใต้ตารางงานใดๆ ที่งานที่ใหญ่ที่สุดไม่ได้
อยู่ลำดับสุดท้าย ความล่าช้าของงานนั้นจะน้อยกว่าอย่างเข้มงวด ในขณะ
เดียวกัน SPT ให้ความล่าช้าเป็นศูนย์แก่งานที่เล็กที่สุด
(\Delta_1^{\text{SPT}} = 0) ภาระการรอคิวทั้งหมดถูกเปลี่ยนจากงานเล็ก
ไปยังงานใหญ่ \blacksquare
SPT ทำให้ความล่าช้ารวมมีค่าน้อยที่สุด (ดีสำหรับประสิทธิภาพโดยรวม) โดย กระจุกความล่าช้าไปที่งานที่สามารถรับได้ดีที่สุดในแง่ของอัตราส่วนความช้า แต่ในแง่สัมบูรณ์ คือจำนวนชั่วโมงที่ใช้ในการรอ งานที่ใหญ่ที่สุดแบกรับ น้ำหนักทั้งหมด
4.4 ความไม่แปรผันของปริมาณงาน
ทฤษฎีบท 6 (ความไม่แปรผันของปริมาณงาน) ปริมาณงานรวมที่เสร็จสิ้น
ในช่วงเวลา T ใดๆ จะเท่ากันภายใต้ทุกนโยบายการจัดลำดับ
การพิสูจน์ ผู้ปฏิบัติงานประมวลผลงานด้วยอัตราคงที่ ในช่วงเวลา
T \ge \sum p_i ปริมาณงานรวมที่ทำได้คือ \sum p_i ไม่ว่าจะเรียงลำดับ
อย่างไร สำหรับกรณีสถานะคงตัวที่มีงานเข้ามาอย่างต่อเนื่อง ปริมาณงานใน
ระยะยาวถูกกำหนดโดยอัตราการบริการ \mu และไม่ขึ้นกับการจัดลำดับงาน
โดยสิ้นเชิง:
\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{for all schedules } \sigma
\blacksquare
ผลสืบเนื่อง 6.1 ทีมที่เปลี่ยนจากนโยบายการจัดลำดับใดๆ มาเป็น SPT จะ สังเกตเห็นการปรับปรุงในค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักโดย ไม่มีการเปลี่ยนแปลงปริมาณงานจริงเลย มาตรวัดดีขึ้น ผลผลิตไม่ เปลี่ยนแปลง
4.5 ผลกระทบแบบรวม
เมื่อรวมทฤษฎีบท 4, 5, และ 6:
| มาตรวัด | ผลของการเพิ่มประสิทธิภาพค่าเฉลี่ยแบบไม่ถ่วงน้ำหนัก |
|---|---|
| ปริมาณงาน (งาน/เวลา) | ไม่เปลี่ยนแปลง (ทฤษฎีบท 6) |
| ความล่าช้าสำหรับงานเล็ก | ลดลงมากที่สุด เข้าใกล้ศูนย์ (SPT) |
| ความล่าช้าสำหรับงานใหญ่ | มากที่สุด แบกรับภาระการรอคิวทั้งหมด (ทฤษฎีบท 5) |
| เวลาดำเนินการของงานที่ใหญ่ที่สุด | สูงสุดเท่าที่เป็นไปได้: \sum p_i (ทฤษฎีบท 4) |
ผลกระทบสุทธิต่อคุณภาพที่รับรู้เป็นลบ เพราะ:
-
การเกลียดการสูญเสียเป็นแบบไม่สมมาตร [8] ลูกค้าที่งาน 100 ชั่วโมง ถูกลดลำดับความสำคัญจะประสบกับประสบการณ์เชิงลบที่ใหญ่และเด่นชัด ลูกค้าที่งาน 1 ชั่วโมงได้รับการเร่งรัดจะประสบกับประสบการณ์เชิงบวก ที่เล็กน้อยและมักไม่สังเกต
-
งานที่ต้องใช้ความพยายามสูงสัมพันธ์กับลูกค้าที่มีมูลค่าสูง งานขนาดใหญ่ มีความเป็นไปได้สูงที่จะมาจากลูกค้ารายใหญ่ สัญญาที่ซับซ้อน หรือความ ต้องการทางธุรกิจที่สำคัญ
-
การอดอาหารทวีความรุนแรง ในระบบต่อเนื่อง (ทฤษฎีบท 3) งานขนาด ใหญ่อาจถูกเลื่อนออกไปอย่างไม่มีกำหนดเมื่องานขนาดเล็กใหม่เข้ามา เรื่อยๆ
ทฤษฎีบท 7 (ผลลัพธ์หลัก) สำหรับทีมที่ประมวลผลงานที่มีขนาดไม่ สม่ำเสมอ การใช้ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็นมาตรวัดผล การปฏิบัติงาน:
(a) ให้ผลผลิตเพิ่มขึ้นเป็นศูนย์ (ทฤษฎีบท 6) ในขณะที่ (b) กำหนดเวลาดำเนินการสูงสุดที่เป็นไปได้ให้กับงานที่ใหญ่ที่สุด (ทฤษฎีบท 4) และ (c) กระจุกความล่าช้าในการรอคิวทั้งหมดไปที่งานที่ใหญ่ที่สุด ในขณะที่ กำจัดความล่าช้าสำหรับงานที่เล็กที่สุด (ทฤษฎีบท 5)
นี่ไม่ใช่การแลกเปลี่ยน มาตรวัดสร้างการโอนคุณภาพบริการจากลูกค้าที่มี
งานต้องใช้ความพยายามสูงไปยังลูกค้าที่มีงานต้องใช้ความพยายามต่ำ โดย
ไม่ได้งานสุทธิเพิ่มขึ้นเลย \blacksquare
ส่วนที่ II: ระบบลำดับความสำคัญ
5. การล่มสลายภายใต้การจำแนกลำดับความสำคัญ
บทก่อนหน้าพิสูจน์ว่าค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักมีอคติเมื่อ งานมีขนาดแตกต่างกัน ต่อไปนี้เราจะแสดงว่าการนำระบบลำดับความสำคัญ เข้ามาใช้ ซึ่งทีมจริงแทบทุกทีมใช้ จะทำให้มาตรวัดกลายเป็นไม่เพียงแค่มี อคติ แต่เป็นปฏิปักษ์โดยตรงต่อเป้าหมายที่ระบุไว้ขององค์กร
5.1 แบบจำลองขยาย: งานที่มีลำดับความสำคัญ
ให้แต่ละงาน i มีเวลาประมวลผล p_i และระดับลำดับความสำคัญ
q_i \in \{1, 2, 3, 4\} โดย 1 คือลำดับสูงสุด (วิกฤต) และ 4 คือต่ำสุด
(ปรับปรุงเสริม/เครื่องสำอาง) กำหนดน้ำหนักลำดับความสำคัญ:
w(q) = \begin{cases} 8 & q = 1 \text{ (Critical)} \\ 4 & q = 2 \text{ (High)} \\ 2 & q = 3 \text{ (Medium)} \\ 1 & q = 4 \text{ (Low)} \end{cases}
น้ำหนักเฉพาะเหล่านี้เป็นเพียงตัวอย่าง ผลลัพธ์ใช้ได้กับฟังก์ชันน้ำหนักที่ ลดลงอย่างเข้มงวดใดๆ คุณสมบัติสำคัญคือลำดับความสำคัญถูกกำหนดโดย ผลกระทบทางธุรกิจ ไม่ใช่โดยขนาดของงาน
5.2 มาตรวัดขัดแย้งกับระบบลำดับความสำคัญ
ทฤษฎีบท 8 (การกลับหัวของลำดับความสำคัญ-ขนาด) เมื่อลำดับ ความสำคัญเป็นอิสระจากขนาดงาน ตารางงานที่ทำให้ค่าเฉลี่ยเวลาดำเนินการ แบบไม่ถ่วงน้ำหนัก (SPT) มีค่าน้อยที่สุด จะทำให้งานที่มีลำดับความสำคัญต่ำ เสร็จก่อนงานที่มีลำดับความสำคัญสูงที่มีขนาดใหญ่กว่า โดยค่าคาดหวัง
การพิสูจน์ SPT เรียงลำดับงานตาม p_i จากน้อยไปมาก โดยไม่คำนึงถึง
q_i พิจารณาสองงาน:
- งาน A:
p_A = 40ชั่วโมง,q_A = 1(วิกฤต เช่น เซิร์ฟเวอร์ล่ม) - งาน B:
p_B = 0.5ชั่วโมง,q_B = 4(ต่ำ เช่น แก้ไขหน้าตา UI เล็กน้อย)
SPT จัดลำดับ B ก่อน A ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสำหรับคู่นี้:
\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25
มาตรวัดประกาศว่า SPT ดีกว่าเกือบสองเท่า ทั้งที่ทำการแก้ไขเครื่อง สำอางในขณะที่เซิร์ฟเวอร์กำลังล่ม
โดยทั่วไป เมื่อ q_i เป็นอิสระทางสถิติจาก p_i การเรียงลำดับของ SPT มี
สหสัมพันธ์เป็นศูนย์กับลำดับความสำคัญ ในทางปฏิบัติ งานวิกฤต (การล่ม
ของระบบ เหตุการณ์ด้านความปลอดภัย การสูญเสียข้อมูล) มักต้องการงาน
มากกว่างานระดับต่ำ ดังนั้นมาตรวัดจึงมีแนวโน้มที่จะสัมพันธ์ผกผันกับ
ระบบลำดับความสำคัญ \blacksquare
5.3 การทำลายข้อมูล
ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักลดทอนงานสามมิติ (p_i, q_i, C_i) ให้เหลือ
สัญญาณหนึ่งมิติ (C_i) แล้วหาค่าเฉลี่ยอย่างสม่ำเสมอ สิ่งนี้ทิ้งลำดับ
ความสำคัญทั้งหมดและกลับขนาดโดยปริยาย
ทฤษฎีบท 9 (การทำลายข้อมูล) ให้ I(\sigma) เป็นข้อมูลร่วม
(mutual information) ระหว่างการจัดอันดับลำดับความสำคัญโดยปริยายของ
ตารางงาน (ตำแหน่ง) กับการกำหนดลำดับความสำคัญจริง q_i สำหรับ SPT:
I(\sigma_{\text{SPT}}) = 0 \quad \text{when } p_i \perp q_i
การพิสูจน์ SPT กำหนดตำแหน่งตาม p_i เพียงอย่างเดียว เมื่อ p_i และ
q_i เป็นอิสระต่อกัน การรู้ตำแหน่งของงานในตารางงาน SPT ไม่ให้ข้อมูล
ใดๆ เกี่ยวกับลำดับความสำคัญของงานนั้น \blacksquare
ผลสืบเนื่อง 9.1 ทีมที่เพิ่มประสิทธิภาพค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วง น้ำหนักกำลังดำเนินการระบบจัดลำดับที่ไม่มีข้อมูลใดๆ เกี่ยวกับการจำแนก ลำดับความสำคัญของตัวเอง ฟิลด์ลำดับความสำคัญในระบบจัดการตั๋วของพวกเขา เป็นเพียงเครื่องประดับเมื่อพิจารณาในแง่ของลำดับการดำเนินการ
นี่เป็นตัวอย่างของสิ่งที่ Austin [18] เรียกว่าปัญหาพื้นฐานของการวัดผลที่ไม่ สมบูรณ์: เมื่อระบบการวัดจับเพียงส่วนย่อยของมิติที่เกี่ยวข้อง การเพิ่ม ประสิทธิภาพการวัดจะลดทอนมิติที่ไม่ได้วัดอย่างเป็นระบบ
5.4 ต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญ
กำหนดต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญของตาราง งาน:
D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i
ทฤษฎีบท 10 (SPT และต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับ
ความสำคัญ) ตารางงานที่เหมาะสมที่สุดสำหรับการลด D(\sigma) ให้
น้อยที่สุดคือ WSJF (Weighted Shortest Job First หรือ งานสั้นที่มีน้ำหนักมาก
ก่อน): เรียงลำดับตาม w(q_i)/p_i จากมากไปน้อย [1, 5] การเรียงลำดับของ
SPT ตาม 1/p_i จากมากไปน้อย ไม่สนใจลำดับความสำคัญเลย และให้ค่า
D สูงกว่าทางเลือกที่คำนึงถึงลำดับความสำคัญ เมื่อลำดับความสำคัญ
สัมพันธ์กับขนาดงาน
การพิสูจน์ โดยอาร์กิวเมนต์การแลกเปลี่ยน การสลับงานที่อยู่ติดกัน i, j
เปลี่ยน D โดย:
\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j
การสลับปรับปรุง D เมื่อ w(q_j)/p_j > w(q_i)/p_i แต่ j ถูกจัดหลัง i
ดังนั้นลำดับที่เหมาะสมที่สุดคือ w(q_i)/p_i จากมากไปน้อย ซึ่งก็คือกฎ
WSJF นั่นเอง SPT สอดคล้องกับ WSJF เมื่อ w(q_i) = \text{const}
(งานทุกงานมีลำดับความสำคัญเท่ากัน) เท่านั้น
ตัวอย่าง งานวิกฤต (w = 8, p = 3) และงานต่ำ (w = 1, p = 2):
- SPT (งานต่ำก่อน):
D = 1 \cdot 2 + 8 \cdot 5 = 42 - WSJF (งานวิกฤตก่อน):
D = 8 \cdot 3 + 1 \cdot 5 = 29
SPT ก่อให้เกิดต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญมากกว่า
45% ในทางปฏิบัติ งานวิกฤตมักมีขนาดใหญ่กว่า (การล่มของระบบ เหตุการณ์
ด้านความปลอดภัย) ทำให้ความแตกต่างนี้เป็นไปอย่างเป็นระบบ \blacksquare
6. แนวทางแก้ไขที่เสนอ
6.1 มาตรวัดแบบถ่วงน้ำหนักตามลำดับความสำคัญ
แทนที่ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักด้วยคะแนนเวลาดำเนินการ แบบถ่วงน้ำหนักตามลำดับความสำคัญ (PWCS -- Priority-Weighted Completion Score):
\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}
นี่คือค่าเฉลี่ยอัตราส่วนความช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญ วัดว่า แต่ละงานต้องรอนานเท่าใดเมื่อเทียบกับขนาดของงาน ถ่วงน้ำหนักตามความ สำคัญของงานนั้น ค่าต่ำกว่าดีกว่า
คุณสมบัติ:
- คำนึงถึงลำดับความสำคัญ ความล่าช้าของงานวิกฤตมีต้นทุนสูงกว่างาน ระดับต่ำ 8 เท่า
- ยุติธรรมต่อขนาด ใช้อัตราส่วนความช้า
C_i / p_iดังนั้นงานขนาดใหญ่ จะไม่ถูกลงโทษเพียงเพราะมีขนาดใหญ่ - ไม่สามารถถูกบิดเบือนด้วย SPT การเรียงลำดับตามเวลาประมวลผลไม่ ปรับปรุงคะแนนอย่างเป็นระบบ
- ลดรูปเป็นค่าเฉลี่ยไม่ถ่วงน้ำหนักเมื่องานสม่ำเสมอ เป็นการวางนัยทั่วไป อย่างเข้มงวด
6.2 นโยบายที่เหมาะสมที่สุด: WSJF
ทฤษฎีบท 11 ตารางงานที่ทำให้เวลาดำเนินการแบบถ่วงน้ำหนักตามลำดับ
ความสำคัญ \text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i) มีค่า
น้อยที่สุด จะประมวลผลงานในลำดับ w(q_i)/p_i จากมากไปน้อย ซึ่งก็คือ
กฎ Weighted Shortest Job First (WSJF) [1, 5]
การพิสูจน์ โดยอาร์กิวเมนต์การแลกเปลี่ยน (เช่นเดียวกับทฤษฎีบท 10)
การสลับงานที่อยู่ติดกัน i, j ปรับปรุง PWCT เมื่อ w(q_j)/p_j > w(q_i)/p_i
แต่ j ถูกจัดหลัง i ดังนั้นลำดับที่เหมาะสมที่สุดจึงเป็น w(q_i)/p_i
จากมากไปน้อย \blacksquare
ภายในระดับลำดับความสำคัญเดียวกัน สิ่งนี้ลดรูปเป็น SPT (งานสั้นก่อน)
ข้ามระดับ งานวิกฤต 4 ชั่วโมง (w/p = 2.0) ชนะงานระดับต่ำ 1 ชั่วโมง
(w/p = 1.0)
ข้อควรระวังในทางปฏิบัติ WSJF บริสุทธิ์สามารถวางงานเล็กระดับต่ำ
ไว้ก่อนงานใหญ่ระดับวิกฤต (งานระดับต่ำ 15 นาทีมี w/p = 1/0.25 = 4.0
ชนะงานวิกฤต 6 ชั่วโมงที่ w/p = 8/6 = 1.33) ในทางปฏิบัติ สิ่งนี้ถูก
บรรเทาโดยการบังคับการเรียงลำดับตามระดับลำดับความสำคัญอย่างเข้มงวด
และใช้ WSJF เฉพาะภายในแต่ละระดับเท่านั้น
6.3 ตัวอย่างประยุกต์: โต๊ะบริการไอที
พิจารณาทีมไอทีที่มีคิวตั๋วต่อไปนี้:
| ตั๋ว | ลำดับความสำคัญ | ประเภท | ชั่วโมงโดยประมาณ |
|---|---|---|---|
| T1 | P1 (วิกฤต) | เซิร์ฟเวอร์อีเมลล่ม | 6 |
| T2 | P2 (สูง) | VPN ขัดข้องสำหรับทีมระยะไกล | 4 |
| T3 | P3 (ปานกลาง) | ตั้งค่าแล็ปท็อปพนักงานใหม่ | 2 |
| T4 | P4 (ต่ำ) | อัปเดตนโยบายภาพพื้นหลังเดสก์ท็อป | 0.5 |
| T5 | P3 (ปานกลาง) | ติดตั้งใบอนุญาตซอฟต์แวร์ | 1 |
| T6 | P1 (วิกฤต) | การสำรองข้อมูลฐานข้อมูลล้มเหลว | 3 |
| T7 | P2 (สูง) | เครื่องพิมพ์ทั้งกลุ่มออฟไลน์ | 2 |
| T8 | P4 (ต่ำ) | จัดเก็บโฟลเดอร์ไดรฟ์ร่วมเก่า | 0.25 |
ลำดับ SPT (เพิ่มประสิทธิภาพค่าเฉลี่ยแบบไม่ถ่วงน้ำหนัก): T8, T4, T5, T3, T7, T6, T2, T1
| ลำดับ | ตั๋ว | ลำดับความสำคัญ | ชั่วโมง | เวลาดำเนินการ | อัตราส่วนความช้า |
|---|---|---|---|---|---|
| 1 | T8 (จัดเก็บโฟลเดอร์) | P4 ต่ำ | 0.25 | 0.25 | 1.0 |
| 2 | T4 (ภาพพื้นหลัง) | P4 ต่ำ | 0.5 | 0.75 | 1.5 |
| 3 | T5 (ซอฟต์แวร์) | P3 ปานกลาง | 1 | 1.75 | 1.75 |
| 4 | T3 (แล็ปท็อป) | P3 ปานกลาง | 2 | 3.75 | 1.875 |
| 5 | T7 (เครื่องพิมพ์) | P2 สูง | 2 | 5.75 | 2.875 |
| 6 | T6 (สำรองข้อมูล) | P1 วิกฤต | 3 | 8.75 | 2.917 |
| 7 | T2 (VPN) | P2 สูง | 4 | 12.75 | 3.188 |
| 8 | T1 (อีเมล) | P1 วิกฤต | 6 | 18.75 | 3.125 |
WSJF เชิงปฏิบัติ (ลำดับความสำคัญก่อน, SPT ภายในระดับ):
| ลำดับ | ตั๋ว | ลำดับความสำคัญ | ชั่วโมง | เวลาดำเนินการ |
|---|---|---|---|---|
| 1 | T6 (สำรองข้อมูล) | P1 วิกฤต | 3 | 3 |
| 2 | T1 (อีเมล) | P1 วิกฤต | 6 | 9 |
| 3 | T7 (เครื่องพิมพ์) | P2 สูง | 2 | 11 |
| 4 | T2 (VPN) | P2 สูง | 4 | 15 |
| 5 | T5 (ซอฟต์แวร์) | P3 ปานกลาง | 1 | 16 |
| 6 | T3 (แล็ปท็อป) | P3 ปานกลาง | 2 | 18 |
| 7 | T8 (จัดเก็บ) | P4 ต่ำ | 0.25 | 18.25 |
| 8 | T4 (ภาพพื้นหลัง) | P4 ต่ำ | 0.5 | 18.75 |
การเปรียบเทียบ:
| มาตรวัด | SPT | WSJF เชิงปฏิบัติ | ผู้ชนะ |
|---|---|---|---|
| ค่าเฉลี่ยเวลาดำเนินการไม่ถ่วงน้ำหนัก | 6.56 ชม. | 13.63 ชม. | SPT |
| เวลาเฉลี่ยในการแก้ไข P1 | 13.75 ชม. | 6 ชม. | WSJF |
| เวลาเฉลี่ยในการแก้ไข P2 | 9.25 ชม. | 13 ชม. | SPT |
| เวลาในการแก้ไขเซิร์ฟเวอร์อีเมล | 18.75 ชม. | 9 ชม. | WSJF |
| เวลาในการแก้ไขการสำรองข้อมูล | 8.75 ชม. | 3 ชม. | WSJF |
| เวลาในการอัปเดตภาพพื้นหลัง | 0.75 ชม. | 18.75 ชม. | SPT |
เวลาดำเนินการรวมแบบถ่วงน้ำหนักตามลำดับความสำคัญใกล้เคียงกัน (PWCT: 10.2 เทียบกับ 10.17) เพราะการรวมซ่อนความเสียหายเชิงการกระจาย ความแตกต่างที่แท้จริงอยู่ในรายละเอียดแยกตามระดับลำดับความสำคัญ: เซิร์ฟเวอร์อีเมลล่มเป็นเวลา 18.75 ชั่วโมงภายใต้ SPT เทียบกับ 9 ชั่วโมง ภายใต้ WSJF การสำรองข้อมูลฐานข้อมูลล้มเหลวเป็นเวลา 8.75 ชั่วโมง เทียบกับ 3 ชั่วโมง
มาตรวัดแบบไม่ถ่วงน้ำหนักรายงานอย่างมั่นใจว่า SPT มีประสิทธิภาพมากกว่า สองเท่า (6.56 เทียบกับ 13.63) โดยให้รางวัลแก่ทีมที่อัปเดตภาพพื้นหลัง เดสก์ท็อปในขณะที่เซิร์ฟเวอร์อีเมลกำลังลุกไหม้
6.4 ชุดมาตรวัดที่แนะนำ
แม้แต่มาตรวัดรวมที่ถ่วงน้ำหนักตามลำดับความสำคัญก็อาจไม่สามารถแยกแยะ ตารางงานที่ดีจากที่ไม่ดีได้ เพราะการรวมซ่อนความเสียหายเชิงการกระจาย มาตรวัดเดียวไม่เพียงพอ ระบบการวัดที่สมบูรณ์ควรติดตาม:
| มาตรวัด | สิ่งที่วัด | สูตร |
|---|---|---|
| เวลาดำเนินการเฉลี่ยแยกตามระดับลำดับความสำคัญ | การตอบสนองแยกตามระดับ | \bar{C} กรองตาม q |
| เวลาเฉลี่ยในการแก้ไข P1 | การตอบสนองต่อเหตุการณ์วิกฤต | \bar{C} สำหรับ q = 1 |
| ปริมาณงาน | กำลังการทำงานจริง | ชั่วโมงงานที่เสร็จสิ้น / เวลาปฏิทิน |
| การละเมิดเวลาสะสม | การป้องกันการอดอาหาร | งานที่เกิน SLA แยกตามลำดับความสำคัญ |
| เวลาดำเนินการสูงสุด (P1/P2) | การตอบสนองกรณีเลวร้ายที่สุด | \max(C_i) สำหรับ q \le 2 |
ข้อมูลเชิงลึกสำคัญ: มาตรวัดแยกตามระดับลำดับความสำคัญเปิดเผยความ ล้มเหลวในการจัดลำดับที่มาตรวัดรวมซ่อนไว้
ส่วนที่ III: พลวัตขององค์กร
7. เมื่อมาตรวัดเป็นตัวผลิตภัณฑ์
บทที่ 2–6 สมมติว่าความพึงพอใจของลูกค้าเป็นฟังก์ชันของคุณภาพ การบริการที่ได้รับ แต่มีสถานการณ์หนึ่งที่สมมติฐานนี้ล้มเหลวและทำให้ ข้อโต้แย้งทั้งหมดพังทลาย
7.1 มาตรวัดที่อ้างอิงตนเอง
สมมติว่าผู้ให้บริการรายงานค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักโดยตรงต่อลูกค้า บนแดชบอร์ด ในรายงาน SLA หรือบนหน้าการตลาด และความพึงพอใจของ ลูกค้าได้มาจากตัวเลขนั้นเป็นหลัก:
U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0
ภายใต้แบบจำลองนี้ SPT ทำให้ความพึงพอใจของลูกค้าสูงสุดอย่างแท้จริง (ทฤษฎีบท 1) ปริมาณงานไม่เปลี่ยนแปลง (ทฤษฎีบท 6) ผลลัพธ์ทาง ธุรกิจดีขึ้น: งานเท่าเดิม ลูกค้าพอใจมากขึ้น
ทุกทฤษฎีบทในบทความนี้ยังคงถูกต้องทางคณิตศาสตร์ แต่ข้อสรุปกลับ ด้าน มาตรวัดไม่ใช่ตัวแทนที่สามารถถูกบิดเบือนอีกต่อไป มันคือคุณภาพ การบริการ เพราะลูกค้าตกลงที่จะประเมินคุณภาพด้วยตัวเลขรวม
7.2 เศรษฐศาสตร์
สิ่งนี้สร้างดุลยภาพที่สอดคล้องและเสถียร:
| ผู้กระทำ | พฤติกรรม | ผลลัพธ์ |
|---|---|---|
| ผู้ให้บริการ | เพิ่มประสิทธิภาพค่าเฉลี่ยไม่ถ่วงน้ำหนัก (SPT) | มาตรวัดดีขึ้น ไม่มีงานเพิ่ม |
| ลูกค้า | อ่านแดชบอร์ด เห็นค่าเฉลี่ยต่ำ | รายงานความพึงพอใจ |
| ผู้บริหาร | เห็นลูกค้าพอใจ + มาตรวัดดี | ให้รางวัลทีม |
ผู้ให้บริการดึงความพึงพอใจโดยไม่มีต้นทุนส่วนเพิ่ม โดยเพิ่มประสิทธิภาพ ตัวเลขที่ลูกค้ายอมรับเป็นตัวแทนของคุณภาพ
7.3 ความเปราะบาง
ดุลยภาพนี้เสถียรเฉพาะตราบเท่าที่ลูกค้าไม่เคยตรวจสอบประสบการณ์ของ ตนเอง มันพังเมื่อ:
-
ลูกค้าตรวจสอบตั๋วของตนเอง CTO ที่เซิร์ฟเวอร์อีเมลล่มเป็นเวลา 18.75 ชั่วโมงจะไม่คลายใจเมื่อได้ยินว่า "การแก้ไขเฉลี่ย: 6.56 ชั่วโมง" ลูกค้าที่มีแนวโน้มจะตรวจสอบมากที่สุดคือลูกค้าที่ได้รับบริการแย่ที่สุด พอดี (ทฤษฎีบท 4)
-
คู่แข่งเสนอ SLA ต่อตั๋ว "P1 แก้ไขภายใน 4 ชั่วโมง" ดีกว่า "การแก้ไขเฉลี่ยต่ำกว่า 7 ชั่วโมง" สำหรับลูกค้าที่มีความต้องการวิกฤต
-
ทีมยึดถือมาตรวัด หากทีมเชื่อว่ามาตรวัดสะท้อนผลการปฏิบัติงานจริง พวกเขาสูญเสียความสามารถในการรับรู้เมื่องานวิกฤตถูกละเลย มาตรวัด กลายเป็นอันตรายทางญาณวิทยา
7.4 รูปแบบทั่วไป
รูปแบบนี้ ที่ตัวแทนเข้ามาแทนที่คุณภาพ ตัวแทนถูกเพิ่มประสิทธิภาพ คุณภาพ แยกออกจากกัน ระบบเสถียรจนกว่าจะถูกทดสอบโดยความเป็นจริง ปรากฏ ซ้ำๆ ในหลายสาขา Muller [19] บันทึกไว้อย่างละเอียดในชื่อ "metric fixation" (การยึดติดกับมาตรวัด) Campbell [24] ทำให้ผลกระทบการบิดเบือนจากการใช้ ตัวชี้วัดเป็นเป้าหมายเป็นรูปแบบอย่างเป็นทางการ
| สาขา | มาตรวัดตัวแทน | คุณภาพที่แท้จริง | ความแตกต่าง |
|---|---|---|---|
| ฝ่ายสนับสนุนไอที | เวลาแก้ไขเฉลี่ย | เวลาทำงานของระบบวิกฤต | เซิร์ฟเวอร์ล่ม 19 ชม. ค่าเฉลี่ยบอก 6.5 |
| การศึกษา | คะแนนสอบ | การเรียนรู้จริง | สอนเพื่อสอบ |
| การแพทย์ | ปริมาณผู้ป่วย | ผลลัพธ์ผู้ป่วย | จำหน่ายเร็วขึ้น อัตรากลับมารักษาสูงขึ้น |
| การเงิน | กำไรรายไตรมาส | มูลค่าระยะยาว | ลดต้นทุนเพิ่ม EPS กัดกร่อนความสามารถ |
| ซอฟต์แวร์ | Velocity (story points) | คุณภาพผลิตภัณฑ์ | เงินเฟ้อคะแนน ฟีเจอร์ทำเสร็จครึ่งๆ กลางๆ |
7.5 ความไม่สมมาตรของข้อมูล
จำลองระบบเป็นเกมระหว่างผู้ให้บริการ (P) และลูกค้า (C) โดย P สังเกต
\{C_i\} แต่ละรายการและเลือก \sigma ในขณะที่ C สังเกตเพียง
\bar{C}(\sigma) นี่คือปัญหาภัยทางศีลธรรม (moral hazard) [10]:
กลยุทธ์ที่เหมาะสมที่สุดของ P คือการทำให้สัญญาณที่สังเกตได้มีค่าน้อยที่สุด
ไม่ว่าการกระจายที่สังเกตไม่ได้จะเป็นอย่างไร
ดุลยภาพนี้เป็นดุลยภาพแบบรวมกลุ่ม (pooling equilibrium) [9]: มาตรวัด
ที่ P รายงานดูเหมือนกันไม่ว่าผลการปฏิบัติงานแบบถ่วงน้ำหนักตามลำดับ
ความสำคัญจะเป็นอย่างไร ดุลยภาพจะเสถียรจนกว่า C จะเข้าถึงค่า C_i
แต่ละรายการได้ ผ่านพอร์ทัลลูกค้า ความโปร่งใสของคู่แข่ง หรือเหตุการณ์
ที่เจ็บปวดเพียงพอ
7.6 บทสรุปที่ไม่สบายใจ
คำตอบที่ซื่อสัตย์ต่อคำถาม "การเพิ่มประสิทธิภาพค่าเฉลี่ยไม่ถ่วงน้ำหนัก ทำร้ายธุรกิจหรือไม่?" คือ: ไม่จำเป็น ตราบเท่าที่ลูกค้าไม่เคยมองเบื้องหลัง ตัวเลข คำตอบที่ซื่อสัตย์ต่อคำถาม "นี่ยั่งยืนหรือไม่?" คือ: มันยั่งยืน เท่ากับระบบใดๆ ที่ผู้ขายรู้มากกว่าผู้ซื้อ เสถียรเป็นระยะเวลานาน จากนั้น พังทลายอย่างรวดเร็วเมื่อความไม่สมมาตรถูกเจาะ
8. ต้นทุนทางจิตใจของการรู้
บทที่ 7 จำลองผู้ให้บริการเป็นผู้กระทำเดี่ยว แต่ทีมประกอบด้วยบุคคล เมื่อ สมาชิกทีมเข้าใจการพิสูจน์ เมื่อพวกเขารู้ว่ามาตรวัดเป็นสิ่งสังเคราะห์ ว่า แดชบอร์ดเป็นการแสดง ว่าเซิร์ฟเวอร์อีเมลยังล่มอยู่ขณะที่พวกเขาปิดตั๋ว ภาพพื้นหลัง ต้นทุนใหม่ปรากฏขึ้นที่แบบจำลองดุลยภาพไม่ได้รวมไว้
8.1 ตัวแปรซ่อน: ความตระหนักของทีม
| ผู้กระทำ | สังเกต C_i แต่ละรายการ |
สังเกต \bar{C} |
เข้าใจการพิสูจน์ |
|---|---|---|---|
| ผู้บริหาร | อาจจะ | ใช่ | แตกต่างกันไป |
| สมาชิกทีม | ใช่ | ใช่ | ใช่ (ในสถานการณ์นี้) |
| ลูกค้า | ไม่ | ใช่ | ไม่ |
สมาชิกทีมมีข้อมูลครบถ้วน พวกเขาเห็นคิวตั๋ว พวกเขารู้ว่าเซิร์ฟเวอร์อีเมล ล่มตั้งแต่ 7 โมงเช้า พวกเขารู้ว่ากำลังปิดตั๋วภาพพื้นหลังเพราะมันปรับปรุง ตัวเลข และพวกเขารู้เหตุผล
8.2 ความขัดแย้งทางปัญญาภายใต้ข้อมูลครบถ้วน
ความขัดแย้งทางปัญญา (cognitive dissonance) [11] เกิดขึ้นเมื่อบุคคลถือ ความคิดที่ขัดแย้งกัน หากไม่เข้าใจเหตุผล ความขัดแย้งสามารถถูกให้เหตุผล ได้: "ผู้บริหารรู้ดีกว่า" การเข้าใจการพิสูจน์ทำลายความคลุมเครือ สมาชิก ทีมตอนนี้ถือ:
- ความคิด A: "ฉันเป็นมืออาชีพที่มีความสามารถ งานของฉันคือแก้ปัญหา ที่สำคัญ"
- ความคิด B: "ฉันกำลังปิดตั๋วภาพพื้นหลังในขณะที่เซิร์ฟเวอร์อีเมลล่ม เพราะมาตรวัดมีอคติทางคณิตศาสตร์ (ทฤษฎีบท 1) การเรียงลำดับใหม่ ให้ปริมาณงานเป็นศูนย์ (ทฤษฎีบท 6) และผู้ได้รับประโยชน์เพียงรายเดียว คือแดชบอร์ด (บทที่ 7) ฉันพิสูจน์สิ่งนี้ได้"
ความขัดแย้งนี้ตอนนี้เป็นโครงสร้างรับน้ำหนัก ทางออกที่มี ได้แก่ ละทิ้ง อัตลักษณ์วิชาชีพ ปฏิเสธการพิสูจน์ สนับสนุนการเปลี่ยนแปลง หรือลาออก แต่ละทางเลือกมีต้นทุนที่ไม่เคยมีก่อนหน้านี้
8.3 ทฤษฎีการกำหนดตนเอง: สามความต้องการที่ถูกละเมิด
ทฤษฎีการกำหนดตนเอง (Self-Determination Theory) ของ Deci และ Ryan [12, 13] ระบุความต้องการสามประการที่ทำนายแรงจูงใจภายใน:
ความเป็นอิสระ มาตรวัดจำกัดทางเลือกในลักษณะที่สมาชิกทีมรู้ว่าไม่ เหมาะสมทางคณิตศาสตร์ ผู้ปฏิบัติงานที่เข้าใจว่ากระบวนการนั้นไม่มี ประสิทธิผลอย่างพิสูจน์ได้ ไม่สามารถรู้สึกเป็นอิสระในการทำตามได้
ความสามารถ มาตรวัดให้รางวัลประสิทธิผลที่ปรากฏ (\bar{C} ต่ำ)
ในขณะที่ไม่แปรผันต่อประสิทธิผลจริง (ทฤษฎีบท 6) ความสามารถที่แท้จริง
การแก้ไขเซิร์ฟเวอร์อีเมลก่อน ถูกลงโทษโดยมาตรวัด
ความสัมพันธ์ สมาชิกทีมรู้ว่าเซิร์ฟเวอร์อีเมลของลูกค้าล่ม พวกเขา สามารถช่วยได้ แต่กลับอัปเดตภาพพื้นหลัง ไม่ใช่เพราะมันช่วยใคร แต่เพราะ มันช่วยตัวเลข การเชื่อมต่อระหว่างงานกับผลกระทบต่อมนุษย์ถูกตัดขาด และสมาชิกทีมสามารถเห็นปลายที่ถูกตัดขาดทั้งสองข้าง
8.4 บาดแผลทางศีลธรรม
บาดแผลทางศีลธรรม (moral injury) [16, 17] คือความเสียหายที่คงอยู่อัน เกิดจาก "การกระทำ ไม่สามารถป้องกัน เป็นพยาน หรือเรียนรู้เกี่ยวกับการ กระทำที่ละเมิดความเชื่อทางศีลธรรมที่ฝังลึก" [17] ตั้งแต่นั้นมามีการขยาย ไปสู่บริบททางธุรกิจ [25] ความแตกต่างสำคัญจากภาวะหมดไฟ: ภาวะ หมดไฟคือความเหนื่อยล้าจากการทำมากเกินไป บาดแผลทางศีลธรรมคือ ความเสียหายจากการทำสิ่งที่ผิด
สมาชิกทีมที่รู้ว่าเซิร์ฟเวอร์อีเมลล่ม รู้ว่าควรแก้ไข ปิดตั๋วภาพพื้นหลังแทน และทำเช่นนั้นเพราะมาตรวัดกำหนด กำลังประสบกับเงื่อนไขเชิงโครงสร้างของ บาดแผลทางศีลธรรม
8.5 ความสิ้นหวังที่เรียนรู้และความยอมจำนนต่อมาตรวัด
ความสิ้นหวังที่เรียนรู้ (learned helplessness) ของ Seligman [14, 15] อธิบาย ว่าการเผชิญกับผลลัพธ์เชิงลบที่ควบคุมไม่ได้นำไปสู่ความเฉื่อยอย่างไร ลำดับ:
- มาตรวัดมีข้อบกพร่อง (เข้าใจการพิสูจน์แล้ว)
- สนับสนุนการเปลี่ยนแปลง
- ถูกปฏิเสธ ("ตัวเลขดี อย่ากวนน้ำ")
- ทำซ้ำด้วยความเชื่อมั่นที่ลดลง
- สถานะสุดท้าย: "มาตรวัดมันก็เป็นอย่างนี้แหละ ฉันจะแค่ปิดตั๋วไป"
นี่ไม่ใช่ความเกียจคร้าน มันเป็นการตอบสนองที่มีเหตุผลต่อระบบที่ลงโทษ พฤติกรรมที่ถูกต้องและให้รางวัลพฤติกรรมที่ไม่ถูกต้อง เมื่อบุคคลไม่มีอำนาจ ในการเปลี่ยนแปลงระบบ
8.6 วงจรการคัดเลือกแบบปฏิปักษ์
เมื่อรวมดุลยภาพของบทที่ 7 กับพลวัตการลาออก:
- องค์กรใช้ค่าเฉลี่ยไม่ถ่วงน้ำหนัก มาตรวัดดูดี (SPT)
- สมาชิกทีมที่ตระหนักรู้และมีความสามารถประสบต้นทุนทางจิตใจ (8.2–8.5)
- สมาชิกเหล่านั้นลาออก ถูกแทนที่ด้วยสมาชิกที่ไม่เข้าใจข้อบกพร่องของ มาตรวัดหรือไม่สนใจ
- มาตรวัดยังคงดูดี ดูดีเสมอภายใต้ SPT ไม่ว่าทีมจะมีความสามารถ เท่าใด (ผลสืบเนื่อง 6.1)
- คุณภาพการบริการจริงเสื่อมลง แต่มาตรวัดไม่สามารถตรวจจับสิ่งนี้ได้ (ผลสืบเนื่อง 9.1)
- กลับไปขั้นตอนที่ 1
มาตรวัดคัดเลือกต่อคนที่จะปรับปรุงระบบ และสำหรับคนที่จะไม่ท้าทาย มัน ระบบเสถียรที่ระดับความสามารถที่ต่ำลง ซึ่งมองไม่เห็นจากเครื่องมือ วัดผลของตัวเอง
8.7 แบบจำลองต้นทุนที่สมบูรณ์
| บทที่ 7 (มองเห็น) | บทที่ 8 (ซ่อน) |
|---|---|
| ลูกค้าพอใจ (ตัวเลขดี) | ทีมไม่พอใจ (ความเป็นจริงไม่ดี) |
| ปริมาณงานไม่เปลี่ยนแปลง | ความพยายามตามดุลพินิจถูกถอน |
| มาตรวัดดีขึ้น | สมาชิกที่มีความสามารถลาออก |
| เศรษฐกิจธุรกิจเสถียร | ความสามารถของสถาบันเสื่อมลง |
สิ่งเหล่านี้ดำเนินการในมาตราเวลาที่แตกต่างกัน: ดุลยภาพมองเห็นได้ รายไตรมาส การเสื่อมสลายของความสามารถมองเห็นได้ในหลายปี แบบจำลอง ที่สมบูรณ์คือ: มาตรวัดใช้งานได้ และมันทำลาย และการทำลายนั้นมอง ไม่เห็นจากมาตรวัด มาตรวัดเปรียบเสมือนสีทาใหม่บนเหล็กเสริมที่ผุกร่อน
9. การซึมซับของผู้จัดการ: ทางออกที่ปฏิบัติได้
บทที่ 2–6 บอกให้ปฏิเสธมาตรวัด บทที่ 7 บอกว่ามาตรวัดใช้งานได้ (สำหรับธุรกิจ) บทที่ 8 บอกว่ามันทำลายทีม ในทางปฏิบัติ ผู้จัดการส่วนใหญ่ ไม่สามารถเปลี่ยนมาตรวัดได้ฝ่ายเดียว ทางออกที่ดีที่สุดคือการปฏิรูปมาตรวัด ทั้งบริษัท ทางออกที่ปฏิบัติได้คือสิ่งที่ผู้จัดการคนเดียวที่มีความรู้สามารถทำ ได้ตอนนี้
9.1 กลยุทธ์
ผู้จัดการที่เข้าใจการพิสูจน์สามารถซึมซับข้อจำกัดของมาตรวัดโดยไม่ เผยแพร่ต่อทีม:
- จัดลำดับตามความสำคัญเป็นหลัก ทีมทำงานวิกฤตก่อน
- สอดแทรกงานเล็กอย่างมีชั้นเชิง เมื่องานเล็กที่มีลำดับความสำคัญต่ำ สามารถทำเสร็จได้โดยไม่ทำให้งานที่มีลำดับความสำคัญสูงล่าช้าอย่าง มีนัยสำคัญ ให้ทำ ไม่ใช่เพราะมาตรวัดต้องการ แต่เพราะมันก็ต้องทำ อยู่ดีและแทบไม่มีต้นทุน
- อย่าเปิดเผยมาตรวัดเป็นแรงจูงใจ "ทำงานเล็กนี้ให้เสร็จระหว่างรอ vendor โทรกลับเรื่อง P1" ไม่ใช่ "เราต้องลดค่าเฉลี่ยลง" แรงจูงใจ ภายในของทีมยังคงสมบูรณ์ (บทที่ 8) ผู้จัดการรับภาระการบริหาร มาตรวัด
9.2 การทำให้เป็นรูปแบบ
ปัญหาของผู้จัดการคือการเพิ่มประสิทธิภาพภายใต้ข้อจำกัด:
\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}
ทฤษฎีบท 12 (ต้นทุนมาตรวัดที่จำกัดของการจัดลำดับตามความสำคัญ) ผู้จัดการที่ใช้ SPT ภายในแต่ละระดับลำดับความสำคัญและเรียงลำดับตาม ความสำคัญระหว่างระดับ จะให้มาตรวัดใกล้เคียงกับค่าที่เหมาะสมที่สุดของ SPT ช่องว่างเกิดขึ้นจากการกลับหัวระหว่างระดับเท่านั้น
โครงร่างการพิสูจน์ ภายในแต่ละระดับลำดับความสำคัญ SPT ไม่มีต้นทุน
(งานทุกงานมีลำดับความสำคัญเท่ากัน) ความเบี่ยงเบนจาก SPT ทั่วไปมี
เพียงการเรียงลำดับระหว่างระดับ การกลับหัวข้ามระดับแต่ละครั้งมีต้นทุนไม่เกิน
p_{\text{large}} - p_{\text{small}} ในผลรวมไม่ถ่วงน้ำหนัก และการกลับหัว
เหล่านี้ถูกจำกัดด้วยจำนวนระดับ ในทางปฏิบัติ ช่องว่างมักอยู่ภายใน 10–20%
ของค่าที่เหมาะสมที่สุดของ SPT \blacksquare
9.3 ผู้จัดการในฐานะกำแพงข้อมูล
| ชั้น | เห็นมาตรวัด | เห็นลำดับความสำคัญ | เห็นการพิสูจน์ |
|---|---|---|---|
| องค์กร | ใช่ | ในนาม | ไม่ |
| ผู้จัดการ | ใช่ | ใช่ | ใช่ |
| ทีม | ไม่ (ถูกปกป้อง) | ใช่ | ไม่เกี่ยว |
| ลูกค้า | ใช่ (แดชบอร์ด) | ผ่าน SLA | ไม่ |
ผู้จัดการเป็นผู้กระทำเพียงคนเดียวที่ถือข้อมูลทั้งสามชิ้น นี่ไม่ใช่การ บิดเบือน พวกเขากำลังทำงานที่ถูกต้องในลำดับที่ถูกต้อง และมาตรวัดก็บังเอิญ ยอมรับได้เพราะ SPT ภายในระดับไม่มีต้นทุน
9.4 การล่มสลายเชิงการแข่งขัน
กลยุทธ์นี้ล้มเหลวเมื่อมาตรวัดกลายเป็นการแข่งขันระหว่างทีม
กรณีที่ 1: ร่วมมือ ทีมถูกวัดเพื่อความเท่าเทียม ไม่ใช่การจัดอันดับ ผู้จัดการ แต่ละคนใช้กลยุทธ์การซึมซับอย่างเป็นอิสระ มาตรวัดเป็นเครื่องประดับแต่ไม่ เป็นอันตราย นี่คือเกมประสานงานที่มีดุลยภาพร่วมมือที่เสถียร
กรณีที่ 2: แข่งขัน ทีมถูกจัดอันดับตาม \bar{C} นี่คือทวิบถนักโทษ
(prisoner's dilemma):
| ทีม B: ลำดับความสำคัญก่อน | ทีม B: SPT | |
|---|---|---|
| ทีม A: ลำดับความสำคัญก่อน | (งานดี, งานดี) | (A ดูแย่, B ดูดี) |
| ทีม A: SPT | (A ดูดี, B ดูแย่) | (ทั้งคู่ดูดี, ทั้งคู่ทำงานผิด) |
ดุลยภาพ Nash คือ (SPT, SPT) กลยุทธ์การซึมซับเป็นดุลยภาพร่วมมือที่ ไม่เสถียรภายใต้การแข่งขัน
9.5 ขอบเขต
| เงื่อนไข | ความเป็นไปได้ |
|---|---|
| มาตรวัดใช้สำหรับตรวจสุขภาพ / ความเท่าเทียม | เป็นไปได้ |
| มาตรวัดมองเห็นได้แต่ไม่ถูกจัดอันดับ | เป็นไปได้ |
| มาตรวัดถูกจัดอันดับข้ามทีม | เปราะบาง ต้องการให้ผู้จัดการทุกคนร่วมมือ |
| มาตรวัดผูกกับค่าตอบแทน / ทรัพยากร | ไม่เป็นไปได้ ทวิบถนักโทษครอบงำ |
| สามารถปฏิรูปมาตรวัดในระดับองค์กร | ไม่จำเป็น แก้ไขมาตรวัดแทน |
ทางออกที่ดีที่สุดคือระดับทั้งบริษัท ทางออกที่ปฏิบัติได้คือผู้จัดการที่เข้าใจ การพิสูจน์นี้ ปกป้องทีมจากมาตรวัด จัดลำดับตามความสำคัญ และใช้ SPT เฉพาะภายในระดับลำดับความสำคัญเพื่อให้ตัวเลขอยู่ในระดับที่ยอมรับได้
ส่วนที่ IV: การประเมิน
10. ทนายฝ่ายค้าน
ความซื่อสัตย์ทางปัญญากำหนดให้ยอมรับว่าข้อโต้แย้งมีขีดจำกัดตรงไหน
10.1 ความเรียบง่ายมีคุณค่าจริง
ข้อโต้แย้ง ค่าเฉลี่ยไม่ถ่วงน้ำหนักไม่ต้องการน้ำหนักลำดับความสำคัญ ไม่ต้องการการประมาณขนาดงาน ไม่ต้องการการปรับเทียบ
การประเมิน: จริง แต่มาตรวัดไม่ถ่วงน้ำหนักไม่ได้หลีกเลี่ยงสมมติฐาน มันซ่อนสมมติฐานโดยตั้งน้ำหนักทั้งหมดเป็น 1 และขนาดทั้งหมดเป็น 1 โดยปริยาย การประมาณขนาดงานที่รู้ว่าไม่แม่นยำยังคงให้ข้อมูลมากกว่า สมมติฐานโดยปริยายว่าขนาดทั้งหมดเท่ากัน
10.2 การลดจำนวนคนที่รอ
ข้อโต้แย้ง SPT ลดชั่วโมง-คนรวมที่ใช้ในการรอ หากแต่ละงานเป็นตัวแทน ของลูกค้าหนึ่งคน สิ่งนี้เหมาะสมที่สุด
การประเมิน: ถูกต้องทางคณิตศาสตร์ หากคุณบริหารสำนักงานทะเบียน และเวลาของทุกคนมีค่าเท่ากัน SPT เป็นนโยบายที่ถูกต้อง มันล้มเหลวเมื่อ งานไม่ใช่ 1:1 กับลูกค้า ต้นทุนการรอไม่สม่ำเสมอ หรือมาตรวัดถูกใช้เพื่อ ประเมินทีมแทนที่จะให้บริการคิวจริง
10.3 SPT ในฐานะฮิวริสติกคัดกรอง
ข้อโต้แย้ง เมื่อขนาดงานกระจุกตัวอยู่ใกล้กัน SPT ประมาณ FIFO และค่าเฉลี่ยไม่ถ่วงน้ำหนักประมาณค่าเฉลี่ยถ่วงน้ำหนัก
การประเมิน: ถูกต้อง สัมประสิทธิ์การแปรผัน CV = \sigma_p / \bar{p} กำหนดความรุนแรงของการบิดเบือน:
CV |
การกระจายขนาดงาน | การบิดเบือน |
|---|---|---|
| < 0.3 | แคบ (ศูนย์บริการสาย) | ไม่มีนัยสำคัญ |
| 0.3 – 1.0 | ปานกลาง (ไอทีผสม) | ปานกลาง |
| > 1.0 | กว้าง (คิวไอทีทั่วไป) | รุนแรง |
โต๊ะบริการไอทีทั่วไปครอบคลุมตั้งแต่ 15 นาทีถึง 40+ ชั่วโมง (CV > 2)
การบิดเบือนไม่ใช่กรณีขอบ มันเป็นค่าเริ่มต้น
10.4 การบิดเบือนต้องมีเจตนาร้าย
ข้อโต้แย้ง ทฤษฎีบทแสดงว่ามาตรวัดสามารถถูกบิดเบือน ไม่ใช่ว่ามัน จะถูกบิดเบือน
การประเมิน: นี่คือข้อโต้แย้งที่แข็งแกร่งที่สุด หากมาตรวัดเป็นเพียง ข้อมูลและไม่เคยมีอิทธิพลต่อพฤติกรรม แรงจูงใจในการบิดเบือนก็ไม่มี อย่างไรก็ตาม มาตรวัดใดๆ ที่ถูกรายงานต่อผู้บริหาร ผูกกับ OKR หรือถูก อภิปรายในการทบทวน จะมีอิทธิพลต่อพฤติกรรม นี่คือกฎของ Goodhart [6, 7] และมันใช้ได้กับทีมที่มีเจตนาดีอย่างน่าเชื่อถือเท่ากับทีมที่มีเจตนาร้าย การ เบี่ยงเบนเกิดขึ้นตามธรรมชาติ: การปิดตั๋วง่ายสามใบ "รู้สึกมีประสิทธิผล" ในขณะที่มาตรวัดยืนยันความรู้สึกนั้น
10.5 เมื่อใดที่ค่าเฉลี่ยไม่ถ่วงน้ำหนักสมเหตุสมผล
มาตรวัดนี้สมเหตุสมผลเฉพาะเมื่อเงื่อนไขทั้งสี่ข้อเป็นจริง:
- ขนาดงานสม่ำเสมอโดยประมาณ (
CV < 0.3) - ไม่มีการแยกลำดับความสำคัญ (งานทุกงานสำคัญเท่ากัน)
- แต่ละงานเป็นตัวแทนของลูกค้าหนึ่งคนพอดี
- มาตรวัดไม่ถูกใช้ในการประเมิน ให้รางวัล หรือกำหนดพฤติกรรม
เงื่อนไขเหล่านี้แทบไม่เคยเป็นจริงในระบบที่มาตรวัดนี้ถูกใช้บ่อยที่สุด
11. งานวิจัยที่เกี่ยวข้อง
บทความนี้อยู่ที่จุดตัดของวรรณกรรมหลายสาขาที่ไม่เคยถูกเชื่อมโยงกัน มาก่อน
11.1 ทฤษฎีการจัดลำดับงานและความยุติธรรม
Smith [1] สร้างผลลัพธ์ความเหมาะสมที่สุดของ SPT และกฎ WSJF ในปี 1956 Conway, Maxwell, และ Miller [2] ให้การอธิบายแบบตำราเรียนที่ครอบคลุม ความยุติธรรมของนโยบายการจัดลำดับตามขนาดได้รับการถกเถียงในการจัด ลำดับระบบคอมพิวเตอร์: Bansal และ Harchol-Balter [22] ตรวจสอบความไม่ ยุติธรรมของ SRPT; Wierman และ Harchol-Balter [23] ทำให้การจำแนกความ ยุติธรรมเทียบกับ Processor-Sharing เป็นรูปแบบอย่างเป็นทางการ; Angel, Bampis, และ Pascual [21] วัดคุณภาพตารางงาน SPT เทียบกับเกณฑ์ความ เหมาะสมที่สุดเชิงยุติธรรม
งานวิจัยก่อนหน้านี้วิเคราะห์ความยุติธรรมในการจัดลำดับ CPU และเซิร์ฟเวอร์ บทความปัจจุบันใช้ผลลัพธ์ทางคณิตศาสตร์เดียวกันกับการจัดการงานองค์กร ซึ่ง "ตัวจัดลำดับ" คือทีมมนุษย์ "งาน" คือคำขอของลูกค้าที่มีลำดับความสำคัญ ตามผลกระทบทางธุรกิจ และ "ฟังก์ชันวัตถุประสงค์" คือมาตรวัดการบริหาร กลไกเหมือนกัน ผลกระทบแตกต่างกันเพราะการจัดลำดับงานองค์กรมีระบบ ลำดับความสำคัญ ความสัมพันธ์กับลูกค้า และต้นทุนทางจิตใจที่การจัดลำดับ CPU ไม่มี
11.2 ความผิดปกติของการวัดผล
Austin [18] พิสูจน์ว่าการวัดผลที่ไม่สมบูรณ์ การวัดเพียงส่วนย่อยของมิติที่ เกี่ยวข้อง สร้างแรงจูงใจให้เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละมิติที่ไม่ ได้วัด และว่าผลกระทบนี้ไม่เพียงแค่เป็นไปได้แต่หลีกเลี่ยงไม่ได้เมื่อ การวัดผูกกับรางวัล กรอบความไม่สมมาตรของข้อมูลของเขามีความคล้ายกัน อย่างใกล้ชิดกับบทที่ 7 บทความปัจจุบันให้กลไกทางคณิตศาสตร์เฉพาะ (ทฤษฎีบท 1–2) สำหรับกรณีการจัดลำดับงาน และขยายข้อโต้แย้งผ่าน จิตวิทยา (บทที่ 8) เพื่อติดตามห่วงโซ่ความเสียหายขององค์กรอย่างสมบูรณ์
Muller [19] บันทึก "metric fixation" (การยึดติดกับมาตรวัด) ในการศึกษา การแพทย์ ตำรวจ และการเงิน โดยให้หลักฐานเชิงประจักษ์อย่างกว้างขวาง สำหรับรูปแบบที่ตั้งทฤษฎีไว้ในบทที่ 7.4 Campbell [24] ทำให้ผลกระทบ การบิดเบือนจากการใช้ตัวชี้วัดเป็นเป้าหมายเป็นรูปแบบอย่างเป็นทางการ เสริมการสังเกตดั้งเดิมของ Goodhart [6] และการวางนัยทั่วไปของ Strathern [7]
Bevan และ Hood [26] บันทึกพฤติกรรมการบิดเบือนในระบบสาธารณสุข ของอังกฤษเชิงประจักษ์ รวมถึงรูปแบบ "ถึงเป้าหมายแต่พลาดประเด็น" ที่อธิบายในบทที่ 5.2 ของเราอย่างตรงเผง
11.3 ต้นทุนทางจิตใจของความผิดปกติของมาตรวัด
การประยุกต์ใช้บาดแผลทางศีลธรรม (Shay [16], Litz et al. [17]) กับ บริบททางธุรกิจมีแบบอย่างล่าสุด: การศึกษาใน Journal of Business Ethics ปี 2024 [25] ขยายแนวคิดนี้ไปยังสถานที่ทำงานแสวงหากำไรอย่างชัดเจน พบเงื่อนไขเชิงโครงสร้างที่คล้ายกับที่อธิบายในบทที่ 8.4 Moore [27] วิเคราะห์การถอนตัวทางศีลธรรม (moral disengagement) ซึ่งเป็นการ ปรับโครงสร้างทางปัญญาที่ทำให้พฤติกรรมที่ไม่มีจริยธรรมเกิดขึ้นได้ภายใต้ แรงกดดันขององค์กร บทความปัจจุบันกล่าวถึงปรากฏการณ์ที่เสริมกัน: ความเสียหายต่อบุคคลที่ปฏิเสธที่จะถอนตัว
11.4 สิ่งที่เป็นนวัตกรรม
องค์ประกอบแต่ละส่วน ความเหมาะสมที่สุดของ SPT กฎของ Goodhart ความ ผิดปกติของการวัดผล บาดแผลทางศีลธรรม ล้วนมีแบบอย่างมาก่อน ผลงานของบทความนี้คือ:
-
กฎการอนุรักษ์ (ทฤษฎีบท 2) ใช้เชิงกำหนด เป็นข้อโต้แย้ง เชิงสร้างสรรค์ว่าเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงานไม่ สามารถถูกบิดเบือน แทนที่จะเป็นผลลัพธ์เชิงทฤษฎีการจัดลำดับ
-
การพิสูจน์เฉพาะว่าระดับลำดับความสำคัญทำให้มาตรวัดเป็นปฏิปักษ์ เชิงพีชคณิต (ทฤษฎีบท 8–9) ไม่เพียงแค่ไม่ดีเชิงประจักษ์ แต่ขัดแย้ง เชิงโครงสร้าง โดยมีข้อมูลร่วมเป็นศูนย์ระหว่างตารางงานและระบบลำดับ ความสำคัญ
-
ห่วงโซ่บูรณาการจากการพิสูจน์ทางคณิตศาสตร์ ผ่านความไม่สมมาตร ของข้อมูล ผ่านความเสียหายทางจิตใจ ไปจนถึงวงจรการคัดเลือกแบบ ปฏิปักษ์ ติดตามมาตรวัดเดียวจาก Smith (1956) ถึงการกลวงขององค์กร
-
กลยุทธ์การซึมซับของผู้จัดการ (บทที่ 9) พร้อมการวิเคราะห์เชิง ทฤษฎีเกมอย่างเป็นทางการเกี่ยวกับเสถียรภาพและเงื่อนไขการล่มสลาย ภายใต้การแข่งขันระหว่างทีม
-
การประยุกต์ทฤษฎีการจัดลำดับงานกับการวิจารณ์การบริหารองค์กร พิสูจน์ว่ามาตรวัดทีมที่ใช้กันทั่วไปมีพยาธิสภาพเฉพาะที่วัดปริมาณได้ แทนที่จะโต้แย้งจากเรื่องเล่าหรือหลักการทั่วไป
12. บทสรุป
ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็นสถิติที่มีอคติที่:
- สามารถถูกบิดเบือนด้วยนโยบายการจัดลำดับ (ทฤษฎีบท 1) ต่างจาก เวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงานซึ่งไม่แปรผันตามตารางงาน (ทฤษฎีบท 2)
- สร้างแรงจูงใจให้เกิดการอดอาหารของงานขนาดใหญ่ (ทฤษฎีบท 3)
- ลดคุณภาพความพึงพอใจของลูกค้าโดยไม่มีผลผลิตเพิ่มขึ้นเป็นการ ชดเชย (ทฤษฎีบท 7)
- ขัดแย้งกับระบบลำดับความสำคัญโดยตรงโดยไม่มีข้อมูลใดๆ เกี่ยวกับ การจำแนกผลกระทบทางธุรกิจ (ทฤษฎีบท 9)
- ไม่สนใจลำดับความสำคัญเลยในคำแนะนำการจัดลำดับ ให้ต้นทุน ความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญที่ไม่เหมาะสมที่สุด เมื่อใดก็ตามที่ลำดับความสำคัญและขนาดไม่สัมพันธ์ผกผันอย่างสมบูรณ์ (ทฤษฎีบท 10)
มาตรวัดที่สามารถปรับปรุงได้ด้วยการเรียงลำดับงานใหม่ โดยไม่ต้องทำงาน เพิ่มเติมใดๆ กำลังวัดนโยบายการจัดลำดับ ไม่ใช่ความสามารถของระบบ เมื่อ รวมกับระบบลำดับความสำคัญ มันแนะนำตารางงานที่สร้างความเสียหายมาก ที่สุดให้กับงานที่มีลำดับความสำคัญสูงที่สุด
เมื่อมาตรวัดถูกรายงานต่อลูกค้า มันสร้างความไม่สมมาตรของข้อมูล (บทที่ 7) ที่ดุลยภาพทางธุรกิจมีกำไรแต่เปราะบาง เมื่อสมาชิกทีมเข้าใจข้อบกพร่อง มันละเมิดแรงจูงใจภายในของพวกเขาและคัดเลือกให้คนที่มีความสามารถ มากที่สุดลาออก (บทที่ 8) ผู้จัดการคนเดียวที่มีความรู้สามารถบรรเทาผลกระทบ เหล่านี้ได้บางส่วนผ่านการเพิ่มประสิทธิภาพภายใต้ข้อจำกัด (บทที่ 9) แต่ กลยุทธ์ร่วมมือนี้ไม่เสถียรภายใต้การแข่งขันระหว่างทีม
ค่าเฉลี่ยไม่ถ่วงน้ำหนักสมเหตุสมผลเฉพาะภายใต้เงื่อนไขที่แคบ (บทที่ 10.5): ขนาดงานสม่ำเสมอ ไม่มีลำดับความสำคัญ การจับคู่ลูกค้า-งานแบบหนึ่งต่อ หนึ่ง และไม่มีอิทธิพลต่อพฤติกรรม เงื่อนไขเหล่านี้แทบไม่เคยเป็นจริง
ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักไม่ใช่มาตรวัดที่ยุติธรรมหรือ แม่นยำของผลการปฏิบัติงานด้านการดำเนินการ การใช้เป็นมาตรวัดทีมจะ ก่อให้เกิดการอดอาหารของงานที่ซับซ้อนอย่างมีเหตุผล การละเมิดลำดับ ความสำคัญที่ระบุไว้ ผลลัพธ์ที่ไม่เท่าเทียมต่อลูกค้า และภาพลวงของ ผลผลิตที่ไม่มีอยู่จริง
ทางออกที่ดีที่สุดคือการปฏิรูปมาตรวัดระดับองค์กร ทางออกที่ปฏิบัติได้คือ ผู้จัดการที่เข้าใจการพิสูจน์นี้
เอกสารอ้างอิง
ทฤษฎีการจัดลำดับงาน
[1] Smith, W. E. (1956). Various optimizers for single-stage production. Naval Research Logistics Quarterly, 3(1–2), 59–66. doi:10.1002/nav.3800030106
ที่มาของผลลัพธ์ความเหมาะสมที่สุดของ SPT (ทฤษฎีบท 1) กฎเวลา ดำเนินการแบบถ่วงน้ำหนัก
w_i/p_iจากมากไปน้อย (WSJF, ทฤษฎีบท 11) และเทคนิคการพิสูจน์แบบสลับคู่ที่อยู่ติดกัน (อาร์กิวเมนต์การแลกเปลี่ยน) ที่ใช้ตลอดทั้งบทความ
[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). Theory of Scheduling. Addison-Wesley.
ตำราเรียนมาตรฐานสำหรับทฤษฎีการจัดลำดับงานเครื่องจักรเดียว ขยายผล ลัพธ์ของ Smith
[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. Operations Research, 9(3), 383–387. doi:10.1287/opre.9.3.383
การพิสูจน์อย่างเข้มงวดครั้งแรกของกฎของ Little อ้างอิงในบทที่ 3.2 สำหรับบริบทเชิงทฤษฎีแถวคอย
[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th anniversary. Operations Research, 59(3), 536–549. doi:10.1287/opre.1110.0941
บทวิเคราะห์ย้อนหลังที่อภิปรายขอบเขต ข้อจำกัด และการนำไปใช้ผิดที่พบ บ่อย
[5] Reinertsen, D. G. (2009). The Principles of Product Development Flow: Second Generation Lean Product Development. Celeritas Publishing. ISBN: 978-0-9844512-0-8.
ทำให้ WSJF และ "Cost of Delay / Duration" (ต้นทุนความล่าช้า / ระยะเวลา) เป็นที่นิยมในบริบท agile/lean รากฐานทางคณิตศาสตร์คือ Smith (1956) [1]
การวัดผลและแรงจูงใจ
[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. experience. In Monetary Theory and Practice (pp. 91–121). Macmillan.
ที่มาของกฎของ Goodhart: "ความสม่ำเสมอทางสถิติที่สังเกตได้ใดๆ จะ มีแนวโน้มที่จะพังทลายเมื่อถูกกดดันเพื่อวัตถุประสงค์ในการควบคุม"
[7] Strathern, M. (1997). 'Improving ratings': Audit in the British university system. European Review, 5(3), 305–321. doi:10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4
วางนัยทั่วไปกฎของ Goodhart: "เมื่อมาตรวัดกลายเป็นเป้าหมาย มันหยุด เป็นมาตรวัดที่ดี"
เศรษฐศาสตร์พฤติกรรม
[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica, 47(2), 263–292. doi:10.2307/1914185
สร้างแนวคิดการเกลียดการสูญเสีย อ้างอิงในบทที่ 4.5
ทฤษฎีเกมและทฤษฎีสัญญา
[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty and the market mechanism. The Quarterly Journal of Economics, 84(3), 488–500. doi:10.2307/1879431
ความไม่สมมาตรของข้อมูลและการคัดเลือกที่ไม่พึงประสงค์ ดุลยภาพแบบ รวมกลุ่มในบทที่ 7.5 มีโครงสร้างที่คล้ายกัน
[10] Hölmstrom, B. (1979). Moral hazard and observability. The Bell Journal of Economics, 10(1), 74–91. doi:10.2307/3003320
การอธิบายอย่างเป็นทางการของภัยทางศีลธรรม สถานการณ์การรายงาน มาตรวัดในบทที่ 7.5 เป็นปัญหาภัยทางศีลธรรม
จิตวิทยา
[11] Festinger, L. (1957). A Theory of Cognitive Dissonance. Stanford University Press. ISBN: 978-0-8047-0131-0.
ทฤษฎีพื้นฐาน อ้างอิงในบทที่ 8.2
[12] Deci, E. L., & Ryan, R. M. (1985). Intrinsic Motivation and Self-Determination in Human Behavior. Plenum Press. ISBN: 978-0-306-42022-1.
การอธิบายดั้งเดิมของทฤษฎีการกำหนดตนเอง อ้างอิงในบทที่ 8.3
[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 68–78. doi:10.1037/0003-066X.55.1.68
ภาพรวมของทฤษฎีการกำหนดตนเองที่เชื่อมโยงการตอบสนองความต้องการ กับแรงจูงใจภายในและความเป็นอยู่ที่ดี
[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74(1), 1–9. doi:10.1037/h0024514
การแสดงให้เห็นดั้งเดิมของความสิ้นหวังที่เรียนรู้ อ้างอิงในบทที่ 8.5
[15] Seligman, M. E. P. (1975). Helplessness: On Depression, Development, and Death. W. H. Freeman. ISBN: 978-0-7167-0752-3.
การอธิบายขยายที่เชื่อมโยงความสิ้นหวังที่เรียนรู้กับภาวะซึมเศร้าของ มนุษย์และพฤติกรรมสถาบัน
[16] Shay, J. (1994). Achilles in Vietnam: Combat Trauma and the Undoing of Character. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.
แนะนำแนวคิดบาดแผลทางศีลธรรม อ้างอิงในบทที่ 8.4
[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war veterans: A preliminary model and intervention strategy. Clinical Psychology Review, 29(8), 695–706. doi:10.1016/j.cpr.2009.07.003
ทำให้บาดแผลทางศีลธรรมเป็นแนวคิดทางคลินิกอย่างเป็นทางการ คำนิยาม อ้างอิงในบทที่ 8.4
การวัดผลองค์กร
[18] Austin, R. D. (1996). Measuring and Managing Performance in Organizations. Dorset House. ISBN: 978-0-932633-36-1.
พิสูจน์ว่าการวัดผลที่ไม่สมบูรณ์สร้างแรงจูงใจที่หลีกเลี่ยงไม่ได้ในการ เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละมิติที่ไม่ได้วัด กรอบความไม่สมมาตร ของข้อมูลมีความคล้ายกันอย่างใกล้ชิดกับบทที่ 7 เป็นงานบรรพบุรุษที่สำคัญ ที่สุดสำหรับข้อโต้แย้งของบทความนี้
[19] Muller, J. Z. (2018). The Tyranny of Metrics. Princeton University Press. ISBN: 978-0-691-17495-2.
การอธิบายอย่างครอบคลุมเกี่ยวกับ "metric fixation" (การยึดติดกับมาตรวัด) ในการศึกษา การแพทย์ ตำรวจ และการเงิน หลักฐานเชิงประจักษ์อย่าง กว้างขวางสำหรับรูปแบบที่ตั้งทฤษฎีไว้ในบทที่ 7.4
ความยุติธรรมในการจัดลำดับงาน
[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). Multiclass queueing systems: Polymatroid structure and optimal scheduling control. Operations Research, 40(S2), S293–S299.
กฎการอนุรักษ์ในการจัดลำดับงาน ความไม่แปรผันของเวลาดำเนินการแบบ ถ่วงน้ำหนักตามปริมาณงาน (ทฤษฎีบท 2) เป็นตัวอย่างหนึ่งของกฎ การอนุรักษ์เหล่านี้
[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT schedules for fair optimality criteria? Annals of Operations Research, 159(1), 53–64. doi:10.1007/s10479-007-0267-0
วัดคุณภาพตารางงาน SPT เทียบกับเกณฑ์ความยุติธรรมโดยตรง เป็น งานบรรพบุรุษที่ใกล้ที่สุดในทฤษฎีการจัดลำดับงานกับการวิเคราะห์ความ ยุติธรรมในบทที่ 4
[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT scheduling: Investigating unfairness. ACM SIGMETRICS Performance Evaluation Review, 29(1), 279–290. doi:10.1145/384268.378792
ตรวจสอบความเชื่อที่ว่า SRPT ลงโทษงานขนาดใหญ่อย่างไม่ยุติธรรม ในการจัดลำดับคอมพิวเตอร์ โต้แย้งว่าความไม่ยุติธรรมน้อยกว่าที่เชื่อกัน แต่ยอมรับความตึงเครียดหลัก
[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling policies with respect to unfairness in an M/GI/1. ACM SIGMETRICS Performance Evaluation Review, 31(1), 238–249.
ทำให้นิยามความยุติธรรมสำหรับนโยบายการจัดลำดับเป็นรูปแบบอย่างเป็น ทางการโดยเปรียบเทียบกับ Processor-Sharing
เอกสารอ้างอิงเพิ่มเติม
[24] Campbell, D. T. (1979). Assessing the impact of planned social change. Evaluation and Program Planning, 2(1), 67–90. doi:10.1016/0149-7189(79)90048-X
กฎของ Campbell: "ยิ่งตัวชี้วัดเชิงปริมาณทางสังคมใดๆ ถูกใช้สำหรับ การตัดสินใจทางสังคมมากเท่าไร มันก็จะยิ่งถูกกดดันให้เกิดการบิดเบือน มากขึ้นเท่านั้น และยิ่งมีแนวโน้มที่จะบิดเบือนและทำลายกระบวนการ ทางสังคมที่มันตั้งใจจะติดตาม" เสริมกฎของ Goodhart [6]
[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study of moral injury in business settings. Journal of Business Ethics. doi:10.1007/s10551-024-05615-0
ขยายบาดแผลทางศีลธรรมไปยังสถานที่ทำงานแสวงหากำไร ยืนยันการ ประยุกต์ใช้ของบทที่ 8.4 จาก Shay/Litz นอกเหนือจากบริบททางทหาร และการแพทย์
[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: Targets and gaming in the English public health care system. Public Administration, 84(3), 517–538. doi:10.1111/j.1467-9299.2006.00600.x
บันทึกพฤติกรรมการบิดเบือนเชิงประจักษ์ รวมถึง "ถึงเป้าหมายแต่พลาด ประเด็น" ให้หลักฐานจากโลกจริงสำหรับความขัดแย้งระหว่างลำดับ ความสำคัญกับมาตรวัดในบทที่ 5.2
[27] Moore, C. (2012). Why employees do bad things: Moral disengagement and unethical organizational behavior. Personnel Psychology, 65(1), 1–48. doi:10.1111/j.1744-6570.2011.01237.x
วิเคราะห์การถอนตัวทางศีลธรรม ซึ่งเป็นการปรับโครงสร้างทางปัญญาที่ ทำให้พฤติกรรมที่ไม่มีจริยธรรมเกิดขึ้นได้ บทที่ 8 กล่าวถึงปรากฏการณ์ที่ เสริมกัน: ความเสียหายต่อบุคคลที่ปฏิเสธที่จะถอนตัว
การพิสูจน์นี้ถูกพัฒนาผ่านการสนทนาและทำให้เป็นรูปแบบเมื่อ 28 มีนาคม 2569