ทำไมความน่าจะเป็น 56.4% จึงหลอกลวง

by:ThorneData5 วันที่แล้ว
831
ทำไมความน่าจะเป็น 56.4% จึงหลอกลวง

เลขพูดโกห์

ESPN รายงานโอคลาโฮมาซิตี้มีโอกาสชนะ 56.4% เทียบอินเดียนนา 43.6% — สัญญาณของอคติเชิงโครงสร้างที่ปกปิดด้วยความถูกต้องทางสถิติ ผมตรวจสอบเส้นทางข้อมูล: การเลือกshots, การเปลี่ยนแปลงเชิงรับประสิทธิภาพ, และการกระจายแรงกดขอบเข้า—ถูกลดน้ำหนักหรือตัดออกโดยสิ้งเชิง

ตัวแปรที่หายไป

โมเดลไม่คำนึงถึงระบบป้องกันแบบ pick-and-roll อันเฉียบแหลมของอินเดียนนา—ซึ่งได้รับประโยชน์จากการบังคุมการเปลี่ยนผ่านในครึ่งสนาม ส่วนโอคลาโฮมาซิตี้แม้มีแรงกดขอบเข้าจริง แต่พึ่งพาการเล่นแบบแยกเดี่ยวทำให้อัตราชนะสูงเกินจริง

เพราะเหตุใดจึงสำคัญ

เมื่อลอกพื้นผิวเมตริกซ์ (อย่าง net rating) จะพบสิ่งที่ขาดหาย: อินเดียนนาอยู่อันดับหนึ่งในเรื่องการเปลี่ยนแปลงเชิงรับ (เปอร์เซ็นไทล์ที่87) ในขณะที่โอคลาโฮมาซิตี้สร้างการเล่นแบบแยกเดี่ยวประสิทธิภาพสูงแต่มีต้นทุนไม่ยั่งแท้ต่อความเป็นหนึ่งเดียวของทีม

เห็ดบอดของอัลกอริตึม

นี่ไม่ใช่เรื่องพรสวร—แต่คือการออกแบบฟีเจอร์ เมทริกซ์มองจังหวะเป็นเส้นตรง ในเมื่อความเป็นจริงไม่มีสายตรง: Pacers เอา advantage ในพื้นที่ขณะเปลี่ยนผ่าน; Thunder พึ่งพาการเล่นแบบแยกเดียวช่วงปลายมากเกินไป

สิ่งควรทำ

อย่าไว้วางใจเลขบนหัวข่าว เช็คเทียบกับเมตริกซ์ขั้นสูง: DBPM, อัตราการครองครอบครอง, และ ADPR โดยใช้โมเดลโอเพ่นซอร์—or พัฒนา API endpoint เองเอง

หมายเหตุสุดท้าย

curious?ถามตัวเอง: ฟีเจอร์ไหนถูกประเมินต่ำเกินไป? หากไม่ใช่แรงกดขอบเข้าหรือการเปลี่ยนแปลงเชิงรับ… ก็หมายความว่าคุณกำลังวางเงินโดยไร้เหตุผล

ThorneData

ไลค์38K แฟนคลับ4.91K

ความคิดเห็นยอดนิยม (1)

นักพนันเชิงสถิติ
นักพนันเชิงสถิตินักพนันเชิงสถิติ
4 วันที่แล้ว

ธันเดอร์มีโอกาสชนะ 56.4%? แม่งคำนวณผิดจนลืมว่า Pacers เล่นแบบ “ตีกลับเร็ว” ส่วน Thunder ยังแตะตัวอยู่กับการเล่นคนเดียว! อัลกอริทึมตัวนี้เหมือนพระเจ้าที่นั่งคิดเลขบนพื้นไม่ได้เลย — ถ้าเป็นปัญหาจริงๆ ก็ควรปล่อยให้ Pacers เดินไปก่อน! เจ๋ยๆ…แล้วคุณจะเดิมพันอะไร? #DataNotLies

282
39
0
อินเดียนา เพเซอรส์
โกลเด้นสเตทวอร์ริเออร์ส