看板 Badminton
為了統計全英熱身賽有沒有用, 做了一個數學模型 先把選手的 Elo積分 當作基礎戰鬥力 假設全英前一週的比賽場數 會提供不同的 Buff (若得到負數則是 Debuff) 上週打 1 場 → 戰鬥力 +A 上週打 2 場 → 戰鬥力 +B (從原始 Elo 往上加, 不是先+A 再+B) 上週打 3 場 → 戰鬥力 +C 上週打 4 場 → 戰鬥力 +D 上週打 5 場 → 戰鬥力 +E (打到決賽) 再把歷史數據丟進迴歸模型去 fit 這五個參數 (Logistic Regression) 得到這套戰鬥力調整值後, 最後驗證有沒有比只看 elo 更準 (算 log loss) [男單] 上週打 1 場相當於 Elo + 82 2 場相當於 Elo +182 3 場相當於 Elo +209 (八強) 4 場相當於 Elo +258 (四強) 5 場相當於 Elo +288 (決賽) Log loss 0.606→0.573 代表這個指標讓模型變好 5.4%, 已經算顯著差異 這個數據怎麼看? 1. Elo 調整值越來越高 代表鎖定在這種 過年休息→s300熱身→第二週全英的節奏下 「多打找手感」的優勢目前還大於連續出賽的疲勞 2. 如果兩個實力相當的人在全英相遇 (Elo相近) 其中一個人上週休息 另一個人上禮拜去熱身賽打了八強, Elo +209 等於勝率憑空上升到 77% 3. 雖然 4~5場 可能小樣本或倖存者偏差, 但前幾場的趨勢是可以參考的 [女單] 上週打 1 場相當於 Elo +124 2 場相當於 Elo + 78 3 場相當於 Elo + 57 (八強) 4 場相當於 Elo + 33 (四強) 5 場相當於 Elo + 49 (決賽) Log loss 0.417→0.403 代表這個指標讓模型變好 3.4% 也很高了 這個數據怎麼看? 1. 與男單的情況不同, 女單反而是越早跑越好, 每多打一場都在扣血 一樣拿原本五五開, Elo 接近的兩個人來比 上週一輪遊 vs 上週認真打到四強, 前者直接拿到了 63% 的勝率優勢 2. 可能會注意到 Log loss 比男單低很多, 經過換算 女單的比賽看 Elo 就決定了 66% 男單則差不多只有 55% 3. 打到第五場回升可能是過擬合或 ID 差距 4. 既然提到 ID 差距就順便算一下霸王色霸氣 假如球衣上印的是八大或安洗瑩 站到球場就先 +125 分, 比什麼熱幾場都多... [結論] 熱身賽要打, 十個數值都是正的, 正多正少而已 -- 第一次看到 Elo 的人可參考: https://zh.wikipedia.org/zh-tw/%E7%AD%89%E7%BA%A7%E5%88%86 取用的是 2018, 2019, 2022, 2023, 2025 五年的數據 (再往前熱身賽變成六輪, 疫情停辦兩年, 2024全英前一週是 s750) 如果有什麼地方解釋得怪怪的或是其他有興趣的指標可以討論看看 0.0 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.161.142 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Badminton/M.1772178137.A.610.html
Lavaro : 頗有意思的數據! 02/27 17:44
comesome : 覺得不能這樣看 男單很戰國 女單就固定那幾個 02/27 19:45
b1236711 : 願聞其詳 (?) 是男單不能還是女單不能 02/27 20:43
Dazzium : ??????? 02/28 15:07
gandalf2 : 也可能說實力高的人可以連續兩週狀態好實力壓制奪冠 03/01 01:00
Kroner : 樓下關節痛都吃鞏固力 03/01 18:23
b1236711 : 實力高就是elo高, 這個數據是表示實力外的影響 03/01 18:08
b1236711 : 也許就是狀態 狀態怎麼來=>熱身來 03/01 18:09
b1236711 : 不過主要是看那些中段選手能不能一兩輪變兩三輪 03/01 18:23
b1236711 : (強者樣本少很難說) 03/01 18:23
Kroner : 我阿嬤說吃豬腳補關節,豬腳吃起來 03/02 09:25
locka : 想小聲問個問題:選手有辦法自己決定熱身賽打幾場/ 03/02 09:25
locka : 幾輪嗎?照大大的意思是,熱身賽打越多場對正賽幫助 03/02 09:25
locka : 越大,所以選手應該要多打幾輪;但如果打得贏誰不會 03/02 09:25
locka : 繼續往下打? 03/02 09:25
Chricey : UC2是天然成分嗎?還是有添加物啊? 03/02 09:26如果數據有效, 我想對男單的意義是: 不需要故意省力打 (女單則相反)
locka : 我會覺得打到第五輪Elo+288的數值意義是,代表當下該 03/02 09:25
locka : 選手的實力已經比Elo排名強,只是還沒有反應到Elo上; 03/02 09:26
locka : 而不是只要熱身賽打五場我的能力就能比自己的 03/02 09:26
locka : Elo加288的buff 03/02 09:26
Kroner : 本魯關節痛始祖,葡萄糖胺保證沒用,乖乖吃UC2 03/02 17:21不過女單卻沒有發現一樣冠軍加爆的情形(?) 的確 Elo 需要是穩定的才能有效代表實力, 而冠亞軍很有可能 Elo 持續上升中 如果真的要拆解這個數據可能可以擴大追蹤全英前後的 Elo 變化 雖然少數人的 Elo 可能還沒穩定, 但覆蓋比較多選手的 0~3 場應該相對平滑 而這個區段仍有兩個重要的線索: 1. 有打比沒打好 2. 女單固定下降, 男單固定上升 (也稍微提升了對 4~5 場數值的信心) 感謝提出這些有意義的討論~~ 數據不會說話 人才會說話 我也一直在想哪邊可能不完備/有漏洞 ※ 編輯: b1236711 (1.161.161.142 臺灣), 03/02/2026 16:45:20
locka : 女單沒有加爆的原因不就是因為女單強的只有少數幾個 03/02 17:21
locka : 人嗎?(我跟二樓大大看法一致) 打到冠亞軍時幾乎都 03/02 17:21
locka : 是固定的人,所以第五輪原本的 Elo 排名就已經能反 03/02 17:21
locka : 映該選手實力水準,於是在你的模型裡加的分就不多 03/02 17:21
Chricey : 樓上UC2當糖吃,天天走拿飛 03/03 11:12
b1236711 : 其實滿有道理的 XD 所以我覺得 4-5 場不用太認真看 03/02 23:05
locka : 我會覺得這個模型的問題是ABCDE變數彼此不是相互獨 03/03 11:12
locka : 立的,也就是「打5場的一定至少贏了4場、打4場的一 03/03 11:12
locka : 定至少贏了3場…」,以統計的角度來說這樣用在logis 03/03 11:12
Chricey : 最近天氣變化大,關節痛好像更嚴重了。 03/03 11:12
locka : tic model很奇怪,用log loss進步百分比來判斷模型 03/03 11:12
locka : 有效性也不是很嚴謹(所謂達到顯著差異是有明確定義 03/03 11:12
locka : 的)不過在機器學習領域好像都不用管這些,反正fit 03/03 11:12
locka : 出貼近結果的模型就好(茶) 03/03 11:12
Kroner : 本魯關節痛始祖,葡萄糖胺保證沒用,乖乖吃UC2 03/03 21:54
b1236711 : 其實我是故意設計成獨立的 如果出來有連續性就更有 03/03 16:39
b1236711 : 信心(?) 03/03 16:39
locka : 欸抖…我是說你的變數沒獨立,不是有獨立XD 03/03 17:31
b1236711 : 這幾個數字的性質上是有關的 但我在建模型的時候 03/03 21:54
Chricey : 關節痛就老人病 03/04 00:30
b1236711 : 4場的就是4場的人 2場的就是2場的人 是當獨立變數 03/03 21:54
locka : 你沒有看懂我為什麼說他們不是獨立變數… 然後你說 03/04 00:29
locka : 的也不是獨立變數的意思… 03/04 00:29
locka : 不過我想是我的問題,我一直在用統計的角度思考(my 03/04 00:30
Kroner : 哇勒,UC2 這個東西真的是太讚了 03/04 00:30
locka : bad),但對機器學習領域來說本就無須這麼嚴謹,模型 03/04 00:30
locka : 預測力最重要~ 03/04 00:30
locka : 還是建議多思考變數選擇的邏輯,並請小心解讀 insig 03/04 00:30
locka : ht… anyways, good job!! 03/04 00:30
Chricey : 我也有過關節痛的經驗,真的超痛苦的啦!推薦去看醫生,早點處理比較不會拖延變嚴重。 03/04 00:30