Notes
![]() ![]() Notes - notes.io |
---
### **1. 多元线性/岭回归模型的灵敏度评估**
#### **目标:**
评估预测奖牌总数和金牌数的多元线性回归模型对输入变量的敏感性。
#### **步骤:**
1. **特征选择**:
- 自变量包括:
- 上一届的奖牌数((T_{i-4}));
- 前两届的奖牌数((T_{i-8}));
- 是否为主办国((B_i));
- 运动员潜能指数((API_i))。
- 因变量为:
- 奖牌数((T_i))或金牌数((G_i))。
2. **权重计算**:
- 建立多元线性回归方程:
[
T_i = beta_0 + beta_1 T_{i-4} + beta_2 T_{i-8} + beta_3 B_i + beta_4 API_i + epsilon
]
- 使用回归模型计算每个特征的权重,比较主办国效应(权重为 12.799)和其他变量(如 (API_i) 权重为 1.452)。
3. **协变量检测**:
- 通过计算变量的方差膨胀因子(VIF),确定是否存在多重共线性问题。发现 (T_{i-4}) 与其他特征的 VIF 值为 10.756。
- 使用岭回归消除共线性问题,并比较岭回归与普通多元线性回归的结果差异。
4. **模型准确性评估**:
- 使用 (R^2) 和调整后的 (R^2) 指标评估模型拟合度:
[
R^2 = 0.882, quad R^2_{text{adjusted}} = 0.877
]
- 通过 F 检验(显著性差异 (P < 0.001))验证模型的总体显著性。
- 计算均方根误差(RMSE = 10.821)验证误差范围(占数据范围的 4.32%)。
5. **特定情况验证**:
- 针对美国数据单独建模,评估模型在异常数据下的灵敏度,发现美国模型对其历史数据拟合效果显著提高。
#### **结论:**
模型对主办国效应和上一届奖牌数高度敏感。岭回归的结果与普通回归接近,表明模型鲁棒性较高。
---
### **2. 逻辑回归模型的灵敏度评估**
#### **目标:**
评估预测未获奖牌国家“突破”(首次获奖牌)概率模型对输入变量的敏感性。
#### **步骤:**
1. **特征选择**:
- 自变量包括:
- 总参赛次数((S_i));
- 代表团平均规模((N_i));
- 总参赛项目数((Spoi))。
- 因变量为:
- 是否突破((D = 1) 表示突破,(D = 0) 表示未突破)。
2. **逻辑回归模型建立**:
- 模型公式:
[
P(D = 1) = frac{1}{1 + e^{-z}}, quad z = -2.237 + 0.088 Spoi + 0.469 N_i - 0.174 S_i
]
3. **特征显著性分析**:
- 使用 (P)-值评估每个特征的重要性:
- 平均规模显著性水平为 (P = 0.007),对结果影响最大;
- 总参赛次数和参赛项目数影响较小,但有一定相关性。
4. **模型准确性验证**:
- 检查模型在训练集和测试集上的准确性,评估其对输入变量的敏感性。
5. **蒙特卡罗模拟增强**:
- 设置模拟次数为 1000,重复逻辑回归分析,观察概率值波动。
- 示例结果:萨尔瓦多突破的概率从 0.7905 降至 0.7760,说明模型对输入变量和随机性具有一定敏感性。
#### **结论:**
代表团平均规模对突破概率的预测高度敏感。蒙特卡罗模拟显示随机性对模型预测影响有限。
---
### **3. XGBoost 模型的灵敏度评估**
#### **目标:**
利用 XGBoost 回归模型评估奖牌数与关键特征之间的重要性及灵敏度。
#### **步骤:**
1. **特征选择**:
- 自变量包括:
- 参赛项目总数((E_i));
- 当届新增项目数((Delta E_i));
- 是否为主办国((B_i))。
- 因变量为:
- 每届奥运会的奖牌数((M_i))。
2. **模型训练与参数调整**:
- 数据随机分为训练集和测试集,比例设定为 7:3。
- 使用 XGBoost 算法迭代计算目标函数:
[
text{Obj}(t) = sum_{i=1}^n l(y_i, hat{y}_i^{(t)}) + sum_{j=1}^t Omega(f_j)
]
其中 (l) 为损失函数,(Omega) 为正则化项。
3. **特征重要性分析**:
- 模型输出每个特征的重要性:
- 主办国效应((B_i))占比 61.6%,为影响最大的特征;
- 参赛项目数((E_i))占比 20.4%;
- 当届新增项目数((Delta E_i))占比 9.0%。
4. **模型准确性评估**:
- 训练集 (R^2 = 0.958),RMSE = 1.806,表明模型对输入变量的高灵敏度和预测精度。
#### **结论**:
主办国效应在 XGBoost 模型中为最敏感变量,其影响远高于其他特征。
---
以上是每个模型的灵敏度评估详细方案,涵盖了特征选择、建模过程、准确性验证以及最终结论。如需进一步补充或细化,请告知!
![]() |
Notes is a web-based application for online taking notes. You can take your notes and share with others people. If you like taking long notes, notes.io is designed for you. To date, over 8,000,000,000+ notes created and continuing...
With notes.io;
- * You can take a note from anywhere and any device with internet connection.
- * You can share the notes in social platforms (YouTube, Facebook, Twitter, instagram etc.).
- * You can quickly share your contents without website, blog and e-mail.
- * You don't need to create any Account to share a note. As you wish you can use quick, easy and best shortened notes with sms, websites, e-mail, or messaging services (WhatsApp, iMessage, Telegram, Signal).
- * Notes.io has fabulous infrastructure design for a short link and allows you to share the note as an easy and understandable link.
Fast: Notes.io is built for speed and performance. You can take a notes quickly and browse your archive.
Easy: Notes.io doesn’t require installation. Just write and share note!
Short: Notes.io’s url just 8 character. You’ll get shorten link of your note when you want to share. (Ex: notes.io/q )
Free: Notes.io works for 14 years and has been free since the day it was started.
You immediately create your first note and start sharing with the ones you wish. If you want to contact us, you can use the following communication channels;
Email: [email protected]
Twitter: http://twitter.com/notesio
Instagram: http://instagram.com/notes.io
Facebook: http://facebook.com/notesio
Regards;
Notes.io Team