预测下谁最有机会能拿下卡塔尔世界杯冠军?

声明:文中内容基于山东某高校数据挖掘课程的学习成果,本系列文章为课程期末项目的个人总结。
【2022年6月补充:非常不好意思大家,当时是笔记用,我没想到这么久还有人看(捂脸),因为个人考上了研究生,平时忙着论文项目等内容…自己也不经常上CSDN,好多内容因为跟自己关联不大导致自己也忘记了…可能不能帮大家解答太多东西了…我把源代码和数据源附下吧】

该数据存在诸多多余的属性:如比赛年份,比赛场地等。我们首先去掉无关的属性,只留下:主队、客队、主队进球数、客队进球数,比赛结果。其中结果集分为1为主队获胜,2为客队获胜,-1为平局。
(注:以上为部分数据此处为了方便展示,加上了日期,并且将CSV文档中国家名翻译成了中文。该文件名:fifa_ch.csv)

此时,我们发现仅有主场客场比分并不能很好地分析每个队的实力,所以我们要进行数据统计,找出新的特征值来扩充数据集。

首先我们计算每个国家的参赛次数



合并后生成的tr_data_after.csv中内容为:主队、客队、主队参赛次数、客队参赛次数、主队胜利次数、客队胜利次数、主队进球数、客队进球数、主队胜率、客队胜率、主队场均进球、客队场均进球、比赛结果。
此处统计数据共有900行,即纾解杯中所有比赛场次,特种扩充到了15列

方便展示可以使用Echart将统计到的各个国家的信息进行简单的数据可视化



其中标准分数(z-score)是一个分数与平均数的差再除以标准差的过程。
用公式表示为:z=(x-μ)/σ。
其中x为某一具体分数,μ为平均数,σ为标准差。


此处使用了神经网络、逻辑回归、支持向量机、决策树、随机森林算法分别进行训练。
并输出其在训练集上的准确度、在测试集上的准确度以及平均绝对误差。

此时发现结果并不理想。准确度仅为六成左右

(尝试方法一)分别输出以上机器学习算法的学习曲线:


结果图上可以看出,随着数据量的增加,三组模型虽然趋近于收敛,但是在训练集和检验集上准确度表现都很差,仅有0.58左右。这预示着存在着很高的偏差,是欠拟合的表现。

决策树和随机森林出现了高方差情形,也就是过拟合的情况。这都预示着我们要找到正确率低原因,并且优化我们的模型。

(尝试方法二)输出灰色关联矩阵:

统计出每个特征关联度的均值后,我们发现大部分的特征关联度都在0..710410之间,也就是说大部分特征都与结果呈现出了相对较高的关联性。
这也意味着已有的数据源的特征关联度对之前模型的影响是有限的。

(尝试方法三)以上两种方法进一步缩小了误差原因,于是重新分析测试集与预测结果如图:
发现在预测平局方面,算法预测结果有着较大的误差。于是我们推测由于结果集中的平局拉低了模型的准确度。
进一步查询有关资料发现,我们所使用的决策树算法,随机森林算法,还有逻辑回归,都典型二分类的算法。而此时我们的结果集有三类。
我们重新检查数据源,发现平局的情况仅有199条,而仅凭借着这些较少数据量去很好的训练数据是不合适的。 于是我们开始探讨简化结果集即去掉平局结果的可行性。

在充分了解世界杯的规则后,从16强开始,就意味着告别了小组赛,开始了淘汰赛。如遇到平局,就开始加时赛以及点球大战。即比赛结果只有胜负两种结果而数据集中的比赛结果是将点球大战排除在外的90分钟内的比赛结果。 所以含有平局的情况。

重新采用上述机器学习算法进行训练学习。

由上可见,准确度有了略微的提升,但这还不是我们想要达到的准确度。 于是我们继续研究,并尝试使用深度学习算法继续提升模型的准确度。

于是我们使用了Sequential模型,它是多个网络层的线性堆叠,通过堆叠许多层,构建出深度神经网络。

正确率已经能够到达92%。但需要进一步的调参,找到更合适的参数,防止过拟合。
接下来我们暂时用此模型,对世界杯的结果进行模拟预测。

对于2022年的16强队的选择,考虑到近几年球队的数据更能反映出该球队的状态,于是我们统计了近几年()年共5次世界杯进入16强次数最多的队伍。

从16支队伍里面随机选中8支队伍,分为两队:


从数据集里面找到这16支队伍相对应的数据:

比赛的两支队伍的数据进行合并用作待预测数据,并使用深度学习算法进行预测:

将每次的比赛结果输出到Excel表中:

以此类推,8强、4强到最后的决赛


以上预测结果仅为参考,原因如下:
2、小组赛是由抽签结果确定的,而且分为了各个地区(如亚洲区、欧州区),抽签的结果无法预测,即每个队伍有特定地区的对手,且是由抽签决定的。
3、本预测结果16强队均为历史上进入16强次数最多的队伍,且比赛时为两两随机比赛,而真正进入世界杯16强队伍中会有很多“黑马”杀入,并且有很多洲际规则需要考虑。

若要真正预测结果,则需等待小组分组结果后,决出16强或32强。这样会比较然后将其球队数据代入,最终决出冠军。

主要机器学习以及分析代码:

以上内容为个人学习总结用,预测世界杯冠军并非笔者目的。未经许可不得转载。

}

美洲杯的阿根廷,2022年有望夺冠吗?

网友分享:阿根廷拿下了美洲杯是有希望在2022年获得世界杯冠军的。但是阿根廷和欧洲足球很可能有差距我们可以通过今年举行的欧洲杯冠军VS美洲杯冠军的比赛作为参考。…阿根廷。

2022年世界杯阿根廷没进圈吗?

网友分享:2022年世界杯南美区预选赛还没有进行完只有进行完了才知道阿根廷队进没有进决赛2022年世界杯南美区预选赛还没有进行完只有进行完了才知道阿根廷队进没。

2022年世界杯阿根廷入围了吗?

网友分享:2022年美洲世界杯预选赛还没打完现在阿根廷排名第二有很大几率进军世界杯2022年美洲世界杯预选赛还没打完现在阿根廷排名第二有很大几率进军世界杯。

2022年,梅西带领阿根廷夺冠捧起大力神杯的概率有多大?

网友分享:我可以准确告诉你2022梅西带领阿根廷夺冠概率为0因为眼下阿根廷这支国家队没有任何竞争力各个位置到了2022年都没有真正的强点尤其是攻击线!他们的对手…我可以准。

梅西和C罗有没有可能其中一个人夺得2022年世界杯冠军?

网友分享:不能说完全没有机会毕竟上届欧洲杯葡萄牙队当初也没人看好最后获得了冠军。只能说机会不大:1、两人2022年年纪都挺大了C罗37梅西35。这个年纪对于很。

2022世界杯,你认为巴西和阿根廷队,能走多远?

网友分享:2022年世界杯个人认为巴西会夺得冠军阿根廷最多4强!原因如下:先说巴西队可以这么说巴西届届都是世界杯冠军的有力争夺者在2018年世界杯被比利时淘汰…2022年世界。

阿根廷2022世界杯阵容解析?

网友分享:阿根廷队因为有梅西在各项赛事中都处于夺冠热门即使是2018孱弱的阿根廷对战法国也享有着不相上下的赔率在之后的比赛中阿根廷的劳塔罗、迪巴拉更能助阵梅西。

2022世界杯比利时夺冠率大吗?

网友分享:22年世界杯比利时夺冠的概率不大还有法国英格兰等等一些队伍所以夺冠概率不大22年世界杯比利时夺冠的概率不大还有法国英格兰等等一些队伍所以夺冠概率不。

预测2022年卡塔尔世界杯的决赛对阵,以及冠军是?

网友分享:反正是预测嘛不如脑洞开的大一点先预测入围卡塔尔世界杯决赛阶段的32支球队。欧洲:德国法国英格兰意大利西班牙荷兰比利时波兰挪威塞尔维…阿根廷曾5次打。

2022年卡塔尔世界杯谁最有希望夺冠??

网友分享:法国意大利德国巴西阿根廷西班牙葡萄牙比利时荷兰英格兰还是其他国家?中国。

}

我要回帖

更多关于 卡塔尔世界杯32强 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信