找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

简单说一下我对AI预测的理解

最近很多贴都有在吹这个AI预测多么多么准,什么前面预测全对,去年预测全对之类的,好像可以直接预知结果一样,看到很多人无脑吹舔这个东西,就想简单说下我的看法,避免大伙被菠菜坑骗。我硕士专业与机器学习相关,同时也是一个足球爱好者,对足彩非常了解,所以我想从数据预测模型开发和足彩这两个角度展开介绍。鼠鼠才疏学浅,说的不一定准确,希望大伙可以一起讨论。

简单说一下我对AI预测的理解-1.jpg
回复

使用道具 举报

大神点评(14)

你说啊
回复 支持 反对

使用道具 举报

牛批
回复 支持 反对

使用道具 举报

ChiWongsuig 楼主 6 小时前 显示全部楼层
1. 模型开发
首先模型开发需要初始数据,数据处理并生成训练集与测试集,机器学习模型,模型参数与迭代次数,结果测试这几个部分。其中对模型预测结果最重要的有三点,初始数据的获取,数据的处级方法和机器学习模型的选择。
首先说初始数据的获取,这可以从小组赛中进行获取,比如10分钟经济领先,15分钟经济领先,15分钟推塔数,15分钟小龙数等等,可以有很多很多数据,这些数据都是可以具体化的信息,能够反应出队伍特定时间之前的状态,优劣情况等等。做预测模型的时候,选择哪些比赛数据作为初始数据可以通过相关性计算来确定,比如15分钟经济领先与胜负结果的相关性为0.7,而15分钟补刀数与胜负结果的相关性为0.4,那么前者就更适合用作初始数据。
数据获取后需要对数据进行相关处理,常见的方法有PCA降维,归一化,随机化等。PCA通俗说就是初始数据可能是10维的,这对模型来说太复杂了,容易导致过拟合,所以可以使用PCA在保留这10维数据中贡献率最大的信息的同时降低数据的维度。归一化也非常重要,比如15分钟经济值和15分钟补刀数这两个数据,如果他们同时变化5%,对模型带来的影响是不相同的,因此需要归一化来避免这种误差。
然后模型选择方面,要先考虑模型的目的,主要分为分类和回归两种。分类可以理解为判断这个蘑菇是香菇还是金针菇,而回归则是根据输入数据预测一个具体的结果值,也就是AI预测模型胜率的预测,使用人工神经网络就可以顺利实现这个功能。
回复 支持 反对

使用道具 举报

ChiWongsuig 楼主 6 小时前 显示全部楼层
上面简单说了一下AI预测模型的开发结构,那么思考下列几个问题:
1. 小组赛所获取的数据信息是否具有很好的通用性?
比如小组赛阶段,A组中获取的信息与B组中所获取的信息,他们之间有什么关系吗?DK打肉鸽的数据信息关T1打100T什么事呢?
2. 如果第一个问题认为A组和B组信息无关或者关系不大,那么它凭什么就敢直接预测DK打T1是64开呢?
3. 如果模型没有进行归一化,降维等处理,又或者对初始数据添加了特定权重,这种做法又是否合适呢?
经过几个问题的简单思考,就会发现这个所谓的AI有不少漏洞。下面我将再以足彩的经典操作作为案例进行对比。
回复 支持 反对

使用道具 举报

回复 支持 反对

使用道具 举报

回复 支持 反对

使用道具 举报

回复 支持 反对

使用道具 举报

ChiWongsuig 楼主 6 小时前 显示全部楼层
2. 足彩十连中
众所周知,足球进一个球只有1分,这样就会导致结果出现胜,负,平三种情况。而有一种注叫让半数,也就是某个队让0.5个球。比如甲和乙比赛,甲让半球,那么比赛踢成了1-1,赌盘就是0.5-1,也就是乙胜。这种做法就避免了出现平球。
然后呢,注册512个账号,其中256个买甲赢,256个买乙赢,那么就一定会有256个账号买对:然后再下一场128个买甲赢,128个买乙赢,这样就又会有128个账号二连中,以此类推,10场比赛之后,就一定会有一个账号实现10连中。
那么如果第11场比赛是焦点之战,比如是五大联赛德比或者是欧冠,世界杯关键局,那么关注的人数也会非常高,这时有一个十连中的人站出来,摆出自己的十连胜战绩,宣称自己是“专家”或有“AI支持”,说什么相信他,一定会中之类的言论,实际上他根本不知道谁会赢,不过这对他一点都不重要,只要有人投他就一定会赚。
回复 支持 反对

使用道具 举报

ChiWongsuig 楼主 6 小时前 显示全部楼层
所以把足彩和这个AI预测联系起来,大概就会明白菠菜的用意。
我最近刷贴吧比较多,大概是在八强赛第四天的时候见到的这张图。他用神乎其神的“AI”人设加以包装,再加上几场正确的预判,仿佛在告诉人们他掌握了真理。所以很多人就会对它无比信任,并大肆推崇,这样菠菜甚至连广告钱都省下来了。而决赛的预测,也会让很多玩家抱着相信和尝试的态度投一点,而最终不管他预测是否正确,目的都已经达到了。
回复 支持 反对

使用道具 举报

ChiWongsuig 楼主 6 小时前 显示全部楼层
其实最简单的就是lpl经常有的大校的胜率预测,什么经典73开,什么大校毒奶之类的,这些恰恰就说明了AI的不准确性。我的毕设项目,两百多万个初始数据,十几维的信息量,调试了快两个月才勉强达到了85%左右的准确性,而小组赛总共就那么几场,不同小组彼此之间还没有什么相关性,吹AI真的大可不必,大伙千万别真就去菠菜,那玩意真的会上瘾,千万别沾。
回复 支持 反对

使用道具 举报

ai主要还是打一些数据无用论人的脸,你数据哪哪都不行就是有问题不要狡辩
回复 支持 反对

使用道具 举报

我想过这个问题,怎么对战队编码。有一些player-wise的数据(每个选手的英雄池,对位数据),有一些team-wise的数据(团队的控龙,15分钟的领先),这些原始数据如果只是concate一起丢mlp训练的话很难。要用一些prior加工一下,比如本来英雄池和版本的契合度,rank里面海量数据得出的克制效果。但我怀疑这个所谓的AI预测的数据源根本不是比赛的数据,而是很多菠菜网的数据。。。直接赔率取倒数全加在一起softmax一下也八九不离十
回复 支持 反对

使用道具 举报

这种东西不太可能是用神经网络做的,数据量太小
回复 支持 反对

使用道具 举报

ai预测的bug放到具体情况中表现出来的就是没有长大性,事实上很多队伍都会有长大性。最明显的bug就是小组6-0的队伍是淘汰赛胜率最高的
回复 支持 反对

使用道具 举报

说点什么

您需要登录后才可以回帖 登录 | 立即注册
HOT • 推荐