博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
人人都能成为预言师
阅读量:4199 次
发布时间:2019-05-26

本文共 2366 字,大约阅读时间需要 7 分钟。

欧洲杯决赛已经落下帷幕,有人在为C罗自豪,有人在为东道主惋惜。作为资深伪球迷,小编想告诉大家一个秘密,球赛是可以预测的!如何通过快速搭建一套机器学习预测系统,来预测一场球赛呢?小编请到了腾讯云的产品经理张杉为我们详细讲解预测一场球赛前,都需要做哪些方面的准备工作。

 

1、数据导入

 

针对离线数据:我们可视化拖拽式地把球队排名、比赛数据,通过离线任务导入到数智平台,经过指标化和归一化之后传出到输出层。企业客户也可以通过这种方式,便捷的集成企业的海量业务数据到大数据平台中。

 

针对实时数据:博彩网的盘口数据是根据博彩网的内部渠道信息实时变动的,比如球员受伤的内部消息。针对这些能够真实反应双方实力变动的实时数据,我们通过实时接入的方式,接收到消息中间件中,通过实时流处理引擎的聚合、运算,产生的实时盘口指标进行展示和预警。金融、交通、医疗、工业等行业的客户可以基于数智平台所提供的这种实时数据处理能力做金融风险管控、交通实时管控、医疗体征数据实时检测、工业生产线实时故障预警等。

 

2、通过机器学习平台预测胜负

 

球队信息和博彩网盘口数据进入数智平台后,可以采用数智所提供的强大机器学习能力进行预测分析。在现场演示中,我们简单采用了数智内置的机器学习算法进行样本训练和比赛结果的预测,可以看到整个算法的拖拽式的体验,便捷的可视化参数调整都大大降低了机器学习门槛。

 

3、数据的可视化呈现

 

最后,由数智的黄金眼这样的一个敏捷报表门户来实现对分析结果和预测结果的可视化呈现。黄金眼的自助报表是一款敏捷报表门户,企业可以通过它内置的柱状图、饼图、雷达图等主流图表模板,非常便捷的对企业业务数据进行可视化呈现,生成业务报表,实时的推送企业的主要决策者,助力企业的商业决策。

 

小编:在这个案例中,我们用到了腾讯云大数据的哪些产品组件?

 

张杉:在这个简单的案例中,我们用到了以下产品组件。

 

可视化工作流开发IDE

 

拖拽式的工作流开发IDE,通过简单Web式拖拽操作来完成整个大数据工作流的任务开发。它内置了丰富的处理器,囊括离线数据导入导出、在线实时数据接入、Java程序、Shell脚本、机器学习等多种任务的配置集成。

 

离线批处理计算

 

数智平台中的离线批处理计算引擎,支持MapReduce、Hive、Pig等批处理计算作业。同时支持Spark分布式内存计算框架,以支持复杂的数据挖掘算法和图计算算法。

 

实时流处理计算

 

支持TStorm(腾讯对社区Storm流处理引擎重写的java版本)、Storm流式任务作业引擎,覆盖实时要求极高的流式作业场景。

 

支持基于Spark上的Spark Streaming,满足毫秒级的实时计算场景需求,如实时推荐、用户行为分析等。

 

机器学习平台

 

数智的机器学习平台集成了Spark、Python、R、XGBoost等四种机器学习框架,支持图计算和深度学习。内置了分类、回归、聚类、关联规则等60余种丰富算法。用户可以通过可视化的Web拖拽就可以完成机器学习任务流的开发,它还支持团队协作开发。

 

敏捷报表门户

 

在黄金眼敏捷报表门户中通过可视化数据源配置、配置指标和纬表、囊括丰富图表模板的可视化页面设计即可自助创建报表门户,让客户轻松把握业务脉搏,助力企业决策。

 

小编:在实际生活中,数智平台还有哪些应用场景?

 

张杉:其实要去对一场比赛进行预测,并尽可能的提升其预测准确度,是需要非常多专业支持的。不同的人基于不同的背景下,对球赛影响因子的理解不一样,比如有些人会认为当前状态更重要、而另一些人会认为历史对战更具有科学性,这都是由于不同知识背景的人对足球理解上的差异所致。

 

所以,即便有了数智这样强大的平台能帮助我们快速获得数据洞察力之外,我们还需要对整个专业或行业准确的理解,这也是我们开启腾讯云大数据合作伙伴招募的原因。只有合作伙伴在相关行业的宝贵经验与专业知识,才能让数智发挥他的大数据平台能力。

 

这次给大家做这样的演示,更重要的是想告诉大家:通过我们的大数据产品,通过数智平台,人人都可以低门槛的应用大数据技术来解决一些有趣的问题,比如这次球赛的预测;当然,我们的数智平台,在企业中有很丰富的应用场景。

 

数据仓库建设

 

腾讯云数智完整覆盖数据抽取、转换、加载、建模、分析、报表呈现、数据治理等数仓建设环节,用户可借助数智平台在公有云、私有云、非云化环境快速建设TB到PB级的企业数据仓库和数据集市,搭建专属的大数据应用。

 

通过腾讯云数智,用户可显著降低基于企业数据仓库的数据应用开发周期,降低开发成本,还可大大降低数据仓库、数据处理、数据应用的运维成本。

 

实时流式数据处理

 

用户可基于腾讯云数智快速开发本行业在实时流式场景下的大数据处理、分析的应用程序,以实现对企业实时业务的风险监控与告警,以占据大数据时代的优势地位。

 

流式数据处理可用于金融行业的风险管控、物联网的海量传感器数据处理、工业生产线的实时故障预警、病人特征数据实时分析、实时交通流量分析、互联网实时流量分析等应用场景。

 

离线数据处理

 

腾讯云数智基于Hadoop体系的MapReduce、HIVE、PIG、SPARK技术向企业用户提供的强大的数据离线批处理能力,用户可以便捷的使用腾讯云数智对企业数据进行抽取、转换、加载等离线数据处理加工。

 

通过离线数据处理引擎,用户可迅速的对企业所积累的数据进行ETL处理,快速发掘海量历史数据的商业价值和社会价值。

 

数据分析与探索挖掘

 

通过腾讯云数智所提供的强大数据分析与探索挖掘能力,用户可快速对企业在PB级规模下的大数据进行可视化的数据分析探索,在纷繁复杂的商业数据中快速获取数据洞察力,占领商业先机。

 

用户还可通过腾讯云数智所提供的强大机器学习能力对企业数据进行深度挖掘,进一步发掘海量数据中蕴藏的无限价值

转载地址:http://hmuli.baihongyu.com/

你可能感兴趣的文章
yii2 php namespace 引入第三方非namespace库文件时候,报错:Class not found 的解决
查看>>
softlayer 端口开放
查看>>
操作1:mongodb安装
查看>>
操作2:mongodb使用语法
查看>>
如何给分类增加一个属性(后台)
查看>>
linux设置环境变量 临时设置 和 永久设置
查看>>
检查网站在世界各地的打开速度
查看>>
jquery 向上(顶部),向下(底部)滑动
查看>>
seo
查看>>
10个出色的NoSQL数据库
查看>>
MySQL: InnoDB 还是 MyISAM?
查看>>
MySQL性能优化的最佳20+条经验
查看>>
SQL语言的组成部分 ddl dcl dml
查看>>
mysql数据库从库同步延迟的问题
查看>>
1.mysql数据库主从复制部署笔记
查看>>
mysql数据库主从同步的问题解决方法
查看>>
mysql 配置 - on xFanxcy.com
查看>>
MySQL数据库高并发优化配置
查看>>
mysql一: 索引优化
查看>>
mysql status 解释 Handler_read%
查看>>