big data共9篇
大数据--spark--核心:sparkCore - MaxSSL

大数据–spark–核心:sparkCore

一.什么是RDDRDD(ResilientDistributedDataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。在代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。...
MaxSSL的头像 - MaxSSLMaxSSL2年前
80
Elasticsearch:运用 Python 实时通过 Logstash 写入日志到 Elasticsearch - MaxSSL

Elasticsearch:运用 Python 实时通过 Logstash 写入日志到 Elasticsearch

在我之前的文章,我详细地介绍了如何通过Filebeat来收集日志并写入到Elasticsearch。你可以阅读我之前的文章:Beats:使用Filebeat进行日志结构化-PythonBeats:使用ElasticStack记录P…
MaxSSL的头像 - MaxSSLMaxSSL3年前
220
利用Python数据分析处理进行炒股实战行情 - MaxSSL

利用Python数据分析处理进行炒股实战行情

大家好我是政胤今天教大家利用python数据分析处理进行炒股实战行情目录本文主要介绍三部分:数据采集数据预处理利用SVM算法进行建模注:本文仅供参考借数据内容:包含股票、基金、期货、债券、外...
MaxSSL的头像 - MaxSSLMaxSSL3年前
40
国内市场上的BI软件,到底有啥区别 - MaxSSL

国内市场上的BI软件,到底有啥区别

看起来各有特色现在国内市场上活跃的BI软件有很多,从界面上看,琳琅满目有这样的:还有这样的:以及这样的:看起来确实是五花八门,各有特色其实区别不大我们知道,BI的终极目标是做数据分析,...
MaxSSL的头像 - MaxSSLMaxSSL3年前
80
一零零九、Docker搭建 全集群 环境配置 - MaxSSL

一零零九、Docker搭建 全集群 环境配置

目录纯Docker部分Docker结合Hadoop部分环境搭建篇Docker入门传送门基于传统的hadoop搭建方式,将hadoop搭建前的虚拟物理机准备部分使用docker容器替代,后续配置文件操作依然为传统方式。规划为...
MaxSSL的头像 - MaxSSLMaxSSL3年前
00
Observability:如何使用 Elastic Agents 把定制的日志摄入到 Elasticsearch 中 - MaxSSL

Observability:如何使用 Elastic Agents 把定制的日志摄入到 Elasticsearch 中

在我之前的文章“Observability:使用ElasticAgent来摄入日志及指标-ElasticStack8.0”,我详细地描述了如何安装Elasticsearch,Stack及ElasticAgents来采集系统日志及指标。很多开…
MaxSSL的头像 - MaxSSLMaxSSL3年前
70
经典的数据湖“不可能三角”,如何有效解决? - MaxSSL

经典的数据湖“不可能三角”,如何有效解决?

数据湖是什么?提到数据湖就要先说一下数据仓库,数据仓库是集成多业务系统数据、面向主题的、专门用于数据查询分析的数据组织形式。当业务系统数据量不断增大、业务系统数量不断增多以后,数据...
MaxSSL的头像 - MaxSSLMaxSSL3年前
80
场景化数据应用,企业业务创新的内在驱动力 - MaxSSL

场景化数据应用,企业业务创新的内在驱动力

2020年4月国家发文数据成为生产要素之一,它与土地、劳动力、资本、技术等一样,都是可市场化配置的生产要素。数据已和其他要素一起融入经济价值创造过程之中,对生产力发展具有广泛影响。数据...
MaxSSL的头像 - MaxSSLMaxSSL3年前
60
大数据:大一整年感悟及总结 - MaxSSL

大数据:大一整年感悟及总结

学期期末总结一、期末感悟1.个人感悟2.知识积累3.谦卑心理4.利用好碎片时间5.为学历添砖加瓦6.暑假计划二、比赛经历及所获荣誉1.全国高校第三届计算机挑战赛2.蓝桥杯大赛——全国大学生TMT行业...
MaxSSL的头像 - MaxSSLMaxSSL3年前
70