大数据在互联网行业的应用
互联网企业拥有大量的线上数据,而且数据量还在快速增长,除了利用
金融行业是典型的数据驱动行业,每天都会产生大量的数据,包括交易、报价、业绩报告、消费者研究报告、各类统计数据、各种指数等。所以,金融行业拥有丰... 经过近几年的发展,
数据除了具有第一次被使用时提供的价值以外,还具有无穷无尽的“剩余价值”可以被利用,这一点通过一些具体的应用模式和场景就能得到集中体现。
大数据预测是大数... 随着互联网时代的发展和
主要描述了基于 Apriori 算法的关联分析方法。为了克服 Apriori 算法在复杂度和效率方面的缺陷,还进一步的介绍了基于 FP-Tre... 关联分析是指从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。在
DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种... k-means 算法是一种基于划分的聚类算法,它以 k 为参数,把 n 个数据对象分成 k 个簇,使簇内具有较高的相似度,而簇间的相似度较低。... 聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 聚类(... 回归分析的基本概念是用一群变量预测另一个变量的方法。通俗点来讲,就是根据几件事情的相关程度来预测另一件事情发生的概率。回归分析的目的是找到一个... 主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 分类和预测是两种使用数据进行预测的方式,可用来确定未来的结果。 MLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 对数据挖掘的基本概念进行介绍,包括数据挖掘的定义、数据挖掘的价值类型和数据挖掘算法的类型等。 与 RDD 类似,DStream 也提供了自己的一系列操作方法,这些操作可以分成 3 类:普通的转换操作、窗口转换操作和输出操作。
介绍 Spark Streaming 的编程模型,包括 DStream 的操作流程和使用方法。 首先分析传统流处理系统架构存在的问题,然后介绍 Spark Streaming 的系统架构及其工作原理和优势。 ---继续浏览---
大数据在金融行业的应用
大数据可以应用在哪些行业?
大数据的其他应用领域
大数据预测(大数据核心应用)
基于大数据的个性化推荐系统
基于大数据的精准营销
Apriori算法和FP-Tree算法简介
数据挖掘之关联规则分析简介
DBSCAN聚类算法简介
k-means聚类算法简介
什么是聚类分析?聚类分析方法的类别
基本概念
回归分析预测技术简介
决策树和朴素贝叶斯算法简介
决策树算...
数据挖掘之分类和预测简介
分类是用于预测数据对象的离散类别的,需...
Spark MLlib简介
ML...
数据挖掘是什么?
<...
Spark DStream相关操作
Spark Streaming编程模型
DStream 的...
Spark Streaming的系统架构
传...