-
[数据仓库] 使用excel开展数据挖掘(6)- 预测
使用excel进行数据挖掘(6)----预测在配置环境后,可以使用excel进行数据挖掘。环境配置问题可参阅:http://blog.csdn.net/xinxing__8185/article/details/46445435样例DMAddins_SampleData.xlsx文件下载地址:htt...
213
热度 -
[数据仓库] 【地质空间数据挖掘】关联规则发现
【地理空间数据挖掘】关联规则发现关联规则是当前数据挖掘研究的主要方法之一,主要用于确定数据中不同领域之间的联系,找出满足给定支持度和可信度阀值的多个域之间的依赖关系。在时空分析中,除了经典因子之间的关联(简单关联、时序关联和因果关联等)规则的发现,关联规则分析还可用于探索上下不同事件之间的关联性,如...
117
热度 -
[数据仓库] kaggle数据挖掘——以Titanic替例介绍处理数据大致步骤
kaggle数据挖掘——以Titanic为例介绍处理数据大致步骤Titanic是kaggle上的一道justforfun的题,没有奖金,但是数据整洁,拿来练手最好不过。本文以Titanic的数据,使用较为简单的决策树,介绍处理数据大致过程、步骤注意,本文的目的,在于帮助你入门数据挖掘,熟悉处理数据步...
135
热度 -
[数据仓库] KNIMI数据挖掘建模与分析系列_004_利用KNIMI干客户流失预测
KNIMI数据挖掘建模与分析系列_004_利用KNIMI做客户流失预测利用KNIMI做客户流失预测老帅20150801http://blog.csdn.net/shuaihj一、测试数据中国移动客服数据需要测试数据,请留下邮箱二、统计已流失客户1.读取移动客服数据(客户流失.xlsx)2.统计已流失...
141
热度 -
[数据仓库] 数据仓库的架构主要有星型跟雪花型两种方式
数据仓库的架构主要有星型和雪花型两种方式http://www.xuebuyuan.com/1642262.htmlhttp://blog.csdn.net/nisjlvhudy/article/details/7889422当所有维表都直接连接到“事实表”上时,整个图解就像星星一样,故将该模型称为星...
101
热度 -
[数据仓库] 数据挖掘十大经典算法之K最比邻算法
数据挖掘十大经典算法之K最近邻算法k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。基于实例的学习已知一系列的训练样例,很多学习方法为目标函数建立起明确的一般化描述;但与此不同,基于实例的学习方法只是简单地把训练样例存储起来。从这些实例中泛化的工作被推迟到必须分类新的实例时...
151
热度 -
[数据仓库] 使用excel进展数据挖掘(7)- 从示例填充数据
使用excel进行数据挖掘(7)----从示例填充数据在配置环境后,可以使用excel进行数据挖掘。环境配置问题可参阅:http://blog.csdn.net/xinxing__8185/article/details/46445435样例DMAddins_SampleData.xlsx文件下载地...
122
热度 -
[数据仓库] 使用excel开展数据挖掘(8)- 购物篮分析
使用excel进行数据挖掘(8)----购物篮分析在配置环境后,可以使用excel进行数据挖掘。环境配置问题可参阅:http://blog.csdn.net/xinxing__8185/article/details/46445435样例DMAddins_SampleData.xlsx文件下载地址:...
80
热度 -
[数据仓库] 浅谈数据挖掘中的关联规则开掘
浅谈数据挖掘中的关联规则挖掘数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。举个最简单的例子,比如通过调查商场里顾客买的东西发现,30%的顾客会同时...
136
热度 -
[数据仓库] 常见的机器学习与数据挖掘知识点之常见遍布
常见的机器学习与数据挖掘知识点之常见分布常见的机器学习与数据挖掘知识点之常见分布CommonDistribution(常见分布):DiscreteDistribution(离散型分布):0-1Distribution(0-1分布)定义:若随机变量X只取0和1两个值,且其分布律为P{X=k}=pk(1...
153
热度 -
[数据仓库] 二零一五年机器学习/数据挖掘面试总结
2015年机器学习/数据挖掘面试总结2015年机器学习/数据挖掘面试总结明年硕士毕业,今年开始找工作。在北方呆的太久,想回湿润的南方。第一站(3月份),阿里数据挖掘实习生面试。个人觉得,阿里的面试是最人性化的,几乎不需要提前准备什么。不需要刷题,不需要死记硬背一些概念。他们看重的是你的项目经历和解决...
90
热度 -
[数据仓库] [数据挖掘与处置]微型自动数据处理系统构造
[数据挖掘与处理]微型自动数据处理系统构造MADP(微型自动数据处理)系统的构造原理猜想如果我们把一个节点比喻成一个计算项,那么在一个复杂的,可自定义的分支汇聚拓扑结构图中,把这些微小的计算项结合在一起的,除了拓扑分析算法以外,还有就是用于传递计算项计算参数的寄存器模块了在这里,我们用最简单的语言来...
135
热度 -
[数据仓库] 关于OLTP跟OLAP的疑问
关于OLTP和OLAP的疑问网上的OLTP和OLAP资料很多,我也了解他们的内容和用途,但是对于实际的应用,还是无法结合,有几点疑问,恳请大家解惑1、我们平常设计数据库时,基本都是OLTP类型,而如果需要大数据量的查询,才考虑加入OLAP,是吗?2、如果目前有OLTP,现在需要加入OLAP,那么OL...
129
热度 -
[数据仓库] 数据挖掘入门算法拾掇
数据挖掘入门算法整理最近正打算学习一些数据挖掘方面的知识,开始看了一些相关博文,但是太过零碎,一直对此没有一个较为系统的认识。周末在图书馆闲逛,偶然看见《大话数据挖掘》一书,发现讲的比较有条理,还蛮适合入门的,因此就读了两章,作此笔记。本文只是介绍了数据挖掘入门的一些算法分类,不涉及具体算法实现。一...
87
热度 -
[数据仓库] (数据挖掘-入门-五)基于内容的协同过滤与分类
(数据挖掘-入门-5)基于内容的协同过滤与分类1、动机2、基于内容的分类器3、python实现一、动机在前面的文章中介绍了基于用户和基于物品的协同过滤推荐方法,其实无论是基于用户还是基于物品,都是通过群体效应来进行推荐,因为衡量相似度的向量都是基于一定群体用户的评分,所以推荐出来的物品都是热门的流行...
406
热度 -
[数据仓库] 日期维表的创造,事实表中有多个日期
日期维表的创建,事实表中有多个日期事实表中有多个日期,这个事实表的类型是事务粒度级,对这几个日期是要建几个日期维表吗,还是都关联一个日期维表就行------解决思路----------------------日期维度表一个就够------解决思路----------------------一个日期表...
82
热度 -
[数据仓库] 数据仓库课题(15)-数据仓库建设基本原则-实践篇(求补充)
数据仓库专题(15)-数据仓库建设基本原则-实践篇(求补充)数据仓库建设原则第一条:一切为就绪数据让路;数据仓库建设原则第一条:业务分析和数据分析深浅有度;数据仓库建设原则第二条:业务分析和数据分析深浅有度;数据仓库建设原则第三条:数据价值挖掘切莫求之过急,水到渠才能成;数据仓库建设原则第四条:团队...
103
热度 -
68
热度 -
[数据仓库] 机器学习跟数据挖掘推荐书单
机器学习和数据挖掘推荐书单机器学习和数据挖掘推荐书单有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Log...
152
热度 -
[数据仓库] 保险行业BI表格实例技术架构与数据仓库解析
保险行业BI报表实例技术架构与数据仓库解析应用企业:XX国寿技术架构示意图数据仓库主题分类数据仓库设计:多维数据集单证主题数据立方体包含日期,单证类型,机构,操作人员,等多种维度,来提供单证清单类基础数据。收付费主题数据立方体以现有的统计查询系统(hbqrydb)为基础,实现收付费基础数据的搭建,为...
123
热度