当前位置: 代码迷 >> 数据仓库
 解决方案列表
  • [数据仓库] 日志存档与数据挖掘(日志中心)

    日志归档与数据挖掘(日志中心)日志归档与数据挖掘http://netkiller.github.io/journal/log.htmlMr.NeoChen(陈景峰),netkiller,BG7NYT中国广东省深圳市龙华新区民治街道溪山美地518131+86?13113668890+86?755?29...

    130
    热度
  • [数据仓库] 新浪微博数据挖掘食谱之二: 话题篇 (selenium)

    新浪微博数据挖掘菜谱之二:话题篇(selenium)#!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2014-12-29@author:beyondzhou@name:discovery_trend_topic.py'&...

    126
    热度
  • [数据仓库] 新浪微博数据挖掘食谱之三: 搜索篇 (selenium)

    新浪微博数据挖掘菜谱之三:搜索篇(selenium)#!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2014-12-30@author:beyondzhou@name:decode_search_entities.py'...

    122
    热度
  • [数据仓库] 2、Soft-margin SVM

    加州理工学院公开课:机器学习与数据挖掘_KernalMethod(第十五课)课程简介继续上一课最后的问题,当数据是非线性可分的时候需要把数据转化到Z空间(线性可分)才可以利用SVM,因此需要知道Z空间是什么。这节课解决了不用知道具体的Z空间就可以利用SVM进行分类。最后,该课程介绍了如何因对过拟化的...

    118
    热度
  • [数据仓库] 新浪微博数据挖掘菜谱之六: 元素篇 (提取微博元素)

    新浪微博数据挖掘食谱之六:元素篇(提取微博元素)#!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2015-1-2@author:beyondzhou@name:extract_weibo_entities.py''...

    146
    热度
  • [数据仓库] 数据挖掘算法学习(9)EM算法-上篇-多元高斯分布

    数据挖掘算法学习(九)EM算法-上篇-多元高斯分布------------------------------------------------------------------------------------欢迎转载,请附上链接http://blog.csdn.net/iemyxie/ar...

    104
    热度
  • [数据仓库] 关于kettle增量更新的实现可以用 流表的的rowid 吗

    关于kettle增量更新的实现可以用源表的的rowid吗?大牛们好,如题所示,我现在需要从源数据库更新500多张表过来,数据量也很大,目前的工具是kettle。由于源库是别人的,所以更改不了源表的结构,只能从我们这边儿想办法。。那么,通过每个表的rowid能能实现吗?rowid是不是递增的呢?---...

    108
    热度
  • [数据仓库] 【数据中国大讲坛】二零一二年讲座汇总

    【数据中国大讲坛】2012年讲座汇总【讲座录音01】20120613《数据仓库架构》Jimmy简介:http://db365.net/forum.php?mod=viewthread&tid=355&fromuid=19录音:http://pan.baidu.com/share/li...

    142
    热度
  • [数据仓库] 数据挖掘(入门常识)

    数据挖掘(入门知识)最近在看一本叫《大话数据挖掘》的书,简单的摘要总结一些数据挖掘的基础理论知识:1.DataMining(在学术界也叫KDD:knowledgediscoveryindatabase),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含...

    135
    热度
  • [数据仓库] 数据仓库建模步骤初步

    数据仓库建模方法初步一、前言数据仓库得建模方法同样也有很多种,每一种建模方法其实代表了哲学上的一个观点,代表了一种归纳,概括世界的一种方法。目前业界较为流行的数据仓库的建模方法非常多,这里主要介绍范式建模法,维度建模法,实体建模法等几种方法,每种方法其实从本质上讲就是从不同的角度看我们业务中的问题,...

    79
    热度
  • [数据仓库] 5、RBF and regularization

    加州理工学院公开课:机器学习与数据挖掘_RadialBasisFunction(第十六课)课程简介:主要介绍了RBF模型及其与最近邻算法、神经网络、KernelMethod的比较。最后介绍了RBF模型的regularization问题。课程提纲:1、whatisRBF2、RBFandnearestn...

    94
    热度
  • [数据仓库] 数据挖掘分门别类方法小结

    数据挖掘分类方法小结下面对分类流程作个简要描述:训练:训练集——>特征选取——>训练——>分类器分类:新样本——>特征选取——>分类——>判决最初的数据挖掘分类应用大多都是在这些方法及基于内存基础上所构造的算法。目前数据挖掘方法都要求具有基于外存以处理大规模数据集...

    59
    热度
  • [数据仓库] 数据挖掘的步骤有哪些

    数据挖掘的方法有哪些?利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。1、分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个...

    119
    热度
  • [数据仓库] 数据挖掘9律

    数据挖掘九律TTNN里面一位朋友分享的,感觉很有意思,拿来分享给大家!数据挖掘九律-DataMining-数据挖掘与数据分析有位挖掘专家tomkhabaza提出了挖掘九律,挺好的东西,特别是九这个数字,深得中华文化精髓,有点独孤九剑的意思:第一,目标律。数据挖掘是一个业务过程,必须得有业务目标。无目...

    51
    热度
  • [数据仓库] 3、Aggregation(聚合)

    加州理工学院公开课:机器学习与数据挖掘_Epilogue(第十八课-终结篇)课程简介:这是该课程的最后一课,作者首先总结了有关机器学习的理论、方法、模型、范式等。最后介绍了贝叶斯理论和Aggregation(聚合)方法在机器学习中的应用。课程提纲:1、机器学习的地图。2、贝叶斯理论。3、Aggreg...

    160
    热度
  • [数据仓库] 闻名统计学者谢邦昌数据挖掘访谈

    著名统计学者谢邦昌数据挖掘访谈1.记者:DataMining包含哪些主要功能?谢邦昌:DataMining实际应用功能可分为三大类六分项来说明:Classification和Clustering属于分类区隔类;Regression和Time-series属于推算预测类;Association和Seq...

    104
    热度
  • [数据仓库] Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱_转载

    Python网页爬虫&文本处理&科学计算&机器学习&数据挖掘兵器谱__转载曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱...

    270
    热度
  • [数据仓库] 干商务智能是不是需要很好的语言表达能力

    做商务智能是不是需要很好的语言表达能力本帖最后由williambaldwin于2012-10-1423:50:34编辑本人从小有些口吃,在通讯领域BI做了3年多了,基本业务还是比较熟悉的,和一些甲方的业务人员沟通倒是没问题,因为大家岁数差不多,而且没有什么上下级关系,可每次做了一些大项目,可能就需要...

    65
    热度
  • [数据仓库] 数据仓库应用(1):数据仓库模型设计

    数据仓库应用(一):数据仓库模型设计一、问题背景某电子商务网站主要销售电子类产品,产品又分为几个大类别,包括:电脑类、手机类、键盘类等,每个类别内又细分为几个小类别,各类别下又有诸多的商品,每一个商品都有一个唯一的商品编号。用户可以通过注册成为会员来进行商品的下单购买。用户下单后会由系统自动产生一个...

    131
    热度
  • [数据仓库] 数据仓库应用(3): SQL Server 2005的数据仓库应用-联机分析OLAP

    数据仓库应用(三):SQLServer2005的数据仓库应用--联机分析OLAP关联文章:数据仓库应用(一):数据仓库模型设计数据仓库应用(二):数据抽取、转换、加载(ETL)前言:有关数据仓库的研究,并不仅仅停留在理论上。目前,几种主要的RDBMS产品,如Oracle、SQLServer、Info...

    63
    热度