当前位置: 代码迷 >> 数据仓库 >> 数据挖掘的纳闷,期望大神给些指导
  详细解决方案

数据挖掘的纳闷,期望大神给些指导

热度:108   发布时间:2016-05-05 15:51:42.0
数据挖掘的疑惑,,期望大神给些指导
先简单的做一个自我介绍吧:

我是一所普通211的一年级研究生,88年底出生,男,专业是通信工程,本科也是该校的。
07——11年在这所学校读本科,过了四六级,计算机二级。
参加了11年的考研,考华科电信,数学128,专业课136,政治70,英语38(没有过线),总分372
自我评价,自己的数学基础还比较好,肯专研。
11.7——12.5在一家做半导体材料和产品的公司工作,工作的内容是PCB,基本没有工作压力,所幸就在职复习考研了,就直接考回了本校,学术型研究生三年。(整个考研期间我只请假了一个星期)
自己在考完研以后就开始看C,C++primer(翻了两遍了),VC++深入详解 孙鑫(看了一遍),也看了一点JAVA编程思想。。
12.6——12.8在一家台资企业工作,在佛山顺德,是一家子公司,该公司是一家生产型的公司,生产服务器等。我也是在这家公司开始接触linux,把鸟哥的私房菜翻了两遍,看了一点linux编程。
12.9到学校报到了,但是自己在当初选导师的时候没有选择正确:导师(一女的,学术能力比较强悍,现在是副教授,三十五不到)的方向是高光谱遥感数据处理(国家青年基金的项目,偏向学术)。而且导师要求有点严,要求周一到周五早中晚必须呆在实验室!!妹的,有点恨这导师了。。。


下面说一下我自己的一些想法吧(我有点啰嗦哩,期望大家耐心一点,不胜感激):
导师的方向是高光谱数据处理,偏向算法,一上来就是要我们搞svm,knn,lda等等,监督学习算法,半监督学习算法,机器学习等等,主要是遥感数据的分类算法,用matlab来实现,
有人说这些算法就是数据挖掘里面的核心算法,但我似乎还没有懂这些东东到底是什么个玩意儿。。
我作为她的研究生,每天要做的事情是看有关高光谱数据处理算法的文章,完了理解别人的思想,用matlab来实现,这些也就是我最不愿意做的事情,每天仅仅只是做做仿真,妹的!!

现在的我刚报了软考中级,主要是用周末跟周一到周五中午的那点时间在看书做题,顺便看看java编程思想。。

每次只要一想到自己的未来,就有点后怕。因为导师的课题方向主要用matlab来实现;然而前车之鉴,仅仅会写matlab代码,发一两篇核心文章,这些东西对于自己找工作完全是不行的,压根儿就找不到工作,除了读博。。

现在我的困惑主要是在于数据挖掘方向的工作需要哪些技能和知识,我该如何学习,与导师的方向到底有什么联系……

期望各位给一点意见,不胜感激~~~
数据挖掘

------解决方案--------------------
建议你跟导师多沟通  跟导师深谈一次  互相了解下对方的想法
------解决方案--------------------
引用:
建议你跟导师多沟通  跟导师深谈一次  互相了解下对方的想法

确实,沟通是应该的,怎么着导师的经验还是可以给你分享一下
------解决方案--------------------
这位仁兄还是蛮牛的,建议多沟通吧。
------解决方案--------------------
xuexiz
------解决方案--------------------
羡慕lz有好导师先

一般来说数据挖掘是属于BI范畴,BI是上世纪90十年代才被提出来,不说国内,其实国外也刚成熟,看看现在首页的linkedin的新闻就知道

个人认为这是个越老越值钱的行业,很有前途。

BI这个系统包括很多职业,java工程师啊,数据挖掘工程师啊,数据仓库什么的,lz既然已经有编程方面的基础,可以考虑在BI里面选一个方向钻研

嘛,我也还是学生,给的建议不多,仅供参考啦
------解决方案--------------------
恩。多沟通还是好的,早些明确发展的方向。
------解决方案--------------------
你的情况跟我太相似的了,我的老师也是个女的,也搞数据挖掘,偏算法,要求周一到周五在实验室,这样的情况估计还有很多。我的一个疑问就是虽然你的数学和专业课的分数都比较高,但是英语没有过线,怎么又上了研究生呢?
------解决方案--------------------
晕死,我居然能把两个帖子看叉了,看的楼主的内容,结果跳到另一个的回复内容,搞的我还写了那么多,不过也算相通吧,贴过来你参考一下。


6楼的是理论分析,很到位,11楼算是白话文告诉你其实数据仓库在干什么。
我理解楼主的意思,就想搞明白数据仓库到底是什么,总有个实物吧,接触了一段时间发现这实物就是数据库啊,所以就困惑了。因为我本人也是很讨厌专业术语,枯燥的理论这种东西,实在很虚,心里怎么都没有踏实感。我以我的经验,再把6楼的思想,按照11楼的分块部分白话文一下。
举个简单的例子,假设我们有一家小卖部,每天卖多少,营业额是多少,细心的老板可能还记个账,心里有个底,粗心的连帐都不记。那么这种规模,完全不需要什么数据库,数据仓库,每天大概挣多少,每年挣多少心里不是都清清楚楚的。随着生意好了,我们翻新成一家小超市,卖更多的产品,不用任何市场调研,用常识就能判断货品范围,卖几个月也能总结出进货量,出货量,这时候可能要请几个工人,账目就要记起来了,一家店的时候,我们用本子,或者电脑EXCEL记一下也是可以的,但扩张了几个连锁店后,如果你是老板,你也不放心每家店都靠这样记的吧,然后你就要考虑买POS机,每天的销售记录仔仔细细都在系统(数据库)里面存着,这就是业务处理数据库,如果这时候所发生的业务就几十万的量,放在一张hist表中,也许下一句复杂点的SQL也能做出一些简单条件的业绩报表,但是如果连锁超市往超级市场SUPERmart方向发展,那业务处理量大了之后,hist表大到不能直接在上面下复杂SQL了,下了之后超市实时的业务处理会受到影响,而且不能我每次需要这样的SUMMARY数据都用彪悍的方法来QUERY吧,并且,这时候我们对业绩分析的要求也提高了,就不仅仅局限于按照时间(天,周,月,季度,年度)或按照品种来进行统计,我可能要细分,比如老板要求你统计每个周六周日下午三点以后的刷卡的交易额,并且其中同一张单子中有购买两种以上类别(日用,食品,体育等)的单子情况,(这里我只是举例,这也涉及到商业智能了,这些分析可能可以给大老板的一些决策提供一些参考。但是不是所有老板都会有这方面的想法),但作为日常的分析,我们可能需要写一些额外的程序进行数据分析,并且把这些数据保存到另外一个业务分析数据库中。
至此,我想说明的是,数据仓库这个概念,跟我们一些企业日常在做的工作,整个界限是模糊的,你可以认为我们做的工作中,已经有部分工作在系统的进行数据处理的就是在做数据仓库,不一定是要使用什么级别的数据库,或者使用什么工具。
  相关解决方案