需要用到:多粒度树 分类树 决策树的知识
老师要带我做项目了 很激动,但是老师要我找英文最新的文章看比如multipscale tree,但是没有免费数据库,google查外文也很不稳定。我该从哪里开始入手啊?本人马上大三,从哪里开始学起?
项目的原理貌似这样说的:
根据粒度计算的思想,在粗糙集理论基础上,对Web数据挖掘的分类算法进行研究。主要通过改进传统的分类模型和决策树算法,建立一种以粒度为中心的数据分类模型,即建立一种基于粒度层次树的分类算法,从中导出分类规则,对Web信息的分类和进一步处理将打下良好的基础。
谢谢了!
------解决方案--------------------------------------------------------
呵呵,理论性挺强的。首先你得搞清楚传统的分类模型和决策树算法的局限性在哪儿,传统的聚类算法如k-means算法,初始化中心点是随机选取的,而初始化中心点的选取对最终的聚类结果有明显的影响。而以粒度为中心的数据分类模型实质是基于密度的方法来选取初始聚类中心的,能够有效地改善k-means算法的聚类效果。总之,你需要对传统算法进行分析,提出改进的建议,并最终通过模型加以验证。