当前位置: 代码迷 >> 企业开发 >> 文章的内容识别解决办法
  详细解决方案

文章的内容识别解决办法

热度:9997   发布时间:2013-02-26 00:00:00.0
文章的内容识别
假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?
(1)如果采用关键词方法,数据库如何设计?
(2)如何让程序具有人工智能?
(3)中文或者日文的话,怎样对文章进行分词啊?

------解决方案--------------------------------------------------------
建议你看一下Data mining: practical machine learning tools and techniques 和Data Mining: Concepts and Techniques这两本书,讲到了人工智能及数据挖掘的东西.关于多语言的问题,无论是关键词还是文章内容建议统一用unicode方式存取,这样比较的时候就不存在编码转化的问题了。
  相关解决方案