当前位置:首页 » 编程语言 » javaictclas

javaictclas

发布时间: 2023-02-27 23:32:44

‘壹’ 有人用java写过文本分类系统吗

文本分类的重点不在分类,而在怎么样描述文本模型和提取文档中的terms并把它数字化,转化为分类器可以使用的输入类型。这前面的处理直接关系到后面分分类效果。就文本模型而言,现在普遍使用的还是Salton 和 McGill的Vector Space Model, 通过TF-IDF统计,如果是英文的话,要进行语义层次的抽象, 这方面可以使用WordNet,网上可以找到JAVA wordnet 的API,,个人认为比较好的是JWNL 如果是中文的话,涉及到分词, 中科院计算所分词系统ICTCLAS, 可到其网站上下载免费版。
至于JAVA写的分类器很多,常用的比如说Weka, RapidMiner(这个相当不错,有专门的Web data Mining的扩展包,是我的最爱),这些都可以自己调用其接口实现新的算法。个人强烈推荐使用RapidMiner,功能相当强大,几乎实现了当前的所有机器学习的算法,并且操纵简便。
学习提示:不要刚开始就希望效果很好,急躁是做学问的大敌,肯定会出现一些意想不到的问题,最主要是勤于思考,善于查找问题,慢慢改进,一个问题,如果比较难,回到它最原始最简单的问题上去。祝你学业进步。

热点内容
代号治愈如何创建服务器 发布:2024-11-07 16:50:25 浏览:45
dos强制删除文件夹 发布:2024-11-07 16:41:05 浏览:294
java协程框架 发布:2024-11-07 16:30:55 浏览:380
预测拟合算法 发布:2024-11-07 16:30:45 浏览:663
橙光原始密码是多少 发布:2024-11-07 16:24:33 浏览:34
安卓电话密码是什么 发布:2024-11-07 16:14:44 浏览:317
战网客户端文件夹 发布:2024-11-07 16:02:42 浏览:123
我的世界服务器转账点券的指令 发布:2024-11-07 15:57:34 浏览:268
马桶解压 发布:2024-11-07 15:57:32 浏览:890
手机游戏苹果和安卓哪个好 发布:2024-11-07 15:55:36 浏览:701