毕业论文范文网-论文范文
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 学前教育 德语论文 工程管理 文化产业 工商管理 会计专业 行政管理 广告学
机械设计 汉语文学 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 药学论文 播音主持 人力资源 金融论文 保险学
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 计算机论 电子信息 市场营销 法学论文 财务管理 投资学
体育教育 小学教育 印刷工程 土木工程 书法论文 护理论文 心理学论 信息管理 公共事业 给水排水 新闻专业 摄影专业 广电编导 经济学
  • 范文首页 |
  • 毕业论文 |
  • 论文范文 |
  • 计算机论文 |
  • 外文翻译 |
  • 工作总结 |
  • 工作计划 |
  • 现成论文 |
  • 论文下载 |
  • 教学设计 |
  • 免费论文 |
  • 原创论文 |
搜索 高级搜索

原创毕业论文

当前位置:毕业论文范文网-论文范文 -> 论文下载 -> 计算机毕业论文范文

中文文本分类中的特征选择研究

 本文ID:ZJWD240879 充值:150元
免费毕业论文范文
免费毕业论文
政治工作论文
计算机论文
营销专业论文
工程管理论文范文
医药医学论文范文
法律论文范文
生物专业论文
物理教学论文范文
人力资源论文范文
化学教学论文范文
电子专业论文范文
历史专业论文
电气工程论文
社会学专业论文
英语专业论文
行政管理论文范文
语文专业论文
电子商务论文范文
焊工钳工技师论文
社科文学论文
教育论文范文
数学论文范文
物流论文范文
建筑专业论文
食品专业论文
财务管理论文范文
工商管理论文范文
会计专业论文范文
专业论文格式
化工材料专业论文
英语教学专业论文
电子通信论文范文
旅游管理论文范文
环境科学专业论文
经济论文
人力资源论文范文
营销专业论文范文
财务管理论文范文
物流论文范文
财务会计论文范文
数学教育论文范文
数学与应用数学论文
电子商务论文范文
法律专业论文范文
工商管理论文范文
汉语言文学论文
计算机专业论文
教育管理论文范文
现代教育技术论文
小学教育论文范文
机械模具专业论文
报告,总结,申请书
心理学论文范文
学前教育论文范文

收费计算机专业论文范文
收费计算机专业论文
Delphi
ASP
VB
JSP
ASP.NET
VB.NET
java
VC
pb
VS
dreamweaver
c#.net
vf
VC++
计算机论文
扫一扫 扫一扫
毕业论文范文题目: 中文文本分类中的特征选择研究,论文范文关键词: 中文文本分类中的特征选择研究
中文文本分类中的特征选择研究毕业论文范文介绍开始:
   毕业论文 中文文本分类中的特征选择研究,正文共45页,附源程序。
  摘 要
  信息技术的迅猛发展与互联网的快速普及引发了信息的爆炸性增长。文本作为最重要的电子数据形式之一,增长速度更为惊人。为了从规模庞大的文本集里获取有用的信息,需要快速有效的方法。基于机器学习的文本分类技术可以在较大程度上解决文本库杂乱无章的现象,帮助人们将大量的文本自动分门别类。文本自动分类技术有广阔的应用前景,因此得到了广泛的关注,对其相关方面的研究也取得很大的进展。 特征选择是文本自动分类中最重要的环节之一,是本文研究的重点。特征选择是一个从原始特征集中抽取出它的一个由重要词汇组成的真子集的过程。通过一个评估函数给原始特征集里的每个特征打分,选取分值高于阈值的特征。 高效的文本分类分类器要求组成其向量空间的特征应该带有较强的分类信息,同时向量空间能很好的兼顾各个类别里的文本的信息。本文分析了典型的特征选择算法DF和MI的优点和不足,并以此为基础提出了基于二类信息差值的特征提取方法(IDTC),IDTC强调特征对任意两个类别的分类作用,理论上能很好的满足文本分类中对特征集的要求。实验结果表明,使用IDTC选择方法的分类器,比使用DF和MI选择方法的分类器的效果要好得多,并有不逊于使用其他特征选择算法的分类器的表现。
  关键词: 中文;文本分类;特征选择;二类信息差值
  
  目录
  摘 要 I
  ABSTRACT II
  第一章 前言 1
  11 研究背景 1
  12 文本分类的应用领域 2
  13 中文文本分类概述 3
  131 文本分类问题描述 3
  132 文本分类过程 3
  14 国内外研究现状 4
  141 国外研究现状 4
  142 国内研究现状 5
  143 现有分类系统的缺陷 5
  15 本文组织 6
  第二章 中文文本分类的关键技术 7
  21 自动分词技术 7
  211 中文分词方法 7
  212 中科院 ICTCLAS 分词组件简介 8
  22 VSM向量空间模型 8
  23 停用词过滤 8
  24 单词权重的计算 9
  241 布尔权重 9
  242 TF权重 10
  243 IDF权重 10
  244 TF-IDF权重及其变体 10
  25 文本分类算法 11
  251 朴素贝叶斯分类算法 11
  252 KNN分类算法 12
  26 文本分类器性能评价 13
  27 中文文本语料库 15
  第三章 基于二类信息差值的特征提取方法 16
  31 特征选择概要 16
  32 常用的特征选择算法 16
  321 文档频率 16
  322 信息增益(IG) 17
  - v -
  323 互信息(MI) 17
  324 𝝌𝟐 统计量(CHI) 18
  325 期望交叉熵 19
  33 改进的基于二类信息差值特征提取方法 19
  331 DF与MI的思想与不足 19
  332 基于二类信息差值的特征提取方法IDTC 20
  第四章 实验结果与分析 22
  41 实验目的 22
  42 实验数据 22
  43 实验方案 22
  44 实验结果及分析 23
  45 实验总结 27
  第五章 总结与展望 28
  51 总结 28
  52 进一步工作 28
  致谢 30
  参考文献 31
 


以上为本篇毕业论文范文 中文文本分类中的特征选择研究的介绍部分。

本论文在计算机毕业论文范文栏目,由论文网(www.zjwd.net)整理,更多论文,请点论文范文查找

毕业论文降重 相关论文
收费毕业论文范文
收费毕业论文
汉语言文学论文
物理学论文
自动化专业论文
测控技术专业论文
历史学专业论文
机械模具专业论文
金融专业论文
电子通信专业论文
材料科学专业论文
英语专业论文
会计专业论文
行政管理专业论文
财务管理专业论文
电子商务国贸专业
法律专业论文
教育技术学专业论文
物流专业论文
人力资源专业论文
生物工程专业论文
市场营销专业论文
土木工程专业论文
化学工程专业论文
文化产业管理论文
工商管理专业论文
护理专业论文
数学教育专业论文
数学与应用数学专业
心理学专业论文
信息管理专业论文
工程管理专业论文
工业工程专业论文
制药工程专业论文
电子机电信息论文
现代教育技术专业
新闻专业论文
艺术设计专业论文
采矿专业论文
环境工程专业论文
西班牙语专业论文
热能与动力设计论文
工程力学专业论文
酒店管理专业论文
安全管理专业论文
交通工程专业论文
体育教育专业论文
教育管理专业论文
日语专业论文
德语专业论文
理工科专业论文
轻化工程专业论文
社会工作专业论文
乡镇企业管理
给水排水专业
服装设计专业论文
电视制片管理专业
旅游管理专业论文
物业管理专业论文
信息管理专业论文
包装工程专业论文
印刷工程专业论文
动画专业论文
环境艺术专业论文
信息计算科学专业
物流专业论文范文
人力资源论文范文
营销专业论文范文
工商管理论文范文
汉语言文学论文范文
法律专业论文范文
教育管理论文范文
小学教育论文范文
学前教育论文范文
财务会计论文范文

电子商务论文范文

上一篇: 人事管理系统 下一篇: 多媒体课件制作的审美学研究

最新论文

精品推荐

毕业论文排版

热门论文


本站简介 | 联系方式 | 论文改重 | 免费获取 | 论文交换

本站部分论文来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:229120615@qq.com

毕业论文范文-论文范文-论文同学网(www.zjwd.net)提供计算机毕业论文范文毕业论文,毕业论文范文,毕业设计,论文范文,毕业设计格式范文,论文格式范文

Copyright@ 2010-2024 zjwd.net 毕业论文范文-论文范文-论文同学网 版权所有