毕业论文范文网-论文范文
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 学前教育 德语论文 工程管理 文化产业 工商管理 会计专业 行政管理 广告学
机械设计 汉语文学 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 药学论文 播音主持 人力资源 金融论文 保险学
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 计算机论 电子信息 市场营销 法学论文 财务管理 投资学
体育教育 小学教育 印刷工程 土木工程 书法论文 护理论文 心理学论 信息管理 公共事业 给水排水 新闻专业 摄影专业 广电编导 经济学
  • 范文首页 |
  • 毕业论文 |
  • 论文范文 |
  • 计算机论文 |
  • 外文翻译 |
  • 工作总结 |
  • 工作计划 |
  • 现成论文 |
  • 论文下载 |
  • 教学设计 |
  • 免费论文 |
  • 原创论文 |
搜索 高级搜索

原创毕业论文

当前位置:毕业论文范文网-论文范文 -> 计算机论文 -> 计算机论文

基于独立用户的聚类搜索引擎


本文ID:ZJWD6668 字数:23141,页数:52

下载地址 全文下载链接(充值: 98 元) 

客服QQ:229120615 微信:lunwen668 免费获取

免费论文范文
免费论文
政治工作论文
计算机论文
营销专业论文
工程管理论文范文
医药医学论文范文
法律论文范文
生物专业论文
物理教学论文范文
人力资源论文范文
化学教学论文范文
电子专业论文范文
历史专业论文
电气工程论文
社会学专业论文
英语专业论文
行政管理论文范文
语文专业论文
电子商务论文范文
焊工钳工技师论文
社科文学论文
教育论文范文
数学论文范文
物流论文范文
建筑专业论文
食品专业论文
财务管理论文范文
工商管理论文范文
会计专业论文范文
专业论文格式
化工材料专业论文
英语教学专业论文
电子通信论文范文
旅游管理论文范文
环境科学专业论文
经济论文
人力资源论文范文
营销专业论文范文
财务管理论文范文
物流论文范文
财务会计论文范文
数学教育论文范文
数学与应用数学论文
电子商务论文范文
法律专业论文范文
工商管理论文范文
汉语言文学论文
计算机专业论文
教育管理论文范文
现代教育技术论文
小学教育论文范文
机械模具专业论文
报告,总结,申请书
心理学论文范文
学前教育论文范文

收费计算机专业论文范文
收费计算机专业论文
Delphi
ASP
VB
JSP
ASP.NET
VB.NET
java
VC
pb
VS
dreamweaver
c#.net
vf
VC++
计算机论文
毕业论文范文题目:基于独立用户的聚类搜索引擎,论文范文关键词:基于独立用户的聚类搜索引擎
基于独立用户的聚类搜索引擎毕业论文范文介绍开始:

论文字数:23141,页数:52  有开题报告,任务书,实习报告

 摘   要
 互联网的迅速发展提供了越来越多的网络信息,为了快速检索到所需信息,搜索引擎成为不可或缺的网络应用工具之一。而现有的搜索引擎尽管采用了各种方法来提高检索结果的精度,仍无法排除检索结果中用户查询请求不相关的论文,而且相关论文和不相关论文仍然相互混杂,也给用户带来了额外负担。
 本文在对搜索引擎概况和聚类过程分析进行介绍的基础上,设计实现了一个基于聚类的独立用户搜索引擎,帮助Web用户从搜索引擎所返回的大量论文片断中筛选出自己所需要的论文,通过将搜索引擎返回的结果进行聚类为若干个簇类,使得同一簇类内论文相关度尽可能的大,不同簇类间论文相关度尽可能的小,从而大大缩小用户所需浏览的结果数量,缩短用户查询所需要的时间。在系统的设计与实现时,对用户的每次独立搜索请求,我们都采用Yahoo提供的API接口来获取研究所需的源数据,采用倒排文件索引模型建立索引同时采用关键词语的方法表征索引,根据检索结果的标题、URL和网页摘要所含信息计算返回结果网页之间的相似性,并将检索结果以及它们之间的相似性关系映射到无向图,最后根据无向图中每个点的相似度进行聚类最终得到结果。在聚类过程中,本文提出了一种新的聚类方法,该方法首先随机选取几个点作为初时质心,然后依次计算剩余点与质心的相似度并决定是否将其加入某个簇。如果大于某个阀值则将其加入该质心所代表的类并调整质心的位置,直至加入全部的点。理论分析表明,系统采用的倒排文件模型需要较少的资源,所提出的聚类算法在一定程度上解决了论文多义性问题,同时系统对孤立点问题也进行了相应的处理。实验结果也表明,本文所提的聚类方法具有较好的效果,能对返回结果进行有效聚类。
 
关键词:搜索引擎,聚类,索引,相似度

Clustering Search Engine Based on Independent Users
 
 
 Abstract
 The rapid development of the Internet has provided more and more internet information. In order to search the required information rapidly, search engines have become one of the indispensable internet tools. Nowadays, although many search engine systems have been applying many methods to improve the retrieval precision, the retrieved results still include a lot of irrelevance documents mixing with the relevance ones, and it brings users an additional burden.
 Based on the profile of search engines and cluster analysis, the clustering search engine for the independent users is designed. It helps the web users choose required information from along list of returned snippets, clustering of the retrieved results will assign snippets to automatically groups based on calculating the similarity. The groups (clusters) formed should have a high degree of association between members of the same groups and a low degree between members of different groups. So the users can only view their interested groups and save much time. In the process of design and implementation, when a independent search request is send to the search engine, the Yahoo API is used to obtain the necessary research data sources in our system and inverted files indexing model is used to create index while using the key words denoting index. The similarity is calculated according to the title of retuned results, URL and summary in our system, then search results and their relationship of similarity are mapped to an undirected graph. Finally, the points of the undirected map are clustered according to the similarity of each point in the undirected map and the ultimate results are gotten.
 During the clustering process, a new clustering method is proposed. Firstly, the method randomly selects a few points as initial centers. Secondly, each point is gradually added one or several clusters based on re-calculation of the similarity between added point and each center. If the similarity is greater than predefined threshold, the point will be added some cluster, whose center are adjusted until adding all the points. Theoretic analysis shows that the used reverted file model in our system needs little resources and proposed clustering algorithm resolves the problem of . And the isolating point problem is also considered. Experimental results also show that the proposed method has better clustering performance and the returned results can be clustered effectively.
 

Key Words: Search Engine; Clustering; Index; Similarity

目   录
摘 要   I
ABSTRACT   II
插图索引  IV
附表索引  V
1. 绪 论 1
1.1 研究背景 1
1.2 研究概况 2
1.3 本文结构 3
2. 搜索引擎概述 5
2.1 搜索引擎的组成 5
2.1.1 Robot 5
2.1.2 分析器 6
2.1.3 索引器 6
2.1.4 检索器 6
2.1.5 用户接口 7
2.2 搜索引擎工作流程 7
2.3 搜索引擎分类 8
2.3.1 全文搜索引擎 8
2.3.2 目录索引搜索引擎 9
2.3.3 垂直搜索引擎 10
2.3.4 元搜索引擎 11
3. 聚类研究 13
3.1 论文自动分类 13
3.2聚类分析 13
3.3 基本聚类方法 14
3.3.1 平面划分方法 14
3.3.2 层次凝聚方法 16
3.4 网页聚类算法 19
3.4.1基于网页内容的聚类算法 19
3.4.2基于链接分析的聚类算法 20
3.4.3基于用户搜索日志的聚类算法 21
4. 聚类搜索引擎设计 23
4.1数据源预处理 23
4.2索引的建立 24
4.3相似度计算 28
4.4聚类处理 29
5.性能分析 35
5.1 理论分析 35
5.2 系统演示 36
总 结 39
致  谢 41
参考文献 43

充值 98 元下载全文→充值 以上为本篇毕业论文范文基于独立用户的聚类搜索引擎的介绍部分。

本论文在计算机论文栏目,由论文网(www.zjwd.net)整理,更多论文,请点论文范文查找

毕业论文降重 相关论文
收费论文范文
收费论文
汉语言文学论文
物理学论文
自动化专业论文
测控技术专业论文
历史学专业论文
机械模具专业论文
金融专业论文
电子通信专业论文
材料科学专业论文
英语专业论文
会计专业论文
行政管理专业论文
财务管理专业论文
电子商务国贸专业
法律专业论文
教育技术学专业论文
物流专业论文
人力资源专业论文
生物工程专业论文
市场营销专业论文
土木工程专业论文
化学工程专业论文
文化产业管理论文
工商管理专业论文
护理专业论文
数学教育专业论文
数学与应用数学专业
心理学专业论文
信息管理专业论文
工程管理专业论文
工业工程专业论文
制药工程专业论文
电子机电信息论文
现代教育技术专业
新闻专业论文
艺术设计专业论文
采矿专业论文
环境工程专业论文
西班牙语专业论文
热能与动力设计论文
工程力学专业论文
酒店管理专业论文
安全管理专业论文
交通工程专业论文
体育教育专业论文
教育管理专业论文
日语专业论文
德语专业论文
理工科专业论文
轻化工程专业论文
社会工作专业论文
乡镇企业管理
给水排水专业
服装设计专业论文
电视制片管理专业
旅游管理专业论文
物业管理专业论文
信息管理专业论文
包装工程专业论文
印刷工程专业论文
动画专业论文
环境艺术专业论文
信息计算科学专业
物流专业论文范文
人力资源论文范文
营销专业论文范文
工商管理论文范文
汉语言文学论文范文
法律专业论文范文
教育管理论文范文
小学教育论文范文
学前教育论文范文
财务会计论文范文

电子商务论文范文

上一篇:龙岗区综合执法信息系统的设计实现 下一篇:虚拟现实技术在数字博物馆系统中..

最新论文

精品推荐

毕业论文排版

热门论文


本站简介 | 联系方式 | 论文改重 | 免费获取 | 论文交换

本站部分论文来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:229120615@qq.com

毕业论文范文-论文范文-论文同学网(www.zjwd.net)提供计算机论文毕业论文,毕业论文范文,毕业设计,论文范文,毕业设计格式范文,论文格式范文

Copyright@ 2010-2024 zjwd.net 毕业论文范文-论文范文-论文同学网 版权所有