毕业论文范文网-论文范文
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 学前教育 德语论文 工程管理 文化产业 工商管理 会计专业 行政管理 广告学
机械设计 汉语文学 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 药学论文 播音主持 人力资源 金融论文 保险学
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 计算机论 电子信息 市场营销 法学论文 财务管理 投资学
体育教育 小学教育 印刷工程 土木工程 书法论文 护理论文 心理学论 信息管理 公共事业 给水排水 新闻专业 摄影专业 广电编导 经济学
  • 范文首页 |
  • 毕业论文 |
  • 论文范文 |
  • 计算机论文 |
  • 外文翻译 |
  • 工作总结 |
  • 工作计划 |
  • 现成论文 |
  • 论文下载 |
  • 教学设计 |
  • 免费论文 |
  • 原创论文 |
搜索 高级搜索

原创毕业论文

当前位置:毕业论文范文网-论文范文 -> 免费论文 -> 电子专业论文

Deep Web查询结果后处理

作者: 浏览:4次
免费专业论文范文
免费专业论文
政治工作论文
计算机论文
营销专业论文
工程管理论文范文
医药医学论文范文
法律论文范文
生物专业论文
物理教学论文范文
人力资源论文范文
化学教学论文范文
电子专业论文范文
历史专业论文
电气工程论文
社会学专业论文
英语专业论文
行政管理论文范文
语文专业论文
电子商务论文范文
焊工钳工技师论文
社科文学论文
教育论文范文
数学论文范文
物流论文范文
建筑专业论文
食品专业论文
财务管理论文范文
工商管理论文范文
会计专业论文范文
专业论文格式
化工材料专业论文
英语教学专业论文
电子通信论文范文
旅游管理论文范文
环境科学专业论文
经济论文
人力资源论文范文
营销专业论文范文
财务管理论文范文
物流论文范文
财务会计论文范文
数学教育论文范文
数学与应用数学论文
电子商务论文范文
法律专业论文范文
工商管理论文范文
汉语言文学论文
计算机专业论文
环境艺术专业论文
信息计算科学专业
物流专业论文范文
人力资源论文范文
教育管理论文范文
现代教育技术论文
小学教育论文范文
机械模具专业论文
报告,总结,申请书
理工科专业论文
心理学论文范文
学前教育论文范文



毕业论文范文题目:Deep Web查询结果后处理,论文范文关键词:Deep Web查询结果后处理
Deep Web查询结果后处理毕业论文范文介绍开始:
【论文摘要】:随着网络快速猛进的发展,人们在网上公布的信息愈来愈多,与此同时网络上出现了各种各样的网页结构。目前,整个Web主要由两大部分构成,一部分是SurfaceWeb,另一部分则是DeepWeb。SurfaceWeb指的是在传统的搜索引擎上经过查询就可以检索到的页面,DeepWeb则不同,大多数传统的搜索引擎并不能完全搜索到它们,它们隐藏在网页的索引表单之后,存储在巨大的动态数据库里,用户需要通过在查询接口上提交查询关键词后才能显示出来。根据2007年7月的一个调查显示,大约有43000—960000个DeepWeb网站,而且它包含的信(本文此处忽略..)息内容是SurfaceWeb的500倍还要多。在随后的2004年4月的一项调查报道显示,DeepWeb站点已经达到307000之多。在短短的4年里DeepWeb站点增长了3—7倍。由于DeepWeb含有惊人的数据信息,所以对DeepWeb信息进行抽取是非常必要的,但是由于网页结构多种多样,还掺杂了很多用户根本就不感兴趣的信息,例如广告之类的信息,它们不但占据网页的大部分篇幅,而且还影响了计算机打开网页的速度,对用户造成了困扰。本文为了解决该问题,主要对已经搜索到的网上售书领域网页的内容进行抽取,通过去除网页上的无用信息来方便用户搜(略..)索需要的内容。目前,国内外对信息抽取技术方面已经有了很多的研究成果,提出了许多信息抽取技术,例如基于自然语言的信息抽取技术、基于XML的信息抽取技术,基于DOM树的信息抽取技术等,但是它们受网页结构的影响非常大,面临现在网页结构的复杂多样,实现比较准确的信息抽取十分困难。本文提出了利用领域本体来帮助信息抽取的技术,本体用来描述某个领域内概念以及这些概念之间的关系,使这些概念和关系在共享范围内有着明确的且唯一的定义,以便能够达成共识,因此它不受网页结构的限制,只要构建的本体内容足够丰富,就能够实现使(略..)用本体指导信息准确抽取。本文主要由两部分构成,第一部分为本体构建,第二部分为查询结果信息抽取。由于目前大多数网页都是用HTML语言编写,该语言使用了大量的标签来对页面进行排版,本文充分利用了这一点,使用HTML标签和网上售书领域网页的结构特点,利用查询接口和相应的查询结果页面之间信息相互补充的方法来构建网上售书领域的本体,通过使用RSEM模型来确定本体的领域知识,然后用本体构建工具Protege来构建本体。在信息抽取部分,首先用HTMLParser对待抽取的网页进行页面解析,在解析过程中去除用户不(文章此处忽略..)感兴趣的信息部分,如广告、导航栏等信息,得出待抽取信息的HTML树,把此HTML树和经过Jena解析后的OWL文件进行信息匹配,识别出网页中信息部分,并对其进行提取。最后把抽取的结果按照排序算法进行排序,并将最终结果存储到数据库中,完成抽取任务。在本文最后,为了证明此方法的可行性,对网上售书领域的几个比较有代表性的网站进行了抽取实验,如当当网、中华图书网、亚马逊网等,并和RSEM模型进行了试验比较,结果证明了该方法的可行性。


以上为本篇毕业论文范文Deep Web查询结果后处理的介绍部分。
本论文在电子专业论文栏目,由论文网(www.zjwd.net)整理,更多论文,请点论文范文查找

毕业论文降重
收费专业论文范文
收费专业论文
汉语言文学论文
物理学论文
自动化专业论文
测控技术专业论文
历史学专业论文
机械模具专业论文
金融专业论文
电子通信专业论文
材料科学专业论文
英语专业论文
会计专业论文
行政管理专业论文
财务管理专业论文
电子商务国贸专业
法律专业论文
教育技术学专业论文
物流专业论文
人力资源专业论文
生物工程专业论文
市场营销专业论文
土木工程专业论文
化学工程专业论文
文化产业管理论文
工商管理专业论文
护理专业论文
数学教育专业论文
数学与应用数学专业
心理学专业论文
信息管理专业论文
工程管理专业论文
工业工程专业论文
制药工程专业论文
电子机电信息论文
现代教育技术专业
新闻专业论文
热能与动力设计论文
教育管理专业论文
日语专业论文
德语专业论文
轻化工程专业论文
社会工作专业论文
乡镇企业管理
给水排水专业
服装设计专业论文
电视制片管理专业
旅游管理专业论文
物业管理专业论文
信息管理专业论文
包装工程专业论文
印刷工程专业论文
动画专业论文
营销专业论文范文
工商管理论文范文
汉语言文学论文范文
法律专业论文范文
教育管理论文范文
小学教育论文范文
学前教育论文范文
财务会计论文范文

电子商务论文范文

上一篇:网络环境下政府竞争情报系统构建 下一篇:民国时期图案教材版本与撰述研究

最新论文

精品推荐

毕业论文排版

热门论文


本站简介 | 联系方式 | 论文改重 | 免费获取 | 论文交换

本站部分论文来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:229120615@qq.com

毕业论文范文-论文范文-论文同学网(www.zjwd.net)提供电子专业论文毕业论文,毕业论文范文,毕业设计,论文范文,毕业设计格式范文,论文格式范文

Copyright@ 2010-2024 zjwd.net 毕业论文范文-论文范文-论文同学网 版权所有