毕业论文范文网-论文范文
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 学前教育 德语论文 工程管理 文化产业 工商管理 会计专业 行政管理 广告学
机械设计 汉语文学 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 药学论文 播音主持 人力资源 金融论文 保险学
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 计算机论 电子信息 市场营销 法学论文 财务管理 投资学
体育教育 小学教育 印刷工程 土木工程 书法论文 护理论文 心理学论 信息管理 公共事业 给水排水 新闻专业 摄影专业 广电编导 经济学
  • 范文首页 |
  • 毕业论文 |
  • 论文范文 |
  • 计算机论文 |
  • 外文翻译 |
  • 工作总结 |
  • 工作计划 |
  • 现成论文 |
  • 论文下载 |
  • 教学设计 |
  • 免费论文 |
  • 原创论文 |
搜索 高级搜索

原创毕业论文

当前位置:毕业论文范文网-论文范文 -> 免费论文 -> 医药医学论文

基于词缀及特征单词等级的生物实体名称识别方法

作者: 浏览:7次
免费专业论文范文
免费专业论文
政治工作论文
计算机论文
营销专业论文
工程管理论文范文
医药医学论文范文
法律论文范文
生物专业论文
物理教学论文范文
人力资源论文范文
化学教学论文范文
电子专业论文范文
历史专业论文
电气工程论文
社会学专业论文
英语专业论文
行政管理论文范文
语文专业论文
电子商务论文范文
焊工钳工技师论文
社科文学论文
教育论文范文
数学论文范文
物流论文范文
建筑专业论文
食品专业论文
财务管理论文范文
工商管理论文范文
会计专业论文范文
专业论文格式
化工材料专业论文
英语教学专业论文
电子通信论文范文
旅游管理论文范文
环境科学专业论文
经济论文
人力资源论文范文
营销专业论文范文
财务管理论文范文
物流论文范文
财务会计论文范文
数学教育论文范文
数学与应用数学论文
电子商务论文范文
法律专业论文范文
工商管理论文范文
汉语言文学论文
计算机专业论文
环境艺术专业论文
信息计算科学专业
物流专业论文范文
人力资源论文范文
教育管理论文范文
现代教育技术论文
小学教育论文范文
机械模具专业论文
报告,总结,申请书
理工科专业论文
心理学论文范文
学前教育论文范文



毕业论文范文题目:基于词缀及特征单词等级的生物实体名称识别方法,论文范文关键词:基于词缀及特征单词等级的生物实体名称识别方法
基于词缀及特征单词等级的生物实体名称识别方法毕业论文范文介绍开始:
【论文摘要】:随着分子生物学、基因组学和蛋白质组学的发展,出版的生物医学文献呈指数级增长,从海量的文献中利用计算机算法获取信息成了必然的发展趋势。生物信息学领域中对于基因、蛋白质等实体没有统一的命名标准,因此从文献中识别实体名称是获取信息的首要步骤。机器学习方法在解决生物实体识别问题中表现出较高的精度,因此被越来越多的研究者采用并不断改进。本文详细介绍了机器学习中在文本挖掘领域常用的隐马尔可夫模型HMM(HiddenMarkovModels)、最大熵马尔可夫模型MEMMs(MaximumEntro(文章此处忽略..)pyMarkovModels)和条件随机域CRFs(ConditionsRandomFields),分析三种算法的特征及优劣性,并使用这三种算法对英文文献进行词性标注,而后识别蛋白质和DNA等实体名称。在算法设计过程中,本文结合英文构词特征和语法知识,引入了前缀后缀和单词固定搭配对词性的影响,以句子为单位对英文单词进行词性标注。英文单词中,介词、代词等单词通过前缀后缀无法判断词性,统计其在训练样本中的词频,将高频单词按照词性分为不同的高频词集合,在词性标注时通过字符串匹配的方法标记词(此处忽略..)性。在识别生物实体名称过程中,本文首先在训练样本中统计各种实体名称中出现频率较高的单词,作为特征单词集。之后根据词性标注的结果,通过前后文单词词性确定词组边界,在名词词组中使用字符串匹配的方法查找是否出现表示实体名称的特征单词,以此判断此词组是否为实体名称。通过观察训练样本中已标记实体类型的语句,发现不同类型的实体会出现同名的情况,同时不同类型的实体名称中会出现相同的特征单词。为了解决这两个问题,本文使用了特征单词等级策略,当实体名重名或特征单词重复出现时,根据特征单词的等级区分实体(文章此处忽略..)类别。本文以GENIAProject上提供的语料库GENIACorpus作为主要数据集,使用隐马尔可夫模型、最大熵马尔可夫模型和条件随机域对语料库中的语句标注词性,再根据词性序列识别语句中的蛋白质、DNA、RNA、细胞系和细胞类型名称。通过比较实验结果,可以看出CRFs在词性标注准确率和生物实体名称识别中的性能强于HMM和MEMMs。为了评价本文提出的特征单词等级策略,对使用策略前后的两次实验结果进行了比较,可以看出使用了特征单词等级策略后,在识别到的各种实体名称中,错误的数目均有所(文章此处忽略..)减少。算法召回率略低于未使用特征单词等级策略的实验结果,但算法在准确率上的提升幅度明显。通过比较召回率和准确率的综合评价指标F值,可以看出特征单词等级策略对算法的性能有明显提高。通过对改进的CRFs与GENIAtagger在识别生物实体时的性能比较,根据实验结果可以看出,本文使用的基于词缀及特征单词等级的生物实体名称识别方法性能略强于GENIAtagger,其中识别DNA和RNA的优势最明显,在准确率、召回率两方面均高于GENIAtagger,F值分别提高6.29%和4.56%。


以上为本篇毕业论文范文基于词缀及特征单词等级的生物实体名称识别方法的介绍部分。
本论文在医药医学论文栏目,由论文网(www.zjwd.net)整理,更多论文,请点论文范文查找

毕业论文降重
收费专业论文范文
收费专业论文
汉语言文学论文
物理学论文
自动化专业论文
测控技术专业论文
历史学专业论文
机械模具专业论文
金融专业论文
电子通信专业论文
材料科学专业论文
英语专业论文
会计专业论文
行政管理专业论文
财务管理专业论文
电子商务国贸专业
法律专业论文
教育技术学专业论文
物流专业论文
人力资源专业论文
生物工程专业论文
市场营销专业论文
土木工程专业论文
化学工程专业论文
文化产业管理论文
工商管理专业论文
护理专业论文
数学教育专业论文
数学与应用数学专业
心理学专业论文
信息管理专业论文
工程管理专业论文
工业工程专业论文
制药工程专业论文
电子机电信息论文
现代教育技术专业
新闻专业论文
热能与动力设计论文
教育管理专业论文
日语专业论文
德语专业论文
轻化工程专业论文
社会工作专业论文
乡镇企业管理
给水排水专业
服装设计专业论文
电视制片管理专业
旅游管理专业论文
物业管理专业论文
信息管理专业论文
包装工程专业论文
印刷工程专业论文
动画专业论文
营销专业论文范文
工商管理论文范文
汉语言文学论文范文
法律专业论文范文
教育管理论文范文
小学教育论文范文
学前教育论文范文
财务会计论文范文

电子商务论文范文

上一篇:聚二甲基硅氧烷表面的树状化合物.. 下一篇:cNO声门上型喉癌颈部淋巴结的处理..

最新论文

精品推荐

毕业论文排版

热门论文


本站简介 | 联系方式 | 论文改重 | 免费获取 | 论文交换

本站部分论文来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:229120615@qq.com

毕业论文范文-论文范文-论文同学网(www.zjwd.net)提供医药医学论文毕业论文,毕业论文范文,毕业设计,论文范文,毕业设计格式范文,论文格式范文

Copyright@ 2010-2024 zjwd.net 毕业论文范文-论文范文-论文同学网 版权所有