毕业论文范文网-论文范文
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 学前教育 德语论文 工程管理 文化产业 工商管理 会计专业 行政管理 广告学
机械设计 汉语文学 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 药学论文 播音主持 人力资源 金融论文 保险学
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 计算机论 电子信息 市场营销 法学论文 财务管理 投资学
体育教育 小学教育 印刷工程 土木工程 书法论文 护理论文 心理学论 信息管理 公共事业 给水排水 新闻专业 摄影专业 广电编导 经济学
  • 范文首页 |
  • 毕业论文 |
  • 论文范文 |
  • 计算机论文 |
  • 外文翻译 |
  • 工作总结 |
  • 工作计划 |
  • 现成论文 |
  • 论文下载 |
  • 教学设计 |
  • 免费论文 |
  • 原创论文 |
搜索 高级搜索

原创毕业论文

当前位置:毕业论文范文网-论文范文 -> 论文下载 -> 计算机毕业论文范文

基于强化学习的倒立摆控制

 本文ID:ZJWD241519 充值:150元
免费毕业论文范文
免费毕业论文
政治工作论文
计算机论文
营销专业论文
工程管理论文范文
医药医学论文范文
法律论文范文
生物专业论文
物理教学论文范文
人力资源论文范文
化学教学论文范文
电子专业论文范文
历史专业论文
电气工程论文
社会学专业论文
英语专业论文
行政管理论文范文
语文专业论文
电子商务论文范文
焊工钳工技师论文
社科文学论文
教育论文范文
数学论文范文
物流论文范文
建筑专业论文
食品专业论文
财务管理论文范文
工商管理论文范文
会计专业论文范文
专业论文格式
化工材料专业论文
英语教学专业论文
电子通信论文范文
旅游管理论文范文
环境科学专业论文
经济论文
人力资源论文范文
营销专业论文范文
财务管理论文范文
物流论文范文
财务会计论文范文
数学教育论文范文
数学与应用数学论文
电子商务论文范文
法律专业论文范文
工商管理论文范文
汉语言文学论文
计算机专业论文
教育管理论文范文
现代教育技术论文
小学教育论文范文
机械模具专业论文
报告,总结,申请书
心理学论文范文
学前教育论文范文

收费计算机专业论文范文
收费计算机专业论文
Delphi
ASP
VB
JSP
ASP.NET
VB.NET
java
VC
pb
VS
dreamweaver
c#.net
vf
VC++
计算机论文
扫一扫 扫一扫
毕业论文范文题目: 基于强化学习的倒立摆控制,论文范文关键词: 基于强化学习的倒立摆控制
基于强化学习的倒立摆控制毕业论文范文介绍开始:
   硕士学位论文 基于强化学习的倒立摆控制,说明书共61页。
  【摘要】 70年代以来,人们探索不同的学习策略和学习方法,且在本阶段已开始把学习系统与各种应用结合起来,并取得很大的成功,促进机器学习的发展。1980年,在美国的卡内基—梅隆(CMU、)召开了第一届机器学习国际研讨会,标志着机器学习研究已在全世界兴起。1989年,Carbonell发表文章指出机器学习有4个研究方向:连接机器学习、基于符号的归纳机器学习、遗传机器学习与分析机器学习。十年过去了,人们的研究热点发生了转移,1997年,Dietterich提出了另外4个新的研究方向:分类器的集成、海量数据的有教师学习算法、强化机器学习(即强化学习)与学习复杂统计模型。 在1954年,“强化”和“强化学习”这些术语由Minsky首次提出并出现在工程文献上。于1965年,在控制理论中,由Waltz和付京孙分别独立提出这一概念。在六七十年代,强化学习研究进展比较缓慢,进入80年代以后,随着人们人工神经网络的研究不断地取得进展以及计算机技术的进步,人们对强化学习的研究出现了高潮,逐渐成为机器学习研究中的活跃领域。世界各地的学者提出了各种算法及学习策略,也把强化学习应用到很多领域,比如说,游戏比赛,在这方面最早的应用例子是Samuel的下棋程序;调度优化;应用最多的莫过于机器人领域:控制问题,其中典型实例,就是倒立摆控制系统。 在稳定性控制问题上,倒立摆既具有普便性又具有典型性。倒立摆作为一个装置,成本低廉,结构简单。作为一个被控对太原理工大学硕士研究生学位论文象,又相当复杂,高阶次,不稳定,多变量,非线性,强祸合系统,只有采取行之有效的方法方才能使之稳定。而且当一种新的理论和方法提出以后,在不能用理论加以严格证明时,可以用倒立摆系统装置来验证其正确性及实用性。倒立摆的研究不仅有其深刻的理论意义,还有重要的工程背景。直升飞机、火箭飞行、人造卫星的运行、机器人的举重、做体操、及机器人的行走都存在有类似于倒立摆系统稳定控制相似问题。因此,倒立摆的研究对于火箭飞行以及机器人的控制等现代高新技术的研究具有重要的实践意义。 本文主要是在对机器学习、强化学习及倒立摆进行简明面深入的综述的基础上,并把强化学习的思想用于一阶倒立摆和二阶倒立摆的控制,并对学习结果做了进一步的分析,论文中的创新点如下: 首先,本文把强化学习的思想与多维线性插值结合起来平衡控制一阶倒立摆,本算法是把状态空间离散化,用规则表作为值函数的表达结构,用强化学习直接对平衡控制倒立摆所需要的力进行学习。学习结果表明,所学到力与各个状态变量之间的关系几乎呈线性的,所以它为学习线性控制方程的系数做了必要准备。 其次,通过学习一阶、二阶倒立摆控制方程系数,倒立摆取得很好的控制效果。对于二阶倒立摆,本文分析了系数初始值对学习的影响,初始值对学习时间有一定的影响,但对学习效果基本上没影响;从最后学习效果可以看出,此算法对二级倒立摆的控制取得了很好的效果;把一级的学习结果作为二级学习的初始值时,学习时间会大大缩短,因此这种学习方法有很好的从低级到高级的拓展性:它不需要太多的先验知识,是解决一类控制问题的好的学习方法。
  【关键词】 机器学习; 强化学习; 倒立摆;
 


以上为本篇毕业论文范文 基于强化学习的倒立摆控制的介绍部分。

本论文在计算机毕业论文范文栏目,由论文网(www.zjwd.net)整理,更多论文,请点论文范文查找

毕业论文降重 相关论文
收费毕业论文范文
收费毕业论文
汉语言文学论文
物理学论文
自动化专业论文
测控技术专业论文
历史学专业论文
机械模具专业论文
金融专业论文
电子通信专业论文
材料科学专业论文
英语专业论文
会计专业论文
行政管理专业论文
财务管理专业论文
电子商务国贸专业
法律专业论文
教育技术学专业论文
物流专业论文
人力资源专业论文
生物工程专业论文
市场营销专业论文
土木工程专业论文
化学工程专业论文
文化产业管理论文
工商管理专业论文
护理专业论文
数学教育专业论文
数学与应用数学专业
心理学专业论文
信息管理专业论文
工程管理专业论文
工业工程专业论文
制药工程专业论文
电子机电信息论文
现代教育技术专业
新闻专业论文
艺术设计专业论文
采矿专业论文
环境工程专业论文
西班牙语专业论文
热能与动力设计论文
工程力学专业论文
酒店管理专业论文
安全管理专业论文
交通工程专业论文
体育教育专业论文
教育管理专业论文
日语专业论文
德语专业论文
理工科专业论文
轻化工程专业论文
社会工作专业论文
乡镇企业管理
给水排水专业
服装设计专业论文
电视制片管理专业
旅游管理专业论文
物业管理专业论文
信息管理专业论文
包装工程专业论文
印刷工程专业论文
动画专业论文
环境艺术专业论文
信息计算科学专业
物流专业论文范文
人力资源论文范文
营销专业论文范文
工商管理论文范文
汉语言文学论文范文
法律专业论文范文
教育管理论文范文
小学教育论文范文
学前教育论文范文
财务会计论文范文

电子商务论文范文

上一篇: 大专毕业设计 网吧收费系统的结.. 下一篇: 基于图像空间的碰撞检测

最新论文

精品推荐

毕业论文排版

热门论文


本站简介 | 联系方式 | 论文改重 | 免费获取 | 论文交换

本站部分论文来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:229120615@qq.com

毕业论文范文-论文范文-论文同学网(www.zjwd.net)提供计算机毕业论文范文毕业论文,毕业论文范文,毕业设计,论文范文,毕业设计格式范文,论文格式范文

Copyright@ 2010-2024 zjwd.net 毕业论文范文-论文范文-论文同学网 版权所有