绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 3
  (已选择0条) 清除 结果分析
找到 54 条结果
摘要:文章以茶油为原料,利用超声辅助酶法合成了异丙酯.考察了超声功率、超声预处理时间、酶添加量、底物比和反应温度对异丙酯得率的影响.通过响应面确定了最优工艺条件为超声功率200 W、超声预处理时间5 min、酶添加量220 U/g、底物比6:1、反应温度60℃,在此条件下反应6 h异丙酯得率在93.64% 以上;同时Novozym 435脂肪酶在最佳条件下反应10批次后仍有较高的稳定性....
[期刊论文] 黄浩 唐昊 周雷 程文娟
-
北大核心 CSTPCD CSCD AJ CBST SA
-
摘要:研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题.在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,在状态相关的情况下,给出全局优化算法进行鲁棒控制策略求解.首先,运用遗传算法求解固定策略下的最差性能值;其次,根据求解得到的最差性能值,运用模拟退火算法求解最优鲁棒控制策略.仿真结果表明,服务率不确定的CSPS系统的最优鲁棒性能代价与服务率固定为区间中值系统的最优性能代价相差不大,并且随着不确定区间的缩小,两者的差值越小,说明了全局优化算法的有效性....
[期刊论文] 唐昊 许玲玲 周雷 谭琦
-
北大核心 CSTPCD CSCD EI CBST SA
-
摘要:本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性....
[期刊论文] 周雷 苏红 唐昊 韩江洪
-
北大核心 CSTPCD CSCD
-
摘要:网络生命周期是评价能量受限无线网络性能的重要指标之一,如何有效延长网络生命周期是影响该类无线网络实际应用的重要问题,优化发射功率或节约能耗是比较常见的解决方法之一。针对直接和协作2种传输链路,将协作通信技术与路由机制相结合,并基于节点的位置信息,提出一种最大化网络生命周期的协作路由算法。该算法在保证一定中断率的前提下,运用非线性规划方法求解最优发射功率,进而构建由节点发射能耗、接收能耗和剩余能量组成的权值代价公式。然后,基于Dijkstra’ s最短路径,依据权值代价公式建立从源节点到目的节点的协作路由。仿真实验结果表明,该算法可以降低节点的发射功率,减少节点的能量消耗,从而有效的延长网络生命周期。...
[期刊论文] 唐昊 张晓艳 韩江洪 周雷
-
EI CSTPCD 北大核心
-
摘要:针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(HierarchicalReinforcementLearning,HRL)来解决其“维数灾”和“建模难”问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可有效加速策略学习过程.其中,Option方法可将系统目标任务分解成多个子目标任务来学习和执行,层次化结构清晰,是具有代表性的HRL方法之一.传统的Option算法主要是建立在离散时间半马尔可夫决策过程(Semi-MarkovDecisionProcesses,SMDP)和折扣性能准则基础上,无法直接用于解决连续时间无穷任务问题.因此本文在连续时间SMDP框架及其性能势理论下,结合现有的Option算法思想,运用连续时间SMDP的相关学习公式,建立一种适用于平均或折扣性能准则的连续时间统一Option分层强化学习模型,并给出相应的在线学习优化算法.最后通过机器人垃圾收集系统为仿真实例,说明了这种HRL算法在解决连续时间无穷任务优化控制问题方面的有效性,同时也说明其与连续时间模拟退火Q学习相比,具有节约存储空间、优化精度高和优化速度快的优势....
[期刊论文] 唐昊 裴荣 周雷 谭琦
-
北大核心 CSTPCD CSCD CBST SA
-
摘要:单站点传送带给料加工站(Conveyor-serviced production station, CSPS)系统中,可运用强化学习对状态–行动空间进行有效探索,以搜索近似最优的前视距离控制策略。但是多站点CSPS系统的协同控制问题中,系统状态空间的大小会随着站点个数的增加和缓存库容量的增加而成指数形式(或几何级数)增长,从而导致维数灾,影响学习算法的收敛速度和优化效果。为此,本文在站点局域信息交互机制的基础上引入状态聚类的方法,以减小每个站点学习空间的大小和复杂性。首先,将多个站点看作相对独立的学习主体,且各自仅考虑邻近下游站点的缓存库的状态并纳入其性能值学习过程;其次,将原状态空间划分成多个不相交的子集,每个子集用一个抽象状态表示,然后,建立基于状态聚类的多站点反馈式Q学习算法。通过该方法,可在抽象状态空间上对各站点的前视距离策略进行优化学习,以寻求整个系统的生产率最大。仿真实验结果说明,与一般的多站点反馈式Q学习方法相比,基于状态聚类的多站点反馈式Q学习方法不仅具有收敛速度快的优点,而且还在一定程度上提高了系统生产率。...
[期刊论文] 苏红 唐昊 周雷 江琦
-
CSTPCD CSCD AJ CBST SA
-
摘要:  研究了无线协作网络中的中继选择问题,允许中继具有缓存数据的能力,提出了一种带有buffer的能量有效性中继选择算法,以延长网络生命周期并提高系统吞吐量。该算法综合考虑链路信息,中继的队列状态以及节点的剩余能量信息,通过加权效用公式选择最优接收数据中继与最优发送数据中继。考虑源节点与中继节点间的功率分配,以降低因源节点到中继节点以及中继节点到目的节点间的信道速率不一致所引起的系统丢包率。仿真实验结果表明,该算法有效地延长了网络的生命周期,随着中继个数的增加网络吞吐量有明显的提高,考虑功率分配后,有效降低了系统丢包率。...
摘要:针对Internet环境的动态性和Web服务的不确定性,文章使用有限状态连续时间半马尔可夫决策过程(Semi-Markov Decision Process,简称SMDP)对服务组合进行建模,并给出了服务组合的Q学习优化算法,以获得最优的服务组合策略.通过仿真实验验证了该算法的有效性,仿真结果表明,使用动态的控制方法具有较高的服务组合成功率....
摘要:文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CTMDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学习具有收敛速度快、存储空间小的优势;根据实验结果分析了在最优策略下业务拒绝率与业务特征的关系....
[期刊论文] 程文娟 穆自立 唐昊 周雷
-
北大核心 CSTPCD CSCD AJ EI CBST
-
摘要:相对于传统方式的无线传感器网络结构,带Mobile Agent(MA)的无线传感器网络(sensor network with mobile agent,SENMA)具有更高的能量效率和更长的网络生存时间.设计了一种针对SENMA的分簇算法:依据节点之间的位置关系将节点分为多个簇并选举出簇头节点,每个簇中,簇成员不与簇头进行通信,由簇头将监测数据回传至MA.实验证明这种算法能较好地平衡节点负载,缓解因节点失效导致的网络性能衰减....
[期刊论文] 唐昊 丁丽洁 程文娟 周雷
-
北大核心 CSTPCD CSCD EI CBST SA
-
摘要:研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在"维数灾"问题,传统的数值优化难以进行.根据小脑模犁关节控制器(CMAC)具有收敛速度快和适应性强的特点,运用该结构作为Q值函数的逼近器,并与Q学习和性能势概念相结合,给出了一种适用于平均或折扣性能准则的CMAC-Q学习优化算法.仿真结果说明,这种神经元动态规划方法比常规的Q学习算法具有节省存储空间,优化精度高和优化速度快的优势....
[期刊论文] 程文娟 唐昊 李豹 周雷
-
北大核心 CSTPCD CSCD CBST SA
-
摘要:在性能势理论框架内,研究折扣和平均准则马尔可夫决策过程(MDP)的统一并行Q学习算法.提出了独立并行Q学习算法和状态划分并行Q学习算法,重点讨论了算法中的关键参数的设计,即同步点如何选择的同步策略和如何合成Q因子的Q值构建策略,给出了一种固定步长结合一定偏移量的同步策略,并分析了并行中Q值构建策略的确定原则,给出了几种Q值构建策略的选择方法.仿真实验表明并行Q学习算法的有效性....
[期刊论文] 李豹 程文娟 周雷 唐昊
-
北大核心 CSTPCD CSCD CBST SA
-
摘要:Rollout算法是Bertsekas提出的求解马尔科夫决策过程(MDP)问题的一种仿真优化算法.文章研究Rollout算法求解多类商品库存控制问题,给出了基于性能势和神经元动态规划的Rollout优化算法.另外,为了降低运算时间,文章提出了两种Rollout并行求解算法,并讨论了这两种并行算法各自的适用场合.实验结果表明,Rollout算法能满足模型未知系统的优化要求,具有较好的并行性能....
[期刊论文] 唐昊 陈栋 周雷 吴玉华
-
北大核心 CSTPCD CSCD AJ EI CBST SA
-
摘要:研究半马尔可夫决策过程(SMDP)基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP的一致马尔可夫链的单个样本轨道,给出了折扣和平均准则下统一的性能势TD(λ)学习算法,进行逼近策略评估;利用一个神经元网络逼近结构作为行动器(Actor)表示策略,并根据性能势的学习值给出策略参数改进的两种方法.最后通过数值例子说明了有关算法的有效性....
[期刊论文] 吴玉华 唐昊 周雷
-
北大核心 CSTPCD CSCD EI
-
摘要:运用基于性能势的M步向前(look-ahead)异步策略迭代算法研究了半Markov决策过程(SMDP)优化问题.首先给出了基于性能势理论求解的一种M步向前策略迭代算法.该算法不仅对标准策略迭代算法和一般的异步策略迭代算法都适用,而且对SMDP在折扣和平均准则下的优化也是统一的;另外给出了两种性能准则下基于即时差分学习的M步向前仿真策略迭代.最后通过一个数值算例比较了各种算法的特点....
[期刊论文] 唐昊 周雷 袁继彬
-
北大核心 CSTPCD CSCD EI CBST SA
-
摘要:为适应实际大规模Markov系统的需要,讨论Markov决策过程(MDP)基于仿真的学习优化问题.根据定义式,建立性能势在平均和折扣性能准则下统一的即时差分公式,并利用一个神经元网络来表示性能势的估计值,导出参数TD(0)学习公式和算法,进行逼近策略评估;然后,根据性能势的逼近值,通过逼近策略迭代来实现两种准则下统一的神经元动态规划(neuro-dynamic programming,NDP)优化方法.研究结果适用于半Markov决策过程,并通过一个数值例子,说明了文中的神经元策略迭代算法对两种准则都适用,验证了平均问题是折扣问题当折扣因子趋近于零时的极限情况....
[期刊论文] 唐昊 吴玉华 周雷
-
北大核心 CSTPCD CSCD EI
-
摘要:针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性.另外,讨论了两 种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进.结果表明,该算法可直接适用于连续时间Markov决策过程.最后通过一个数值例子来比较各种算法的特点....
摘要:针对工业现场的特定环境及对螺纹钢打捆时端面图像分割的特殊要求,提出了一种基于融合技术的图像分割方案.该方案先分别采用阈值化与基于边界的分割方法对图像进行初始分割,然后将所得数据加以关联并采用遗传算法加以融合与提取.实验结果表明该方法有利于提高分割质量....
[专利] 发明专利 CN201910235244.0
合肥工业大学 2019-06-11
摘要:本发明公开了一种不考虑延时等待的CSPS系统控制方法。该控制方法用于可移动拾取式CSPS系统,在加工或卸载的过程中,不考虑延时等待的时间,通过基于模拟退火思想的Q‑学习算法,对系统进行优化。以此达到提高系统的生产率和性能的目的。
[专利] 发明专利 CN201810402936.5
合肥工业大学 2018-10-02
摘要:本发明公开了一种非泊松工件流CSPS系统优化控制及仿真测试方法,其特征是:用马尔可夫调制泊松过程MMPP模拟非泊松到达过程,获得非泊松工件流CSPS系统优化控制策略;在相同的理论平均到达率下,测试非泊松工件流CSPS系统优化控制策略;在工件非泊松到达情况下,以统计平均到达率作为工件标准泊松到达率,测试非泊松工件流CSPS系统优化控制策略。本发明能在工件非泊松到达,CSPS系统无法建立为SMDP模型情况下,获得系统优化控制策略并测试Q学习算法的适用性。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部