绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除 结果分析
找到 7 条结果
[期刊论文] 苏晨 张玉洁 郭振 徐金安
-
北大核心 CSTPCD CSCD AJ CA CBST SA
-
摘要:为了缓解双语语料不足导致的翻译知识欠缺问题,提出基于复述技术的翻译框架.此框架利用第三种语言获取带有概率的复述知识表,以Lattice表示输入句子的多种复述形式,扩展解码器使之可以对Lattice形式的输入进行解码,将复述知识作为特征加入到对数线性模型的目标函数中.在保持原始翻译知识表不变的情况下,此框架不仅可以增大短语翻译表对源语言现象的覆盖率,也能够增加候选译文表现形式的多样性.在3个不同规模训练集上的对比实验结果表明,在训练语料规模最小的情况下(10 K句对),系统性能有明显提升(BLEU+l.4%);在训练语料规模最大的情况下(1M句对),系统性能也取得一定提升(BLEU+0.32%)....
[期刊论文] 郭振 张玉洁 苏晨 徐金安
-
北大核心 CSTPCD CSCD CBST
-
摘要:目前,基于转移的中文分词、词性标注和依存句法分析联合模型存在两大问题:一是任务的融合方式有待改进;二是模型性能受限于全标注语料的规模.针对第一个问题,该文利用词语内部结构将基于词语的依存句法树扩展成了基于字符的依存句法树,采用转移策略,实现了基于字符的中文分词、词性标注和依存句法分析联合模型;依据序列标注的中文分词方法,将基于转移的中文分词处理方案重新设计为4种转移动作:Shift S、Shift B、Shift M和Shift E,同时能够将以往中文分词的研究成果融入联合模型.针对第二个问题,该文使用具有部分标注信息的语料,从中抽取字符串层面的n-gram特征和结构层面的依存子树特征融入联合模型,实现了半监督的中文分词、词性标注和依存句法分析联合模型.在宾州中文树库上的实验结果表明,该文的模型在中文分词、词性标注和依存分析任务上的F1值分别达到了98.31%、94.84%和81.71%,较单任务模型的结果分别提升了0.92%、1.77%和3.95%.其中,中文分词和词性标注在目前公布的研究结果中取得了最好成绩....
[期刊论文] 苏晨 张玉洁 郭振 徐金安
-
北大核心 CSTPCD CSCD CBST
-
摘要:在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高.这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量.为解决这个问题,该文实现了基于生语料的领域自适应分词模型和双语引导的汉语分词,并提出融合多种分词结果的方法,通过构建格状结构(Lattice)并使用动态规划算法得到最佳汉语分词结果.为了验证所提方法,我们在NTCIR-10的汉英数据集上进行了评价实验.实验结果表明,该文提出的融合多种分词结果的汉语分词方法在分词精度F值和统计机器翻译的BLEU值上均得到了提高....
[专利] 发明专利 CN201810562791.5
北京交通大学 2018-11-13
摘要:一种示波器自动测试系统及方法,属于测量仪器技术领域。基于LabVIEW平台自制一套示波器自动测试软件,可控制数字示波器自动设置测量参数;自动解除单次触发后的停止采集状态,实现信号的连续自动采集;自动存储采集数据至PC机,解决了数字示波器存储深度不足的问题,实现无人值守下信号长时间的测量与记录;根据测试需求,实现预定测试序列自动测量;根据信号的变化自动调整测量档位(水平时基、垂直档位),实现未知信号的自适应测量。
[硕士论文] 苏晨
控制工程 北京交通大学 2018(学位年度)
摘要:数字示波器集成了信号调理、高速采样、信号分析与显示,可完成信号采集与信号参数的测量。但多数数字示波器存储深度有限,无法实现信号长时间记录。此外,数字示波器不能按预设测试序列自动设置测量参数,以实现不同测试项目的自动测量;也不能根据信号幅值、频率的变化自动调整测量参数,以保证测量精度,不具备自适应性。本文基于自动化测试的工程背景,在LabVIEW平台开发一套自动测试软件,可以控制数字示波器实现按预设序列自动测试、对未知信号的自适应测量、以及数据的深度存储等。本文的主要工作如下:
  第一,分析数字示波器的优点与不足,提出示波器自动测试系统的功能需求。根据功能需求,设计了系统总体框架,主要包括数据采集、数据存储、预设序列自动测试、自适应测量等六个模块。
  第二,通过数据通信模块与数据采集模块,实现了示波器测试参数的自动设置,信号的自动采集与信号特征参数的测量。在数据存储模块中,设计程序在PC机实时保存采集数据,充分利用PC机硬盘的深度存储空间,解决数字示波器存储深度不足的缺陷。通过预设序列自动测试模块,实现了复杂序列的自动测量与信号的筛选,提高了测试效率。基于数据回放平台,通过重建信号波形与信号的FFT,实现了信号的时域和频域的分析。
  第三,对信号自适应测量的方法进行深入研究,分析信号自适应测量的控制参数,设计了基于模糊控制理论的信号自适应测量方法。在LabVIEW平台设计模糊控制器,可根据信号的幅值、频率选择最佳的测量档位,提高了测量的准确程度,实现了量程内信号的自适应测量。设计了二分查找法结合步进控制的信号自适应测量方法,实现了过量程信号的自适应测量。
  第四,设计实验验证系统自动测试功能、自适应测量功能、存储深度与存储速度等性能指标。搭建25Hz相敏轨道电路工程测试环境。利用示波器自动测试系统记录扼流变压器不同状态下的测试数据,验证系统的实用性。
摘要:为了缓解双语语料不足导致的翻译知识欠缺问题,提出基于复述技术的翻译框架.此框架利用第三种语言获取带有概率的复述知识表,以Lattice表示输入句子的多种复述形式,扩展解码器使之可以对Lattice形式的输入进行解码,将复述知识作为特征加入到对数线性模型的目标函数中.在保持原始翻译知识表不变的情况下,此框架不仅可以增大短语翻译表对源语言现象的覆盖率,也能够增加候选译文表现形式的多样性.在3个不同规模训练集上的对比实验结果表明,在训练语料规模最小的情况下(10 K句对),系统性能有明显提升(BLEU+1.4%);在训练语料规模最大的情况下(1M句对),系统性能也取得一定提升(BLEU+0.32%).
[硕士论文] 苏晨
计算机科学与技术 北京交通大学 2015(学位年度)
摘要:统计机器翻译是目前主流的机器翻译方法,它以统计模型为基础,可以高效地获取翻译知识、快速地开发性能优良的翻译系统。但是当领域发生变化时,利用现有的统计机器翻译方法难以开发出令人满意的机器翻译系统。一方面,在中英科技文献领域应用统计机器翻译时,领域变化带来的中文分词精度的下降会给获取高质量翻译知识带来很大障碍;另一方面,新领域往往引入大量的特有词汇,造成翻译系统已有的翻译知识无法对其进行翻译。
  针对领域变化引起的问题,本文重点研究面向统计机器翻译的领域自适应方法,以提高翻译知识的质量和覆盖率。这些方法包括面向统计机器翻译的中文分词的领域自适应方法和复述技术的应用方法,都以提高统计机器翻译系统的领域自适应能力为目标。本文主要包括以下两方面工作:
  (1)针对领域变化引起的中文分词精度下降问题,本文提出了利用大规模生语料中n-gram统计特征的中文分词方法和基于平行语料引导的中文分词方法。在此基础上,本文提出了基于线性模型的多特征融合方法,将不同方法的分词结果进行融合,为不同领域中汉外统计机器翻译系统的开发提供了解决方案。实验结果表明,融合多种分词结果的方法在分词精度和统计机器翻译系统的翻译性能上均取得了提升。
  (2)对于新领域特有词汇降低统计机器翻译性能的问题,最直接的做法是增加短语表规模,提高翻译知识对新领域词汇的覆盖率,进而增强统计机器翻译的领域适应能力。大规模、高质量的平行语料库难以获得,直接扩充短语表规模的方法受到限制。针对此问题,本文提出了引入复述技术的统计机器翻译系统(复述是同语言同语义的不同表达方式)。其基本思想是:由于自然语言表达多样性的存在,短语表对语义的覆盖率一般高于对短语现象的覆盖率;通过将新领域特有词汇转化为短语表熟知的复述形式,统计机器翻译系统可以为其寻得合适的译文。具体实现中,本文利用第三种语言获取带有概率的复述短语表,用格图表示待翻译句子的多种复述形式,改进机器翻译解码算法使之能够处理格图形式的输入。实验结果表明,在不同规模的数据集上,引入复述特征的翻译系统性能普遍优于传统的统计机器翻译系统,并且系统鲁棒性较好。
  综上所述,为了提升统计机器翻译系统的领域适应能力,本文在翻译知识获取阶段和翻译知识应用阶段进行了改进。实验结果表明本文所提方法增强了统计机器翻译领域适应能力,带来了翻译性能的提升。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部