您的位置: 首页-> 文档分类-> 学位论文-> 理科论文 收藏此页到365Key

本类下载TOP10

4语音播报记事器
4上海市人口发展预测(统计学论文)
4虚拟示波器设计—USB高速数据采集器设计
4计算器模拟系统设计
4智能电子秤的设计
4dvd租赁建模解决方案
4电磁波辐射的问题
4计量经济论文
4基于VHDL的十字路口
4汉语股市公告信息抽取系统的设计与实现

汉语股市公告信息抽取系统的设计与实现

文档类别: 理科论文
文档大小: 355K
文档评级:
文档格式: Word文件,WPS格式文档
文档更新: 2007-5-16 19:43:35
页面刷新: 2008-11-1 10:23:36
下载次数: 108
其它信息:  
 
 

全文下载

Word文件格式下载

0 文钱


文钱不够?

   
文档介绍:  


摘要

本文介绍了一个基于中文信息抽取模型的股市公告信息抽取系统(SBIES)的设计与实现。介绍了该系统的结构框架和分布图。讨论了汉语信息抽取模型的具体结构,构建了由自动分词、自动标注和模板填充三个阶段组成的简化模型。简单介绍了自动分词的常用算法和自动标注中的标注规范。重点探讨了模板填充的具体算法。文中分别讨论了采用基于规则的结构主义方法和基于语料库概率统计的功能主义方法。着重讨论了采用隐马尔科夫模型进行信息抽取的具体算法。对模型的参数获取算法作了讨论,改进了Baum-Welch算法以适应信息抽取的应用。对领域文本做了人工标注,通过计算机处理获取所需的统计数据。利用统计数据完善HMM模型。

关键词:信息抽取 隐马尔科夫模型 自然语言
目 录
1 概述 1
1.1 信息抽取技术(INFORMATION EXTRACTION) 1
1.1.1 信息抽取技术的发展 1
1.1.2 信息抽取技术的特点 3
1.2 股市公告信息抽取系统(SBIES) 3
1.2.1 应用背景 3
1.2.2 系统框架结构 4
1.2.3 系统分布结构 5
1.3 本文内容简介 5
2 信息抽取模块的设计 7
2.1 模块内部结构 7
2.1.1 串行化的模块内部结构及其问题 7
2.1.2 简化的高性能信息抽取模型 8
2.2 自动分词 9
2.3 词类自动标注 10
3 信息抽取的关键算法 13
3.1 传统语言学方法 13
3.1.1 基于规则的信息抽取算法 13
3.1.2 基于规则信息抽取面临的严峻问题 15
3.2 统计学方法 16
3.2.1 基于语料库的统计语言学方法 16
3.2.2 隐马尔科夫模型(HMM)简介 16
3.2.3 隐马尔科夫模型(HMM)在信息抽取上的应用 17
3.2.4 隐马尔科夫模型的训练与优化问题 19
4 实现与结果分析 20
4.1 模块实现情况 20
4.2 两种信息抽取方法的比较 21
4.3 结果总结 21
4.4 遗留的问题 22
参考文献 23
致谢 24

相关文档:
注意事项:
如果出现该页无法显示,请多试几次;如果总是不能下载,请点击报告错误,谢谢!
☉部分文档使用了最新版的[WinRAR]才能正常解压,该文档可在首页下载;如有其它问题,欢迎发信联系管理员
由于网站服务器承受能力有限,请其他网站不要直接链接我们提供的文档,谢谢!!
网赚365