当前位置:首页 > 文化科学教育体育
信息技术领域新术语提取研究 in the field of information technology

信息技术领域新术语提取研究 in the field of information technologyPDF格式文档图书下载

文化科学教育体育

  • 购买点数:10
  • 作 者:王强军著
  • 出 版 社:呼和浩特:内蒙古人民出版社
  • 出版年份:2005
  • ISBN:7204056086
  • 标注页数:208 页
  • PDF页数:227 页
图书介绍

序 张普 1

前言 1

第一章 绪论 1

第一节 课题的提出 1

第二节 本研究的定位 3

一、术语自动提取 3

二、基于大规模动态流通语料库 4

三、以信息技术领域为切入点 5

四、描述性的术语工作 6

第三节 本书中一些指称的界定 7

第四节 本研究的方法和技术路线 10

一、用接续指数确定字符串的词语度 10

二、用TFIDF和领域相减确定字符串的术语度 11

第五节 本研究的工作流程和实验目标 12

一、本研究的工作流程 12

二、本研究的实验目标和实验结果 13

第六节 本研究的贡献 14

第七节 本书的内容安排 15

第二章 术语学研究及其对术语提取的指导 17

第一节 引言 17

第二节 术语学相关研究 17

一、术语的定义 17

二、术语定义的三个含义 19

三、术语的基本特征 24

四、作为提取对象的术语的特征 26

五、术语和一般词语的关系 30

七、新术语的特点 33

六、新术语 33

八、新术语提取的基本思路 34

第三节 术语提取相关研究 34

一、作为提取对象的术语的分类 34

二、术语提取的定义 37

三、术语提取跟其他自然语言处理研究的关系 38

四、术语提取的方法 39

五、术语提取的工作模式 41

第四节 本章小结 45

第三章 动态语言知识更新 46

第一节 本研究的理论基础及背景介绍 46

一、流通度理论简介 46

二、动态语言知识更新理论 49

三、动态流通语料库(DCC) 51

四、国家语言资源监测与研究中心(平面媒体) 53

五、DCC建设情况 54

第二节 本研究的总体规划和实验流程设计 58

一、本研究的总体规划 58

二、本研究的提取方法和策略 59

第三节 本研究的资源建设和系统开发 60

一、动态流通语料库扩展规划 60

二、术语数据库建设 64

三、统一的语料库建设和术语提取系统 64

第四节 本章小结 68

第四章 术语提取技术分析 69

第一节 引言 69

一、词语度和术语度 69

二、术语的统计学特征 69

第二节 接续指数概念的引入 70

第三节 接续指数及相关术语 73

第四节 接续指数的理论基础 75

第五节 接续指数分析 75

一、接续指数与频率的关系 75

二、接续指数与字符串的关系 79

三、前接指数和后续指数的关系 82

四、接续指数为0的情况 83

第六节 接续指数在术语提取中的应用 88

一、术语提取的范围划定 88

二、术语的接续指数分析 89

三、字符串词语度判断 92

第七节 术语度的判断 93

一、定义 95

第八节 TFIDF介绍 95

二、各参数的取值 97

第九节 TFIDF在术语提取中的作用 98

第十节 TFIDF在术语提取中的不足 103

第十一节 领域相减介绍 105

一、领域相减的定义 105

二、关于领域距离 105

三、学科领域的划分 106

第十二节 领域相减的作用和不足 108

第十三节 两者相结合的方法 109

第十四节 本章小结 109

第二节 IT领域语料库的建设 110

一、建设原则和基本方案 110

第一节 引言 110

第五章 基于DCC的术语提取和更新实验系统 110

二、语料获取和存储 112

第三节 术语提取和更新实验系统介绍 114

一、系统概述 114

二、输入和输出 115

三、各模块介绍 115

四、系统小结 141

第四节 术语提取实验 147

一、实验所用的语料 147

二、实验所用的术语词典 148

三、实验的硬软件环境 148

四、实验流程 149

五、提取结果分析 150

六、新术语提取结果 158

第五节 本章小结 164

第六章 结论和展望 166

第一节 全书总结 166

第二节 今后的工作 168

附录1 CCW02切分结果统计 171

附录2 不同长度的字符串在各频率段的分布 172

附录3 语料库各部分代码 174

附录4 接续指数举例 175

附录5 部分无人工干预的提取结果(一) 179

附录6 部分无人工干预的提取结果(二) 184

附录7 提取结果:新术语(2字) 189

附录8 提取结果:命名实体(2字) 193

参考文献 198

后记 205

查看更多关于信息技术领域新术语提取研究 in the field of information technology的内容

返回顶部