当前位置:首页 > 文化科学教育体育
面向信息检索的汉语同义词自动识别

面向信息检索的汉语同义词自动识别PDF格式文档图书下载

文化科学教育体育

  • 购买点数:8
  • 作 者:陆勇编著
  • 出 版 社:南京:东南大学出版社
  • 出版年份:2009
  • ISBN:9787564119133
  • 标注页数:134 页
  • PDF页数:155 页
图书介绍:本丛书是在学位论文及社科基金研究报告基础上写成,主题是情报检索语言(或知识组织系统)在网络环境信息组织中的应用。包括了近10年来南京农大信息检索实验室的一批研究成果,诸如:知识组织系统(叙词表、分类表、本体等)的自动构建、文本的自动标引和自动分类;中文同义词的自动识别;情报检索语言的互操作等。其中既有系统全面的理论分析;也有深入的系统和技术要点的讨论。

查看更多关于面向信息检索的汉语同义词自动识别的内容

图书介绍

第1章 同义词的界定及自动识别的必要性 1

1.1面向信息检索的同义词的定义 1

1.2同义词自动识别的应用 4

1.3面向信息检索的同义词自动识别的必要性 8

1.4同义词发现的途径和方法 10

1.5本书的主要内容 11

第2章 国外语义相关性和相似度研究进展 14

2.1基于英文单词字面相似度的方法 14

2.2基于词汇同现分析的统计方法 15

2.3基于向量空间模型的算法 17

2.4基于搜索引擎的方法 19

2.5基于义类词典的方法 22

2.6基于词汇释义的方法 26

2.7基于语料库的方法 28

2.8基于维基百科的词汇语义相关度计算方法 29

第3章 中文同义词研究述评 34

3.1基于中文词汇字面相似度算法 35

3.2基于词素的语义相似度算法 36

3.3基于《同义词词林》的语义相似度算法 39

3.4基于《知网》的语义相似度算法 40

3.5基于向量空间模型的统计方法 44

3.6基于信息检索的方法 46

3.7基于本体的语义相似度算法 46

3.8综合方法 47

第4章 基于语义体系的同义词自动识别 50

4.1《同义词词林》简介 50

4.2基于《同义词词林》语义体系的相似度算法 51

4.3基于语义体系的同义词识别方法的测评 60

第5章 基于模式匹配的同义词自动获取 65

5.1语料的选择 65

5.2概念定义模式 66

5.3 Web同义词模式 69

5.4模式获取的方法 70

5.5模式的类型和表示 72

5.6模式归纳和提取的原则 78

5.7模式性能评价 78

5.8实验结果 80

5.9其他资源(叙词表)同义词模式 82

5.10模式匹配的特点 85

5.11本章小结 85

第6章 词间关系推导 87

6.1词间关系的类型 87

6.2同义关系 87

6.3反义关系 88

6.4上、下位关系 88

6.5推导规则的表示 89

6.6词汇关系推导 91

6.7本章小结 93

第7章 基于PageRank算法的同义词自动识别 94

7.1 PageRank算法介绍 94

7.2数据来源和预处理 96

7.3汉语分词和抽词词典 97

7.4构造词汇矩阵 98

7.5 PageRank值计算 103

7.6数据测试结果 105

7.8本章小结 106

第8章 面向信息检索的汉语同义词自动挖掘系统 108

8.1同义词自动挖掘系统的设计思路 108

8.2同义词自动挖掘系统的流程 110

8.3系统总体设计 110

8.4实验结果及分析 116

8.5本章小结 118

附录 120

附录1 模式提取的同义词结果(样例) 120

附录2 PageRank算法提取同义词结果(样例) 123

名称索引 126

主题索引 129

后记 133

查看更多关于面向信息检索的汉语同义词自动识别的内容

返回顶部