Flume 构建高可用、可扩展的海量日志采集系统PDF格式文档图书下载
- 购买点数:10 点
- 作 者:(美)史瑞德哈伦著
- 出 版 社:北京:电子工业出版社
- 出版年份:2015
- ISBN:9787121265587
- 标注页数:208 页
- PDF页数:227 页
第1章 认识Apache Hadoop和Apache HBase 1
分布式文件系统HDFS 1
HDFS的数据格式 3
处理HDFS中的数据 4
Apache HBase 4
总结 5
参考文献 6
第2章 用Apache Flume处理流数据 7
我们需要Flume 7
Flume是否适合呢? 9
Flume Agent内部原理 10
配置Flume Agent 13
Flume Agent之间的相互通信 17
复杂的流 17
复制数据到不同目的地 20
动态路由 21
Flume的无数据丢失保证,Channel和事务 22
Flume Channel中的事务 23
Agent失败和数据丢失 25
批量的重要性 26
重复怎么样? 27
运行Flume Agent 27
总结 29
参考文献 30
第3章 源(Source) 31
Source的生命周期 31
Sink-to-Source通信 33
Avro Source 34
Thrift Source 37
RPC Sources的失败处理 39
HTTP Source 40
针对HTTP Source写处理程序 42
Spooling Directory Source 47
使用Deserializers读取自定义格式 50
Spooling Directory Source性能 55
Syslog Source 55
Exec Source 59
JMS Source 61
转换JMS消息为Flume事件 63
编写自定义Source 65
Event-Driven Source和Pollable Source 66
总结 73
参考文献 73
第4章 Channel 75
事务工作流 76
Flume自带的Channel 78
Memory Channel 78
File Channel 80
总结 86
参考文献 86
第5章 Sink 87
Sink的生命周期 88
优化Sink的性能 89
写入到HDFS:HDFS Sink 89
理解Bucket 90
配置HDFS Sink 93
使用序列化器控制数据格式 100
HBase Sink 106
用序列化器将Flume事件转换成HBase Put和Increment 108
RPC Sink 113
Avro Sink 113
Thrift Sink 115
Morphline Solr Sink 116
Elastic Search Sink 119
自定义数据格式 121
其他Sink:Null Sink、Rolling File Sink和Logger Sink 124
编写自定义Sink 125
总结 129
参考文献 129
第6章 拦截器、Channel选择器、Sink组和Sink处理器 131
拦截器 131
时间戳拦截器 132
主机拦截器 133
静态拦截器 133
正则过滤拦截器 134
Morphline拦截器 135
UUID拦截器 136
编写拦截器 137
Channel选择器 140
复制Channel选择器 140
多路复用Channel选择器 141
自定义Channel选择器 144
Sink组和Sink处理器 146
Load-Balancing Sink处理器 148
Failover Sink处理器 151
总结 153
参考文献 154
第7章 发送数据到Flume 155
构建Flume事件 155
Flume客户端SDK 156
创建Flume RPC客户端 157
RPC客户端接口 157
所有RPC客户端的公共配置参数 158
默认RPC客户端 165
Load-Balancing RPC客户端 168
Failover RPC客户端 171
Thrift RPC客户端 172
嵌入式Agent 173
配置嵌入式Agent 175
log4j Appender 180
Load-Balancing log4j Appender 181
总结 182
参考文献 183
第8章 规划、部署和监控Flume 185
规划一个Flume部署 185
修复时间 185
我的Flume Channel需要多少容量? 186
多少层? 186
通过跨数据中心链接发送数据 188
层分片 190
部署Flume 191
部署自定义代码 191
监控Flume 193
从自定义组件报告度量 196
总结 196
参考文献 196
索引 197
- 《Flume 构建高可用、可扩展的海量日志采集系统》(美)史瑞德哈伦著 2015
- 《PYTHON云原生 构建应对海量用户数据的高可扩展WEB应用》(印)Manish Sethi著 2018
- 《Python云原生 构建应对海量用户数据的高可扩展Web应用》(印)ManishSeathi著;宋净超译 2018
- 《海量数据存储》方粮编著 2016
- 《海量运维监控系统规划与部署》付哲编著 2015
- 《海量网络存储系统原理与设计》曹强,黄建忠,谢长生著 2010
- 《互联网运营智慧 高可用可扩展网站技术实战》田逸著 2011
- 《可伸缩架构 面向增长应用的高可用》(美)李·艾奇逊(Lee Atchison) 2017
- 《Oracle Database 10g DBA手册 管理健壮的、可扩展的、高可用的Oracle数据库》(美)Kevin Loney,(美)Bob Bryla著;朱洁梅,王海涛译 2006
- 《构建高可用Linux服务器 第2版》余洪春著 2018
- 《Flume 构建高可用、可扩展的海量日志采集系统》(美)史瑞德哈伦著 2015
- 《Java 5游戏编程》(美)哈伦(Harbour,J.S.)著;李强等译 2007
- 《剑桥中国 辽西夏金元史 09》(德)傅海波,(英)崔瑞德编;史卫民,马晓光,刘晓,吴玉贵,定宜庄,陈煜,何峻,王湘云译;陈高华,史卫民,马晓光,石晓校订 1998
- 《速成经济学家》(美)普尔,(美)拉罗著;金瑞德,张邦辉译 1991
- 《震慑论》(美)哈伦·厄尔曼(Harlan K.Ullman)等著;滕建群等译 2004
- 《迅速制敌 一场真正的军事革命》(美)哈伦·厄尔曼(Harlan K.Ullman),(美)詹姆斯·韦德(James P.Wade)著;滕建群,王春生译 2004
- 《颅骶椎手法调理术》(美)约翰·优普哲,(美)乔恩·傅瑞德著;董福慧,章瑛译 2018
- 《罗马名人传》(美)约翰·哈伦,艾迪生·波伦著;黄波译 2016
- 《公司估值 原书第2版》(美)大卫·弗里克曼,(美)雅各布·托勒瑞德著;注册估值分析师协会译 2017
- 《个人电脑故障诊断案例》(美)大卫·史通(David Stone),(美)阿尔佛瑞德·普尔(Alfred Poor)著;《视窗世界》编辑部译 2002
- 《北京工业志 电子志》卜世成,高玉庆主编 2001
- 《北京志 工业卷 68 电子工业志 仪器仪表工业志》北京市地方志编纂委员会编著 2001
- 《网络互联技术手册 第2版》(美)(K.唐斯)Kevin Downes等著;包晓露等译 1999
- 《当代北京广播电视和电子元件工业》《当代北京工业丛书》编辑部编 1988
- 《电子电路实验》梅开乡,梅军进主编;陈大力,吴勇平,李鹏鹏副主编 2014
- 《操作系统》韩仲清主编 1990
- 《'94北京国际电子出版研讨会论文集》粟武宾主编 1994
- 《dBASE Ⅲ PLUS》GOTOP编著 1995
- 《PowerPoint 97 操作导引》王耆,李文润编著 1998
- 《多媒体数据压缩技术》高文著 1994