hadoop文档下载可以处理pdf文档吗

文档分类:
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,
下载前请先预览,预览内容跟原文是一样的,在线预览图片经过高度压缩,下载原文更清晰。
您的浏览器不支持进度条
淘豆网网友近日为您收集整理了关于Hadoop海量数据处理技术详解与项目实战 PDF电子书下载 带书签目录 sample的文档,希望对您的工作和学习有所帮助。以下是文档介绍:本人可以提供各种PDF电子书资料,计算机类,文学,艺术,设计,医学,理学,经济,金融,等等。质量都很清晰,而且每本100%都带书签和目录,方便读者阅读观看,只要您提供给我书的相关信息,一般我都能找到,如果您有需求,请联系我 QQ: , 或者 QQ: 。本人已经帮助了上万人找到了他们需要的PDF,其实网上有很多PDF,大家如果在网上不到的话,可以联系我QQ。因PDF电子书都有版权,请不要随意传播,最近pdf也越来越难做了,希望大家尊重下个人劳动,谢谢!PDF电子书说明:__________________________________________________________________________________1播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表Hadoop海量数据处理技术详解与项目实战 PDF电子书下载 带书签目录 sample.pdf
文档介绍:
本人可以提供各种PDF电子书资料,计算机类,文学,艺术,设计,医学,理学,经济,金融,等等。质量都很清晰,而且每本100%都带书签和目录,方便读者阅读观看,只要您提供给我书的相关信息,一般我都能找到,如果您有需求,请联系我 QQ: , 或者 QQ: 。本人已经帮助了上万人找到了他们需要的PDF,其实网上有很多PDF,大家如果在网上不到的话,可以联系我QQ。因PDF电子书都有版权,请不要随意传播,最近pdf也越来越难做了,希望大家尊重下个人劳动,谢谢!PDF电子书说明:__________________________________________________________________________________
内容来自淘豆网转载请标明出处.-------------
新增文件夹...
新增文件夹
(多个标签用逗号分隔)
Hadoop实战(第2版).pdf
2  Hadoop实战1.1 什么是Hadoop1.1.1 Hadoop概述Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等
2  Hadoop实战1.1 什么是Hadoop1.1.1 Hadoop概述Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉的硬件上,形成分布式系统;MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下开发并行应用程序。所以用户可以利用Hadoop轻松地组织计算机资源,从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理。 &&
下载本文档需要登录,并付出相应积分()。
文件大小:2.21 MB
所需积分:& 8
相关资讯  — 
相关讨论话题  — 
浏览:3335次&& 下载:0次
上传时间: 08:39:29
同类热门文档
57493次浏览 &106次下载
20392次浏览 &58次下载
22570次浏览 &38次下载
10023次浏览 &29次下载
13565次浏览 &23次下载
11519次浏览 &18次下载
相关经验 -
& 1人评&0页
& 4人评&56页
& 0人评&148页
& 6人评&150页
& 15人评&193页
OPEN-OPEN, all rights reserved.您的位置:
→ hadoop实战第3版pdf中文版 高清免费版
hadoop实战第3版pdf中文版 高清免费版hadoop实战第三版pdf下载|
网友评分:8
软件大小:39.9M
软件语言:中文
软件类型:国产软件
软件类别:免费软件 / 电子图书
更新时间:
软件等级:
官方网站:
运行环境:WinAll
软件厂商:
顶好评:50%
同类相关软件
39.9M/中文/10.0113.3M/英文/10.042.4M/英文/10.06.1M/中文/10.0788M/中文/10.0
hadoop实战第3版pdf为们从三大部分进行指导,让读者们可以通过此书快速了解Hadoop的基本知识和数据处理以及更大的系统程序,是对于Hadoop初学者们而言,提高自身能力的良好书籍,感兴趣的朋友们快来下载吧!本书介绍:作为云计算所青睐的分布式架构,Hadoop 是一个用Java 语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石.本书分为3 个部分,深入浅出地介绍了Hadoop 框架、编写和运行Hadoop 数据处理程序所需的实践技能及Hadoop 之外更大的生态系统.《Hadoop实战》适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考.本书目录:第一部分 Hadoop――一种分布式编程框架第1 章 Hadoop简介1.1 为什么写《Hadoop 实战》1.2 什么是Hadoop1.3 了解分布式系统和Hadoop1.4 比较SQL 和Hadoop1.5 理解MapReduce1.5.1 动手扩展一个简单程序1.5.2 相同程序在MapReduce中的扩展1.6 用Hadoop统计单词――运行第一个程序1.7 Hadoop历史1.8 小结1.9 资源第2 章 初识Hadoop2.1 Hadoop 的构造模块2.1.1 NameNode2.1.2 DataNode2.1.3 Secondary NameNode2.1.4 JobTracker2.1.5 TaskTracker2.2 为Hadoop 集群安装SSH2.2.1 定义一个公共账号2.2.2 验证SSH安装2.2.3 生成SSH密钥对2.2.4 将公钥分布并登录验证2.3 运行Hadoop2.3.1 本地(单机)模式2.3.2  伪分布模式2.3.3 全分布模式2.4 基于Web 的集群用户界面2.5 小结第3 章 Hadoop组件3.1 HDFS 文件操作3.1.1 基本文件命令3.1.2 编程读写HDFS3.2 剖析MapReduce 程序3.2.1 Hadoop数据类型3.2.2 Mapper3.2.3 Reducer3.2.4 Partitioner:重定向Mapper输出3.2.5 Combiner:本地reduce3.2.6 预定义mapper和Reducer类的单词计数3.3 读和写3.3.1 InputFormat3.3.2 OutputFormat3.4 小结第二部分 实战第4 章 编写MapReduce基础程序4.1 获得专利数据集4.1.1 专利引用数据4.1.2 专利描述数据4.2 构建MapReduce 程序的基础模板4.3 计数4.4 适应Hadoop API 的改变4.5 Hadoop 的Streaming4.5.1 通过Unix命令使用Streaming4.5.2 通过脚本使用Streaming4.5.3 用Streaming处理键/值对4.5.4 通过Aggregate包使用Streaming4.6 使用combiner 提升性能4.7 温故知新4.8 小结4.9 更多资源第5 章 高阶MapReduce5.1 链接MapReduce 作业5.1.1 顺序链接MapReduce作业5.1.2 具有复杂依赖的MapReduce链接5.1.3 预处理和后处理阶段的链接5.2 联结不同来源的数据5.2.1 Reduce侧的联结5.2.2 基于DistributedCache的复制联结5.2.3 半联结:map侧过滤后在reduce侧联结5.3 创建一个Bloom filter5.3.1 Bloom filter做了什么5.3.2 实现一个Bloom filter5.3.3 Hadoop 0.20 以上版本的Bloom filter5.4 温故知新5.5 小结5.6 更多资源第6 章 编程实践6.1 开发MapReduce 程序6.1.1 本地模式6.1.2 伪分布模式6.2 生产集群上的监视和调试6.2.1 计数器6.2.2 跳过坏记录6.2.3 用IsolationRunner重新运行出错的任务6.3 性能调优6.3.1 通过combiner来减少网络流量6.3.2 减少输入数据量6.3.3 使用压缩6.3.4 重用JVM6.3.5 根据猜测执行来运行6.3.6 代码重构与算法重写6.4 小结第7 章 细则手册7.1 向任务传递作业定制的参数7.2 探查任务特定信息7.3 划分为多个输出文件7.4 以数据库作为输入输出7.5 保持输出的顺序7.6 小结第8 章 管理Hadoop8.1 为实际应用设置特定参数值8.2 系统体检8.3 权限设置8.4 配额管理8.5 启用回收站8.6 删减DataNode8.7 增加DataNode8.8 管理NameNode 和SNN8.9 恢复失效的NameNode8.10 感知网络布局和机架的设计8.11 多用户作业的调度8.11.1 多个JobTracker8.11.2 公平调度器8.12 小结第三部分 Hadoop也疯狂第9 章 在云上运行Hadoop9.1 Amazon Web Services 简介9.2 安装AWS9.2.1 获得AWS身份认证凭据9.2.2 获得命令行工具9.2.3 准备SSH密钥对9.3 在EC2 上安装Hadoop9.3.1 配置安全参数9.3.2 配置集群类型9.4 在EC2 上运行MapReduce 程序9.4.1 将代码转移到Hadoop集群上9.4.2 访问Hadoop集群上的数据9.5 清空和关闭EC2 实例9.6 Amazon Elastic MapReduce 和其他AWS 服务9.6.1 Amazon Elastic MapReduce9.6.2 AWS导入/导出9.7 小结第10 章 用Pig编程10.1 像Pig 一样思考10.1.1 数据流语言10.1.2 数据类型10.1.3 用户定义函数10.2 安装Pig10.3 运行Pig10.4 通过Grunt 学习Pig Latin10.5 谈谈Pig Latin10.5.1 数据类型和schema10.5.2 表达式和函数10.5.3 关系型运算符10.5.4 执行优化10.6 用户定义函数10.6.1 使用UDF10.6.2 编写UDF10.7 脚本10.7.1 注释10.7.2 参数替换10.7.3 多查询执行10.8 Pig 实战――计算相似专利的例子10.9 小结第11 章 Hive及Hadoop群11.1 Hive11.1.1 安装与配置Hive11.1.2 查询的示例11.1.3 深入HiveQL11.1.4 Hive小结11.2 其他Hadoop 相关的部分11.2.1 HBase11.2.2 ZooKeeper11.2.3 Cascading11.2.4 Cloudera11.2.5 Katta11.2.6 CloudBase11.2.7 Aster Data和Greenplum11.2.8 Hama和Mahout11.2.9 11.3 小结第12 章 案例研究12.1 转换《纽约时报》1100 万个库存图片文档12.2 挖掘中国移动的数据12.3 在StumbleUpon 推荐最佳网站12.3.1 分布式StumbleUpon 的开端12.3.2 HBase 和StumbleUpon12.3.3 StumbleUpon 上的更多Hadoop 应用12.4 搭建面向企业查询的分析系统――IBM的ES2 项目12.4.1 ES2 系统结构12.4.2 ES2 爬虫12.4.3 ES2 分析12.4.4 小结12.4.5 参考文献附录A HDFS文件命令
其他版本下载
hadoop实战第3版pdf中文版 高清免费版
软件无法下载或下载后无法使用,请点击报错,谢谢!
请描述您所遇到的错误,我们将尽快予以修正,谢谢!
*必填项,请输入内容
本类下载排行
7.81 9.32 7.83 6.04 8.35 1.36 5.07 1.88 10.09 10.010 4.111 10.012 10.013 10.014 5.015
本类精品软件
65.2M/中文/10.011.0M/中文/10.0
装机必备软件
本类集合软件君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
基于Hadoop的百度游戏数据平台的设计与实现.pdf
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口Java1234官方群16:
Java1234官方群17:
《Hadoop实战》PDF 下载
《Hadoop实战》PDF 下载
提醒:假如百度云分享链接失效,请联系站长,我会补上的。
《Hadoop实战》PDF 下载
下载地址:版权归作者和出版社所有,下载链接已删除,可以到&&搜索
图书简介:
作为云计算所青睐的分布式架构,Hadoop 是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。本书分为3个部分,深入浅出地介绍了Hadoop 框架、编写和运行Hadoop 数据处理程序所需的实践技能及Hadoop之外更大的生态系统。
  本书适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。
相关截图:
图书目录:
第一部分 Hadoop&&一种分布式编程框架
 第1章 Hadoop简介
  1.1 为什么写《Hadoop 实战》
  1.2 什么是Hadoop
  1.3 了解分布式系统和Hadoop
  1.4 比较SQL 数据库和Hadoop
  1.5 理解MapReduce
  1.5.1 动手扩展一个简单程序
  1.5.2 相同程序在MapReduce中的扩展
  1.6 用Hadoop统计单词&&运行第一个程序
  1.7 Hadoop历史
  1.8 小结
  1.9 资源
 第2章 初识Hadoop
  2.1 Hadoop 的构造模块
  2.1.1 NameNode
  2.1.2 DataNode
  2.1.3 Secondary NameNode
  2.1.4 JobTracker
  2.1.5 TaskTracker
  2.2 为Hadoop 集群安装SSH
  2.2.1 定义一个公共账号
  2.2.2 验证SSH安装
  2.2.3 生成SSH密钥对
  2.2.4 将公钥分布并登录验证
  2.3 运行Hadoop
  2.3.1 本地(单机)模式
  2.3.2  伪分布模式
  2.3.3 全分布模式
  2.4 基于Web 的集群用户界面
  2.5 小结
 第3章 Hadoop组件
  3.1 HDFS 文件操作
  3.1.1 基本文件命令
  3.1.2 编程读写HDFS
  3.2 剖析MapReduce 程序
  3.2.1 Hadoop数据类型
  3.2.2 Mapper
  3.2.3 Reducer
  3.2.4 Partitioner:重定向Mapper输出
  3.2.5 Combiner:本地reduce
  3.2.6 预定义mapper和Reducer类的单词计数
  3.3 读和写
  3.3.1 InputFormat
  3.3.2 OutputFormat
  3.4 小结
第二部分 实战
 第4章 编写MapReduce基础程序
  4.1 获得专利数据集
  4.1.1 专利引用数据
  4.1.2 专利描述数据
  4.2 构建MapReduce 程序的基础模板
  4.3 计数
  4.4 适应Hadoop API 的改变
  4.5 Hadoop 的Streaming
  4.5.1 通过Unix命令使用Streaming
  4.5.2 通过脚本使用Streaming
  4.5.3 用Streaming处理键/值对
  4.5.4 通过Aggregate包使用Streaming
  4.6 使用combiner 提升性能
  4.7 温故知新
  4.8 小结
  4.9 更多资源
 第5章 高阶MapReduce
  5.1 链接MapReduce 作业
  5.1.1 顺序链接MapReduce作业
  5.1.2 具有复杂依赖的MapReduce链接
  5.1.3 预处理和后处理阶段的链接
  5.2 联结不同来源的数据
  5.2.1 Reduce侧的联结
  5.2.2 基于DistributedCache的复制联结
  5.2.3 半联结:map侧过滤后在reduce侧联结
  5.3 创建一个Bloom filter
  5.3.1 Bloom filter做了什么
  5.3.2 实现一个Bloom filter
  5.3.3 Hadoop 0.20 以上版本的Bloom filter
  5.4 温故知新
  5.5 小结
  5.6 更多资源
 第6章 编程实践
  6.1 开发MapReduce 程序
  6.1.1 本地模式
  6.1.2 伪分布模式
  6.2 生产集群上的监视和调试
  6.2.1 计数器
  6.2.2 跳过坏记录
  6.2.3 用IsolationRunner重新运行出错的任务
  6.3 性能调优
  6.3.1 通过combiner来减少网络流量
  6.3.2 减少输入数据量
  6.3.3 使用压缩
  6.3.4 重用JVM
  6.3.5 根据猜测执行来运行
  6.3.6 代码重构与算法重写
  6.4 小结
 第7章 细则手册
  7.1 向任务传递作业定制的参数
  7.2 探查任务特定信息
  7.3 划分为多个输出文件
  7.4 以数据库作为输入输出
  7.5 保持输出的顺序
  7.6 小结
 第8章 管理Hadoop
  8.1 为实际应用设置特定参数值
  8.2 系统体检
  8.3 权限设置
  8.4 配额管理
  8.5 启用回收站
  8.6 删减DataNode
  8.7 增加DataNode
  8.8 管理NameNode 和SNN
  8.9 恢复失效的NameNode
  8.10 感知网络布局和机架的设计
  8.11 多用户作业的调度
  8.11.1 多个JobTracker
  8.11.2 公平调度器
  8.12 小结
第三部分 Hadoop也疯狂
 第9章 在云上运行Hadoop
  9.1 Amazon Web Services 简介
  9.2 安装AWS
  9.2.1 获得AWS身份认证凭据
  9.2.2 获得命令行工具
  9.2.3 准备SSH密钥对
  9.3 在EC2 上安装Hadoop
  9.3.1 配置安全参数
  9.3.2 配置集群类型
  9.4 在EC2 上运行MapReduce 程序
  9.4.1 将代码转移到Hadoop集群上
  9.4.2 访问Hadoop集群上的数据
  9.5 清空和关闭EC2 实例
  9.6 Amazon Elastic MapReduce 和其他AWS 服务
  9.6.1 Amazon Elastic MapReduce
  9.6.2 AWS导入/导出
  9.7 小结
 第10章 用Pig编程
  10.1 像Pig 一样思考
  10.1.1 数据流语言
  10.1.2 数据类型
  10.1.3 用户定义函数
  10.2 安装Pig
  10.3 运行Pig
  10.4 通过Grunt 学习Pig Latin
  10.5 谈谈Pig Latin
  10.5.1 数据类型和schema
  10.5.2 表达式和函数
  10.5.3 关系型运算符
  10.5.4 执行优化
  10.6 用户定义函数
  10.6.1 使用UDF
  10.6.2 编写UDF
  10.7 脚本
  10.7.1 注释
  10.7.2 参数替换
  10.7.3 多查询执行
  10.8 Pig 实战&&计算相似专利的例子
  10.9 小结
 第11章 Hive及Hadoop群
  11.1 Hive
  11.1.1 安装与配置Hive
  11.1.2 查询的示例
  11.1.3 深入HiveQL
  11.1.4 Hive小结
  11.2 其他Hadoop 相关的部分
  11.2.1 HBase
  11.2.2 ZooKeeper
  11.2.3 Cascading
  11.2.4 Cloudera
  11.2.5 Katta
  11.2.6 CloudBase
  11.2.7 Aster Data和Greenplum
  11.2.8 Hama和Mahout
  11.2.9
  11.3 小结
 第12章 案例研究
  12.1 转换《纽约时报》1100 万个库存图片文档
  12.2 挖掘中国移动的数据
  12.3 在StumbleUpon 推荐最佳网站
  12.3.1 分布式StumbleUpon 的开端
  12.3.2 HBase 和StumbleUpon
  12.3.3 StumbleUpon 上的更多Hadoop 应用
  12.4 搭建面向企业查询的分析系统&&IBM的ES2 项目
  12.4.1 ES2 系统结构
  12.4.2 ES2 爬虫
  12.4.3 ES2 分析
  12.4.4 小结
  12.4.5 参考文献
附录A HDFS文件命令
(责任编辑:小锋)
------分隔线----------------------------
《了不起的Node.js: 将JavaScript进行到底》PDF 下载...
《Java RESTful Web Service实战》PDF 下载...
《架构探险从零开始写JavaWeb框架》PDF 下载...
《疯狂Workflow讲义——基于Activiti的工作流应用开发》PDF 下载...
《Oracle WebLogic Server开发权威指南》PDF 下载...
《深入理解OSGi:Equinox原理、应用与最佳实践》PDF 下载...
免责声明:网站所有作品均由会员网上搜集共同更新,仅供读者预览及学习交流使用,下载后请24小时内删除,如果喜欢请购买正版资源!原作者如果认为本站侵犯了您的版权,请QQ告知,我们会立即删除!}

我要回帖

更多关于 hadoop 中文文档 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信