博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop课程-01
阅读量:5218 次
发布时间:2019-06-14

本文共 419 字,大约阅读时间需要 1 分钟。

课程目标

1、能独立熟练完成Hadoop的安装及熟悉Hadoop的配置与管理.

2、熟练地在Hadoop和操作系统以及关系型数据库之间传递数据.

3、能独立指定数据集成方案

4、  

Google的低成本之道

  1. 不使用超级计算机,不使用存储(淘宝的去i,去e,去o之路)
  2. 大量使用普通的PC服务器(去掉机箱、外设、硬盘),提供冗余的集群服务
  3. 全世界多个数据中心,有些附带发电厂
  4. 运营商向Google倒付费

Google面对的数据和计算难题

  1. 大量的网页怎么存储
  2. 搜索算法
  3. Page-Rank计算问题

Google带给我们的关键技术和思想

  1. GFS
  2. Map-Reduce
  3. Bigtable

Hadoop体系下的分析手段

  1. 主流:Java程序
  2. 轻量级的脚本语言:Pig
  3. SQL技巧平稳过度:Hive
  4. NoSQL:HBase

推荐书籍

Hadoop分布式实战

 

转载于:https://www.cnblogs.com/arcer/p/5677022.html

你可能感兴趣的文章
安卓高手之路 图形系统(3 底层SurfceFlinger系统)
查看>>
Web 前端开发精华文章推荐(jQuery、HTML5、CSS3)【系列十三】
查看>>
LA 3135 优先队列
查看>>
JQuery EasyUI后台UI框架使用连载
查看>>
codeforce 5E(dp阵亡)
查看>>
【Android】Android 开机广播的使用
查看>>
将 Shiro 作为应用的权限基础 二:shiro 认证
查看>>
tomcat 虚拟目录的安全问题
查看>>
react 中echarts-for-react使用 自适应div
查看>>
lvM增减教程-转
查看>>
js基础之动画(二)
查看>>
The method of type must override a superclass method解决方式(转)
查看>>
bzoj 4506: [Usaco2016 Jan]Fort Moo
查看>>
leecode 旋转数组
查看>>
大型网站架构系列:缓存在分布式系统中的应用(一)
查看>>
$.proxy用法(解决this转移问题)
查看>>
ORA-28001
查看>>
工作笔记-关于面试
查看>>
Java基础:三步学会Java Socket编程
查看>>
细谈WEB标准
查看>>