林子雨编著《大年夜数据技巧道理与应用》教材配套大年夜数据软件装置和编程实际指南

厦门大年夜学林子雨编著《大年夜数据技巧道理与应用》

教材配套大年夜数据软件装置和编程实际指南

拜访教材官网

作者:厦门大年夜学计算机迷信系 林子雨(ziyulin@xmu.edu.cn, http://www.cs.xmu.edu.cn/linziyu)

工信部”全国云计算及大年夜数据应用技巧人才网job.vhao.net培训测验项目”唯一指定大年夜数据教材

全国多所高校大年夜数据课程选用本教材,京东、铛铛等各大年夜网店滞销书本

入门级精品教材,丰富的教材配套资本赞助读者完成“零基本”进修大年夜数据

下载教材配套教材PPT | 铛铛网购买本书|京东商城购买本书|亚马逊购买本书

面向教员的大年夜数据课程教员办事站 | 面向先生的大年夜数据课程先生办事站

林子雨大年夜数据技巧道理与应用教材配套进修指南网页二维码

扫一扫手机拜访本主页

不雅看厦门大年夜学林子雨师长教员主讲《大年夜数据技巧道理与应用》讲课视频

版权声明:本站一切教授教化资本有版权,请勿用于贸易用处。

“进修指南”的用处】读者在应用林子雨编著《大年夜数据技巧道理与应用》教材时,只看教材,只能较好进修完成实际层面的内容,由于教材撰写必须本着精练的准绳,没法对技巧层面的操作细节八面玲珑,是以,一些详细大年夜数据技巧的实际操作,假设只要教材,是没法顺利完成的。为了让读者可以或许顺利完成教材上相干大年夜数据技巧的上机实际,是以,厦门大年夜学数据库实验室制造了与教材各个章节配套的进修指南,指南中会对若何实际相干大年夜数据技巧停止详细的解释。

“进修指南”应用办法】本主页的进修指南内容,重要分为“章节配套进修指南”和“章节配套专题博客”两大年夜类,读者在进修完《大年夜数据技巧道理与应用》教材某个章节的内容后,应当起首浏览下面的“章节配套进修指南”,然后,再去浏览“章节配套专题博客”,在博客查缺补漏(由于,“章节配套专题博客”外面的内容,有些曾经被包含到了“章节配套进修指南”中了)。

(一)章节配套大年夜数据软件装置和编程实际指南

教材部分章节只要实际,不须要上机实际,是以,不须要进修指南。下面针对一些包含上机实际的章节给出进修指南。装置过程须要用到的一切软件,可以点击这里从百度云盘下载(提取码:4jo8)。

(备注:假设你是苹果MacOS用户,请不要拜访下面指南内容,而是直接拜访专门面向MacOS体系撰写的指南,点击这里拜访

(备注:假设你是阿里云的云办事器ECS用户,也能够在云端搭建大年夜数据实验情况,点击这里浏览云端大年夜数据情况搭建指南

大年夜数据软件装置和编程实际指南(在本地电脑装置,合适绝大年夜多半进修者)
大年夜数据技巧道理与应用(第2版) 第二章 大年夜数据处理架构Hadoop  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第三章 分布式文件体系HDFS  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第四章 分布式数据库HBase  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第五章 NoSQL数据库 检查
大年夜数据技巧道理与应用(第2版) 第六章 云数据库 进修指南 检查
大年夜数据技巧道理与应用(第2版) 第七章 MapReduce  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第九章 Spark  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第十章 流计算  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第十一章 图计算  进修指南 检查
大年夜数据技巧道理与应用(第2版) 第十二章 数据可视化 进修指南 检查
大年夜数据技巧道理与应用(不在教材中的扩大内容) 基于Hadoop的数据仓库Hive 进修指南 检查

以本网页编程指南为基本撰写的《大年夜数据基本编程、实验和案例教程》(教材官网)

曾经于2017年8月出版,并在京东、铛铛等网店发卖

(二)章节配套专题博客

章节配套专题博客,是为了进修某个详细的技巧专题而撰写的,每篇博客都是进修某个详细技巧。

第1章 大年夜数据概述

本章都是概念性知识,不须要上机实际,所以,没有配套博客。

第2章 大年夜数据处理架构Hadoop

【教程编号】章节配套专题博客2-1

【教程称号】在Windows体系下装置Linux虚拟机

【拜访地址】检查

【教程内容】Hadoop和NoSQL数据库的进修,大年夜多须要Linux情况。搭建Linux情况可以经过过程两种方法:(1)在电脑上装置双操作体系,即同时装置Linux和Windows操作体系,在电脑启动的时辰,可以选择进入Linux体系;(2)在装置好Windows操作体系的电脑上,在开机进入Windows操作体系今后,装置Linux虚拟机,即在Windows运转情况下虚拟出一个Linux运转情况。本教程简介如安在Windows体系下装置Linux虚拟机,描述了在Windows操作体系下应用开源虚拟机软件VirtualBox装置CentOS6.4(Linux的一个发行版)的教程,读者也能够应用其他虚拟机VMware Workstation装置。

须要指出的是,假设读者采取双体系方法装置Linux(而不是装置Linux虚拟机),建议可以参考“百度经历”中的文章,详细以下:

第一步:制订U盘启动装置

第二步:双体系装置

【教程编号】章节配套专题博客2-2

【教程称号】Hadoop装置教程_单机/伪分布式设备(Ubuntu14.04)

【拜访地址】检查

【教程内容】留意:Linux有不合的发行版,重要有Ubuntu和CentOS等。建议采取CentOS。本教程采取Ubuntu14.04(Linux的一个发行版)。(单机/伪分布式装置,采取Hadoop2.6.0/Ubuntu14.04)当开端着手实际Hadoop时,装置Hadoop常常会成为老手的一道门槛。虽然装置其实很简单,书上有写到,官方网站也有Hadoop装置设备教程,但由于对Linux情况不熟悉,书上跟官网上简单的装置步调老手常常Hold不住。加上彀上很多教程也甚是坑,招致老手折腾老几天愣是没装好,很是攻击进修热忱。本教程由厦门大年夜学数据库实验室出品,转载请注明。本教程合适于原生Hadoop 2,包含Hadoop 2.6.0, Hadoop 2.4.1等版本,重要参考了官方装置教程,步调详细,辅以恰当解释,包管按照步调来,都能顺利装置并运转Hadoop。别的有Hadoop装置设备简单版便利有基本的读者快速完成装置。另外,欲望读者们能多去懂得一些Linux的知识,今后出现成绩时才能自行处理。

【教程编号】章节配套专题博客2-3

【教程称号】Hadoop装置教程_单机/伪分布式设备(CentOS6.4)

【拜访地址】检查

【教程内容】留意:Linux有不合的发行版,重要有Ubuntu和CentOS等。建议采取CentOS。本教程采取CentOS6.4(Linux的一个发行版)。(单机/伪分布式装置,采取Hadoop2.6.0/CentOS6.4)当开端着手实际Hadoop时,装置Hadoop常常会成为老手的一道门槛。虽然装置其实很简单,书上有写到,官方网站也有Hadoop装置设备教程,但由于对Linux情况不熟悉,书上跟官网上简单的装置步调老手常常Hold不住。加上彀上很多教程也甚是坑,招致老手折腾老几天愣是没装好,很是攻击进修热忱。本教程由厦门大年夜学数据库实验室出品,转载请注明。本教程合适于原生Hadoop 2,包含Hadoop 2.6.0, Hadoop 2.4.1等版本,重要参考了官方装置教程,步调详细,辅以恰当解释,包管按照步调来,都能顺利装置并运转Hadoop。别的有Hadoop装置设备简单版便利有基本的读者快速完成装置。另外,欲望读者们能多去懂得一些Linux的知识,今后出现成绩时才能自行处理。

【教程编号】章节配套专题博客2-4

【教程称号】Hadoop集群装置设备教程

【拜访地址】检查

【教程内容】(集群装置) 当开端着手实际Hadoop时,装置Hadoop常常会成为老手的一道门槛。虽然装置其实很简单,书上有写到,官方网站也有Hadoop装置设备教程,但由于对Linux情况不熟悉,书上跟官网上简单的装置步调老手常常Hold不住。加上彀上很多教程也甚是坑,招致老手折腾老几天愣是没装好,很是攻击进修热忱。本教程由厦门大年夜学数据库实验室出品,转载请注明。本教程合适于原生Hadoop 2,包含Hadoop 2.6.0, Hadoop 2.4.1等版本,重要参考了官方装置教程,步调详细,辅以恰当解释,包管按照步调来,都能顺利装置并运转Hadoop。别的有Hadoop装置设备简单版便利有基本的读者快速完成装置。另外,欲望读者们能多去懂得一些Linux的知识,今后出现成绩时才能自行处理。

【教程编号】章节配套专题博客2-5

【教程称号】Hadoop 2.4.1单机版 自定义完成类和编译运转

【拜访地址】检查

【教程内容】已设备好hadoop2.4.1开辟情况。由于之前运转的都是Hadoop自带的实例,然则关于小我进修而言,肯定是要本身编写完成类和编译运转完成类,是以博主就撰写了这篇文章,欲望对进修hadoop的同志中人有所赞助。

第3章 Hadoop分布式文件体系

本章暂无章节配套专题博客。

第4章 分布式数据库HBase

【教程编号】章节配套专题博客4-1

【教程称号】HBase的装置与运转

【拜访地址】检查

【教程内容】HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个构造化数据的分布式存储体系》。HBase以表的情势存储数据。表有行和列构成。列划分为若干个列族/列簇(column family)。本教程简介HBase的根本装置和应用办法。本教程运转情况是在Ubuntu-64位体系下,HBase版本为hbase-0.94.27。

第5章 NoSQL数据库

【教程编号】章节配套专题博客5-1

【教程称号】MongoDB简略单纯装置和操作教程

【拜访地址】检查

【教程内容】文档数据库MongoDB 是今朝在IT行业异常风行的一种非关系型数据库(NoSQL),本教程为简略单纯教程,将指导大年夜家若何装置和应用MongoDB。

【教程编号】章节配套专题博客5-2

【教程称号】Redis装置与运转

【拜访地址】检查

【教程内容】Redis是一个key-value存储体系,即键值对非关系型数据库,和Memcached类似,今朝正在被愈来愈多的互联网公司采取。本教程只是简略单纯的教程,指导大年夜家若何装置运转Redis和简单地操作Redis。

第6章 云数据库

本章暂无章节配套专题博客。

第7章 MapReduce

【教程编号】章节配套专题博客7-1

【教程称号】应用敕令行编译打包运转本身的MapReduce法式榜样

【拜访地址】检查

【教程内容】网上的MapReduce WordCount教程关于若何编译WordCount.java简直是一笔带过… 而有写到的,大年夜多又是 0.20 等旧版本版本的做法,即 javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar WordCount.java,但较新的 2.X 版本中,曾经没有 hadoop-core*.jar 这个文件,是以编辑和打包本身的MapReduce法式榜样与旧版本有所不合。本文以 Hadoop 2.4.1 情况下的WordCount实例来简介 2.x 版本中若何编辑本身的MapReduce法式榜样。

【教程编号】章节配套专题博客7-2

【教程称号】应用Eclipse编译运转MapReduce法式榜样

【拜访地址】 检查

【教程内容】上篇简介了应用敕令行编译打包运转本身的MapReduce法式榜样,应用 Eclipse 加倍便利。要在 Eclipse 上编译和运转 MapReduce 法式榜样,须要装置 hadoop-eclipse-plugin,可应用 Github 上的 hadoop2x-eclipse-plugin,测试情况:Ubuntu 14.04、Hadoop 2.6.0、Eclipse 3.8。本教程在 Hadoop 2.6.0 下验证经过过程,实际上合适于任何原生 Hadoop 2 版本,如 Hadoop 2.4.1 也能够。

第8章 流计算

【教程编号】章节配套专题博客8-1

【教程称号】Storm装置教程

【拜访地址】检查

【教程内容】本教程简介了如安在单机上装置、运转Storm。本教程基于CentOS 6.4 体系,应用的Storm版本为0.9.6.

【教程编号】章节配套专题博客8-2

【教程称号】Maven编译代码

【拜访地址】检查

【教程内容】Storm官方供给了入门代码(Stormstarter),即“Storm装置教程”中运转的实例(jar是编译后的)。本教程即简介若何应用Maven来编译代码,以运转于 Storm中。

第9章 图计算

【教程编号】章节配套专题博客9-1

【教程称号】图计算框架Hama的基本操作实际

【拜访地址】检查

【教程内容】Hama是Google Pregel的开源完成,与Hadoop合适于分布式大年夜数据处理不合,Hama重要用于分布式的矩阵、graph、搜集算法的计算。简单说,Hama是在HDFS上完成的BSP(Bulk Synchronous Parallel)计算框架,弥补Hadoop在计算才能上的缺乏。本教程重要简介hama的装置设备和用hama处理一些算法成绩。

第10章 数据可视化

【教程编号】章节配套专题博客10-1

【教程称号】D3可视化库应用指南

【拜访地址】检查

【教程内容】D3 的全称是(Data-Driven Documents),望文生义可以知道是一个被数据驱动的文档。听名字有点笼统,说简单一点,其实就是一个 JavaScript 的函数库,应用它主如果用来做数据可视化的。本教程简介若何装置和应用D3可视化库,完成根本的可视化图形的绘制。

【教程编号】章节配套专题博客10-2

【教程称号】可视化对象Tableau简略单纯教程

【拜访地址】检查

【教程内容】在今朝的互联网界,大年夜数据是异常火的一块范畴,并且曾经渗透到生活的各个方面。但是面对宏大年夜的数据,假设只是用表格或许文本来显示数据,那么数据将不容易浏览,并且很好看出数据间的关系。Tableau是一款数据可视化对象,托放式的操作,精细的图表,让这款软件在大年夜数据可视化方面大年夜放光彩。本教程是Tableau简略单纯教程,向大年夜家简介Tableau和指导大年夜家简略单纯操作Tableau。

【教程编号】章节配套专题博客10-3

【教程称号】Easel.ly信息图制造实际

【拜访地址】检查

【教程内容】Easel.ly 是现下异常风行的信息图制造软件之一,其具有界面简洁、操作简a便、图片精细等特点。用户只须要登录Easel.ly官方网站便可开端停止信息图制造。本文重要简介Easel.ly 的根本应用办法。

【教程编号】章节配套专题博客10-4

【教程称号】数据可视化对象魔镜和基于ECharts可视化库的图表制造

【拜访地址】检查

【教程内容】本教程为数据可视化的中级教程,起首简介魔镜这款数据可视化对象,用户只须要拖拽控件便可生成绚丽的图形,关于没有编辑基本的文科生,下班族来讲,也是极易上手。魔镜这款软件有分为云平台和企业版,假设要制造高等图形,如人口迁徙图,热度图等等就须要用到企业版,而企业版须要收费。所以本篇教程,还简介了制造图形图象的代码库ECharts,可以编程完成简单的图形和高等图形。ECharts收费应用,并且接口简单,关于有一点编程基本的用户,可以很轻易上手。

第11章 大年夜数据在互联网范畴的应用

【教程编号】章节配套专题博客11-1

【教程称号】大年夜数据推荐体系的编程完成

【拜访地址】 下载

【教程内容】本教程将编程完成基于“阿里巴巴大年夜数据比赛(天猫推荐算法大年夜挑衅)”的推荐体系。阿里巴巴集团主办的天池大年夜数据比赛(http://tianchi.aliyun.com/),是面向全球科研任务者的高端算法比赛。经过过程开放海量数据和分布式计算资本,大年夜赛让一切参与者无机会应用其设计的算法处理各类社会成绩或营业成绩。

备注:第12章和第13章是关于大年夜数据的应用,属于先生自学内容,都是概念性简介,不须要上机演习,是以,不须要进修指南。