《大年夜数据基本编程、实验和案例教程》教材官网

《大年夜数据基本编程、实验和案例教程》教材官网

厦门大年夜学 林子雨 编著

本书曾经在京东、铛铛等各大年夜网店发卖

进入京东购买本书 |  进入铛铛网购买本书

清华大年夜学出版社  ISBN:978-7-302-47209-4  订价:59元

获得教程一切章节的原始代码(敕令行语句和法式榜样)


 本页面内容导航: 教程简介 | 下载专区 | 在线视频 | 大年夜数据课程公共办事平台 | 申谢


本书是与《大年夜数据技巧道理与应用》教材配套的唯一指定实验指导书

大年夜数据基本编程教材官网二维码

扫一扫拜访本网页

步步引导,墨守成规,详实的装置指南为顺利搭建大年夜数据实验情况铺平门路
深刻浅出,去粗取精,丰富的代码实例赞助快速控制大年夜数据基本编程办法
精心设计,奇妙融合,五套大年夜数据实验标题促进实际与编程知识的消化和接收
结合实际,接洽实际,大年夜数据课程综合实验案例出色出现大年夜数据分析全流程

全国高校大年夜数据教授教化有名教员用时四年倾慕之作
全国浩大高校开课教材《大年夜数据技巧道理与应用》唯一指定配套实验指导书
教程官网供给全书实验代码、相干软件、讲课视频等资本一站式收费下载
高校大年夜数据课程公共办事平台为本教程供给数字化教授教化资本全方位配套办事

祝贺《大年夜数据技巧道理与应用》MOOC课程在中国大年夜学MOOC上线不雅看

教程简介

本教程是林子雨编著《大年夜数据技巧道理与应用》教材(教材官网)的配套实验指导书。《大年夜数据技巧道理与应用》侧重于大年夜数据知识框架和实际简介,而本教程侧重于简介大年夜数据软件的装置、应用和基本编程办法,并供给了大年夜量实验和案例。由于大年夜数据软件都是开源软件,装置过程普通比较复杂,也很消费时间。为了尽可能增添读者搭建大年夜数据实验情况时的妨碍,笔者在本教程中详细写出了各类大年夜数据软件的详细装置过程,可以确保读者顺利完成大年夜数据实验情况搭建。

《大年夜数据基本编程、实验和案例教程》媒介

大年夜数据时代曾经周全开启,带来了信息技巧的巨大年夜变革,并深刻影响着社会临盆和人平易近生活的各个方面。大年夜数据专业人才网job.vhao.net的培养是世界各国新一轮科技较劲的基本,高等院校承当着大年夜数据人才网job.vhao.net培养的重担,须要及时建立起大年夜数据课程体系,为社会培养和保送一大年夜批具有大年夜数据专业素养的高等人才网job.vhao.net,满足社会对大年夜数据人才网job.vhao.net日趋旺盛的需求。

高质量的教材是推动高校大年夜数据课程体系扶植的关键支撑。2013年12月,笔者根据本身主讲厦门大年夜学计算机系研究生大年夜数据课程的教授教化实际,编写了电子书《大年夜数据基本基本》,经过过程搜集收费发布,取得了较好地反响。尔后两年多的时间里,笔者持续对大年夜数据技巧知识体系停止了深刻进修和体系梳理,并结合教授教化实际和大年夜量调研,编著出版了《大年夜数据技巧道理与应用》教材,该书第1版于2015年8月出版发行,第2版于2017年2月出版发行。《大年夜数据技巧道理与应用》一书侧重于简介大年夜数据技巧的完成道理,编程实际内容较少,该教材定位为入门级大年夜数据教材,以“构建知识体系、解释基来源基本理、展开低级实际、懂得相干应用”为准绳,旨在为读者搭建起通向大年夜数据知识空间的桥梁和纽带,为读者在大年夜数据范畴深耕细作奠定基本、指明偏向。教材体系阐述了大年夜数据的根本概念、大年夜数据处理架构Hadoop、分布式文件体系HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、大年夜数据处理架构Spark、流计算、图计算、数据可视化和大年夜数据在互联网、生物医学和物流等各个范畴的应用。

《大年夜数据技巧道理与应用》出版今后,取得了较高的承认,今朝曾经成为国际多所高校的大年夜数据课程教材。与此同时,笔者在比来两年经过过程各类情势助力全国高校加快推动大年夜数据课程扶植,包含扶植全国高校大年夜数据课程公共办事平台、展开全国高校大年夜数据地下课巡讲筹划、组织全国高校大年夜数据教授教化服装论坛t.vhao.net、举办全国高校大年夜数据课程教员培训交换班等。经过过程这些活动,笔者与全国高校广大年夜大年夜数据课程教员有了更深的接触和交换,也搜集到了广大年夜一线教员的核心教授教化需求。很多高校师长教员在高度肯定《大年夜数据技巧道理与应用》教材的同时,也提出了很多中肯的改进看法和建议,个中,有很多师长教员指出,应当增强大年夜数据实际环节的练习,供给实验指导和综合案例。

为了更好满足高校教授教化实际需求,笔者带领厦门大年夜学数据库实验团队,展开了大年夜量的摸索和实际,并对实际材料停止体系整顿编写了本教程。本教程侧重于简介大年夜数据软件的装置、应用和基本编程办法,并供给了大年夜量实验和案例。由于大年夜数据软件都是开源软件,装置过程普通比较复杂,也很消费时间。为了尽可能增添读者搭建大年夜数据实验情况时的妨碍,笔者在本教程中详细写出了各类大年夜数据软件的详细装置过程,可以确保读者顺利完成大年夜数据实验情况搭建。

本教程共12章,详细简介了体系和软件的装置、应用和基本编程办法。第1章简介大年夜数据关键技巧和代表性软件,赞助读者构成对大年夜数据技巧及其代表性软件的整体性熟悉;第2章简介Linux体系的装置和应用办法,为前面其他章节的进修奠定基本;第3章简介分布式计算框架Hadoop的装置和应用办法;第4章简介分布式文件体系HDFS的基本编程办法;第5章简介分布式数据库HBase的装置和基本编程办法;第6章简介典范NoSQL数据库的装置和应用办法,包含键值数据库Redis和文档数据库MongoDB;第7章简介若何编写根本的MapReduce法式榜样;第8章简介基于Hadoop的数据仓库Hive的装置和应用办法;第9章简介基于内存的分布式计算框架Spark的装置和基本编程办法;第10章简介5种典范的可视化对象的装置和应用办法,包含Easel.ly、D3、魔镜、ECharts、Tableau等;第11章简介数据收集对象的装置和应用办法,包含Flume、Kafka和Sqoop。第12章简介一个大年夜数据课程综合实验案例,即网站用户购物行动分析。

本教程面向高校计算机和信息管理等相干专业的先生,可以作为专业?课或选修课的帮助教材。本教程是《大年夜数据技巧道理与应用》的“姊妹书”,可以作为《大年夜数据技巧道理与应用》的帮助配套教程,两本书组合应用,可以达到更好的进修后果。另外,本教程也能够和市场上现有的其他大年夜数据教材配套应用,作为教授教化帮助用书。

书由林子雨执笔。在撰写过程当中,厦门大年夜学计算机迷信系硕士研究生谢荣东、罗道文、邓少军、阮榕城、薛倩、魏亮、曾冠华等做了大年夜量帮助性任务,在此,向这些同窗的辛苦任务表示衷心的感激。

本教程官方网站是http://minzyweb.com/post/bigdatapractice/,收费供给了全部配套资本的在线浏览和下载,并接收缺点反应和发布订正信息。同时,在进修大年夜数据课程的过程当中,迎接读者拜访厦门大年夜学数据库实验室扶植的国际高校首个大年夜数据课程公共办事平台(http://minzyweb.com/post/bigdata-teaching-platform/),该平台为教员教授教化和先生进修大年夜数据课程供给教材PPT、进修指南、备课指南、上机习题、技巧材料、讲课视频等全方位、一站式收费办事。

本书在撰写过程当中,参考了大年夜量搜集材料,对大年夜数据技巧及其典范软件停止了体系梳理,有选择地把一些重要知识归入本书。由于笔者才能无限,本书不免存在缺乏的地方,望广大年夜读者不吝赐教。

下载专区

点击这里检查网页版“教程一切章节中的代码(包含敕令行和法式榜样)”,可以直接复制粘贴到本身机械上履行。

“下载专区”一切资本全部放在百度云盘中(请点击这里拜访)(提取码:t20q),须要在电脑上装置百度云盘客户端,才能顺利下载内容。

“下载专区”栏目供给了本教程内各个章节所触及到的源代码和软件的下载,为了便利读者查找相干软件和代码,下表给出了教程官网“下载专区”目次及其内容的概览。

目次 文件清单
软件 spark-streaming_2.10-1.6.2.jar

spark-streaming-kafka_2.10-1.6.2.jar

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

kafka_2.10-0.10.1.0.tgz

apache-flume-1.7.0-bin.tar.gz

mysql-connector-java-5.1.40.tar.gz

apache-hive-1.2.1-bin.tar.gz

eclipse-java-mars-2-win32-x86_64.zip

FileZilla_3.17.0.0_win64_setup.exe

hadoop-2.7.1.tar.gz

hbase-1.1.5-bin.tar.gz

mongo-java-driver-3.2.2.jar

mongodb-linux-x86_64-ubuntu1604-3.2.7.tgz

putty_V0.63.0.0.43510830.exe

sbt-launch.jar

SecurAble.exe

spark-1.6.2-bin-without-hadoop.tgz

Ubuntu16.04-hadoop2.7.1-spark1.6.2-XMU-linziyu-20161123.ova

ubuntukylin-16.04-desktop-amd64.iso

VirtualBox_5.0.10.4061_104061_Win.1448355141.exe

代码 第3章 core-site.xml;hdfs-site.xml;mapred-site.xml;yarn-site.xml
第4章 HDFSCreateFile.java;HDFSFileIfExist.java;HDFSReadFile.java
第5章 HBaseOperation.java
第6章 MongoDBExample.java
第7章 WordCount.java
第8章 hive-site.xml
第9章 pom.xml;simple.sbt;SimpleApp.java;SimpleApp.scala
第10章 example1.html;example2.html;example3.html;example4.html;example5.html;example6.html;toolbox.html
第11章 avro.conf;example.conf;KafkaWordCount.scala;KafkaWordProducer.scala;simple.sbt;StreamingExamples.scala
第12章 ImportHBase.java;pre_deal.sh
数据集 第12章 user.zip
实验答案 附录A 附录A:大年夜数据课程实验答案.pdf

在线视频

课程图片

点击这里不雅看在线课程视频

本教程是笔者编著的别的一本教材《大年夜数据技巧道理与应用》的“姊妹书”,本书可以作为《大年夜数据技巧道理与应用》的配套教授教化帮助用书。

《大年夜数据技巧道理与应用》一书侧重于简介大年夜数据技巧的完成道理,编程实际内容较少,该教材定位为入门级大年夜数据教材,以“构建知识体系、解释基来源基本理、展开低级实际、懂得相干应用”为准绳,旨在为读者搭建起通向大年夜数据知识空间的桥梁和纽带,为读者在大年夜数据范畴深耕细作奠定基本、指明偏向。教材体系阐述了大年夜数据的根本概念、大年夜数据处理架构Hadoop、分布式文件体系HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、大年夜数据处理架构Spark、流计算、图计算、数据可视化和大年夜数据在互联网、生物医学和物流等各个范畴的应用。

与《大年夜数据技巧道理与应用》教材不合,本教程侧重于简介大年夜数据软件的装置、应用和基本编程办法,并供给了丰富的实验和案例。本教程可以作为《大年夜数据技巧道理与应用》的配套教程,两本书组合应用,可以达到更好的进修后果。另外,本教程也能够和市场上现有的其他大年夜数据教材配套应用。

《大年夜数据技巧道理与应用》教材具有配套的高清课程视频,共13讲,视频累计长度1300分钟。读者在进修本教程的同时,可以经过过程不雅看在线视频,懂得相干大年夜数据技巧的完成道理,从而更好实际大年夜数据技巧。为了让读者在进修本教程时可以或许快速找到对应的在线视频内容,这里给出本教程和在线视频之间的章节对应关系(以下表所示)。

点击这里不雅看在线课程视频

本教程章节

《大年夜数据技巧道理与应用》视频

第1章 大年夜数据技巧概述 第1讲 大年夜数据概述
第2章 Linux体系的装置和应用
第3章 Hadoop的装置和应用 第2讲 大年夜数据处理架构Hadoop
第4章 HDFS操作办法和基本编程 第3讲 分布式文件体系HDFS
第5章 HBase的装置和基本编程 第4讲 分布式数据库HBase
第6章 典范NoSQL数据库的装置和应用 第5讲 NoSQL数据库
第7章 MapReduce基本编程 第7讲 MapReduce
第8章 数据仓库Hive的装置和应用 第8讲 基于Hadoop的数据仓库Hive
第9章 Spark的装置和基本编程 第10讲 Spark
第10章 典范可视化对象的应用办法
第11章 数据收集对象的装置和应用
第12章 大年夜数据课程综合实验案例

点击这里不雅看在线课程视频

申谢

本书由林子雨执笔。在撰写过程当中,厦门大年夜学计算机迷信系硕士研究生谢荣东、罗道文、邓少军、阮榕城、薛倩、魏亮、曾冠华等做了大年夜量帮助性任务,在此,向这些同窗的辛苦任务表示衷心的感激。

(2017年7月22日 林子雨在实验室展示教材)