数据迷信

厦门大年夜学计算机系研究生课程《数据迷信》课程主页

课程主讲教员:厦门大年夜学计算机迷信系助理传授  林子雨 博士

目标:打造计算机专业研究生精品课程

(声明:请勿将本网站内容用于贸易用处,转载或援用请注明出处)

%e6%95%b0%e6%8d%ae%e7%a7%91%e5%ad%a6%e8%b0%83%e7%a0%94%e6%8a%a5%e5%91%8a%e4%b8%bb%e9%a1%b5%e4%ba%8c%e7%bb%b4%e7%a0%81

扫一扫拜访本主页

数据学(Dataology)和数据迷信(Data Science)(以下称数据学)是关于数据的迷信或许研究数据的迷信,定义为:研究摸索Cyberspace中数据界(datanature)奥妙的理 论、办法和技巧,研究的对象是数据界中的数据。与天然迷信和社会迷信不合,数据学和数据迷信的研究对象是Cyber-space的数据,是新的迷信。数据 学和数据迷信重要有两个内涵:一个是研究数据本身,研究数据的各类类型、状况、属性及变更情势和变更规律;另外一个是为天然迷信和社会迷信研究供给一种新的 办法,称为迷信研究的数据办法,其目标在于提醒天然界和人类行动景象和规律[1]。

大年夜数据技巧道理与应用

(推荐:厦门大年夜学林子雨编著《大年夜数据技巧道理与应用》教材

课程扶植团队

《数据迷信》课程扶植小构成员(8人):林子雨(教员)、刘颖杰(2012级硕士研究生)、叶林宝(2012级硕士研究生)、蔡珉星(2013级硕士研究生)、李雨倩(女,2013级硕士研究生)、谢荣东(2014级硕士研究生)、罗道文(2014级硕士研究生)、李粲(女,2012级本科生)。

linziyu2014 刘颖杰  yelinbao 蔡珉星
林子雨 刘颖杰 叶林宝 蔡珉星
 李雨倩 谢荣东 罗道文  李粲
李雨倩 谢荣东 罗道文 李粲

调研分析

国表里相干高校开设《数据迷信》课程、数据迷信学位筹划、数据迷信短期培训班,停止数据迷信家和数据工程师的培养。在中国,喷鼻港中文大年夜学从2008 年起设立“数据迷信贸易统计”迷信硕士学位;复旦大年夜学从2007 年起开设数据迷信评论辩论班,2010 年开端招收数据迷信博士研究生,并从2013 年起开设研究生课程《数据迷信》;北京航空航天大年夜学于2012年设立大年夜数据工程硕士学位。在美国,加州大年夜学伯克利分校(UC Berkeley)从2011 年起开设《数据迷信导论》课程,并从2012 年起开设《数据迷信和分析》课程;伊利诺伊大年夜学喷鼻槟分校(University of Illinois at Urbana-Champaign,UIUC)从2011 年起举办“数据迷信暑期研究班”(Data Sciences Summer Instituteprogram);哥伦比亚大年夜学(Columbia University)从2011 年起开设《数据迷信导论》课程,2013 年起开设《应用数据迷信》课程,并将从2013 年春季起开设“数据迷信专业成就认证”(Certification of Professional Achievement in Data Sciences)培训项目,并筹划从2014 年起设立硕士学位,2015 年起设立博士学位;芝加哥大年夜学(University of Chicago)开设3 个月的夏季培训课程;纽约大年夜学(New YorkUniversity)将从2013 年春季起设立“数据迷信”硕士学位;南加州大年夜学(South California University)设立“数据迷信”硕士学位;华盛顿大年夜学(University of Washington)从2013 年5 月起开设《数据迷信导论》课程,并对修满数据迷信相干课程学分的先生颁发数据迷信证书(Certificate in Data Science);雪城大年夜学(Syracuse University)也供给数据迷信高等研究证书(Certificate Advanced Studies in Data Science)培训项目。在英国,邓迪大年夜学从2013 年起设立“数据迷信”迷信硕士学位。从上述人才网job.vhao.net 的培养筹划来看,数据迷信家应当体系地控制数据分析相干的技能,重要包含数学、统计学、数据分析、贸易分析和天然说话处理等,具有较宽的知识面,具有自力 获得知识的才能,具有较强的实际才能和创新认识。个中,只要复旦大年夜学的课程设置强调了数据迷信家是研究数据的迷信家,而不只仅是一个数据工程师或许数据分 析师[2](检查中国大年夜数据技巧与家当生长白皮书2013原文)。

国际开设《数据迷信》课程调研成果

大年夜陆:根据搜集调研成果,国际高校今朝还没有关于已开设《数据迷信》课程的相干材料,然则,不清除个别曾经开设《数据迷信》课程(由于有些教员能够没有为课程建立主页)。相干高校在数据迷信范畴展开了相干任务,比如,复旦大年夜学设有“上海市数据迷信重点实验室”和“数据迷信研究中间”,清华大年夜学数据迷信研究院筹划在2014年9月开端培养大年夜数据硕士,华东师范大年夜学设有“数据迷信与工程研究院”。在教材方面,复旦大年夜学朱扬勇、熊赟等人编写了《数据学》,北京理工大年夜学杨旭、汤海京等人编写了《数据迷信导论》。

喷鼻港:调研了中国喷鼻港几所重要大年夜学,喷鼻港大年夜学、喷鼻港中文大年夜学、喷鼻港理工大年夜学、喷鼻港科技大年夜学、喷鼻港城市大年夜学、喷鼻港浸会大年夜学、喷鼻港岭南大年夜学,都没有开设《数字迷信》这门课,然则,有几所大年夜学开设了《Data Analysis》这门课,然则并没有课程信息,只要简单简介。(检查调研申报

台湾:中国台湾省各高校临时未开设《数据迷信》课程,经过过程地下的材料也未显示有开课预备。台湾平易近间有一个“材料迷信实验室”组织,2014年召开了“台湾材料迷信爱好者大年夜会”,有开设材料迷信相干课程。(检查调研申报

国外开设《数据迷信》课程调研成果

美国:华盛顿大年夜学开设了《Introduction to Data Science》,简介了关系型数据库、MapReduce、NoSQL、基本数据分析、机械进修、可视化、图论。约翰霍普金斯大年夜学在Coursera上一口气推出了9门Data Science方面的课程,构成“数据迷信家”专项课程。(1)数据迷信家的对象箱;(2)R说话法式榜样开辟;(3)获得和整顿数据;(4)摸索性数据分 析;(5)可反复性研究;(6)统计揣摸;(7)回归模型;(8)实用机械进修;(9)数据产品开辟。纽约大年夜学开设MS data science项目。哥伦比亚大年夜学设稀有据迷信学院。MIT开设Introduction to Computational Thinking and Data Science(计算思想和数据迷信导论)这门课,简介若何应用计算机来懂得真实世界的景象,目标受众是具有必定Python编程经历和计算复杂度基本知识的先生,课程强调必须加倍照顾浏览范围,而不是一味增长深度;为了这个目标,该课程会为先生供给很多主题的浅近简介,如许先生便可以知道以后在他 们的职业生活中可以用计算机去完成甚么样的义务了;课程的主题包含,画图、随机法式榜样、概率和统计、随机漫步、蒙特卡洛模仿、数据模型化、优化成绩和分类归 并。哈佛大年夜学开设CS109 Data Science,有GitHubk课程材料。(更多内容请检查调研申报

英国:今朝大年夜概有七所高校开设了《数据迷信》及其相干课程,包含谢菲尔德大年夜学、爱丁堡大年夜学、伦敦大年夜学学院、东英吉祥大年夜学、布里斯托大年夜学、曼彻斯特大年夜学、 伦敦大年夜学皇家霍洛威学院。个中,谢菲尔德大年夜学和爱丁堡大年夜学关于这一新兴专业归结最全,并设立了照应的MSc;其他高校只设立了与数据迷信相干的一些课程或专业,如曼大年夜设立了数据与知识管理专业,东英吉祥大年夜学设立了知识发明与数据发掘专业。(更多内容请检查调研申报

韩国、日本:经过对韩国迷信技巧院(KAIST)、浦项大年夜学、首尔国立大年夜学和日本东京大年夜学和京都大年夜学的搜集调研,可初步得出,韩国和日本今朝还没有高校开设《数据迷信》的课程。个中,韩国的三所大年夜学有设立与数据迷信相干的课程,但没有课件材料,也没有扼要的课程简介。(检查调研申报

调研申报汇总

调研内容 调研者 调研日期 调研申报
英国高校开设《数据迷信》课程情况调研 李粲 2014年10月13日到15日 检查
国际大年夜陆高校开设《数据迷信》课程调研 谢荣东 2014年10月13日到16日 检查
美国高校开设《数据迷信》课程情况调研 罗道文 2014年10月13日到16日 检查
日本、韩国高校开设《数据迷信》课程情况调研 李粲 2014年10月17日到20日 检查
中国台湾高校开设《数据迷信》课程情况调研 谢荣东 2014年10月17日到20日 检查
中国喷鼻港高校开设《数据迷信》课程情况调研 罗道文 2014年10月17日到20日 检查

各个大年夜学课程主页

美国

华盛顿大年夜学 约翰霍普金斯大年夜学 哥伦比亚大年夜学  MIT  哈佛大年夜学

英国

The University Of Sheffield The University Of Edinburgh University Science London
University Of East Angila University Of Bristol Royal Holloway

韩国

韩国迷信技巧院 韩国浦项大年夜学 韩国首尔国立大年夜学

进修课程

种别 课程
基本篇 概率论、线性代数、微分方程和微积分、建模、数据库
统计学
编程 Python,Java,JavaScript,R
机械进修
文本发掘
数据可视化
大年夜数据 Hadoop、NoSQL
对象集合

Hive, Tez/Stinger, Impala, Shark和传统开源数据仓库brighthouse

Hawq/Greenplum, Phoenix, HadoopDB, Citusdata

 

相干书本

中文 《数据学》朱扬勇, 熊赟. 复旦大年夜学出版社. 2009年12月, 第1版 检查
中文 中国大年夜数据技巧与家当生长白皮书2013 检查
中文 《数据迷信导论》杨旭,汤海京,丁刚毅主编,北京理工大年夜学出版社,2014年3月出版 检查
英文 <An introduction to data science>, Jeffrey Stanton, Syracuse University, 2012 检查
英文 <Solving problems with visual analytics>, Eurographics Association, 2010
英文 <Advanced Reading List 2014-15, MSc Data Science>,The University of Sheffield供给的数据迷信浏览书本列表 检查
英文 Mining of Massive Datasets, 斯坦福大年夜学,2010年 检查
英文 Foundations of Data Science,John Hopcroft, 2013年3月 检查

相干材料

中文 需求低落的数据迷信家 检查
中文 数据学将深刻影响人类将来 检查
中文 数据迷信与数据发掘 检查
英文 Data science and its relationship to big data and data-driven decision making 检查
英文 What is data science 检查
中文 从零开端,若何生长为一名数据迷信家 检查
中文 如何成为一个数据迷信家? 检查
中文 中国计算机报独家策划:揭秘数据迷信家 检查
中文 若何成为一名数据迷信家? 检查
中文 加州大年夜学伯克利分校数据迷信专业设置 检查
中文 数据迷信简介 检查
中文 数据迷信家起首应当作的任务 检查
中文 数据迷信与大年夜数据的迷信道理及生长前景 检查

课程扶植大年夜事记

*2014年10月13日,厦门大年夜学数据库实验室林子雨师长教员团队正式启动厦门大年夜学计算机迷信系研究生课程《数据迷信》的扶植任务(检查动员书),全部扶植过程用时1年阁下,将于2015年9月正式对厦大年夜计算机系研究生开放该课程。

*2014年10月14日,厦门大年夜学《数据迷信》课程主页正式上线,由林子雨师长教员担任内容保护,蔡珉星同窗担任技巧支撑。

*2014年10月15日,李粲同窗完成对英国高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

*2014年10月16日,谢荣东同窗完成对国际大年夜陆高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

*2014年10月16日,罗道文同窗完成对美国高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

*2014年10月20日,李粲同窗完成对日本、韩国高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

*2014年10月20日,谢荣东同窗完成对中国台湾高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

* 2014年10月20日,罗道文同窗完成对中国喷鼻港高校开设《数据迷信》课程相干情况的调研,并提交调研申报(检查调研申报)。

参考文献

[1]朱扬勇, 数据学与数据迷信. [TR][OL]. 2009. available at: http://www.dataology.fudan.edu.cn

[2]中国计算机学会大年夜数据专家委员会. 中国大年夜数据技巧与家当生长白皮书2013.

如何成为一个数据迷信家?