Data Analysis and Statistical Inference
2015-09-18 02:15
这门课程的教学目标如下:
认清数据收集的重要性,认清数据收集方法的局限,认清这些因素是如何影响推断的。使用数据软件(R)来在数字上和在视觉上总结数据,并且呈现对数据的分析。
对统计推断的本质有一个概念上的理解。利用评估和测试方法(置信区间和假说测试)来分析单一变量和两个变量之间的关系,以便于理解自然现象的本质以及做出基于数据的决策。利用回归框架做模型来研究两个或更多数据之间的关系。
用通俗易懂的语言在具体环境中正确、高效地讲解结果。
评价基于数据做出的声明和决策。
用简单的数据推断和模型方法完成一个调查项目。
课程大纲
第1周:第一单元 - 介绍数据
第一部分 - 设计研究
第二部分 - 探索数据分析
第三部分 - 介绍通过仿真推断
第2周:第二单元 - 概率和分布
第一部分 - 定义概率
第二部分 - 条件概率
第三部分 - 正态分布
第四部分 - 二项分布
第3周:第三单元 - 推断基础
第一部分 - 估值可变性和中心极限理论
第二部分 - 置信区间
第三部分 - 假设测试
第4周:完成第三单元 + 期中
第四部分 - 其他估计量的推断
第五部分 - 判断的错误、重要性和可信度
第5周:第四单元 - 数字变量的推断
第一部分 - 比较两种方法
第二部分 - 另解
第三部分 - t分布推断
第四部分 - 比较三种或更多方法(ANOVA)
第6周:第五单元 - 明确变量推断
第一部分 - 单比例
第二部分 - 两比例对比
第三部分 - 通过仿真比例推断
第四部分 - 比较三种或更多比例(Chi-square)
第7周:第六单元 - 介绍线性回归
第一部分 - 两个数字变量之间的关系
第二部分 - 单一预测的线性回归
第三部分 - 线性回归中的异常值
第四部分 - 线性回归中的推断
第8周:第七单元 - 多重线性回归
第一部分 - 多预测的线性回归
第二部分 - 多重线性回归推断
第三部分 - 模型选择
第四部分 - 模型诊断
第9周:复习/答疑周
贝叶斯推论 vs. 概率推论
第10周:期末考试
先修知识
基础数学,不需要编程经验。对数据分析的真心热爱是附加条件!
参考资料
这门课设计成自我包含所有内容的形式。但是我们建议学生参考《OpenIntro Statistics》(第七版)。这门课紧跟这本书,所以书中内容可以作为视频材料的补充。除此之外,练习题会从这本书中出。本书是公开资源,可以在网站openintro.org上免费在线阅读。
授课形式
这门课会包括视频课程,5到10分钟的长度,每个视频会有几个视频内测试。家庭作业包括评分的选择题测试、不计分的书中问题、数据计算分析作业、一个数据分析项目、期中和期末考试。
常见问题解答
完成这门课程后能获得证书吗?
能。只要你依据评分规则成功完成了这门课,就能得到证书。
这门课是免费的吗?
是的!你免费上这门课,并且获得免费的证书。
不过,如果你想要认证证书,你需要支付费用。你可以在这里阅读更多的认证证书信息,来看看有没有你感兴趣的地方。除此之外,如果你想要获得推理论证、数据分析和写作的系列课程认证,你就需要认证证书。你可以点击这里了解更多关于系列课程的信息。
上这门课需要之前学习编程知识吗?
这门课不需要编程背景。所有你需要学习的这门课都已经包括了。
这门课需要什么资源?
你需要稳定的网络连接以便观看视频,得到推荐的阅读材料,完成测试和考试。为了完成实验和大作业,你需要能够运行R(一个免费的数据计算和图形化软件)和RStudio(一个以R作为用户接口的集成开发环境)。
或者,你可以选择在DataCamp.com搭建实验环境(不是项目),这是一个在线的交互学习平台。这个平台提供这门课所用到的交互版的R实验环境,它提供提示和安装反馈,可以促进学习过程。这些提示就像是对你的一个引导,及时反馈帮助你避免很多因为学习新的编程语言猜测隐晦的报错信息带来的沮丧。
R/RStudio可以在任何系统上运行吗?
R可以在Windows、Mac Os和Ubuntu上运行。你可以在http://www.r-project.org下载R,在http://www.rstudio.com/上下载RStudio。一旦这门课开始,我们会提供怎么安装启动R和RStudio的视频。
完成这门课我需要学习R吗?
你可以顺利通过某些课程内容而不需要使用R,但是你需要用R来做实验和大作业来争取获得优秀证书。
R可以在智能手机或者平板上运行吗?
R可以在智能手机和平板上运行(看这里),但是这需要权限接触RStudio服务器,本门课不提供这些。RStudio服务器安装教程在RStudio的网站上提供,点击这里。