软件包在流行病学研究中的应用

课程的主要目标是:(1)了解流行病学研究过程中,从研究设计、现场数据采集和录入、到数据清理和分析,常用的几种软件包的使用方法;(2)加强研究中对流行病学基础理论知识的灵活应用。

北京大学

分享

软件包在流行病学研究中的应用

课程概况

开展一项流行病学研究需要经历研究设计、现场数据采集和录入、数据清理和分析、报告撰写等众多环节。随着计算机软件包的发展,上述的每个环节都可以通过利用不同的软件包高效率、高质量的实现。本课程期望通过众多的实例练习,并配以必要的流行病学基础知识讲解,使学生能够了解几种常见软件包的使用方法,并能将流行病学基础理论等书本知识更加灵活地应用于实际的研究中。

计算样本量是研究设计环节中的关键内容之一。在很多流行病学的教科书中可较容易的查到不同类型研究设计的样本量计算公式;在Google中搜索,也可以找到一些基于Web的样本量计算模块。但是,通过这些途径只可以计算有限设计类型的样本量。本课程将重点介绍PASS软件的使用方法。该软件可以用于230余种统计检验和可信区间估计的样本量计算及功效分析。

流行病学研究中的数据可以通过问卷调查、体格检查、生物样本的实验室检测、环境调查与检测、既往记录或档案查阅等方式获取。现阶段,通过这些过程直接获取的仍然以纸介质数据为主,需要利用一些数据录入软件转录为可分析的数据库。本课程将重点介绍EpiData软件的使用方法。该软件的优势在于软件小巧和免费,可满足数据录入的基本功能要求。

通过纸质问卷收集调查对象的信息,然后再录入到电脑中,在这个过程中,尽管我们可以通过培训调查员、在问卷上突出注明必要的跳转或合法值要求、调查员自查和互查问卷、在录入数据库中设置必要的核查语句等质量控制措施保证数据质量,但仍然常见数据缺失、逻辑错误等问题。平行双录入耗时耗力,发现问题后可能还需要回访、修正数据。整个过程耗人心力。本课程将简要介绍基于移动设备和网络技术的无纸调查方式,帮助理解如何将数据质量控制的关口前移到调查当时。

流行病学研究有多种不同的设计类型,每种设计又对应着一些特有的分析指标。常用的统计软件包可以获得这些指标,但是由于软件是按统计分析方法组织模块,需要使用者熟悉哪个指标对应的是哪种统计方法得来。STATA作为常用的统计软件包之一,专门设计有一个流行病学相关的分析模块,按研究设计组织菜单。因此,本课程以STATA软件包为基础,介绍常用流行病学指标的计算。

抽样调查是最常开展的流行病学研究类型之一。在较大范围的抽样调查中,很少单独使用单纯随机抽样,更多的是使用整群抽样或整合单纯、系统、分层、整群抽样的多阶段抽样。这样抽样设计得来的数据通常被称为复杂抽样调查数据(complex survey data)。常见的流行病学教科书中通常只介绍单纯随机抽样时的样本量计算方法,然后给出“整群抽样时再增加一定数量”的简单原则。而通常统计教学中介绍的统计方法更适用于针对单纯随机抽样获得的数据。本课程通过介绍CSurvey软件包的使用,帮助学生更好地理解复杂抽样调查时样本量计算的通用原则;通过介绍STATA中专门针对复杂调查数据的分析模块,使学生能够了解针对此类数据合理的分析方法。

《软件包在流行病学研究中的应用》是北京大学医学部流行病与卫生统计学学科研究生的专业必修课。本课程也在同期面向北京大学医学部正常选课的研究生开课,采用翻转课堂的教学模式,选课学生在观看MOOC视频、自学相关资源和完成练习后,还需参与教室内的答疑互动。

课程大纲

第一周:PASS软件包在样本量与功效计算中的应用

介绍利用PASS软件包进行常用流行病学研究设计的样本量和功效计算。

第二周:CSurvey软件包在整群抽样调查中的应用

介绍在两阶段整群抽样调查中利用CSurvey软件包实现样本量计算、PPS抽样和生成随机数字表。

第三周:EpiData软件包在数据录入过程中的应用

介绍利用EpiData软件包建立调查问卷数据库、设置核查语句和录入数据。

第四周:EpiData软件包在数据录入过程中的应用

介绍利用EpiData软件包建立关联数据库,以及后期平行双录入的设置、数据导出等功能。

第五周:基于移动设备和网络技术的无纸调查方式在调查数据采集过程中的应用

介绍基于B/S结构的后台管理系统中调查问卷的设置方法,体验基于Android平台的调查软件或基于B/S结构的浏览器(WAP)客户端在现场调查数据采集中的应用。

第六周:STATA软件包的基本操作

介绍STATA软件包的基本操作方法。

第七周:STATA软件包在常用流行病学指标分析中的应用

重点介绍STATA中Tables for Epidemiologists模块的应用,同时讲解与其他常用分析模块的对应性。

第八周:STATA软件包在复杂抽样调查数据分析中的应用

介绍STATA中Survey data analysis模块在复杂抽样调查数据分析中的应用。

第九周:Sublime Text语句编辑器的简单应用

介绍利用语句编辑器Sublime Text软件包提高统计语句编写的效率和准确性。

第十周:考试

先修要求

选课者最好系统学习过本科《流行病学》和《医学统计学》课程,并具备较熟练的计算机基本操作能力。

参考资料

本课程尚无适用的单一出版教材,以教师提供的电子版讲义为准,辅以流行病学基础教材和各种软件自配的帮助文件。

1. 詹思延. 流行病学(第7版). 北京:人民卫生出版社. 2012.

或,李立明. 流行病学(第6版). 北京:人民卫生出版社. 2007.

2. PASS:http://www.ncss.com/software/pass/

3. CSurvey:http://www.ph.ucla.edu/epi/csurvey.html

4. EpiData:http://www.epidata.dk

5. Stata:http://www.stata.com

6. Sublime Text:http://www.sublimetext.com/

授课形式

本课程由9周课程和1周考试组成,每周学习时间为4—6小时。每周课程周一上线,主要包括若干个视频和练习作业。

课程评分根据日常作业的完成情况、课程参与(如同伴互评作业等)和期末考试的答题情况进行。日常作业和期末考试均以提交完成的数据库、语句、结果及其解释为主,以同伴互评打分为主。北京大学医学部正常选课的研究生需在课堂集中完成期末考试;而其他网上选课同学则为通过在规定的时间内线下完成、线上提交完成期末考试。

作为网络公开课程,在选课人数较多的情形下,教师和助教不可能逐一回答每位同学的所有问题。如果你在学习过程中遇到了问题,课程论坛是解决问题的首选场所——你可以在每次视频课程或本课程的总论坛进行提问和讨论。教学团队每周会对论坛上比较重要、有价值的问题优先回答10个问题。鼓励学习者在论坛上互相帮助,释疑解惑。

常见问题

本课程中涉及的部分软件包可在网上免费下载使用(如CSurvey、EpiData、Sublime Text)。另有部分软件包为商业付费软件(PASS、Stata),请选课学生自行解决,本课程不予提供。

声明:MOOC中国收录之课程均源自下列机构,版权均归他们所有。本站仅作报道并尊重其著作权益,感谢他们对MOOC事业做出的贡献!(排名不分先后)
  • Coursera
  • edX
  • OpenLearning
  • FutureLearn
  • iversity
  • Udacity
  • NovoEd
  • Canvas
  • Open2Study
  • Google
  • ewant
  • FUN
  • IOC-Athlete-MOOC
  • World-Science-U
  • Codecademy
  • CourseSites
  • opencourseworld
  • ShareCourse
  • gacco
  • MiriadaX
  • JANUX
  • openhpi
  • Stanford-Open-Edx
  • 网易云课堂
  • 中国大学MOOC
  • 学堂在线
  • 顶你学堂
  • 华文慕课
  • 好大学在线CnMooc

Copyright © 2008-2015 MOOC.CN 慕课改变你,你改变世界