>> Statistics core subjects
数据科学的统计建模
统计模型是数据科学应用程序的核心。开发了线性和广义线性模型、混合模型和非参数回归等建模方法。讨论了时间序列、纵向和空间数据的应用。介绍了因果推理和处理缺失数据的方法。
数据科学的多元统计
现代统计学和数据科学处理具有多个维度的数据。多元方法用于处理这些类型的数据。讨论了使用多元数据进行监督和非监督学习的方法。特别介绍了分类、聚类、降维等方法,特别适用于高维数据。讨论了参数和非参数方法。
计算统计与数据科学
计算技术和数据挖掘方法在现代统计研究和数据科学应用中不可或缺,其中经常涉及“大数据”问题。本主题将介绍计算统计和数据科学中一些最近开发的方法和应用程序,这些方法和应用程序可扩展到大型数据集和高性能计算。将要介绍的数据挖掘方法包括通用模型诊断和评估技术、核和局部多项式非参数回归、基扩展和非参数样条回归、广义相加模型、分类和回归树、前向阶段和梯度提升模型。将详细解释数据科学中使用的重要统计计算算法和技术。
>> Computer science core subjects
集群与云计算
集群计算:并行和分布式计算的要素、集群系统架构、资源管理和调度、单系统映像、并行编程范例、使用 MPI 的集群编程
效用计算:基础和网格计算技术
云计算:云平台、虚拟化、云应用程序编程模型(任务、线程和 MapReduce)、云应用程序以及公用事业和云计算的未来方向
分布式环境中的“大数据”处理和分析。
统计机器学习
涵盖的主题将包括:线性模型、支持向量机、随机森林、AdaBoost、堆栈、委员会查询、多视图学习、深度神经网络、非/定向概率图模型(贝叶斯网络和马尔可夫随机场)、隐马尔可夫模型,主成分分析,核方法。
高级数据库系统
该主题将涵盖高级数据库系统中使用的技术。涵盖的主题将包括:事务,包括并发性、可靠性(ACID 属性)和性能;以及结构化和非结构化数据的索引。该主题还将涵盖其他主题,例如:不确定的数据;查询;语义网和资源描述框架;数据空间和数据来源;数据中心和数据归档。
>> 选修课程
空间数据管理
空间数据库
空间数据分析
信息可视化
高维数据分析
高级统计建模
风险数学
工业优化
统计与数据科学实践
随机微积分及其应用
高级概率
随机过程
贝叶斯统计学习
数理统计
人工智能规划自治
高级理论计算机科学
生物信息学算法
计算基因组学
约束规划
密码学和安全
声明式编程
分布式算法
分布式系统
互联网技术
移动计算系统编程
并行和多核计算
编程语言实现
自然语言处理
流计算与应用
知识管理系统
安全分析
计算机视觉
人工智能伦理