>> 必修课程
人工智能概论
将概述最成熟的人工智能和机器学习方法和范例,并为学生提供实施人工智能算法和使用相关软件工具的机会。涵盖的领域将包括监督学习(分类和回归,例如神经网络)、非监督学习(聚类)、概率方法(例如贝叶斯网络和马尔可夫决策过程)、遗传算法和多代理系统。
高级数据分析
本单元涵盖的机器学习主题包括:统计模式识别原理(数据概率模型、维数泛化误差灾难、偏差-方差困境);线性模型(概率主成分分析;判别分析);广义相异映射和邻居嵌入技术;高斯过程;潜在变量模型(高斯混合模型、生成地形图和高斯过程潜在变量模型);贝叶斯模型正则化与组合;特征选择;大数据集的挑战和潜在的解决方案。教授的文本分析方法包括基于规则的方法、传统的机器学习技术,以及当前领先的技术,例如基于深度学习神经网络的技术。
数据分析简介
本单元涵盖的信息可视化主题包括:数据类型及其表示、非矢量数据、可视化分析的人类需求、科学可视化、可视化质量指标、Shneiderman 的口头禅(概述优先、缩放和过滤、按需提供细节)实用可视化工具。
本单元涵盖的文本分析主题包括无监督和监督文本挖掘方法,包括文本预处理、结构化数据提取、文档聚类、文档分类和使用不同技术的情感分析。
技术、创新、商业和社会 (TIBS)
本单元旨在为学生提供更广泛的商业、经济和社会背景以及技术创新影响的广泛基础,重点是数字、以数据为中心和软件密集型技术。该课程将涵盖负责任的创新和开放式创新:结合内部和外部利益相关者的想法以推动新技术的有用发展。本单元的学生还将在技术创新的法律、管理和金融方面打下基础,以实现知识转移和财富创造。它将特别考虑使用个人数据所涉及的法律、伦理和技术问题,并参考通用数据保护条例 (GDPR) 等框架和数据伦理与创新中心等组织。
大规模数据工程
本单元首先讨论推动云计算在各个行业快速发展和采用的经济学;然后探索从基础架构即服务 (IaaS) 到平台即服务 (PaaS)、软件即服务 (SaaS) 和“无服务器”功能的云服务供应——即服务 (FaaS)。介绍了开源的Hadoop“生态系统”云服务项目,考察了各种云数据存储和数据处理技术,评价了它们的优缺点。本单元最后概述了大数据使用和管理的最佳实践。
>> 选修课程
软件开发:编程和算法
本单元的目的是为学生提供算法设计和分析、基本编程技能(以 Python 编程语言授课)以及当代软件开发和工程实践的广泛介绍。
统计计算和实证方法
本单元的目的是为学生提供使用 R 编程语言的统计计算原理和经验方法的广泛介绍。我们将涵盖数据整理和数据探索、统计显着性检验、参数估计、实验设计和回归分析等主题。