香港科技大学 HKUST大数据技术硕士 MSc in Big Data Technology+ 查看更多
香港科技大学 HKUST
大数据技术硕士 MSc in Big Data Technology
+ 查看更多
这个独特的课程由计算机科学与工程系和数学系联合提供。该专业整合了各种学科,让学生了解大数据的所有重要方面以及如何在现实世界中使用它。
学生将学习大数据的主要组成部分,包括基础设施、数据集成、存储、建模和管理、计算系统、分析和挖掘系统、安全、政策和社会影响,以及各个领域的人为因素和大数据应用(数据科学)。
项目时长
1年制
地理位置
香港 九龙 清水湾
- 学士学位
申请人必须拥有认可大学或高等教育机构的计算机工程、计算机科学、数学或相关领域的学士学位
- 英语语言入学要求
申请人必须满足英语语言要求:
托福-iBT:80
雅思(学术):总分:6.5+,单项不低于5.5
- 中英文成绩单
- 简历
数据分析基础
本课程将提供数据分析的基本技术,包括数据收集、数据提取、数据集成和数据清理。学生将学习如何管理和优化分析价值链,包括收集和提取合适的价值、选择正确的数据处理流程、整合来自各种资源的数据、数据治理、大数据应用程序的安全和隐私。
数据挖掘和知识发现
数据挖掘最近已成为一个主要的研究和应用领域。数据挖掘旨在从数据库和 Web 等大型数据存储库中提取有用和有趣的知识,它集成了数据库、统计和人工智能领域的技术。
大数据计算
大数据系统,包括云计算和并行数据处理框架,作为管理和挖掘数据中心数百甚至数千台商用服务器上的海量数据的支持技术而出现。本课程让学生接触这项新技术的理论和实践经验。该课程将涵盖以下主题。(1) 云计算和生产云服务的基本概念;(2) MapReduce——事实上的数据中心规模编程抽象——及其 Hadoop 的开源实现。(3) Apache Spark——新一代并行处理框架——及其基础设施、编程模型、集群部署、调优和调试,以及构建在Spark之上的众多专用数据处理系统。
数据分析的数学方法
本课程将介绍数学公式和计算方法(凸/非凸优化)来利用数据中包含的结构。此外,还将探索针对大数据分析的特定计算方法(随机化计算方法)。
数据可视化
本课程将介绍日常生活、社交媒体、商业、科学计算、医学影像等数据的可视化技术。主题包括人类视觉系统和感知、视觉设计原则、开源可视化工具和系统、CT可视化技术/MRI 数据、计算流体动力学、图形和网络、时间序列数据、文本和文档、Twitter 数据和时空数据。
金融时间序列的量化分析
资产收益分析:自相关、可预测性和预测。波动率模型:GARCH 型模型,长程相关性。高频数据分析:交易数据、持续时间。马尔可夫转换和阈值模型。多元时间序列:协整模型和向量 GARCH 模型。
优化和矩阵计算
本课程将介绍优化的基本技术,包括无约束优化和约束优化,以及矩阵计算,包括矩阵分析、线性系统、正交化、最小二乘和特征值问题。
社会计算导论
本课程介绍了社会信息网络分析和工程。学生将学习数学和编程知识,以分析典型社交信息网络(例如 Facebook、Twitter 和 MSN)的结构和动态。他们还将学习如何使用社交指标来改进计算机系统设计,因为人就是网络。它将涵盖小世界现象等主题;网络中的传染性倾倒和影响;网络形成和演化模型;网络图和 PageRank;社交图谱和社区检测;测量中心性;网络中的贪婪路由和导航;介绍博弈论和战略行为;社会工程学; 和计算机系统设计的原则。
并行编程
并行计算机体系结构简介;并行算法设计原则;共享内存编程模型;用于集群计算的消息传递编程模型;GPU 的数据并行编程模型;并行算法、系统和应用的案例研究;为感兴趣的任务编写并行程序的实践经验。
图像处理与分析
本课程将介绍图像数据处理和分析的基本技术。主题包括空间和频率域的图像处理和分析、图像恢复和压缩、图像分割和配准、形态学图像处理、表示和描述、特征描述、人脸识别、虹膜识别、指纹识别、图像分析主题,例如医学图像分析。
高级统计:理论与应用
本课程介绍执行数据分析所需的基本统计原理、方法和计算工具。课程主题包括参数模型、充分性原理、估计方法、线性模型、分位数估计、非参数曲线估计、重采样方法、统计计算和假设检验。
机器学习
本课程介绍机器学习的基础知识,包括概念学习、评估假设、监督学习、无监督学习和强化学习、贝叶斯学习、集成方法。
统计预测
本课程将介绍统计预测模型和算法,包括回归模型、分类、加性模型、图形模型和网络、模型评估和选择、模型推理和模型平均。
人工智能
本课程将涵盖人工智能的高级主题,包括机器学习、代理设计、多代理系统、游戏搜索、自然语言处理以及知识表示和推理系统。
深度学习遇上计算机视觉:实践与应用
计算机视觉和相关算法已经开始在各种应用中发挥作用,并在我们的日常生活中变得越来越重要:面部检测、无人机和自动驾驶汽车等等。深度神经网络架构、大型数据集和训练技术的最新发展极大地提高了这些最先进的视觉识别系统的性能。本课程将研究常见的深度学习架构,重点是学习各种计算机视觉任务的有效模型。课程评估的一部分涉及学生提出的课程项目,重点是使用深度学习算法和技术构建一个有效的计算机视觉系统。
区块链技术简介
本课程介绍区块链的基本概念和技术,例如哈希函数和数字签名,以及区块链应用,尤其是在金融科技领域。学生将学习共识协议和算法、区块链社区的激励和政治、比特币和比特币挖矿的机制。该课程还涵盖了区块链系统的局限性和可能的改进。
自然语言处理
本课程是对自然语言处理的介绍。它涵盖了主题的简要概述,包括任务背景、计算问题设置和方法论的一般思想。还将包括一些支持工业级服务的最先进技术,包括主题建模、深度学习模型,以及它们在搜索引擎、聊天机器人和 QA 系统中的应用。
空间和多媒体数据库
许多新应用领域中的数据类型,例如空间、多媒体和广泛的科学应用,通常表示为多维数据。多维数据的数据管理和查询处理技术与关系数据有很大不同。本课程涵盖了一系列数据库主题,旨在为学生提供对与多维数据管理和分析技术相关的问题的批判性思维。将介绍空间和多媒体数据库管理概念、理论和技术,从数据表示、索引、基本操作到高级查询处理,以及高维数据的挑战和解决方案。
分享到:
相关专业申请 - 数据科学DS
相关专业申请 - 数据科学DS
相关专业申请 - 商业分析BA
相关专业申请 - 商业分析BA