显示模板-统计DS
加拿大-多伦多

多伦多大学 University of Toronto
应用计算硕士 MS in Applied Computing


简 介

UT的课程专注于应用数学、人工智能、计算机科学、数据科学和量子计算,将为您提供真正无与伦比的学术体验。  

学生不仅将有机会定制自己的课程并向世界一流的教师学习尖端技术的最新发展,还有机会通过合作伙伴公司之一的实际应用研究实习来应用这些知识。

数据科学

目标是从数据中获取知识。该分支随着数据收集和处理技术的发展而迅速发展,起源于统计学和计算机科学。许多数据科学家不仅涉及数据的技术方面,还涉及使用数据来帮助指导决策。   

UT的数据科学专业为学生提供了对统计和计算机科学方法的深入理解、积极的研究培训以及通过我们的应用研究实习在现实世界中测试学生知识的机会。

项目时长:4个学期 16个月

项目地点:加拿大 多伦多
四年制本科学位

完成相关领域认可大学的适当本科学位,例如统计学、计算机科学、数学或任何具有重要定量成分的学科
本科学习的最后一年至少B+成绩

先修课程

算法和复杂性、数据库系统或操作系统
统计理论/数理统计、概率论或回归分析

语言成绩

托福:93+,口语和写作不低于 22 分,机构代码:0982
雅思:7.0+,单项不低于6.5

3封推荐信

简历

详细说明你的教育、专业和其他经历。列出所有的会议和期刊出版物,并附上完整的引文,包括所有作者、出版地点、日期、页码以及是否经过同行评审。还要列出你所做的所有会议演讲,包括会议名称和演讲时长

成绩单

GRE成绩 - 非必要

GRE institution code: 0982
GT备考
程序设计的形式化方法

使用数学来编写无错误的程序。证明每一个改进;在错误发生时识别错误。程序开发以满足规范;保持正确性的修改。对所有编程都有用;对于生活所依赖的程序至关重要。基本逻辑、形式规范、细化。条件、顺序、并行、交互、概率编程和函数式编程。

编译器和解释器

编译器的结构,编程语言处理。基于正则表达式的扫描,使用上下文无关语法的解析,语义分析(类型和用法检查),编译器字典和表。运行时组织和存储分配、代码生成、优化。使用现代编译器构建工具。课程项目涉及构建一个完整的编译器。

软件工程专题:区块链技术与工程

本课程将是一半讲座和一半阅读小组。我们将涵盖区块链系统背后的技术和软件工程挑战。通过本课程的学习,学生将了解区块链系统的整体架构。该课程还将深入探讨重要的子主题,例如工作量证明、共识协议和智能合约虚拟机。
先决条件:我们希望参加本课程的学生对系统工程有基本的了解,并具有使用 C/C++/Go/Rust 进行系统编程的经验。

软件工程中的实证研究方法

本课程提供以定性和定量实证研究方法为核心的概述和实践经验,包括访谈、定性编码、调查设计以及大规模数据挖掘和分析。将有广泛的阅读,偶尔会有关于课堂阅读的学生演示,每周的家庭作业,以及一个为期一学期的研究项目,学生必须为此准备课堂启动和最终演示以及最终报告。我们将在阅读和作业中专注于软件工程相关的研究问题。学生将挖掘和整合来自在线软件存储库(例如 GitHub 和 Stack Overflow)的数据,并采用从统计建模到社交网络分析的一系列数据分析技术。对于最终的研究项目,我们鼓励学生提出自己感兴趣的研究问题。交付将是一篇研究论文,课堂上提出的一种或多种实证方法必须成为论文的一部分。

分布式计算简介
 
本课程研究分布式计算中的基本模型和问题,重点是同步和容错。算法和不可能的结果都将被考虑。

并行计算机体系结构和编程

本课程的目标是加深对并行计算机体系结构基础知识的理解以及对它们的高效编程。我们将研究如何设计架构来利用和提取不同类型的并行性。重点将放在基础知识、并行架构设计的权衡和前沿研究上。研究的架构可能包括并行微处理器、GPU 和 FPGA。

计算机系统主题:视觉和移动计算系统

本课程将涵盖有关优化尖端视觉/图形/机器学习/机器人应用程序的主题。对于没有系统背景的学生,您将了解 TPU/GPU/CPU/FGPA/等之间的区别。以及为视觉计算应用程序编写高性能算法的权衡/技术。

存储系统主题

世界上超过 90% 的新信息都存储在数字存储系统中,而存储系统是许多企业的支柱。特别是在当今数据驱动的世界中,许多企业的成功取决于他们高效可靠地存储大量数据的能力。存储系统通常主导着整个系统的性能,对数据容量和访问速度呈指数级增长的需求使其成为一个重要且令人兴奋的研究领域。在本课程中,您将了解存储系统的基础知识和最新进展。您还将执行尖端的小型研究项目,您可以在其中设计、构建和/或评估系统。今年开设的课程将特别关注如何使用机器学习来构建更好的计算机系统。

图形、矩阵和持续优化

本课程将重点介绍现代算法设计中的工具和技术(主要来自连续优化和分析),以及它们在理论计算机科学和数值线性代数基本问题的快速算法设计中的应用。涵盖的主题将包括:与图相关的基本矩阵、这些矩阵的特征值与图的组合结构之间的联系、将图研究为电阻网络、图上的随机游走与电阻网络之间的联系、求解电阻网络和拉普拉斯系统的快速算法。
先决条件:对本科算法、线性代数、概率和一些向量微积分有很好的理解。最重要的是,本课程将假设数学成熟度很高,因为该课程本质上是理论和数学的。

优化问题的数值方法

无约束优化问题的数值方法,特别是线搜索方法和信赖域方法。主题包括最速下降法、牛顿法、拟牛顿法、共轭梯度法和大问题的技术。该课程通常每隔一年开设一次。

高性能科学计算

科学和工程中的计算密集型应用程序是在可用的最快计算机上实现的,如今这些计算机由许多并行运行的处理器组成。并行计算机体系结构;在并行架构上实现数值算法;绩效评估。主题来自:矩阵向量积、线性系统的解、稀疏矩阵、迭代方法、域分解、傅立叶求解器。适用于计算机科学、应用数学、科学、工程专业的学生。

量子算法简介

本课程将为计算机科学专业的学生提供对量子计算的严格介绍。涵盖的主题将包括:量子电路模型;量子查询复杂性;基本量子算法包括Grover算法和振幅放大、量子傅里叶变换和应用、相位估计、Deutsch Josza、量子线性系统算法、量子纠错和量子模拟。还将涵盖量子算法设计的现代方法,包括酉函数的线性组合、块编码和量子奇异值变换。本课程假设您不熟悉量子力学,但假设您非常熟悉线性代数和初等实分析和复分析。

可计算性和逻辑

可计算函数、Church 的论文、无法解决的问题、递归可枚举集。谓词演算,包括完整性、紧性和 Lowenheim-Skolem 定理。形式理论和哥德尔不完备性定理。通常在与 CSC448H1 交替的年份提供。

隐私数据分析算法

在本课程中,我们将从严谨的理论角度研究数据分析中的个人隐私。我们将重点关注差分隐私:一种最近在敏感数据分析中实现强大的可证明隐私保护保证的方法。非正式地,如果更改单个个体的数据仅轻微改变算法的输出分布,则数据分析算法是差分隐私的。此保证确保任何个人的隐私风险仅因参与数据收集而略有增加。我们的重点将放在设计高效的差分隐私算法上。在此过程中,我们将了解差分隐私与博弈论、统计学、学习理论和几何学之间的迷人联系。当我们专注于算法时,将会有证据:重要的是正式证明算法提供隐私:这不是可以通过实验验证的东西。大多数证明都很简单,但该课程确实需要数学成熟度和概率论背景,以及算法的设计和分析。

分布式计算理论的高级主题:分布式计算的不可能结果

本课程将重点介绍证明不可解性结果和分布式计算下界的技术。它假定您已经学习了分布式计算理论课程(例如 CSC2221),但欢迎具有良好复杂性理论背景的学生学习该课程,前提是他们愿意阅读一些背景知识。将介绍研究文献中的一些不可能的结果,以说明不同的技术。学生将被分配家庭作业问题,他们将在这些问题中使用这些技术来证明其他结果。每个学生还将向全班展示一项文献中的不可能结果。

算法设计、分析和理论

本课程作为基础课程,适合计算机科学、计算机工程和数学专业的学生。然而,寻找研究课题的“理论学生”也应该对这门课程感兴趣。我们将从通常在本科课程中讨论的主题开始,例如我们的 CSC373,使用一些标准的非标准示例,并讨论一些标准算法范例的精确模型,例如贪婪算法、局部搜索算法和动态编程算法。我们将讨论诸如算法机制设计、随机顺序模型和其他组合问题的随机优化模型、随机算法、LP 舍入、原始对偶算法以及在线凸优化的简要介绍等主题。

计算理论专题:纠错码

本课程是关于纠错码的理论计算机科学方面。在介绍了经典结果之后,我们将看到许多现代主题——局部测试和解码、来自扩展图的代码、傅立叶分析方法、列表解码以及与伪随机性和复杂性理论的联系。

计算理论专题:代数复杂性理论

本课程的目标是了解代数计算的能力和局限性。对于许多自然代数算法,例如矩阵乘法、计算快速傅立叶变换、计算行列式等,算术电路是一种非常自然的计算模型。证明算术电路下界的问题是复杂性理论中最有趣和最具挑战性的问题之一. 本课程将讨论最近和经典的算术电路的下界。它还将讨论去随机化多项式身份测试、多项式重建和多项式因式分解等非常相关的问题。该课程将假定学生具备很强的数学成熟度,以及复杂性理论和算法方面的一些基本背景。

计算语言学

计算语言学和计算机对语言的处理。主题包括:语言模型;上下文无关文法;图表解析、统计解析;语义和语义解释;歧义消除技术;参考分辨率。强调词汇、句法和语义知识的统计学习方法。

计算机视觉基础

介绍视觉、视觉过程和图像理解。场景照明和反射率模型。相机系统几何和图像采集。边缘、线和区域的稳健估计。感性组织。基于视图的图像模型。图像匹配和图像序列中的运动估计。多视图几何。投影和度量重建。物体识别。
先决条件: MAT235 和 CSC324 或同等学历。熟悉初等概率和统计、线性代数、初等几何和向量微积分(包括偏微分)。还假设学生熟悉 Python 编程。

概率学习与推理

对概率的介绍,它是用不确定知识表示和推理的一种手段。使用概率图形模型的概率分布的定性和定量规范。使用图形模型进行推理和概率推理的算法。从经验数据中学习概率模型的统计方法和算法。这些模型在人工智能和机器学习中的应用。

高级数据系统

这是一门研究生主题课程,假设您熟悉数据库管理系统和数据库内部结构。该课程的目的是让学生了解机器学习和数据管理交叉领域的研究课题和基本技术。我们将涵盖与高维数据的存储和索引以及大型数据存储库的查询处理和优化相关的主题。我们还将涵盖与机器学习任务的数据准备相关的主题,并专注于机器学习的某些高级应用,包括视频查询处理和数据编程。

自然语言计算

介绍在智能网络搜索等应用中涉及自然语言和语音的技术;语音识别与合成;和多语言系统,包括机器翻译。N-gram、词性标注、语义距离度量、语言的神经模型、语料库分析。Python 和其他软件。

人机交互

了解适用于用户界面的人类行为:工作活动分析、观察技术、问卷管理和非侵入性措施。人类认知系统的操作参数、任务分析和认知建模技术及其在界面设计中的应用。界面表示和原型制作工具。认知演练、可用性研究和口头协议分析。特定用户界面的案例研究。

机器学习简介

机器学习 (ML) 是一组允许计算机从数据和经验中学习的技术,而不是要求人类手动指定所需的行为。本课程介绍 ML 中的主要概念和思想,并概述许多常用的机器学习算法。它还可以作为更高级的 ML 课程的基础。

神经网络和深度学习

手动设计程序来解决许多现实世界的问题是非常困难的,例如区分猫和狗的图像。机器学习算法允许计算机从示例数据中学习,并生成完成这项工作的程序。神经网络是一类最初受大脑启发的机器学习算法,但最近在实际应用中取得了很多成功。它们是 Google 和 Facebook 等公司用于图像处理、语音转文本和语言理解的生产系统的核心。本课程概述了神经网络算法的基本思想和最新进展。

句子结构的离散数学模型

介绍当今计算语言学中使用的句子结构的主要数学模型。主题包括:字符串匹配和相似性、字符串和树转换器、扩展的上下文无关形式、树邻接语法、子结构逻辑、话语表示演算、类型特征结构和拓扑模型。将讨论解析、算法复杂性、代数性质和形式等价性。需要逻辑、形式语言理论和图论的基本知识。熟悉句法理论会有所帮助,但不是假定的。

几何处理

几何处理扩展了传统的信号处理,将三维曲线和曲面解释为信号。正如可以对音频和图像信号数据进行频谱过滤、降噪和分解一样,三维曲线或曲面的几何形状也可以。在本课程中,我们研究解释和操作几何数据的基本操作背后的算法和数学。这些基本工具支持:用于计算机辅助设计的几何建模、用于计算机图形的逼真动画、可靠的物理模拟以及用于计算机视觉的强大场景表示。

计算成像

计算成像系统在消费电子、科学成像、HCI、医学成像、显微镜和遥感等领域有着广泛的应用。我们讨论数字摄影和基本图像处理、用于图像处理的卷积神经网络、去噪、去卷积、单像素成像、成像中的逆问题、近端梯度法、波动光学、飞行时间成像和端到端优化光学。重点是应用图像处理和使用形式优化和现代机器学习技术解决反问题。学生通过在 Python 中实施和研究图像处理算法来应用材料。学期项目。线性代数和信号处理方面的经验会有所帮助。

计算成像和 3D 传感

从当今智能手机中的高级深度摄像头到下一代自动驾驶汽车的 3D 传感器,3D 传感已经开始彻底改变我们感知世界的方式。然而,这仅仅是个开始:可以在漆黑的黑暗中和角落周围看到的相机、具有亚微米精度或几公里范围的深度传感器,以及可以在皮肤下看到的相机已经成为现实。这些发展的关键是光学、光子学、传感和计算的快速融合。
本研讨会课程将深入介绍 3D 传感和相关技术,以及用于建模和利用它们的计算技术。具体主题将包括单光子探测器的“极端成像”;飞行时间成像和激光雷达的原理;结构光成像;通过散射介质进行 3D 成像;和成像周围的角落。课程形式将基于讨论,每周大约一篇论文和一个学期项目。

信息可视化

本课程将研究根据平面设计、视觉艺术、感知心理学和认知科学的原理创建有效可视化的技术和算法。该课程既针对有兴趣在自己的工作中使用可视化的学生,也针对有兴趣了解该领域前沿研究的学生。学生将对科学研究论文进行阅读和批判性分析,这些论文将在课堂上进行讨论。期末项目将占成绩的大部分,同时也将强调学生的演讲和批判性分析技能。

语义变化的计算模型

单词是人类语言的基本组成部分,但它们的含义往往会随着时间而改变,例如,face('body part' -> 'facial expression'),gay('happy'-> 'homosexual'),mouse('rodent' -> '设备')。像这样的变化给计算机学习词义的准确表示带来了挑战——这是一项对自然语言系统至关重要的任务。本课程探索数据驱动的计算方法来表示词义和语义变化。主题包括词义的潜在模型(例如,LSA、word2vec)、基于语料库的语义变化检测、词义的概率历时模型以及词义扩展的认知机制(例如,链接、隐喻)。该课程涉及一个强大的实践组件,侧重于大规模文本分析和研讨会式演示。

统计Stat & 数据科学DS专业 - 常申院校
点击院校了解具体详情

模板留学服务-统计DS
留学录取案例
返回 统计Stat & 数据科学DS专业 - 留学申请方案
分享到:
分享到:
常申专业解析
+
更多专业常申院校
  • 芝加哥
    美国 - 芝加哥大学
    【商业分析BA】

    国家:美国
    位置:伊利诺伊·芝加哥
    简介:常年稳居全美前10
    建校:1890年


    >>点击查看学校详情


  • 555
    美国 - 罗切斯特大学
    【商业分析BA】

    国家:美国
    位置:纽约州·罗切斯特
    简介:多年在全美30左右
    建校:1850年


    >>点击查看学校详情


  • 美国-哥大
    美国 - 哥伦比亚大学
    【商业分析BA】

    国家:美国
    位置:纽约州·纽约
    简介:美国常春藤Ivy盟校
    建校:1754年


    >>点击查看学校详情


  • 美国-杜克
    美国 - 杜克大学
    【商业分析BA】

    国家:美国
    位置:北卡·达勒姆
    简介:常年在全美前10
    建校:1838年


    >>点击查看学校详情


  • 美国-康奈尔
    美国 - 康奈尔大学
    【运营研究和信息工程】

    国家:美国
    位置:纽约州伊萨卡
    简介:常春藤盟校八成员之一
    建校:1865年


    >>点击查看学校详情


  • 英国-牛津
    英国 - 牛津大学
    【统计】

    国家:英国
    位置:英国牛津
    简介:英国G5超级精英大学
    建校:1096年


    >>点击查看学校详情