实用深度学习
我们刚刚为经验更丰富的学生推出了新的 >30 小时视频课程
这门免费课程专为具有一定编程经验的人士(和兔子!)设计,他们希望学习如何将深度学习和机器学习应用于实际问题。
深度学习可以做各种神奇的事情。例如,本网站上的所有插图都是使用深度学习通过 DALL-E 2 生成的。
欢迎!
程序员实用深度学习 2022 年第 1 部分课程在 昆士兰大学 录制,涵盖了如何做以下事情:
- 构建和训练用于计算机视觉、自然语言处理、表格分析和协同过滤问题的深度学习模型
- 创建随机森林和回归模型
- 部署模型
- 使用 PyTorch(全球增长最快的深度学习软件)以及 fastai 和 Hugging Face 等流行库
课程共 9 节,每节时长约 90 分钟。本课程基于我们的 5 星图书,该书可在 网上免费获取。
你不需要任何特殊的硬件或软件——我们将向你展示如何使用免费资源来构建和部署模型。你也不需要任何大学数学基础——我们将在课程中教授你所需的微积分和线性代数知识。
现在就开始观看课程 1!
真实成果
我们的视频播放量已超过 6,000,000 次!查看校友、顶尖学者和行业专家对我们的书籍和课程的几十条推荐语。
“深度学习适用于所有人”,我们在本书第 1 章第 1 节中看到了这一点,虽然其他书籍可能也有类似的说法,但本书真正兑现了承诺。作者在该领域拥有丰富的知识,但能够以一种非常适合具有编程经验但没有机器学习经验的读者的方式来描述它。本书先展示示例,然后只在具体示例的背景下介绍理论。对大多数人来说,这是最好的学习方式。本书出色地涵盖了深度学习在计算机视觉、自然语言处理和表格数据处理方面的关键应用,但也涵盖了其他一些书籍可能遗漏的关键主题,例如数据伦理。总而言之,这本书是程序员掌握深度学习的最佳资源之一。
Peter Norvig
Google 研究总监
到第二课结束时,你将构建并部署一个自己的深度学习模型,用于处理你收集的数据。许多学生将他们的课程项目发布到我们的论坛上;你可以在这里查看。例如,如果你的后院有一只未知的恐龙,也许你需要这个恐龙分类器!
我们课程的校友已进入 Google Brain、OpenAI、Adobe、Amazon 和 Tesla 等组织工作,在 NeurIPS 等顶级会议上发表研究成果,并利用在此学到的技能创办了初创公司。广受好评的 Camera+ 应用的首席开发者 Petro Cuenca 在完成课程后,为他的产品添加了深度学习功能,该产品随后因其“机器学习魔法”而受到 Apple 的推荐。
现在就开始观看课程 1!
你的老师
我是 Jeremy Howard,你在这段旅程中的向导。我负责 fastai 的开发,fastai 是你将在整个课程中使用的软件。我使用和教授机器学习已有大约 30 年的时间。我曾连续两年在全球最大的机器学习社区 Kaggle 的机器学习竞赛中排名第一。在此成功之后,我成为了 Kaggle 的总裁兼首席科学家。自从 25 年前首次使用神经网络以来,我领导了许多以机器学习为核心的公司和项目,包括创立了第一家专注于深度学习和医疗领域的公司 Enlitic(被《麻省理工科技评论》评为“全球最聪明的公司之一”)。
我是 fast.ai 的联合创始人(与 Rachel Thomas 博士一起),fast.ai 是本课程背后的组织。在 fast.ai,我们非常重视教学。在本课程中,我首先会展示如何使用一个完整、可用、功能强大且最先进的深度学习网络,利用简单、表达力强的工具来解决现实世界的问题。然后,我们将逐步深入了解这些工具是如何构建的,以及构建这些工具的工具是如何构建的,等等……我们始终通过示例进行教学。我们确保提供你可以直观理解的背景和目的,而不是从代数符号操作开始。
现在就开始观看课程 1!
这门课程适合我吗?
以前的 fast.ai 课程吸引了来自各行各业、世界各地的数十万学生学习。许多学生告诉我们他们如何成为国际机器学习竞赛的多个金牌得主,收到顶尖公司的聘用,并发表了研究论文。例如,Isaac Dimitrovsky 告诉我们,他“玩了几年机器学习,但一直没真正搞懂……[然后] 去年年底学习了 fast.ai 的第一部分课程,突然就开窍了”。他随后在享有盛誉的国际 RA2-DREAM Challenge 竞赛中获得第一名!他利用 fastai 库开发了一种多阶段深度学习方法,用于评估类风湿性关节炎的放射学手足关节损伤评分。
无论你是否拥有技术或数学背景(当然,有也没关系!),我们编写这门课程的目的是让尽可能多的人能够接触深度学习。唯一的先决条件是你懂编程(一年经验就足够了),最好是 Python,并且至少学过高中数学课程。
深度学习是一种计算机技术,通过使用多层神经网络来提取和转换数据——其应用案例从人类语音识别到动物图像分类不等。很多人认为要用深度学习取得好结果需要各种难寻的资源,但正如你在这门课程中将看到的,那些人错了。以下是进行世界级深度学习绝对不需要的几件事
误区(不需要) | 真相 |
---|---|
很多数学知识 | 只需高中数学水平就足够 |
大量数据 | 我们已经用不到 50 条数据取得了破纪录的结果 |
昂贵的电脑 | 你可以免费获得进行最先进工作所需的资源 |
现在就开始观看课程 1!
你将使用的软件
在本课程中,你将使用 PyTorch、fastai、Hugging Face Transformers 和 Gradio。
我们已经完成了数百个机器学习项目,使用了数十种不同的软件包和许多不同的编程语言。在 fast.ai,我们编写的课程使用了当今大多数主要的深度学习和机器学习软件包。在决定将其用于未来的课程、软件开发和研究之前,我们花了超过一千小时测试 PyTorch。PyTorch 现在是全球增长最快的深度学习库,并且已用于大多数顶级会议的研究论文。
PyTorch 最适合作为低级基础库,为更高级的功能提供基本操作。fastai 库是 PyTorch 之上用于添加更高级功能的最受欢迎的库之一。在本课程中,随着我们对深度学习基础知识的深入探索,我们也将深入了解 fastai 的各个层。
Transformers 是一个专注于使用 Transformer 模型进行自然语言处理 (NLP) 的流行库。在课程中,你将看到如何使用这个库创建一个最先进的 Transformer 模型,用于检测专利申请中的相似概念。
现在就开始观看课程 1!
为什么是深度学习?
深度学习具有强大的能力、灵活性和简洁性。这就是我们认为它应该应用于许多学科的原因。这些学科包括社会科学、自然科学、艺术、医学、金融、科学研究等等。以下列出了深度学习或大量使用深度学习的方法目前在世界范围内表现最佳的数千项不同领域的任务中的一部分:
- 自然语言处理 (NLP) 回答问题;语音识别;文档摘要;文档分类;在文档中查找姓名、日期等;搜索提及某一概念的文章
- 计算机视觉 卫星和无人机图像解释(例如,用于灾害恢复);人脸识别;图像字幕生成;读取交通标志;在自动驾驶汽车中定位行人和车辆
- 医学 在放射影像中查找异常,包括 CT、MRI 和 X 光片;计算病理切片中的特征;测量超声检查中的特征;诊断糖尿病性视网膜病变
- 生物学 蛋白质折叠;蛋白质分类;许多基因组学任务,如肿瘤-正常测序和对具有临床意义的基因突变进行分类;细胞分类;分析蛋白质-蛋白质相互作用
- 图像生成 图像着色;提高图像分辨率;去除图像噪声;将图像转换为著名艺术风格的艺术作品
- 推荐系统 网页搜索;产品推荐;主页布局
- 游戏 国际象棋、围棋、大多数 Atari 视频游戏以及许多实时策略游戏
- 机器人 处理难以定位(例如,透明、有光泽、缺乏纹理)或难以拾取的物体
- 其他应用 金融和物流预测,文本到语音,等等……
现在就开始观看课程 1!
你将学到什么
完成本课程后,你将学会:
- 如何训练能在以下领域达到最先进水平的模型:
- 计算机视觉,包括图像分类(例如,按品种分类宠物照片)
- 自然语言处理 (NLP),包括文档分类(例如,电影评论情感分析)和短语相似度
- 包含类别数据、连续数据和混合数据的表格数据
- 协同过滤(例如,电影推荐)
- 如何将你的模型转换为 Web 应用程序并进行部署
- 深度学习模型为何以及如何工作,以及如何利用这些知识提高模型的准确性、速度和可靠性
- 实践中真正重要的最新深度学习技术
- 如何从头实现随机梯度下降和一个完整的训练循环
以下是课程涵盖的一些技术(如果你现在还不明白这些术语也没关系——你很快就会学到它们):
- 随机森林和梯度提升
- 仿射函数和非线性激活
- 参数和激活值
- 迁移学习
- 随机梯度下降 (SGD)
- 数据增强
- 权重衰减
- 图像分类
- 实体和词嵌入
- 以及更多
现在就开始观看课程 1!
如何开始?
要观看视频,请点击导航侧边栏中的“课程”部分。所有视频都配有字幕;观看视频时,点击“CC”按钮可以开启或关闭字幕。为了了解课程内容,你可能想快速浏览一下我们学生整理的课程笔记(感谢 Daniel!)。这里是他的课程 7 笔记和课程 8 笔记。你也可以通过这个 YouTube 播放列表访问所有视频。
每个视频都设计为与书中的各个章节配套。书中的每一章都以交互式 Jupyter Notebook 的形式提供。Jupyter Notebook 是在 Python 中进行数据科学的最流行工具,这是有原因的。它强大、灵活且易于使用。我们认为你会喜欢它!由于学习深度学习最重要的是编写代码和进行实验,因此拥有一个出色的代码实验平台非常重要。
我们将主要使用 Kaggle Notebooks 和 Paperspace Gradient,因为我们发现它们非常适合本课程,并且有很好的免费选项。我们也会在你的笔记本电脑上进行部分课程内容。(如果你还没有 Paperspace 账户,通过此链接注册可获得 10 美元积分——我们也会获得相应积分。)
我们强烈建议不要使用自己的电脑进行模型训练,除非你对 Linux 系统管理以及处理 GPU 驱动、CUDA 等非常熟悉。
如果你需要帮助,forums.fast.ai 上有一个很棒的在线社区随时准备帮助你。在论坛上提问之前,请仔细搜索,看看你的问题之前是否已有人回答过。
现在就开始观看课程 1!