欢迎来到计算机视觉课程

欢迎来到《计算机视觉》教程

本教程是一个基于 PyTorch 的计算机视觉课程,适合希望深入学习深度学习技术、掌握计算机视觉方法,并使用 PyTorch 构建神经网络的学习者。

本教程分为如下部分:

1、Python基础:在这部分中,我们将学习Python的环境搭建,介绍编程的核心概念,包括基础语法与数据类型、运算符,控制语句、函数与模块的使用,以及面向对象编程。帮助大家理解和掌握Python的基础编程技能,为后续的图像处理与机器学习算法的实现奠定基础。通过这一阶段的学习,我们将能够编写简单Python代码,并理解其在实际应用中的逻辑和结构。

2、Numpy、Pandas、Matplotlib等库的使用:在本部分中,我们将学习如何安装模块。学习Numpy中的ndarray数据结构,以及Numpy中的常用函数。学习Pandas中的DataFrame,Series等概念,以及Pandas中常用的统计函数。我们还将学习如何使用Matplotlib绘制各种各样的图表。

3、基于OpenCV的数字图像处理:在这部分中,我们将学习如何使用Opencv读取图片,以及图片在Python程序中是如何表示的,我们还将学习如何对图片进行操作,学习Sobel算子、Laplacian算子、Canny算子这3种边缘检测的算法。

4、机器学习基础:在本部分的机器学习基础教学中,我们将学习机器学习的核心概念和基础算法。课程内容包括数据预处理、特征提取、监督学习与无监督学习的基本原理,以及常见算法如线性回归、逻辑回归、支持向量机、K近邻算法和K均值聚类的详细讲解。通过学习这些机器算法的理论,为后面深入学习深度学习和计算机视觉技术打下坚实基础。

5、深度学习:在这部分中,我们将学习神经网络的基础,我们将构建一个神经网络,并训练一个小型的演示数据集,我们将学习学习率(Learning Rate)、数据集大小(Batch Size)等各种超参数如何影响模型的预测效果,以及如何提高模型预测的准确率。

6、图像分类:在这部分中,我们将学习卷积神经网络,迁移学习(transfer learning),我们将介绍VGG16模型,并利用预训练的VGG16模型进行图片分类。

7、图像检测:在这部分中,我们将学习图片分类的基础,理解区域选取(region proposals)原理,理解交并比(Intersection over Union)的概念,使用R-CNN(region-based convolutional neural network)来进行对象检测。

8、语义分割:在这部分中,我们将学习,U-Net模型的原理,以及如何使用U-Net模型来进行像素级分类。

9、图像生成:在这部分中,我们将学习变分自编码器(VAE)和生成对抗网络(Generative adversarial networks)的基础原理,并给大家介绍Stable diffusion的基本用法。