yolov5 在训练时出现错误: UnicodeEncodeError: 'ascii' codec can't encode character '\U0001f680' in position 99: ordinal not in range(128) 解决办法: 在运行程序时,添加 PYTHONIOENCODING=utf-8 如: PYTHONIOENCODING=utf-8 python train.py yolov5的字符编码问题 待分类
猫狗识别(ResNet34) 前言 网络模型:ResNet34、VGG 数据集:Kaggle Cat&Dogs 实现:自定义数据集、构建模型、学习率衰减、绘制损失函数、评估模型 要求:了解pytorch 加载数据集、训练、验证 1. 数据处理 Kaggle官方的猫狗大战数据集。这个数据集包含训练集25000张和测试集12500张。 1.1 建立dataset.py文件 要求: 图片缩放到网络所需要的大小 对每张图片建立正确的标签label 1.2 导入需要的包 import os, glob import torch import torchvision from PIL import Image from torch.utils.data import Dataset 重写torch.utils.data.Dataset类下的__init__ 、 getitem 、 len 三个函数 重写后的数据集类命名为data_set ,继承 Dataset类 1.3 __init__重写 初始化时,需要传入数据所在的位置,图像的变换操作,是否为train。 def _.... 猫狗分类(ResNet34) 待分类
神经网络讲解:特点是线性可分 tensorflower的可视化非线性分类 在神经网络中,每一个层做的事情就是 完成 输入空间 -> 输出空间的变换。 升维、降维 放大、缩小 旋转 平移 弯曲 123的操作需要W完成,4的操作需要b,5的操作需要激活函数这种非线性的函数了。 空间变换的动态图展示(colah.github.io) 发现一个大佬的博客 Andrej Karpathy Academic Website (stanford.edu) Andrej Karpathy 这两个一个是他的学校主页,一个是他的个人blog。 在博客中,有他的演讲,教学,文章,实验工程 目前看到的实验工程中,大部分是可以在浏览器中运行的类似TensorFlow playground ,可以通过可视化看到详细的过程。 线性可分细节: 先来一维了解。在一个数轴上,区分正负是容易的,一个0点就可以把它们区分开了。如果在一个数轴上要区分奇偶数的话,一个点就不可能实现了,需要对所有数据进行一次变换。对输入数据进行对2取余操作,结果只有两种,0和1 ,这时候就可以分开了。 升高到平面的话,也是类似,比如太极类似.... 空间变换与线性可分 待分类
介绍了yolo的应用方面,特性,长处。以及后面的发展 讨论YOLO模型的基本概念,架构。然后探究v2到v8的改进和增强。有哪些大方向的改进,提供一个对YOLO框架的演变 强调了检测过程中的速度和准确性之间的权衡,及未来发展方向,开发的潜在途径,实时对象检测的持续发展 有更新! YOLO系列综述 YOLO