mmdetection官方文档环境搭建docker找了一个torch版本为1.5.1+cu101的docker环境,然后安装mmdetection环境 pip install mmcv-full git clone https://github.com/SwinTransformer/Swin-Transformer-Object-Detection cd Swin-Transformer-Object-Detection-master pip install -r requirements/build.txt p…

最新在看知识蒸馏的文章,主要是现在的深度学习模型越来越大,例如BERT。在线下处理数据,对时间要求不高的话,还能接受,能跑完就好。但是线上运行,对延迟要求高的话,像BERT这样的大模型,就很难满足要求。因此,就找了找模型压缩的方法。 知识蒸馏被广泛的用于模型压缩和迁移学习当中。开山之作应该是”Distilling the Knowledge in a Neural Network“。这篇文章中,作者的motivation是找到一种方法,把多个模型的知识提炼给单个模型。 文章的标题是Distilling the Kn…

x = nn.functional.interpolate(x, scale_factor=8, mode='bilinear', align_corners=False) torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None): Down/up samples the input to either the given&n…

一、简介       上采样的技术是图像进行超分辨率的必要步骤,最近看到了CVPR2019有一些关于上采样的文章,所以想着把上采样的方法做一个简单的总结。看了一些文章后,发现上采样大致被总结成了三个类别:1、基于线性插值的上采样2、基于深度学习的上采样(转置卷积)3、Unpooling的方法其实第三种只是做各种简单的补零或者扩充操作,下文将不对其进行涉及。 为了方便大家阅读,做了个小的目录,接下来的文章介绍主要分为以下内容:线性插值1、最近邻算法2、双线性…

针对MobileNet v1的缺点,2018年诞生的MobileNet v2吸收了残差网络的思想,主要从两个方面改善了网络结构,提升了MobileNet的检测精度。 首先,MobileNet v2利用残差结构取代了原始的卷积堆叠方式,提出了一个Inverted ResidualBlock结构,如图5所示。依据卷积的步长,该结构可分为两种情形,在步长为1时使用了残差连接,融合的方式为逐元素相加。 相比于MobileNet v1与原始的残差结构,这里有两点不同: Inverted Residual Block结构 由于…

 一.简介: 初次使用python的你一定感受到了python的便捷。作为高级编程语言只需调用类库即可。 对于圆形物体识别问题,opencv提供了大量方法。 二.检测步骤: 2.1读取图像 窗口1(初始图像未经过处理) 2.2降噪处理 由于图像中存在大量噪点(什么是噪点参考https://update.blog.csdn.net/article/details/112390630) 利用降噪方法cv2.blur(img, (5,5)) 其中两个参数为横向纵向的模糊程度,数值越大越模糊 这是5,5的模糊程度…

本期我们将一起学习如何使用OpenCV的进行图像拼接。 01. 目录 python入门步骤1 —图像导入步骤2-调整图像大小步骤3-融合图像步骤4-导出结果 02. Python Python是一种通用的编程语言,在分析数据方面非常流行,它还可以让帮助我们快速工作并更有效地集成系统。 03. 入门 对于该项目,我们将仅使用OpenCV库。在处理计算机视觉项目时,OpenCV是必备软件包。OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库OpenCV的构建旨在为计算机视觉应用程序提供通用的基础结构,…

简介 本文利用attention机制,使得针对网络有了更好的特征表示,这种结构通过支路学习到通道间关系的权重和像素间关系的权重,然后乘回到原特征图,使得特征图可以更好的表示。 Convolutional Block Attention Module 这里的结构有点类似与SENet里的支路结构。 对于Channel attention module,先将原feature map分别做global avg pooling 和global max pooling,然后将两pooling后的向量分别连接一个FC层,之后po…

NEU数据集大全,包含了原始数据集,扩展的64*64大小的分类数据集,缺陷定位(带有label)的数据集钢材表面:NEU-CLS(可用于分类、定位任务) 由东北大学(NEU)发布的表面缺陷数据库,收集了热轧钢带的六种典型表面缺陷,即轧制氧化皮(RS),斑块(Pa),开裂(Cr),点蚀表面( PS),内含物(In)和划痕(Sc)。该数据库包括1,800个灰度图像:六种不同类型的典型表面缺陷,每一类缺陷包含300个样本。对于缺陷检测任务,数据集提供了注释,指示每个图像中缺陷的类别和位置。对于每个缺陷,黄色框是指示其位置…

这篇文章收录于ECCV2020,是旷视科技和香港科技大学发表一篇关于新的激活函数的文章。主要的创新点是在激活函数阶段实现像素级的空间信息建模能力,能够用于目标检测、语义分割等目标识别任务,简单又高效! 论文地址:https://arxiv.org/abs/2007.11824 代码地址:https://github.com/megvii-model/FunnelAct 本文提出了一种用于图像识别任务的简单但有效的激活函数,称为Funnel 激活函数(FReLU),它通过增加可忽略的空间条件开销将ReLU和PReLU…