CV各大方向专栏与各个部署框架最全教程整理
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
目前CV方向有不少公众号、知识星球,但总体而言都在走资讯路线,覆盖内容主要以最新论文、综述、行业新闻、就业等方面,这些资讯类往往更加注重“最新”而非内容本身。对于计算机视觉入门的人来说,对于一个做科研的人来说,对于一个做部署走技术路线的人来说,真正把每个内容讲全、讲透的态度尤为重要。为此,我们历时半年时间,召集了几十位各个方向的大佬, 对每个科研方向写了一个大专栏 ,每个专栏花十几篇文章从最基本的任务、数据集、评估指标开始讲起,一路从最早的经典论文讲到最前沿的论文,最后把整个方向的方法、损失函数、改进思路进行一个大总结。另外, 对每个部署框架写了一个完整的教程 ,学习者对于教程中的任何疑问,都可以在对应的文章下提问,直接与教程作者交流。除此以外,最新的资讯、学习答疑、行业新闻、就业、面试经验等都有安排。 真正做到一个以内容为主,走技术路线的CV技术指南 。
【星球概览】
CV技术指南知识星球是一个提供一站式服务的科研平台,致力于提供CV/DL各个方向全面而有深度的 专栏内容、前沿论文解读、开源库共享、行业最新动态以及实践教程部署。 目前涵盖专栏近 20个 ,近期会扩充至 30+ 。除此之外,后续会整理更多方向综述、重要论文分享给大家,也会邀请更多嘉宾入驻,和大家一起分享职场工作、算法研究心得体会等等干货内容。
【星球内容模块概览】
最新论文分享与解读: 检测、分割、域自适应、蒸馏、轻量化、遥感、医学图像、生成模型、质量增强、目标跟踪等等。
实践部署教程: TensorRT、OpenVino、CUDA、Pytorch、MMlab系列等
专栏系列: 2D/3D检测、分割、Diffusion Model、AIGC、Transformer、点云、缺陷检测、遥感图像、量化剪枝蒸馏、REID、域自适应、医学图像、目标跟踪、车道线、行为识别、BEV、人脸识别、图神经网络、GAN等等。
QQ群微信群日常问题搜集: 我们维护了3000+人数的微信以及QQ群,群内各类交流精华问题汇总。
资源共享: 公共数据集、各个方向综述、论文、行业最新情报等等资源共享。
星球主要涵盖内容
一. 科研板块-专栏系列
计算机视觉/深度学习是一个涵盖研究方向特别广的学科,不仅仅是初学者,哪怕是在其中浸淫多年的老司机,也难以保证对所有方向都有所了解,而网络上纷繁复杂的学习内容也让人眼花缭乱、质量参差不齐,想要入门或者切换一个新的方向时也会经常摸不着头脑不知道从何入手。
从另一个角度来说,CV也是一个需要对各个方向都有所了解的行业,仅仅了解自己方向的行业是远远不够的,就比如从没有哪个公司招聘YOLO工程师、目标检测工程师、语义分割工程师,而是招算法工程师,算法工程师是绝对不能只会一个方向的,否则等同于一个技术工人的工具包里只有一把锤子,怎么灵活加工出任何一个零件出来?
基于此, 我们致力于通过【专栏】的形式打造一个计算机视觉全家桶,通过10-20篇精选文章从方向任务概述、常用数据集、评估指标开始,到方向中各个大类解决方案下的重要论文解读,从最早的论文一直讲到最新论文,再到最后从不同的角度来总结归纳其中的技术要点,如网络结构设计、损失函数、后处理方案总结等,带大家一篇一篇循序渐进的走进一个全新的研究方向,帮助你梳理每篇重点论文的优缺点,改进思路,将这个方向的完整画卷逐渐呈现在眼前。
专栏与一般的综述有什么不同? 如果是从零学一个方向,大家会发现综述基本是看不懂的,因为它写的太简洁了,每个内容都仅用一小段话来介绍。 综述唯一能起到的作用就是汇总了这个方向有哪些经典论文,然后你仍然需要一个一个去看论文学各种具体的东西。咱们专栏则远不止于此,通过10-20篇的文章足以带你掌握整个方向的全貌!
专栏与零散的最新论文有什么不同? 零散的论文对于从零学一个方向的人来说,有太多前置知识,这些知识分布在之前的很多论文中,没有人对他们进行汇总总结,例如,咱们随便更新一个方向的最新论文,你可能连评估指标都看不懂,也不懂这篇是在什么样的基础上来创新设计的,因此, 最新论文这种有头无尾的零散一篇文章的作用实际很小,看完后理解程度可能也就20-30%,而咱们的专栏是先从基本任务、评估指标开始,一步一步深入到最新的论文中,可以非常自然地、由浅及深的学习,同样地看到这样一篇最新论文,可以联系整个方向的体系,理解程度可以远远超出这篇论文本身的价值,达到100-150%。
1.目标检测大专栏
目标检测大专栏包括2D目标检测、遥感目标检测、3D目标检测、相关部署教程、各个方向归纳总结等等。
01 通用目标检测
通用目标检测就是我们最常见的通用场景下的2D目标检测,也是目前应用最广的一个方向,CV中很有研究领域的成果都可以转换到通用目标检测中,比如模型轻量化、蒸馏、域自适应、图像质量增强等等,升值从某一方面来说许多方向的研究都是为了让通用目标检测做的更好而衍生出来的~
02 遥感目标检测专栏
遥感目标检测专栏主要针对遥感图像的特殊性对通用目标检测进行优化,遥感图像,也称为高分辨率遥感图像(Very High-resolution Imagery),但是在遥感图像的领域内,除了可见光遥感图像之外,还有其他两种遥感图像,一种是高光谱遥感图像(Hyperspectral Imagery),一种是雷达遥感图像(Synthetic Aperture Radar Imagery),其分类依据是根据成像的介质不同来进行分类的。
03 点云目标检测专栏
三维物体检测在学术上和工程上都具有重要意义,可以更好地控制机器人和自动化系统。可以更好地检测和识别物体,从而改善自动驾驶、机器人技术、计算机视觉等领域的应用。
2. 不良条件下的视觉感知专栏
检测和分割是场景理解的关键部分,在机器人、无人驾驶、安防等领域有着广泛的应用。现有的大部分方法主要在正常的成像条件下进行,虽然在性能表现上较好, 但是并没有考虑到不良条件(恶劣天气、低光照等)下的场景。现实中的场景是复杂多变的,包含着很多不良的条件给视觉算法带来不利的影响。 针对不良场景设计算法变得尤为重要。
3. 图神经网络专栏
4. 视觉定位专栏
我们都知道,哲学领域存在三大问题,即我是谁,我在哪,我要到哪里去。视觉定位领域解决的问题就是“我在哪里”的问题。多智能体比如扫地机器人、自动驾驶汽车等方面的研究通常会涉及定位、感知、规划、控制等方面,视觉定位则属于定位范畴,是其中的一种主要方法。
5. 模型轻量化专栏
01 剪枝
近年来,深度神经网络在许多计算机视觉和自然语言处理任务中取得了很大的成功。然而,这些网络通常具有非常高的计算和存储成本,限制了它们在嵌入式设备和移动设备上的部署。为了解决这个问题,网络剪枝技术被广泛应用于深度神经网络中,以减少其计算和存储需求,成为模型压缩领域流行的研究发现之一。
02 量化
6. 强化学习专栏
7. 图像分割专栏
语义分割是计算机视觉中的重要研究方向,也是目前应用最广泛的计算机视觉任务之一。在这个领域,我们提供一系列全面的语义分割教程,该教程覆盖了从基础概念到深度学习算法的实现和应用的全部内容。其中包括常见的语义分割算法,如FCN、U-Net等,还包括语义分割的评价指标、数据集、代码示例等实用知识。
8. 计算机视觉与深度学习各种大总结
9. Transformer专栏
除了以上这些列出来的,目标跟踪、缺陷检测、点云模型、AIGC、语义分割等专栏已经开始更新,每周新增专栏数量2-3个。
二. 科研板块-最新论文分享与解读
随时保持对最前沿文章的分享与解读~
三. 部署板块
部署板块包含了许多工程部署相关内容,包括Pytorch教程、PaddlePaddle教程、CUDA教程、TensorRT教程、OpenMMLab系列、LibTorch教程、OpenVINO系列教程等等~后续将继续增加各个教程。
PaddlePaddle教程
Pytorch教程
CUDA教程
TensorRT系列教程
TensorRT是NVIDIA针对深度学习推理而设计的高性能推理引擎,它可以将深度学习模型转换为高效的推理计算图,实现快速的模型推理。该系列教程涵盖了TensorRT的各个方面,包括TensorRT的基本知识、安装和配置、模型优化、推理引擎构建、性能调优等内容。此外,该系列教程还提供了大量的示例代码和实践项目,帮助你更好地理解和应用TensorRT。
LibTorch系列教程
LibTorch是PyTorch的C++前端,它提供了一种快速而灵活的方式,用于开发高性能的C++深度学习应用程序。该系列教程涵盖了LibTorch的各个方面,从安装和配置开始,一步步引导读者学习LibTorch的基本知识,包括张量操作、模型训练、模型保存和加载等内容。
OpenVINO系列教程
四. 行业以及资源板块
星球内还有更多行业资讯、工程实践技巧,优秀开源代码,数据集分享。
还有更多讨论,答疑精选~
更多精彩内容等你来探索!
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
【技术文档】《从零搭建pytorch模型教程》122页PDF下载
QQ交流群:444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。
其它文章
超快语义分割 | PP-LiteSeg集速度快、精度高、易部署等优点于一身,必会模型!!!
AAAI | Panini-Net | 基于GAN先验的退化感知特征插值人脸修
与SENet互补提升,华为诺亚提出自注意力新机制:Weight Excitation
最新FPN | CFPNet即插即用,助力检测涨点,YOLOX/YOLOv5均有效
消费级显卡的春天,GTX 3090 YOLOv5s单卡完整训练COCO数据集缩短11.35个小时
原来Transformer就是一种图神经网络,这个概念你清楚吗?