视觉算法题

发布时间: 2024-02-25 09:19:48

A. 无人驾驶(二)行人检测算法

姓名：王梦妮

学号：20021210873

学院：电子工程学院

【嵌牛导读】本文主要介绍了无人驾驶中所需的行人检测算法

【嵌牛鼻子】无人驾驶环境感知计算机视觉 SVM Adaboost算法 R.CNN

【嵌牛提问】无人驾驶中所用到的行人检测算法有哪些

【嵌牛正文】

在同样的交通路况下，无人车通过对自身运动状态及行驶环境信息进行分析，决策出最佳行驶策略和行驶方案代替驾驶员完成一系列驾驶冲升拆行为，从而降低道路交通事故的发生率。而在无人驾驶中最为重要的技术便是环境感知，而在城市道路上有大量的行人出行，只有准确快速地检测出行人与对其进行跟踪，才能避免车撞人。

计算机视觉是研究赋予机器“人眼”功能的科学，通过多个传感器来获取一定范围内的色彩数据，用算法分析得到的数据从而理解周围环境，这个过程模拟了人眼以及大脑的处理过程，从而赋予机器视觉感知能力。现有的行人检测技术大多都是检测照片中的行人目标，这种照片的拍摄大多是拍摄的静止目标，图像的分辨率和像素点包含的语义信息都及其丰富，对应的算法在这样的图片上往往能取得理想的效果，但是用于无人车的“眼睛”，算法的鲁棒性就表现的非常差。这是因为在实际的道路环境中，摄像头需要搭载的车身上，在行进过程中跟随车以一定的速度移动，并且在实际道路中，行人目标往往是在运动的，由此提取出拍摄视频中的一帧就会出现背景虚化，造成像素点包含的语义信息大量减少，增加了行人检测的难度。

行人检测是计算机视觉领域的一个重要研究课题。在实际生活中，行人大多处于人口密集、背景复杂笑拦的城市环境中，并且行人的姿态各不相同，如何将行人从色彩丰富、形状相似的环境中快速准确地提取出来，是行人检测算法的难点。

行人检测算法分为两大类，一散枣类是基于传统图像处理，另一类是基于深度学习的方法。近年来随着计算机计算速度的大幅提升，基于深度学习的方法有着越来越高的检测速度与检测精度，在行人检测领域应用越加广泛。

（一）基于传统图像处理的行人检测算法

使用传统的图像处理方法来做行人检测一般都是由两个步骤组成，第一就是需要手工设计一个合理的特征，第二就是需要设计一个合理的分类器。手工设计特征就是找到一种方法对图像内容进行数学描述，用于后续计算机能够区分该图像区域是什么物体，分类器即是通过提取的特征判断该图像区域属于行人目标还是属于背景。在传统的图像处理领域，手工特征有许多种，比如颜色特征、边缘特征(canny算子和sobel算子)以及基于特征点的描述子(方向梯度直方图)等。学者们一致认为方向梯度直方图是最适合行人检测的人工特征，其主要原理是对图像的梯度方向直方图进行统计来表征图像。该特征是由Dalal于2005提出的，并与SVM分类器相结合，在行人检测领域取得了前所未有的成功。

传统的行人检测方法首先需要通过提取手工设计特征，再使用提取好的特征来训练分类器，得到一个鲁棒性良好的模型。在行人检测中应用最广泛的分类器就是SVM和Adaboost。SVM分类器就是要找到一个超平面用来分割正负样本，这个超平面的满足条件就是超平面两侧的样本到超平面的距离要最大，即最大化正负样本边界。下图即为线性SVM的示意图。

Adaboost分类算法的主要原理不难理解，就是采用不同的方法训练得到一系列的弱分类器，通过级联所有的弱分类器来组成一个具有更高分类精度的强分类器，属于一种迭代算法。原理简单易于理解且有着良好的分类效果，唯一不足就是练多个弱分类器非常耗时。下图为面对一个二分类问题，Adaboost算法实现的细节。

（二）基于深度学习的行人检测算法

近年来，随着硬件计算能力的不断增强，基于卷积神经网络的深度学习飞速发展，在目标检测领域取得了更好的成绩。卷积神经网络不再需要去手动设计特征，只需要将图片输入进网络中，通过多个卷积层的卷积操作，提取出图像的深层语义特征。要想通过深度学习的方法得到一个性能良好的模型，需要大量的样本数据，如果样本过少，就很难学习到泛化能力好的特征，同时在训练时，由于涉及到大量的卷积操作，需要进行大量计算，要求硬件设备具有极高的算力，同时训练起来也很耗时。随着深度学习的飞速发展，越来越多基于深度学习的模型和方法不断被提出，深度学习在目标检测领域会有更加宽广的发展空间。

Ross Girshick团队提出了R.CNN系列行人检测算法，其中Faster R—CNN 算法通过一个区域提议网络来生成行人候选框，在最后的特征图上滑动来确定候选框。Faster RCNN是首个实现端到端训练的网络，通过一个网络实现了特征提取、候选框生成、边界框回归和分类，这样的框架大大提高了整个网络的检测速度。 He Kaiming等人在2017年提出Mask R—CNN算法，该算法改进了Faster·R—CNN，在原有的网络结构上增加了一个分支进行语义分割，并用ROI Align替代了ROI Pooling，取得了COCO数据集比赛的冠军。

B. 百度计算机视觉算法工程师面经(research 岗，已offer)

一面(技术面)：
1、相机外参，相机内参
2、分水岭算法
3、目标检测了解吗
4、3D这块有了解吗
5、论文是你写的吗
6、介绍一下图像分割
7、Deeplab v1, v2, v3, v3+
8、U-net后续改进
9、Non-local
10、经典三维重建公式
11、分割常用backbone

二面(技术面)：
1、数据增强方法
2、dropout方法
3、图像分割常见深度学习方法
4、简单介绍一下三维重建项目，平行还是stereo，如何估计的depth map
5、deep lab v3与deep lab v3+的区别
6、深度可分离卷积介绍，输入输出，channel数
7、为什么mobile net要用深度可分离卷积
8、数据集imbalance如何处理
9、常见的图像分割损失函数
10、iou能作为损失函数吗
11、linux 下shell命令行开发熟悉吗
12、组里以发论文为主，写论文的意愿
13、相机铅培内外参
14、现在大几，可实习到段激猜什么时候
15、希望自驱性比较高

三面(hr面)
因为是日常实习岗不是校招所以没有...

总结
二次面试过程中我都有些太随意了，有过一些打断面试小姐姐握型说话的举动，谢谢说的比较少，中间不舒服还活动了下嗓子...还好问的问题比较简单最后过了。

C. 机器视觉特征描述方法

常用的机器视觉提取特征方法有哪些？一般常用的机器视觉图像特征有颜色特征、纹理特征、形状特征、空间关系特征，沃德普机器视觉昨天给大家介绍过了颜色特征的提取，今天给大家介绍的是纹理特征、形状特征、空间关系特征这三种特征方法提取。
1.纹理特征描述方法分类：
（1）统计方法
统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法，在研究共生矩阵中各种统计特征基础上，通过实验，得出灰度共生矩阵的四个关键特征：能量、惯量、熵和相关性。统计方法中另一种典型方法，则是从图像的自相关函数（即图像的能量谱函数）提取纹理特征，即通过对图像的能量谱函数的计算，提取纹理的粗细度及方向性等特征参数。
（2）几何法
所谓几何法，是建立在纹理基元（基本的纹理元素）理论基础上的一种纹理特征分析方法。纹理基元理论认为，复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中，比较有影响的算法有两种：Voronio 棋盘格特征法和结构法。
（3）模型法
模型法以图像的构造模型为基础，采用模型的参数作为纹理特征。典型的方法是随机场模型法，如马尔可夫（Markov）随机场（MRF）模型法和 Gibbs 随机场模型法。
（4）信号处理法
纹理特征的提取与匹配主要有：灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究，提出6种属性，即：粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型（simultaneous auto-regressive, SAR）是马尔可夫随机场（MRF）模型的一种应用实例。

阅读全文

热点内容

android图片缩放比例缩放发布：2025-04-26 14:28:40 浏览：415

服务器的驱动备份用什么软件好发布：2025-04-26 14:00:41 浏览：592

centosftp密码发布：2025-04-26 13:50:21 浏览：927

哪个安卓手机屏幕比较丝滑发布：2025-04-26 13:18:07 浏览：84

判断iosandroid 发布：2025-04-26 13:06:50 浏览：903

ftp上传源代码发布：2025-04-26 12:48:10 浏览：119

sql日期参数发布：2025-04-26 12:34:09 浏览：979

搜狗输入法的皮肤在哪个文件夹发布：2025-04-26 12:21:47 浏览：554

平板哪里设置密码发布：2025-04-26 12:20:07 浏览：402

android屏幕锁发布：2025-04-26 12:11:06 浏览：31

视觉算法题

与视觉算法题相关的资讯