Roboseum
1.0.0
1.0.0
  • Roboseum
  • Robots
    • Modular Snake
    • Atlas
    • ANYdrive
    • ASIMO
    • ASIMO
    • Cassie
    • SpotMini
    • Ocean One
    • T-HR3
    • aslteam
    • SEA-Snake
    • OC Robotics Snake Arm Robot
    • Aibo
    • IMPASS
    • NABiRoS
    • Giacometti Arm with Balloon Body
    • CoBot
    • Fetch机器人平台
    • Salto
    • ASIMO
    • GUARDIAN S
    • ANYmal
    • BALLU
    • Robonaut2
    • Fusion-远程操作的寄生机器人
    • Epson SCARA Robot Overview
    • HERMES 遥操作机器人
    • Laikago
    • Gila Monster
    • Electrick
    • E2-DR
    • MIT Cheetah
    • Snake Monster
  • Sensors
    • 霍尔 Hall effect sensor
    • 编码器 Encoder
    • RGBcamera
    • IMU
    • Laser
    • 学习型描述子
    • DepthCamera
    • EventCamera
    • 旋转变压器 Resolver
  • Software
    • Algorithms
      • Mobility
        • Aerial Robotics
          • PX4
          • Planning
          • Geometry
          • Control
          • Mechanics
        • LeggedMobility
        • Bioinspiration
        • Templates
        • MechanicalDynamicalSystems
      • Motion Planning
        • Visibility Graph
          • Configuration Space
        • Rapid Exploring Random Trees
          • Rapid Exploring Random Trees
        • Probablistic Road Map
          • Probablistic Road Map
        • Trapezoidal Decomposition
          • Trapezoidal Decomposition
        • Sample Based Planners
          • Characteristics of Sample Based Planners
        • MoveIt
      • Perception
        • Localization and Mapping
          • Principle
            • localization
              • odometry
                • Odometry Modeling
                  • Odometry Modeling(里程计模型)
                • 视觉里程计 Visual Odometry
              • Iterative Closest Point
                • Iterative Closest Point (ICP 迭代最近邻)
              • Optical Flow (光流跟踪)
              • Particle Filter (粒子滤波)
            • 回环检测 Loop CLosing
            • mapping
              • Occupancy Grid Mapping
                • Occupancy Grid Mapping(占用栅格地图构建)
              • Map Registration
                • Map Registration(地图配准)
              • 3D Mapping
                • 3D Mapping
              • mapping
                • Mapping(建图)
            • Optimization in Mapping(优化在建图中的应用)
          • Project
            • ORBSlam
            • Dense Visual Odometry
            • LSDslam
            • Semi-Direct Monocular Visual Odometry
          • Dataset
            • TUM
            • KITTI
        • Basics
          • Single View Geometry
          • Camera Modeling
          • Point and Line Duality
          • Pinhole Camera Model
          • Perspective Projection
        • Recognition
          • CNNs
      • Learning
        • Estimation
          • ParticleFilters
          • TargetTracking
          • Kalman Filter
          • MaximumLikelihoodEstimate
            • 极大似然估计
    • Simulator
      • Gazebo
      • Airsim
      • VizDoom
      • Rviz
    • Library
      • PCL
      • OpenCV
      • OpenGL
  • Actuators
    • Floating Spring Joint
    • A Detailed Look into SEA(Serial Elastic Actuator)
    • MIT Optimal Actuator Design
Powered by GitBook
On this page

Was this helpful?

  1. Software
  2. Algorithms
  3. Perception
  4. Recognition

CNNs

CNN RCNN MaskRCNN

摘自我的毕设论文: 目前实例分割任务的最好效果,是今年年初由何凯明等学者提出的Mask R-CNN网络结构所取得的[1],此项工作也获得了2017年ICCV的最佳论文奖。Mask R-CNN是在物体检测网络Faster R-CNN[2]的基础上将ROIPool网络替换成了RoIAlign网络结构(微调bounding box位置以更好适应语义分割的需要),并且在训练时采用了将像素分割和物体检测两个子任务解耦的策略,即针对每个类别估计一个像素分割的二值掩膜,与分类识别和bounding box框选同时进行。原初的R-CNN[4]网络结构是先用选择性搜索(Selective Search)生成大量不同尺寸的候选bounding box(每张正常尺寸的图片大约2k个bounding box),再由一个预先训练好的AlexNet网络(一种CNN网络)的变体来判别bounding box中是否有物体存在,再通过SVM来对物体进行分类,最后对所有有物体存在的bounding box坐标点做线性回归,聚合成一个最精准的bounding box。而Fast R-CNN[3]则是先用RPN网络结构(Region Proposal Network,也即RoI Pooling)在R-CNN的特征卷积层之上加了一个池化效果,再将经过池化的卷积特征用选择性搜索算法提出候选的bounding box,并进行分类和bounding box回归。这种做法将特征提取过程的效率提高了近两千倍,并将R-CNN的所有操作(CNN特征提取,SVM分类识别,bounding box线性回归)在一个统一的网络框架中实现。而Faster R-CNN则是将R-CNN中用于提出bounding box候选的选择性搜索算法替换成了一层在卷积层之后的全卷积网络,利用卷积层提取的信息来高效地提出bounding box候选(proposal)。以上提到的具体的网络结构(及其演变过程)可见五篇参考文献[1,2,3,4,5]。

PreviousRecognitionNextLearning

Last updated 6 years ago

Was this helpful?