如何用精灵标注助手标注视频跟踪

2018-04-25 17:46:14

摘要:

我们在用深度学习做监控和识别时,经常需要对视频内容进行标注,比如对于一个行进中的汽车标注一路上的位置。

以前我们需要做这类标注的时候,能用到的工具是MIT开源的一个项目vatic,但是一方面这个项目功能相对简单,而且界面粗糙,毕竟是开源软件,安装起来也不是特别方便。今天我们就一起来看看用标注神器-精灵标注助手如何对视频进行物体跟踪进行标注。

根据自己的系统(Windows/Mac/Linux)情况下载对应的安装包,安装好了之后,可以在开始菜单中找到快捷方式,点击打开。

点击文件菜单中,找到新建,打开新建面板,我们可以看到很多的标注类型,分成两大类,分别是机器视觉类的标注和自然语言处理的标注,我们在机器视觉分类中找到视频追踪标注,选择这个选项,然后在右侧的视频文件夹选框内选择自己要标注的文件所在的文件夹,注意暂时只支持mp4的文件类型,如果不是mp4的文件,需要转换成mp4。具体效果如图:

选择好文件之后,我们点击创建,系统就会自动打开第一个视频。我们就可以开始标注视频了。

值得注意的是,视频标注和图片标注最大的区别就在于,视频是由时间轴的,我们需要根据时间轴上的位置来框定物体,首先我们先找到第一帧有物体出现的图像,并且将视频中的物体框选出来。

在右侧标注信息中选择标注的类型是车辆。这样我们就标注好了车辆出现的位置,然后我们点击播放按钮让视频开始播放,我们可以隔一段不长的时间点击一下暂停,然后调整一下框选的位置。这样在两次暂停之间的位置系统会自动生成一个补间动画,从初始位置匀速的运行到后一个暂停位置:

如果希望精细的话,可以尽量间隔短一点时间进行标注,这样整个过程会更加准确。标注完成之后,可以回到最开始点击播放按钮查看一下整个标注的效果。如果没有问题,点击下方的勾选按钮或者按下ctrl+s保存即可。

确认标注没问题之后,就可以点击导出了,目前精灵标注的视频导出是参照图片的导出,选择pascal voc格式。导出后是将关键帧所设置的位置的标注框都列出来:

  1. <?xml version=“1.0” ?>
  2. <annotation>
  3.     <folder>视频测试</folder>
  4.     <filename>事故.mp4</filename>
  5.     <path>C:\Users\wutong\Desktop\视频测试\事故.mp4</path>
  6.     <source>
  7.         <database>Unknown</database>
  8.     </source>
  9.     <size>
  10.         <width>1280</width>
  11.         <height>720</height>
  12.         <depth>3</depth>
  13.     </size>
  14.     <segmented>0</segmented>
  15.     <object>
  16.         <name>车辆</name>
  17.         <pose>Unspecified</pose>
  18.         <truncated>0</truncated>
  19.         <difficult>0</difficult>
  20.         <bndbox>
  21.             <time>15.35</time>
  22.             <xmin>121</xmin>
  23.             <ymin>253</ymin>
  24.             <xmax>354</xmax>
  25.             <ymax>328</ymax>
  26.         </bndbox><bndbox>
  27.             <time>16.99</time>
  28.             <xmin>384</xmin>
  29.             <ymin>250</ymin>
  30.             <xmax>616</xmax>
  31.             <ymax>325</ymax>
  32.         </bndbox><bndbox>
  33.             <time>17.31</time>
  34.             <xmin>451</xmin>
  35.             <ymin>248</ymin>
  36.             <xmax>669</xmax>
  37.             <ymax>325</ymax>
  38.         </bndbox><bndbox>
  39.             <time>18.85</time>
  40.             <xmin>787</xmin>
  41.             <ymin>284</ymin>
  42.             <xmax>945</xmax>
  43.             <ymax>366</ymax>
  44.         </bndbox>
  45.     </object>
  46. </annotation>
分享到: