

在对比市面上现有的标注工具时,我们发现Github有许多免费且好用的开源工具,于是我们选择了几款最受欢迎的图像/视频标注工具进行测评,其中包括覆盖全部标注类型甚至支持协同标注的CVAT,最受欢迎的Labelme,人脸标注神器VIA-VGG Image Annotator等,文中还提供了标注工具的链接,供诸位体验。
图像/视频标注类型

2D框
给标注工具提供一幅图像,让其在图像内特定对象周围绘制一个框。
最简单的图片数据标注类型,成本最低,应用最广泛。
多边形分割
标注工具会通过在需要标注的对象的外边缘,放置许多个点来绘制成线,勾勒轮廓。
用于图片和视频中精确的物体检测和位置定位,更精准、更耗时、成本更高。
关键点标注
通过人工的方式,在规定位置标注上关键点,例如人脸关键点、骨骼点。常用于面部或姿势识别模型。
线标注
主要用于自动驾驶车辆的道路识别,定义不同道路。
语义分割
根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应的属性,以帮助训练图像识别模型,常应用于自动驾驶汽车、人机交互、虚拟现实等领域。
比较精准,耗时比较长,对图片上的所有内容进行标注。
视频标注
以帧为单位在一系列图像中定位和跟踪物体,多用于训练车辆、行人、骑行者、道路等自动驾驶领域的模型。
2/3D融合标注
通过3D点云数据,返求出2D图片的相对位置,对点云数据和图片数据同时标注。
用于多传感器融合平台的数据处理,多应用于自动驾驶场景。
标注工具推荐
CVAT
CVAT是免费的、在线的、交互式的视频注释工具,它的灵感来自Vatic。支持本地部署,无需担心数据外泄。

https://github.com/opencv/cvat
安装要求
Ubuntu 18.04/Win10/Mac
最好在ubuntu18.04安装,windows平台安装难度较大
标注类型
1.多边形分割、语义分割、2D框、线标注、点标注
2.3D点云
3.视频标注
文件导出格式
CVAT for video、CVAT for images、PASCAL VOC、(VOC) Segmentation mask、YOLO、COCO、TFRecord、MOT、LabelMe 3.0、Datumaro
亮点/优势
1.支持多人协作
CVAT带有用户管理系统,可以创建、删除新成员,并为成员分配不同角色。如管理员、用户、标注员、质检员
2.标注功能强大
能用于几乎所有CV相关标注任务,如点,多边形,语义分割等,并且包含了插值标注即一个视频中若干帧,标注起始帧中间会自动生成、 带有标注任务列表的仪表板等功能
3.预处理功能
使用TensorFlow OD API的自动标注,可以预处理一部分数据
4.持续更新
开源环境较好,工具在不断完善中,有任何问题可以在gitchater问,回复很快
不足
1.没有「贝塞尔曲线」,只能一个一个点
2.只适用于谷歌浏览器,在其他浏览器中表现不佳
3.尽管 CVAT 支持一些自动测试,但所有质检都必须手动完成
4.由于Chrome Sandbox的性能限制,CVAT在某些用例中可能会出现性能问题
VOTT

https://github.com/microsoft/VoTT
安装要求
linux(需要使用snap安装)/macOS / Windows
标注类型
支持点、线、2D框、语义分割与视频数据标注
文件导出格式
CNTK/Pascal VOC、TFRecord、CSV、VoTT等格式
亮点/优势
1.安装方便,直接下载exe文件即可
2.VoTT的学习成本低、上手快
不足
1.不支持多人协作
2.VoTT的标注会超出图像的最大像素范围,如果模型对坐标有规定范围的话,则需要进行特定处理
3.数据无法加密保存,不适合私密数据标注
4.不能导入已有的标注结果(如bbox)
5.程序不稳定:VoTT是桌面应用,经常死机,经常会报错
Labelme
Labelme 是一个图形界面的图像标注软件。其的设计灵感来自于 http://labelme.csail.mit.edu/ 。它是用 Python 语言编写的,图形界面使用的是 Qt(PyQt)。

https://github.com/wkentaro/labelme
安装要求
Ubuntu / macOS / Windows
Python2 / Python3
PyQt4 / PyQt5 / PySide2
标注类型
原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/12/8401.html