ECIR定制化图像识别

Easy Customized Image Recognition 零算法基础训练业务定制模型

简介

Hi,您好,欢迎使用小花儿人工智能ECIR定制化训练和服务平台。

目前在图像方向该平台支持定制图像分类和物体检测两类图像识别模型。

图像分类 识别一张图中是否是某类物体/状态/场景。可以识别图片中主体单一的场景。

[应用场景] 1、图片内容检索,可定制识别各类物体 2、UGC内容审核 3、工业分拣或质检

物体检测: 在一张图包含多个物体的情况下,定制识别出每个物体的位置、数量、名称。可以识别图片中有多个主体的场景。

[应用场景] 1、物体计数,如零售行业货品摆放统计、医疗细胞计数 2、一图多物识别,识别一张图中多个物体

目前支持创建两类模型:

1、图像分类模型

定制图像分类模型,可以识别一张图整体是什么物体/状态/场景。

在各分类图片之间差异明显的情况下,训练数据每类仅需20-100张,最快1分钟可训练完毕

2、物体检测模型

如何选择,取决于实际场景要解决怎样的问题,此处用一张图说明二者的区别。如果不确定实际场景到底应该训练什么样的模型,建议加入官方QQ群(群号:829450001)联系群管解决。

实际场景中也遇到一些要解决的问题比较复杂的用户,可以尽情发挥脑洞将两者结合一起使用。

目前单个用户在每种类型的模型下最多可创建10个模型,每个模型均支持多次训练,若需要创建超过10个以上的模型,可以加入官方QQ群(群号:829450001)联系群管解决。

【图像分类——数据集如何提交、格式要求】

① 设计分类

首先想好分类如何设计,每个分类为你希望识别出的一种结果,如要识别水果,则可以以“苹果”、“梨”等分别作为一个分类;如果是审核的场景判断合规性,可以以“合格”“不合格”设计为两类,或者“合格”“不合格原因一”、“不合格原因二”、“不合格原因三”……设计为多类。

注意:目前单个模型的上限为10000类,如果要超过这个量级可以加入QQ群(群号:829450001)联系群管解决

② 准备数据:

基于设计好的分类准备图片数据,每个分类需要准备20张以上,如果想要较好的效果,建议100张起图片,如果某些分类的图片具有相似性,需要增加更多图片。

图片的基本格式要求: 目前支持图片类型为png、jpg、bmp、jpeg,图片大小限制在4M以内。长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px,一个模型的图片总量限制10万张图片。

注意1:训练集图片需要和实际场景要识别的图片环境一致,举例:如果实际场景要识别的图片都是手机拍摄的,那训练的图片也需要同样的场景获得,而不要采用网上随便下载的图片

注意2:考虑实际应用场景可能有的种种可能性,每个分类的图片需要覆盖实际场景里面可能有的可能性,如拍照角度、光线明暗的变化,训练集覆盖的场景越多,模型的泛化能力越强。

注意3:如果需要寻求第三方数据采集团队协助数据采集,可以加入官方QQ群(群号:829450001)联系群管咨询了解

你可能会有的问题:如果训练图片场景无法全部覆盖实际场景要识别的图片,怎么办?

答:本身模型算法会有一定的泛化能力,如果要识别的主体在图片中占比较大,应该效果上问题不大;如果识别的主体在图片中占比较小,且实际环境很复杂无法覆盖全部的场景时,推荐用物体检测的模型来解决问题。(物体检测可以支持将要识别的主体从训练图片中框出的方式来标注,所以能适应更泛化的场景和环境)。

③上传数据:

图像分类的数据上传方式非常简单,只需要将所有准备好的图片对应的分类以单个文件夹整理,同时将所有文件夹压缩为**.zip格式**,直接上传即可。

注意1:单个压缩包限制大小为2G,图片张数上限10万张,若图片较多,建议分多个压缩包上传,若超出图片上限,请加入官方QQ群(群号:829450001)联系群管咨询解决

注意2:如果多次上传的压缩包里面分类命名存在一致,系统会自动合并数据

注意3:分类的命名需要以数字、字母、下划线格式,目前不支持中文格式命名,同时注意不要存在空格

压缩包的结构示意图如下:

【物体检测——数据集如何提交、格式要求】

① 设计标签:

在上传之前需要想要都有哪些标签,每个标签就是对这张图片希望识别出的全部结果。

注意:标签的上限为10000种

② 准备图片:

基于设计好的标签准备图片数据,每种要识别出的标签在所有图片数量加起来需要有20个以上,如果某些标签的图片具有相似性,需要增加更多图片。

图片的基本格式要求:

目前支持图片类型为png、jpg、bmp、jpeg,图片大小限制在4M以内。长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px,一个模型的图片总量限制10万张图片。物体检测1个模型需要至少4张图片

注意1:训练集图片需要和实际场景要识别的图片环境一致,举例:如果实际场景要识别的图片都是手机拍摄的,那训练的图片也需要同样的场景获得,而不要采用网上随便下载的图片

注意2:考虑实际应用场景可能有的种种可能性,每个标签的图片需要覆盖实际场景里面可能有的可能性,如拍照角度、光线明暗的变化,训练集覆盖的场景越多,模型的泛化能力越强。

注意3:如果需要寻求第三方数据采集团队协助数据采集,可以加入官方QQ群(群号:829450001)联系群管咨询了解

手把手教你图片打标(https://www.uulucky.com/show-290010.html)

注意3:分类的命名需要以数字、字母、下划线格式,目前不支持中文格式命名,同时注意不要存在空格

压缩包的结构示意图如下:

xml文件内容示意图:

群讨论区

群号:829450001

常见问题

接口上线后是否收费?

答:目前接口是限量免费使用的原则,上线模型后可以免费获得500次的调用限额。超过免费限额后按照 0.02元/次 收费

模型能否支持私有化部署?

答:目前我们提供的方案包括在线API,以及即将上线的离线SDK,支持在线调用及设备端本地计算,目前尚不支持服务端的私有化部署。

如何设计分类?

每个文件夹名字就是一个标签,文件夹里的图片是希望识别出的全部结果。

标签名(文件夹名)需要以字母或数字或下划线的格式,不支持中文命名。

图片的具体格式要求

训练集图片需要和实际场景要识别的图片环境一致,举例:如果实际场景要识别的图片都是手机摄录的,那训练的图片也需要同样的场景获得,而不要采用网上随便下载的图片。

每个标签的图片需要覆盖实际场景里面的可能性, 如拍照角度、光线明暗的变化 ,训练集覆盖的场景越多,模型的泛化能力越强。

如果需要寻求第三方数据采集团队协助数据采集,可以加入官方QQ群(群号:829450001)联系群管咨询了解。

目前支持图片类型为jpg、png、bmp、jpeg,图片大小限制在4M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px,一个模型的图片总量限制100万张图片。物体检测1个模型需要至少4张图片。

批量上传的压缩包格式要求

压缩包仅支持zip格式;

压缩包大小需要在50GB以内;

注意,压缩包里的文件夹命名是标签名,只能包含数字/字母/下划线。同时压缩包的目录结构如下图所示:

数据处理失败或者状态异常怎么办?

答:如是是图像分类模型上传处理失败,请先检查已上传的分类命名是否正确,是否存在中文命名、或者增加了空格;然后检查下数据图片量是否超过上限(100万张);再检查图片中是否有损坏。如果自查没有发现问题可以加入官方QQ群(群号:829450001)咨询解决。

模型训练失败怎么办?

答:如果遇到模型训练失败的情况,请直接加入官方QQ群(群号:829450001)咨询解决。