通过AI电子秤窥探视觉识别原理,干货满满

元芒数字| 以卓越的智能产品,助零售化繁为简    i识别-智能称重    通过AI电子秤窥探视觉识别原理,干货满满

 

视觉识别技术在各个领域的价值都有在一点点的探索和挖掘,零售业也并非罕见。现在、自动结账、自动补货、刷脸支付到如今的视觉识别秤,这只是AI技术在零售业应用的开始。为了让大家更好的了解这一趋势,今天就i识别技术原理,为大家做一个揭秘大放送。帮助大家更好地理解 AI识别的相关问题。

.

电子秤识别的过程

 

01 信息的获取

 
 

获取信息的过程可以类比成人类“看”这个动作。在i识别设备中,我们需要首先通过摄像头拍摄到秤盘的商品,将光感信息转化为机器可以识别的电信息。比如,在图像描述中,我们可以通过不同的色彩模式下的参数来描述每个像素点,从而描述一张照片,比如HSB色彩就可以通过色相,饱和度,亮度三个维度来描述像素,此外,还有大家常见的RGB、LAB、灰度等多种方式。

02 信息的预处理

 
 

预处理就是将照片进行图像识别前的处理过程,包括对信息的挑选和加工。首先是挑选,在摄像头拍下照片的时候,我们需要快速在拍摄的多张照片中,挑选最清晰的一张拿来使用。接下来是照片降噪处理。这里面对图像的处理包括:图像修复填充、图像去雾处理、图像对比增强、图像无损放大、拉伸图像恢复、图像清晰度增强、图像色彩增强等等。最终,只为排除干扰因素,获得一张最适合算法去识别的照片。

 

03特征抽取和选择

 
 

简单地理解就是我们所研究的图像是各式各样的,有的图像里包含苹果,有的图像包含香蕉,如果要将这些图片进行分类,就要通过这些图像所具有的本身特征来识别,而获取香蕉、苹果这些特征的过程就是【特征抽取】。在特征抽取中所得到的特征也许对此次识别并不都是有用的,比如苹果上贴有一个标签,我们没有通过标签来识别的计划,这个时候就要提取苹果相关的特征,摒弃标签的特征,这就是【特征的选择】。特征抽取和选择在图像识别过程中是非常关键的技术之一,所以对这一步的理解是图像识别的重点。

 

04 分类器设计和分类决策

 
 

【分类器设计】是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。【分类决策】是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。比如我们在无码商品的识别中,我们发现有大面积叶子的特征的,都属于蔬菜,因为我们可以在特征分类中加上蔬菜这个分类,这样,算法发现有大面积叶子的特征时就会在叶子蔬菜这个分类中去匹配,而不会跑到水果或者干货的品类中去。

.

怎么提高图像识别的准确率?

 

01 样本增强

 
 

数据增强是指在训练的过程中,为了获得更多的样本和模拟实际情况中的多变的情况,对图像进行不同的处理以获得多样的样本。比如,一只正常小猫的照片,我们可以通过将照片进行去色,增加曝光,模糊、锐化,旋转,翻转,加上有色滤镜等处理。增加验证准确性的最简单方法之一是添加更多数据。在没有很多训练实例,这将特别有用。

 

 

02 正确操作,避免脏数据

 
 

在图像识别的过程中,送入训练图像越干净,模型识别的准确率就会越高。这里的干净,就是指有效样本,比如,正常的送入i识别的样本,都应该是包含水果蔬菜之类的无码商品的,而操作员在使用过程中用摄像头拍下一些手机、钱包、或是主体不清晰的照片等,不在训练样本范围内的照片,这样子的我们称之为脏数据,脏数据在越多,准确率就会越低。

 

脏数据图

有效数据图

03 使用清晰度合适的照片 

 
 

和人眼识别一样,如果输入的图像太小,会不利于模型对图像识别图像特征。但是,也不是图像越大越好,如果图像太大,则会增加计算机所需的计算资源,并且模型如果不够复杂,也无法处理它们。所以,怎么选出最适合该商业场景的图像大小也是一门技术活。

 

04 同时使用多套算法,然后将多套算法进行PK

 
 

在i识别的算法中,我们就创新地部署了多套算法,让不同的算法分别进行识别计算,然后将多套算法的识别结果进行PK,显示最有可能的那一张。

 

黄瓜

苦瓜

算法A

80%

2%

算法B

20%

30%

比如,我们在摄像头下放上一根黄瓜,在A算法中,得出的黄瓜的概率最高,是80%;在B算中得出的苦瓜的概率最高,是30%。这两个结果pk后,80%明显大于30%。所以我们会推荐黄瓜,并且将黄瓜放在第一位展示出来,将苦瓜放在第二位。

.

AI识别发展至今,面临的新挑战是什么?

早在2015年2月15日,新浪科技报道了一篇关于微软图像识别方面的研究论文,论文内容显示:在一项图像识别的基准测试中,电脑系统识别能力已经超越了人类。人类在归类数据库Image Net中的图像识别错误率为5.1%,而微软研究小组的这个深度学习系统可以达到4.94%的错误率。

 

随着技术的成熟与发展,就像人的大脑无法记忆浏览器所承载的内容一样,机器对于图像的处理在效率和准确度上可以超越人类,也毋庸置疑。

 

技术成熟后,科学技术人员所面对的是一些新的问题。如何让这些技术为我们所用,走出高昂的费用,走出实验室的苛刻条件,走入复杂的现实世界,走入各行各业和寻常百姓家。

 

通过i识别在生产过程中所解决的问题,大概可以了解对从技术到应用之间的距离。

 

01 最普通的摄像头

 
 

首先,i识别所需要的摄像头,是最普通的720P的摄像头,且不说不是什么工业的专业镜头,就连最普通的手机摄像头都比它拍出的照片清晰多倍,稍微放大一些就能看到清晰的像素码。

02 极小的算力

 
 

其次,i识别所需算力极小。在正常的称重设备上,都有一个芯片供设备本身的系统(windows/安卓)运行,而i识别和这个系统共同用一个芯片的算力,同时要求运算速度在毫秒级别。此外,为了准确率和离线处理,我们还需要同时部署多套神经网络算法和本地自学习算法。

03 复杂的现实环境

 
 

在实际的场景中,i识别需要面对的环境也非常地复杂。不仅要面对生鲜商品随着季节的颜色形态变化,也需要面对不同门店的光环境,不同包装袋透光率等等。

 

虽然,算法基本的底层框架都差不多,但是对于实际场景的使用,还是会有千差万别的处理方式,要想做好某个领域的AI产品,还是得技术和行业两手抓。

 

 

 

创建时间:2023-03-28 16:51
浏览量:0
收藏