2019零售巨变!3D视觉暗战智能集装箱

智慧事物(微信官方账号:zhidxcom)

文|纪雨生

在经历了2017的疯狂点战和2018的巅峰暴跌之后,智能货柜终于迎来了行业的终极形态——3D动态智能货柜!

3D动态智能集装箱能给这个行业带来什么?除了空间利用率高,商品识别效率精准,计算量低,技术是否成熟,产业链建设是否完善,谁是瓜分这块最接近用户的蛋糕的巨头?

带着这些问题,在过去的几周时间里,智动在采访了数十位行业领袖和领域专家后发现,目前的3D动态视觉容器正处于大规模爆发的前夜,一场关于技术和点抢占的商业竞争即将到来2019。

第一,一年升级四次,智能集装箱的终极形态出现。

站在3D动态集装箱出现的那一刻,我们会发现,经过一年多的发展,无人集装箱早已脱离草根舞台,精细化运营和角色分工正在成为当前行业的大趋势。

现阶段有以阿里为代表的智能集装箱平台商,以每日优鲜为代表的集装箱运营商,以小卖柜为代表的整体集装箱厂商,进一步向产业链上游拓展。我们会发现,以途洋科技为代表的3D相机厂商已经准备好了,以神视科技为代表的3D动态子模块提供商已经等了很久了。

从技术的角度来看,你会发现,一切都在迅速而无声地发展。短短一年多时间,产品方案经历了四代升级。

无人货架向智能货柜进化的第一个雏形大概发生在2017年初。当年4月,“CITYBOX”智能集装箱上线,主要采用RFID射频标签进行自动扣款。

在这种运作模式下,每件商品都会被贴上一个RFID标签,成本在50美分左右,然后集装箱的每一层都会安装相应的传感器,价格在1000元左右,所有的商品都会被传感器捕捉到。

然而,没过多久,RFID方案就因为用户可能撕掉标签而带来商品被盗,以及高昂的部署和运营成本而迅速被市场淘汰。曾有业内人士笑称RFID解决方案容器都是给标签厂打工的。

紧接着,2018年初,以非典型智能货柜玩家深蓝科技为代表的机器视觉智能货柜问世,将智能货柜市场带入了“摄像头”时代。

在此期间,会在每层楼的顶部和中央放置一个摄像头,或者在每层楼的左右两侧放置一个摄像头,然后算法会根据每层楼的摄像头记录的集装箱打开前后每层楼货物的变化来完成推演。

但这种方案需要摄像头完整捕捉每一层商品的变化,所以要求商品不能叠放,摄像头与商品之间要留有较大的空隙。因此,尽管这种方案确保了安全性,但是它造成了非常大的空间浪费。

此外,一旦需要增加或减少SKU,静态方案需要不断调整单个SKU的训练位置,以应对各种可能的取放情况,因此整个方案会过拟合,SKU类别会受到限制。目前市场上主流的静态溶液应用还停留在销售饮料等典型标准产品的阶段。

能弥补这个缺陷的就是动态视觉方案。2018年3月,易隧道首次亮相“中国零售数字化创新大会”。同样,计算机视觉也用于识别商品。动态方案利用门口的四个摄像头在开门后识别用户手中的货物,因此对集装箱内部的货物摆放几乎没有要求,智能集装箱内部的摄像头数量也有所减少。

然而,与静态识别可以将所有数据上传到云端然后识别不同,动态识别需要识别连续多帧图像中的每一个像素,这需要大量的计算和定位部署。具体来说,传统的动态方案通常要求相机以每秒60帧的速度配备720个像素。计算需要的最常见的1070显卡,价格在5000元左右,还需要主板、CPU、内存、封装等一系列配置。最后,部署一套系统后,单个机柜的成本会增加近万元。

为了降低本地化部署的成本和背景对识别效率的影响,2019年初正式出现了3D动态方案。

3D动态方案与传统动态方案的主要区别在于引入了3D相机进行定位,可以在原有的2D相机抓拍中,从空间视角对用户手中的物品进行像素级定位,然后擦除无关背景,只识别特定区域的商品,从而达到减少计算量从而降低成本的目的。

二、三头进场,2019大战一触即发。

3D动态视觉货柜爆发前夕,第一个问世的产品是2065438+2008年2月中旬购物者发布的“吉姆系列动态视觉智能货柜”。

据内部人士透露,目前小卖柜的这款产品实际上还没有进入大规模推的阶段,只是已经小规模量产,在一些展会上也能看到这款产品的身影。

从技术角度来说,这款产品主要是使用Intel OpenVINO AI Toolkit开发的。基于3D+2D动态视觉识别和重力感应,集装箱可容纳240件物品堆叠,结算准确率可达99%。无论用户单手、双手还是多次拿取,都可以实现实时交互和识别。

硬件方面,吉姆系列动态视觉智能货柜采用低功耗边缘计算设备加速模型推导,可以在用户关门的瞬间本地完成结算,大大缩短了用户购物的结算时间和宽带成本。

功耗方面,这款产品的容量为510升,还配备了21.5英寸的LED大屏,可以实时显示用户的商品和定价,但功耗只有3度/天。

除了整体橱柜厂商卖小橱柜,阿里也在从平台商的角度积极探索这方面。

从2016双十一开始,阿里新零售智能事业群就开始了智能货柜的项目,到2018年底,正式开始了3D动态智能货柜的探索。

据悉,阿里在铺设这个3D动态解决方案前后接触了三家方案商的产品,其中精度、价格、用户体验都是重要的考虑因素。

不过,据阿里内部人士透露,在设备正式铺开之前,还需要一段时间对设备进行测试和优化。目前,阿里巴巴西溪园区已有少量设备开始测试。估计今年6月165438+10月左右,阿里会大范围铺开设备。

对于集装箱作业人员的日常质量提升,据悉早在2018的4月份就开始探索3D动态视觉方案,并且已经在个别点进行了试运行。

第三,满足市场爆发,3D视觉算法提供商到位。

“三维方案跑不出来,就不要做智能容器了。”在问及未来几年智能集装箱的发展后,神石科技CEO章雷对知止说。

神石科技是一家计算机三维视觉算法提供商。其核心创始人均毕业于北京大学电子系,拥有十余年芯片、算法、计算机视觉等领域的工作经验,以及多项相关行业专利。

早在2017年中期,无人货架浪潮刚刚兴起的时候,章雷和另外两位核心创始人就把目光放在了3D动态视觉方案的智能货柜上。

他们负责的是集装箱内3D动态视觉系统的子模块,简单来说就是3D动态方案中商品识别算法的研发和相应的硬件采购配置。

在他看来,目前市面上主流的智能集装箱解决方案或多或少都有致命伤。3D视觉方案带来的集装箱空间利用率高、本地化部署成本低、商品识别准确率高等三大优势,正好可以解决之前一些行业方案的不足。

当他下定决心做这项工作的时候,他首先确定了一个原则,就是方案要通用高效。

此前市面上的一些3D动态视觉方案大多类似于微软的3D视觉游戏Kinect,但这种方案当时只能运行在X86平台上。如果在大规模工业中应用,成本将是致命的。

因此,如何根据硬件特点在ARM平台上优化算法成为了当务之急。解决这个问题后,成本问题直线下降。章雷说,目前神石科技一套封装CPU、GPU、内存的系统只要2000元左右,只有2D动力方案的三分之一左右。

在解决了技术问题之后,如何把一个demo变成业界普遍稳定的解决方案,也是一个不容忽视的问题。

最简单的,比如四个2D摄像头的布局,大部分人可能会认为上面的两个摄像头朝下,下面的两个摄像头朝上,这样就可以完整清晰的捕捉到用户的行为。

但是实际应用后发现,这个方案根本行不通,女生夏天穿短裙足以让这个方案非常尴尬。经过讨论,我们最终决定,四个2D相机,两个在顶部,两个在中间,一个3D相机在顶部的中间,都拍摄下来。

甚至3D相机的位置也是一个反复讨论和优化的问题。一开始因为3D摄像头会有一些盲区,所以人们会把3D摄像头的位置放得更高,但是这样部署之后,摄像头就无法捕捉到用户本人,对识别效率会有一定的影响。

此外,有时还会出现用户一手持多个商品的问题,对商品的识别效率有一定影响。

我以为要通过各种硬件升级或者算法来优化是一个复杂的问题,但是最后通过在柜子顶部和每个货架底部加一个透明挡板,用户既不能取出盲区的商品,也不能一次性取出太多的商品。一位前来参观的行业大亨曾笑着说,这个板子你可以申请专利。

在解决了这一系列问题之后,神石科技目前的系统也已经在一些主流的橱柜厂商完成了小规模的部署和内测。

第四,迎接市场爆发,3D相机迎来智能容器定制时代。

深视科技3D相机提供商方图洋科技几乎在2017就将目光投向了消费领域。

在途洋科技CEO费哲平看来,当时工业级3D相机的应用已经逐渐成熟,足以支撑企业稳定盈利。同样对3D视觉有迫切需求的零售业,目前还处于蓝海阶段。

虽然工业领域和零售领域在底层硬件技术上差别不大,但针对不同行业调整相机参数和镜头配置还是需要很长时间。

从2017决定进入消费领域到2018需求逐渐显现的这一年间,费哲平主要专注于针对特定消费领域的产品打磨。

首先是技术的选择。目前,市场上主要有以下类型的3D相机解决方案:TOF、RGB双目和结构光。

三种主流方案中,结构光和TOF比较成熟。其中结构光方案最为成熟,但易受外界光线干扰,响应慢,识别准确率低。TOF在这些方面比结构光方案有一些优势,因此TOF在移动端已经成为一种有前途的方案。基于视差原理的双目立体成像方案抗环境光干扰能力强,分辨率高,也是移动终端的可选方案之一。而目前纯双目方案的页面,缺点是在单调的纹理环境中找不到匹配点,变得无效。

与市面上的传统方案不同,途洋采用主动双目视觉方案,3D视觉传感器由双目红外摄像头、彩色摄像头和光学增强系统组成,即双目方案与结构光方案融为一体。

其中,光学增强系统,业内也称为结构光,本质上是激光投影仪,双目相机相当于接收器。当投影仪投射的光线照射到物体表面时,物体将光线反射到两个摄像头采集相应的参数信息,然后通过图形匹配算法给出物体的长、宽、高、距离等物理属性。它可以克服上述方案在精度和效率上的缺点。

除了技术问题,还有工业定制的问题需要处理。

一般来说,消费领域用的相机价格只是中下游水平,因为它对远距离识别的精度要求不高。但在这个领域,对硬件的盲区、视角、速度都有更高的要求。

在帧率方面,3D相机的平均帧率为每秒30帧,但在智能容器中,需要60帧才能支持用户的快速访问和播放。在视觉盲区的大小方面,目前市场上主流的解决方案都有较大的盲区,一般在50 cm以外才能获取数据,但在智能货柜中,这个参数必须缩短到20以下甚至15 cm,以防止用户从盲区偷货。匹配的镜头角度也需要从60度扩展到90度或者100度。

看似简单,却涉及到镜头更换、传感器参数调试、重印的容量输入。如果没有提前预测市场需求或者没有足够的技术支持,客户的这些需求是无法满足的。

完成demo后,如何保证真实情况下的应用,还需要漫长的压力测试之路。比如最基本的问题:什么行为是正常的,什么行为是非法的,真实情况下会出现什么异常的消费行为,对相应硬件产品的参数需要提出什么要求,这些都需要时间来验证。

但是,获取消费者行为数据并不是一般硬件厂商所擅长的。所以,有了头部客户的支持,* * *就成了必须跨越的一道坎。费哲平表示,途洋已与多家头部3D动态容器厂商达成深度合作。

动词 (verb的缩写)3D智能容器的未来可能性和当前局限性

为什么要做智能容器?不同的身份会有不同的考量。对于品牌店来说,这可能会带来更多的集装箱销售。对于运营者的日新鲜度来说,这可能会带来运营效率的翻倍和成本的快速下降。对于阿里来说,作为探索新零售的重要途径,这可能会为他打造一个线下的天猫。

目前阶段,国内电商的爆发式增长几乎不会再来,剩下的用户大多沉淀在农村和线下领域。在农村,无论是扩张的速度还是增长的幅度都非常有限,而线下几乎是一块未开垦的处女地。如果运用得当,很可能带来爆发式的增长。

简单算一笔账,如果运营商铺设2万套设备,单个设备日订单量只有15,那么日订单量可以达到30万。而拼多多这种新贵电商,成立两年,日订单也只有30-40万。对于阿里来说,这几乎是一个线下天猫的再造。

线下场景深厚的智能货柜,也能完成线上天猫、拼多多做不到的一些事情。比如天然的广告展示属性,拉近与用户的距离。

以友宝在线为例,这是一家传统的自动售货机厂商。其财报显示,2018上半年,友宝在线运营设备约5.5万台,营业收入11.41.000亿元,净利润8604.85万元,其中广告收入达265438。

如果以日本五百多万台接收机的密度来计算,目前的市场总量远未饱和。如果全中国的自动售货机和智能货柜屏都用上了,再打造一个分众传媒也不难。

未来可能是众多的,但目前仍有问题需要解决,从技术形成到市场成熟,涉及整个产业链的互动与合作。

虽然现阶段3D动态识别技术在智能集装箱中的应用已经基本成型,但如何保证真实情况下的运行效率以及其他配套硬件的产能供给,还需要通过不断优化来逐步完善。

一方面,从技术指标上看,如何降低用户单手拿取三件或三件以上商品的识别错误,需要一些改进。这种针对各种突发事件的改进,也需要集装箱运营方在真实情况下的反馈。

从效率上来说,虽然3D动态识别的训练速度相比传统的静态识别SKU有了很大的提升,但是面对大规模的SKU货架,2000件单品的训练样本需求仍然需要从算法、计算能力、成本、耗时等方面来考虑。

在配套设施方面,虽然目前的3D视觉技术已经比较成熟,但是用于检查验证的微重力传感设备还没有为零售行业定制,这也对设备的大规模投放时间产生了一定的影响。

但是,当技术和模型已经成型,剩下的就留给时间了。

结论:最终形态已定,大盘会重现2017点战吗?

从兴起到现在,无人货柜经历了两年的过山车。第一年草长莺飞,资本和点战高潮迭起。第二年,队员疯狂撤退,一年换了四次形态。

当终极形态在3D动态方案中基本固定,技术已经成型,智能集装箱的下半场将何去何从?2017的点战会重现吗?

也许技术的形成会给这个行业打一剂强心针,但市场永远不会这么简单。形式只是这个市场暴露出来的冰山一角,海平面以下供应链之战,支付入口之战,供应商抢夺之战...一切尚待确定。

尽管如此,技术的进步还是为这个行业的发展带来了无限可能。在智能货柜已死,无人零售没有未来的合唱中,3D动态视觉正在将智能货柜推向又一次爆发的前夜。