网上的假货太多，你把握不住的，让AI来

还在发愁网购的东西可能是假货？

现在，阿里自己搞了个AI打假师，让算法来协助打假了！

只要让它看一眼想辨认的商品照片，它就能在几十毫秒的时间里，判断出商品的真假。

相当于你一眨眼（约0.5秒），它就已经识别了10个假货。

不仅如此，阿里安全团队还公开了一个包含100万张正版商标照片的数据集Open Brand，让更多的人能参与到“AI打假”行动中来。

那么，AI究竟如何打假呢？

对高仿和山寨同时出击

首先，需要了解假货的售卖套路。

由于没有售卖正品的资质，假货店铺需要采用各种手段，逃过追查：

其一，“高仿”类商品。这种假货会对logo进行模糊处理、部分遮挡，甚至用上对抗样本攻击（没错，就是这么高科技）。

在网购平台上，我们看到的假货图片往往是这样的：

这些商品的外观，往往与品牌商品非常接近，然而并没有产品保障。

其二，“山寨”类商品。这种假货会对logo进行PS、并在注册时使用仿冒名称，以躲过算法的识别。

可别说，这些山寨货，玩起“仿妆”来很有一套：

用户一不留神，就容易中圈套，然而平台人工审查的速度，又实在有限。

为此，阿里安全团队决定，搞个AI“打假师”，更快地进行打假。

AI打假模型，最需要解决的，是这3个问题：

如何解决小目标识别的问题？（图片中的商标logo往往非常小）
如何解决logo模糊变形打码、甚至引入攻击样本的问题？
如何准确识别“山寨”版logo？

为了解决这些问题，阿里安全团队设计了一个名为Brand Net的模型。

据阿里安全图灵实验室资深算法专家华棠介绍，模型主要分成三部分：

Cascade-RPN，这部分重点解决了商品图片中检测的logo“时大时小”的问题，提升了目标检测准确率、小目标召回率。
Soft Mask Attention，这部分采用迁移学习，构造了一个检测框（bounding box）特征到分割（segmentation）特征的映射空间，有效提升logo较小、或发生形变时的检测准确率。
Feature Representation and Instance Retrieval，这部分使得模型能在新logo加入时进行弹性扩展，不需要再对模型进行重复训练。

当然，Brand Net作为AI“打假师”的招数之一，主要还是用于比较有名（商品照片非常多）的品牌，因为它们的商品图片更多，训练出来的模型效果就会更好。