在当前的大数据时代背景下,每个人的大量社会活动都会被大数据系统记录下来。最近跟小伙伴聊起一件事:大数据扫黄,结果发现大家格外感兴趣。

而我平时呢,也会看【守护解放西】、【孝警阿特】之类的视频,发现相关视频的播放量也特别高,那么今天就来探讨一下:大数据扫黄,是真的吗?

▲【孝警阿特】视频截图

1

先一个很久之前的说法,看起来就非常假的很,很难不怀疑是大数据分析的广告…

里面第一步获取数据就说不通,销售信息里的数据都是脱敏的,你怎么能确定淘宝名为“帅气的***彦祖”并买了100个TT的收件人,背后其实是朱小五

通过这种方法去得到“准失足妇女池”,估计还没有警察叔叔自己看后台行政处罚记录快,大部分从事这个行业的人员被抓都不是一次两次了。

比如守护解放西中,每个人口中自己都是第一次,结果发现早就跟派出所快成熟人了。

▲【守护解放西】视频截图

所以上面所谓的大数据扫黄案例就很离谱,既然某公司有能力拿到电商平台真人匹配的销售数据,那直接去拿开房数据不香吗?

那再极端一步,

直接用支付数据不是更狠嘛!

2

说到这里,大数据扫黄 2.0 就来了。在最新大家大家转述的故事里,涉黄人员怀疑名单通常是这样确定的。

如果你是一名年龄在20—40岁之间的女性,并且经常在午夜(前一天晚上11点到第二天凌晨3点)收到像289、389等金额的转账或红包,那你将会出现在涉黄人员怀疑名单上。

如果你是一名男性,经常在午夜(前一天晚上11点到第二天凌晨3点)支付像289、389等金额的红包或是转账,你也可能会被列入涉黄怀疑名单。

这个说法听起来就比上一个逻辑强多了,甚至我都一阵恍惚,觉得是不是某公司出的数据分析模拟面试题,让你用SQL或者Python进行数据处理,找出“可疑交易”。

但是,但是,我对这种说法仍持怀疑态度。

第一点,我们先看看实际中办案民警是如何进行“数据分析”的,他们通常是已经确认存在卖淫活动的人员并在立案侦查过程中发现使用微信进行交易。

这时候办案民警需要前往深圳市腾讯公司依法调取了xx年xx月微信交易账单,然后再根据微信交易账单相关数据,分析、核查出“曾交易过人员”的微信号及身份信息,就可以进一步进行依法传讯,从而实现数据分析扫黄。

(以上信息均整理自处罚公告)

再说第二点,前面说的“大数据扫黄”所依赖的逻辑一个是时间(午夜),另一个就是关键点交易金额(289、389),但事实真的是这样吗?

我没有这方面的经历,但最近确实在写一篇相关的文章,先挖个坑。

但是我只能说结论,嫖娼交易金额绝不是289、389这样商品促销的数字

那么具体是都是什么金额呢?

最高数字是多少呢?

大家可以给本文多多点赞,我加快更新下一篇文章

3

前面说了不少“大数据扫黄”破绽,但是不得不承认,如果数据拥有者真的想去做遍历筛选查询,去做交叉验证,是可以实现的。

但作为普通民众,既感谢警察同志的辛苦付出,也更愿意看到带着“镣铐”执法的行为。

▲【孝警阿特】视频截图

借用半佛老婆的语言说:卖淫组织者和大数据拥有者谁突破的底线更深,本身就是一个难以确定的事实。他们都是出来卖的,我们也都是被白嫖的。

最后,放一个温暖的,正确的大数据使用方式:

我是朱小五,我们下篇文章见。

▼点击查看作者新书《快学Python》的5折优惠!