Minnie 的个人资料世界入秋照片日志列表 工具 帮助
2009/10/27

<Sociology in Daily Life>上海“倒钩执法”事件 – 数据的分析

同学们,经过上一篇的讨论之后,我们发现,文本资料是可以内含废话逻辑的。这也是为什么很多同学习惯跳过废话直接看数据,毫无疑问,这是一个直接快捷而且清晰明了的获取信息的方式。文字可以修辞可以转移注意,数字总是能代表真相了吧。Nononono~~~~亲爱地同学们,森促届个葱满废话地四届,大家还是要时刻保持警惕,因为素字,也四苦以推敲地。

为了证明“黑车”是多么的反社会反人类,东方网报道了“上海黑车引发民怨不断,依法整治呼声不容忽视”一文。见下图:

由此我们可以得知,截止091023日,上海政法综治网“非法营运”栏总共有投诉238条,其中近200条是关于“黑车”地(有多近?不知道,我改完功课还活着的话可以具体考证一下)。记者得出的结论是:市民对“黑车”甚是痛恨。

出于好奇,我来到这个“上海政法综治网”的“非法营运”一栏。我的第一感觉是“非法营运”这名字本身就带点关于“黑车”的暗示,乍一看新闻我就生出一疑问,那约38条不投诉“黑车”的难不成投诉的是“白车”?后来发现这“非法营运”不是通常官方指称的“非法经营运输”,而是“非法经营,和非法运输”,赞吧~~中文博大精深吧~~~同样四个字可以有不同的解释,就看你在什么场合解释,对谁解释。所以我首先就可以质疑栏目名称的暗示作用,造成了“黑车”投诉的比例如此之高。但是考虑到还是有约38位不明真相的群众将“设摊”、“私开店铺”之类的投诉也发在这里,大概还是有人理解了“非法营运”的另一层涵义的,我们暂且不计那些因为找不到合适的投诉渠道而放弃投诉的人,把栏目名称的问题搁在一边。

接着我们点开这个“非法营运”,发现到1026日为止,投诉总数为255(新增17条全部为黑车投诉)。参考记者报道,我们可以得知255次投诉中有约217次针对黑车问题,比例约为85.1%。我们再看一下这217次黑车投诉从什么时候开始计起的呢?答案是200691日,是的,3年零2个月的时间里,总共有217次黑车投诉,平均每100天有投诉约18.8次。比这个频率高的有“黄赌毒”(24.3次),“违章搭建”(19.0次),“盗窃”(22.3次),以及“其它”(144.2次)。如果我们勉强可以说,虽然黑车不比“黄赌毒”、“违章搭建”、“盗窃”严重,但也可以算平分秋色,那我们怎么也无法说“黑车”比“其它”问题来得要严重。不不,“其它”里面没有黑车。当然“黑车”确实是一个社会问题,但是社会问题也分轻重缓急。对对,黑车这个问题要解决,但是是不是只有通过“严打”的方式来解决?


接着,我们来看政府制造的舆论本身,或者政府制造的舆论所带来的影响。这是两个非常奇怪的词组,不过看了一下数据以后也许你会有所思考。

我将“非法营运”这一栏的和时间相对应的投诉频率做一个summary,由于本人时间有限,再加上投诉时效的考虑,只整理由1026日起倒退1年半为止的数据。见下图:


从去年4月到现在,每个月的投诉虽然时高时低,但总体有一个具有规律的分布。但是在今年的10月,额滴神啊~~突然华丽丽地出现了一座珠穆朗玛峰!为了更深入地看这个疯狂的10月究竟发生了什么,我们再做一个10月份内和日期相对应的描述统计。见下图:



大家快来围观快来围观呀~~~整个10月的喜玛拉雅山高耸在1026日!什么?你不知道1026日发生了什么?1026日早上,上海市政府召开了新闻发布会,明确了我们的首要任务是坚决打击黑车!

现在我们可以如何解读这个情况呢?too bad,以现在手上的资料我无法做什么推论。但可以推测两个主要的可能性——也就是之前提到的“政府制造的舆论本身”,或者“政府制造的舆论所带来的影响”。

第一种可能,在1026日新闻发布会之后,五**party们开始积极推高“黑车”投诉的数量,制造黑车问题严重引起民怨的事实——谓之被制造的舆论本身。

第二种可能,由于政府舆论的暗示,许多市民的注意力被引到了“黑车”问题的严重程度上,导致突然间有更多人注意到黑车以及有更多人想要去投诉——谓之制造的舆论所带来的影响。

究竟是哪一个呢?又或者两者皆有之?我不知道,不过到底是哪个已经不是重点了。重点在于,同学们,开车不要经过闵行区和浦东新区,这俩地儿的黑车投诉最多啊~~~也就是说这俩地儿的“倒钩”最多啊~~~

===================================后记======================================

 

非常有趣的事:

1。随意浏览一下群众们的投诉记录,你会发现有一些锲而不舍的同志就同一个问题投诉了很多年。到最后,投诉的内容除了描绘“黑车”运营的情况外,还包括投诉“自己的投诉多年得不到回应”。不过,为了方便起见我还是把它们计入了关于“黑车”的投诉。


2 再随意浏览一下群众们的投诉内容,你还会发现,为民声所怨的黑车营运几乎全是以“聚众式”“人海式”进行活动的,而且主要集中在人流较多的公共设施附近, 例如:医院、地铁口、地标……换句话说,也就是“目标明显且众多”。所以,由此得到的符合逻辑的执法手段应该不包括“在城郊”“人流稀少地区”执法或使用 “倒钩”的方式冒充“无间道”——用肉眼一看就看到的东西何必要如此迂回地去“发现”呢?

不过,没错,我们只是不明真相的群众,并且如果继续“不明”下去,连做“群众”的资格也快没有了,所以,是的我们应该严厉地坚决地义无反顾地打击黑车!





=================================附赠========================================

 

由于整个样本就是很bias地,没有什么做inference的价值,所以以上只做了最最简单的descriptive analysis。以下附赠无聊所做假设检验,内容仅作参考或娱乐。

让我们来看看近1年半以来关于黑车的投诉在“非法营运”这一栏里所占的比例是怎样的。


26日仍然占据高地,除此之外by visual judgment我们可以大致判断,1年半以来黑车投诉和非黑车投诉平分秋色,可能黑车投诉略高于后者。事实是怎样呢?

我们测试一下1年半以来的这个sample中,黑车投诉所占的平均百分比和报道中的85.1%相比,差别是否明显。是的,我知道这个sample不随机,但是这个population一样也不是population,而且,用1年半来的数据来说事,总比用3年多的整体数据要来得具有时效性吧……另外我真的没有时间去翻足26页,数据可都是我人手输的……orz….就当我们来看一下,近1年半来的情况是否和整整3年多来的总体情况是一样的吧。

我们做一个最最基础的one-sample t-testtest value=0.851,也就是报道中三年多来黑车投诉占总共“非法营运”投诉的百分比。由于0910月这个峰值很影响到小样本的统计,暂且将它从数据库中去除。得到的结果是:


黑车投诉平均占59.97%(标准差有点大,没办法大家将就一下吧),与85.1%之间平均相差约25.1%95% Confidence Intervalp-value for 2-tailed test=0.01<0.05,我若要证明1年半来百分比小于报道中3年多来的百分比,p=0.005it means more significant

好,我们退一步,把高耸的10月也放进来:


结果没有显著差别,p-value for 1-tailed test=0.006,我们仍然可以说此百分比显著小于85.1%with 95% confidence interval




评论 (1)

请稍候...
很抱歉,您输入的评论太长。请缩短您的评论。
您没有输入任何内容,请重试。
很抱歉,我们当前无法添加您的评论。请稍后重试。
若要添加评论,需要您的家长授予您相应权限。请求权限
您的家长禁用了评论功能。
很抱歉,我们当前无法删除您的评论。请稍后重试。
您已超过了一天之内允许提供的评论数上限。请在 24 小时后重试。
因为我们的系统表明您可能在向其他用户提供垃圾评论,您的帐户已禁用了评论功能。如果您认为我们错误地禁用了您的帐户,请联系 Windows Live 支持部门
完成下面的安全检查,您提供评论的过程才能完成。
您在安全检查中键入的字符必须与图片或音频中的字符一致。

若要添加评论,请使用您的 Windows Live ID 登录(如果您使用过 Hotmail、Messenger 或 Xbox LIVE,您就拥有 Windows Live ID)。登录


还没有 Windows Live ID 吗?请注册

发表:
“森促届个葱满废话地四届”。。。
被气势吓到,原来奥特曼语进化发展如此神速
10 月 28 日

引用通告

此日志的引用通告 URL 是:
http://dearasuka.spaces.live.com/blog/cns!9BAF5D493047A19A!4020.trak
引用此项的网络日志