作者:D
原文地址:https://www.douban.com/group/topic/143590827/
我之前爬了当下娱乐圈中的女流量,女演员,以及炒团成员的一些微博热搜数据,并写了如下两篇文章:
《(更新杨颖,并更新计算模型) 爬了一下近一年的微博热搜数据,女流量(女演员)数据分析》
《《数据分析》第二弹,炒团内部热搜大解析 --- 谁才是“热搜”下位圈?》
这两篇文章下,有不少朋友给了一些有意思的评论与建议。根据大家的建议,我更新了“微博热搜影响力”的计算模型(已更新在两篇文章中)。也有朋友质疑,计算过去一年的“总影响力”有失偏颇,因为炒团的成员吃了太多的创造101红利,应该看看出创之后,尤其是2019年之后,娱乐圈女星,与炒团成员的影响力变化。
这次,我们来吧这些数据合并,来考虑下面这个问题:创造101过去一年了,出道的11人,如今热度又什么变化?跟娱乐圈的顶流比起来,Top3当下的热度又是什么样的?
从2018年4月创造101播出起,我把时间轴分为2018年第二季度,2018年第三季度,2018年第四季度,2019年第一季度,和2019年第二季度。首先,我们来看一下top3与创外女星的比较。这个“总影响力”计算公式,已由之前的线性模型,修改为幂律模型,更贴近实际。

为了不让图片看上去更复杂,我只挑选了几个有代表性的高热度女星与我们top3进行比较。跟某些研究员想的差不多,top3的热搜影响力在过去的一整年里是逐渐减少的。
大家可以看一下创外这些女星的数据,非常有意思。顶流杨幂,表现非常稳定,近三个季度都排在第一位。欧阳娜娜今年的数据突然变得很好,可能是杨天真准备要开始捧她了。杨紫的数据在去年7-9月份表现亮眼,我查了一下,那段时间香蜜在播出。
在回过头看一下创内的top3:
杨超越在创期以及创结束后的几个月,影响力都是女流量第一。但最近三个季度,这个指标趋近于平缓。不过也基本维持在了女星前五的水平。其中2019年第一季度,由于篮球世界杯抽签,以及编程大赛等几个广受瞩目的热搜,杨超越的影响力指数仍然能排到女星的第二位,仅次于杨幂。
孟美岐与吴宣仪放到一起说吧。在创期,以及刚出创的一段时间,这两位的热度可以排到女星的前几位(吴宣仪在2018年7月-9月影响力一度排到第二位)。但是自从2019年起,这两位的数据真的算不上好。尤其是最近一个季度,吴宣仪闭关拍戏,基本上没有什么热度。而孟美岐尽管有《犟》的加持,她的影响力也无法与娱乐圈的主流女星持平。
我们再来看一下炒团内部的热度:

为了把数值看的更清楚,我把杨超越的数据去除。整体来看,炒团的热度也是普遍下降的。
Sunnee的热度一直保持的相对不错,但是在最近一个季度,也就是今年的4月-6月,从热榜上消失了。孟美岐和吴宣仪的热度成梯度式下降。最近一个季度,除杨超越之外,“热搜影响力”最高的居然是大娟,并远超Top1和Top2。她的“段奥娟瘦了”“段奥娟锁骨”都是高位热搜。
之前的分析中,紫宁的热度是在中位圈,比Sunnee差不了多少。然而这张图清楚的说明,她热度最高的时候是去年的7月-9月,合理猜测是跑三时候带来的热搜,其余时间基本上是无姓名。我记得当时评论区有位朋友说紫宁的热搜都是她自己应得的,看到这里,应该是打脸了吧。
队长的热度也在最近三个月没有了,想到关于她与公司可能存在的“矛盾”,嗯,好像明白了什么。
其余妹妹属于查无姓名的状态,抱歉我就不多说了。
<番外篇:低位热搜到底在哪里?>
讨论完了炒团各位成员的热度,我把这些女明星的所有的热搜数据整合了一下,按照其最高排位做了一个distribution,如下图所示。

整体来看,大部分的热搜都会冲到热一的位置。这也符合正常的逻辑,因为热一可以带给路人更强的影响力。而前15位的分布也整体符合统计学中的“长尾分布”,但是从16开始,又出现了一段小“高峰”。这说明,有一部分人的热搜,到第16位就停了,所谓的低位热搜,其实是卡16(非卡18)。
<总结>:
因为能获取的数据实在有限,以后应该不会再更新了。如果对于数据计算有什么不妥的地方,或者缺少了谁的数据,请给我留言。
通过这三篇文章,我尽可能的客观的来描述我所爬取的这些数据。我的言语表达或许是主观的,但是数据的内容是客观存在的。你可以不相信我说的话,但是一定要相信所看到的数据。