收藏本页 | 设为主页 | 网站首页  

上海雷煜自动化科技有限公司

主营:模温机,吹瓶机,制袋机,植保无人机

网站公告
欢迎光临上海雷煜自动化科技有限公司
详情咨询客服QQ:553987032
有事儿您Q我!
?
公司资讯
站内搜索
 
香港管家婆论坛
Python爬取20万条评论终于查清周杰伦新歌为啥弄崩QQ音乐
发布时间:2019-10-08        浏览次数:        

  原标题:Python爬取20万条评论,终于查清周杰伦新歌为啥弄崩QQ音乐

  【新智元导读】9月16日晚间,周董在朋友圈发布了最新单曲《说好不哭》。发布后,真的让一波人哭了,一群想抢鲜听的小伙伴直接泪奔。因为QQ音乐直接被搞崩了!那么听过周董新歌后的小伙伴都是怎么评价的呢?这里,我们获取了 QQ 音乐的近 20W 条评论数据进行分析,看看其中有哪些有趣的东西?

  这里,在暑假两个人去桂林旅游三天到五天左右我们获取了 QQ 音乐的近 20W 条评论数据进行分析,看看其中有哪些有趣的东西?

  发现可以直接获取到数据,连 Header 都不需要添加。这里尝试对请求参数进行了精简,最终只需要如下几个参数即可:

  返回数据中有很多暂时不需要的字段,这里我们只取其中的用户名、评论时间、评论内容、点赞数。

  由于数据量较大 这里我们暂时将数据存放在 Excel 中,一来无须依赖外部数据库,二来可以使用 Excel 对数据进行二次处理。

  首先我们对评论按小时区间进行汇总,由于时间粒度比较小,这里对时间粒度进行了一些处理:

  周董的新曲是在 9.16 号 23 点准时发布的。可以看出在发布后的一个小时内(23:00-24:00)评论数量达到了高峰,占了总评论数的一半以上。

  词云生成的方法有很多,可以用代码生成,也可以用一些在线工具。这里我就使用了在线词云工具:WordArt,生成效果如下:

  周杰伦、杰伦字眼很明显,还有大量跑来『打卡』的:『好听』、『来了』、『哭了』、『爱了』,因为现在网络导航站太多请大家告诉下我有哪2019-09-03!其中少不了的还有『青春』,另外『阿信』的出现估计给了很多人惊喜。

  对比下可以看出和我们获取到的数据是比较一致的,只不过官方并不是按点赞个数进行排名的,看得出来这些排名靠前的大都是在回忆青春。

?
香港黄大仙| 玄机图| 黄大仙神算| 118cc中马堂图库| 六肖中特期期准| 5683神算网| 白姐图库| 香港金多宝| 深圳图库| 246zl天天好彩734cc| 香港天下彩| 状元红论坛| 杨红主论坛| 搜码网888569| 一肖中特|