百木园-与人分享,
就是让自己快乐。

EDG夺冠!用Python分析22.3万条数据:粉丝都疯了!

原创不易,本文禁止抄袭,转载,违权必究!

一、EDG夺冠信息

11月6日,在英雄联盟总决赛中,EDG战队以3:2战胜韩国队,获得2021年英雄联盟全球总决赛冠军,这个比赛在全网各大平台也是备受瞩目:

 

1、微博热搜第一名,截止2021-11-10已有亿级观看量,微博粉丝数到达638.4万

 

2、哔哩哔哩已有几亿人气,总弹幕有22.3万,全站排行榜最高第2名,B站粉丝已有219.9万

 

 

 

3、腾讯爱奇艺优酷等视频平台800万人看过

 

4、虎牙等直播平台热度也是居高不下

 

5、央视新闻也发微博庆祝EDG夺冠

 

 

 

 

既然比赛热度这么高,那么本次我们就以bilibili为基准,通过采集EDG夺冠比赛视频在哔哩哔哩的22.3万条弹幕数据,再通过Python来分析进而感受粉丝的热情

 

 

二、实战目标 

2.1 网络爬虫

利用爬虫技术抓取EDG战队在B站夺冠比赛视频的22.3万条弹幕数据

 

2.2 数据可视化

通过jieba、numpy等Python库对抓取来的弹幕数据进行分析并且可视化

 

 

2.3 自然语言处理(情感分析)

利用pandas+自然语言处理(NLP)等对EDG夺冠比赛视频的弹幕数据进行情感分析,根据分析结果得出一些结论

 

 

 

 

 

 

 

 

 

 

三、bilibili接口分析 

首先进入EDG夺冠比赛视频URL:

https://www.bilibili.com/video/BV1EP4y1j7kV?p=1

 

哔哩哔哩已为大家整理好了EDG比赛视频,从开幕式到夺冠时刻,共有7个视频

 

哔哩哔哩弹幕数据接口:

http://api.bilibili.com/x/v1/dm/list.so?oid=XXX

这个接口就是B站弹幕数据专用接口,我们可以直接拿来用,这个接口中的oid可以理解为每个视频中的唯一标识符,它由数字组成,每一个视频都有唯一的一个oid,那么我们只要找到oid就可以请求相应比赛视频弹幕的API接口,从而抓取弹幕数据

 

获取oid

打开开发者工具,切换到Network选项,然后找到以pagelist为开头的请求接口

 

 

接着找到Request URL这个请求接口,打开新窗口直接用这个API接口请求,如下图:

 

当我们直接请求这个API接口时可以看到JSON格式的数据,而在里面的cid就是我们需要的oid,如下所示:

1 {\"code\":0,\"message\":\"0\",\"ttl\":1,\"data\":[{\"cid\":437586584,\"page\":1,\"from\":\"vupload\",\"part\":\"第一局 4K\",\"duration\":2952,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437626309,\"page\":2,\"from\":\"vupload\",\"part\":\"第二局 4K\",\"duration\":3031,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437659159,\"page\":3,\"from\":\"vupload\",\"part\":\"第三局 4K\",\"duration\":3406,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437727348,\"page\":4,\"from\":\"vupload\",\"part\":\"第四局 4K\",\"duration\":3212,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437729555,\"page\":5,\"from\":\"vupload\",\"part\":\"第五局 4K\",\"duration\":3478,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437550300,\"page\":6,\"from\":\"vupload\",\"part\":\"开幕式\",\"duration\":984,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437717574,\"page\":7,\"from\":\"vupload\",\"part\":\"夺冠时刻\",\"duration\":2017,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}}]

来源:https://www.cnblogs.com/makerchen/p/15539183.html
图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » EDG夺冠!用Python分析22.3万条数据:粉丝都疯了!

相关推荐

  • 暂无文章