展开菜单

python爬取《流浪地球》16w评论

python爬取《流浪地球》16w评论

今年春节档电影《流浪地球》火的不要不要,截止到今天 2 月 17 日,上映 13 天,目前票房已达 36 亿,可喜可贺。 我自己到现在其实还没看这部电影,毕竟这电影这么火,电影院现在都很难买到好的位置。所以我打算不如先看看大家是怎么评价这部电影的,然后就开始写爬虫吧。 获得这 16w 评论数据的过程并没有那么顺利,对猫眼评论数据接口的分析踩过不少的坑,最终也是参考了网上其他文章得以解决,下面我们一起来分析下。 打开猫眼 pc 网页,发现只有 10 条热门评论数据,果断将浏览器切换成手机模式...

爬虫是什么?

爬虫是什么?

爬虫的英文名叫spider,解释为蜘蛛,最近几年越来越多的人都在说到爬虫,对于不太熟悉互联网行业的人来说,可能并不理解爬虫究竟是什么,莫非真的是某种昆虫吗? 所谓爬虫,简单来说其实就是一个程序,你也可以理解为一段代码,它是按照一定的规则来自动获取并采集互联网的信息和数据的,这些数据可以是来源于各个网站、APP、应用软件等,举个例子,我们常用的搜索引擎某度等其实就是一个特殊的巨大的爬虫,它能根据我们输入的内容自动去采集整个互联网上和你输入内容相关的数据,然后将爬虫采集到的数据结果展示给你,就是你看到的搜索结果,当然爬虫在搜索引擎...