python pip 爬虫练习---动态数据の小红书评论爬取

一、找到你想要爬取的内容

1.在笔记中打开检查，可以在“预览”中找到小红书的评论内容

2.找到想要的请求后，在“标头”里找到你需要的URL、Cookie、User-Agent

二、写代码

三、爬取结果

一、找到你想要爬取的内容

1.在笔记中打开检查，可以在“预览”中找到小红书的评论内容

2.找到想要的请求后，在“标头”里找到你需要的URL、Cookie、User-Agent

二、写代码

import requests

from time import sleep

import csv

import random

def main(page, file, cursor):

url = f'https://edith.xiaohongshu.com/api/sns/web/v2/comment/page?note_id=6576f2cb0000000016007e63&cursor={cursor}&top_comment_id=&image_formats=jpg,webp'

headers = {

'Cookie':'*********', #用自己的Cookie，需要是登录后的Cookie

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0',

}

try:

csvwriter.writerow(('评论内容',))

while page < 7: #爬取7页的评论

if cursor != '' : #评论第一页的url中的cursor是空，请求后返回的数据里会有第二页的cursor，做个循环更新url中的cursor，这样就可以实现翻页了。

url = f'https://edith.xiaohongshu.com/api/sns/web/v2/comment/page?note_id=6576f2cb0000000016007e63&cursor={cursor}&top_comment_id=&image_formats=jpg,webp'

resp = requests.get(url, headers=headers)

data = resp.json()

cursor = data['data']['cursor']

page += 1

for i in data['data']['comments'] :

print('爬取内容：', i['content'])

try:

csvwriter.writerow((i['content'],)) #参数后面要带个逗号，不带逗号在csv中是一格一个字

except:

continue #有的评论中有无法写入的表情包会报错，用try+except把这些评论过滤掉

sleep(3 + random.random())

except:

print("当前网页爬取失败")

return

if __name__ == '__main__' :

cursor=''

with open('red_comment.csv', 'a', newline='', encoding='gbk') as file:

csvwriter = csv.writer(file)

main(0,file, cursor)

sleep(3 + random.random())

三、爬取结果

大家都在看：

windows 开发语言【Python】爬虫练习-爬取豆瓣网电影评论用户的观影习惯数据

目录前言一、配置环境 1.1、安装Python 1.2、安装Requests库和BeautifulSoup库 1.3.、安装Matplotlib 二、登录豆瓣网（重点） 2.1、获取代理 2....

python 爬虫进阶版使用Scrapy框架爬取某网站螺蛳粉评论相关数据及其可视化分析（pyecharts）

文章目录前言开发工具一、数据爬取（Scrapy）1、配置scrapy框架2、在cmd里面创建Scrapy项目工程3、对spiders项目下的文件进行修改（1）修改settings.py（2）修改ite...

nlp 数据可视化【爬虫实战】全过程详细讲解如何使用python获取抖音评论，包括二级评论

简介：前两天，TaoTao发布了一篇关于“获取抖音评论”的文章。但是之前的那一篇包涵的代码呢仅仅只能获取一级评论。虽然说抖音的一级评论挺精彩的了，但是其实二级评论更加有意思，同时二级评论的数量是很多。...

课程设计 python 推荐算法大数据毕业设计Hadoop+Spark电影推荐系统电影评论情感分析电影用户画像系统电影评论情感分析电影爬虫电影可视化电影数据分析计算机毕业设计深度学习机器学习人工智能知识图谱

基于Spark的电影推荐系统角色功能模块具体功能描述用户个人信息模块注册用户输入个人信息进行注册登录用户通过输入账号和密码完成系统登录修改...

大数据毕业设计Python+Spark商品推荐系统电商爬虫电商推荐系统评论情感分析协同过滤算法计算机毕业设计机器学习深度学习人工智能知识图谱商品可视化电商爬虫

推荐算法在电商领域中非常重要，可以帮助提升用户体验和促进销售。以下是一个简单的基于内容的推荐算法示例代码，用于根据用户的偏好推荐商品：# 商品库，每个商品包含 id 和对应的特征# 用户的偏好# 根据...

javascript 如何使用 Python 爬虫抓取动态网页数据

如何使用 Python 爬虫抓取动态网页数据随着 Web 技术的不断发展，越来越多的网站采用了动态网页技术，这使得传统的静态网页爬虫变得无能为力。本文将介绍如何使用 Python 爬虫抓取动态网页数据...

python爬虫抓取小红书【爬虫实战】用Python采集任意小红书笔记下的评论，爬了10000多条，含二级评论！

文章目录一、爬取目标二、爬虫代码讲解2.1 分析过程2.2 爬虫代码三、演示视频四、附完整源码一、爬取目标您好！我是@马哥python说，一名10年程序猿。我们继续分享Python爬...

selenium Python爬虫实战：抽象包含Ajax动态内容的网页数据

在爬虫获取网页数据时，我们经常会遇到一些网页使用Ajax技术加载动态内容的情况。这些动态内容可能包含了我们所需要的数据，但是传统的爬虫工具无法直接获取这些内容。因为传统的爬虫工具在获取网页数据时，只能...

开发语言 python爬虫：Ajax异步爬取数据（b站评论区）

爬虫时遇到很多数据并不在访问网址的返回包里，而是随着用户下拉逐步加载的，也就是用到了Ajax，那么这时我们该如何爬取我们想要的数据呢？这里用爬取b站评论区相关数据为例，练习一下python爬虫异步爬取...

数据可视化情感分析【爬虫+数据清洗+可视化分析】用Python分析哔哩哔哩“狂飙”的评论数据

目录一、背景介绍二、爬虫代码三、可视化代码 3.1 读取数据 3.2 数据清洗 3.3 可视化 3.3.1 IP属地分析-柱形图 3.3.2 评论时间分析-折线图 3.3.3 ...

爬虫开发语言 Python爬取某电商平台商品数据及评论！

目录一、数据采集逻辑二、数据Schema三、数据爬取四、数据存储一、数据采集逻辑在进行数据采集之前，明确哪些数据为所需，制定数据Schema为爬取工作做出要求，并根据数据Schema制定出有针对性的爬...

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论

一、目标整理今天的目标是爬取小红书上指定笔记下的所有评论数据。以某篇举例，有2千多条评论。以下代码，截止2023-12-01 有效。效果如下：每条评论获取多个字段，笔记链接页码评论者...

大数据课程设计数据可视化 hadoop 计算机毕业设计Python+Spark知识图谱酒店推荐系统酒店评论情感分析酒店价格预测系统酒店可视化酒店爬虫 neo4j知识图谱深度学习

广东科技学院毕业设计(论文)开题报告设计(论文)名称民宿数据可视化分析系统的设计与实现设计(论文)类型 C 指导教师朱富裕学院计算机学院专业数据科学与大数据技...

课程设计数据可视化网络爬虫大数据毕业设计Python+Django旅游景点评论数据采集分析可视化系统 NLP情感分析 LDA主题分析 bayes分类旅游爬虫旅游景点评论爬虫机器学习深度学习人工智能计算机毕业设计

毕业论文（设计）开题报告学生姓名学号所在学院信息工程学院专业指导教师姓名指导教师职称工程师助教指导教师单位论文（设计）题目基于朴素...

hadoop 推荐算法大数据毕业设计Python+Spark知识图谱酒店推荐系统酒店评论情感分析酒店价格预测系统酒店可视化酒店爬虫 neo4j知识图谱深度学习机器学习人工智能计算机毕业设计

表2：云南经济管理学院2024届本科毕业论文（设计）开题报告（理科类）学院：信息与智能工程专业：大数据管理与应用论文（设计）题目基于大数...

金钥匙

python pip 爬虫练习---动态数据の小红书评论爬取

tcp/ip 网络 python 网络爬虫爬虫实战亮数据代理IP轻松解决爬虫数据采集痛点

Python杭州二手房源爬虫数据可视化分析大屏全屏系统开题报告

发表评论取消回复

金钥匙

python pip 爬虫练习---动态数据の小红书评论爬取

tcp/ip 网络 python 网络爬虫 爬虫实战 亮数据代理IP轻松解决爬虫数据采集痛点

Python杭州二手房源爬虫数据可视化分析大屏全屏系统 开题报告

相关文章

发表评论取消回复

tcp/ip 网络 python 网络爬虫爬虫实战亮数据代理IP轻松解决爬虫数据采集痛点

Python杭州二手房源爬虫数据可视化分析大屏全屏系统开题报告