扣子Coze智能体实战:一键批量抓取小红书博主所有笔记,写入飞书表格!
大家好,我是汤师爷,专注AI智能体分享,致力于帮助100W人用智能体创富~
想要抓取小红书博主的所有笔记内容,但一个个复制太耗时?
需要批量获取博主的笔记数据,进行分析,却苦于没有高效的工具?
今天,我将为大家介绍一个超强的解决方案,利用Coze工作流,只需5个步骤,就能一键批量抓取小红书博主的所有笔记,并自动写入飞书表格!
这套方案对于想要批量学习优质内容的创作者来说,绝对是个效率神器。
我们先看下工作流的执行效果:

1.整体工作流

1.获取博主所有小红书笔记
2.循环获取笔记详情
- 获取笔记详情
- 提取视频文案
- 将笔记数据整理成飞书表格格式
- 写入飞书表格
2.详细工作流节点
2.1 开始节点

开始节点有3个输入变量。
- 输入:
- foldUrl:飞书表格链接
- cookie:小红书cookie
- userProfileUrl:小红书博主主页链接
2.2 如何获取小红书cookie?
1.登陆https://www.xiaohongshu.com/
2.在页面空白处右击鼠标,选择「检查」

3.在刚刚打开的面板中,点击「网络」选项卡

4.刷新当前页面
5.点击第一条记录,在右侧「标头」部分向下滚动,找到cookie一行,将其内容复制下,这就是我们需要的cookieStr

2.3 获取博主所有小红书笔记
我们将使用【小红书】插件的xhs_auther_notes功能。

通过这个功能,我们可以一键批量抓取小红书博主所有笔记。

- 输入:
- cookieStr:开始 - cookie
- userProfileUrl:开始 - userUrl
2.4 批量获取笔记详情
1.使用循环节点,批量批量获取笔记详情

2.获取单个笔记详情
我们将使用【小红书】插件的xhs_note_detail功能。

通过这个功能,我们可以根据笔记链接获取笔记详情。
- 输入:
- cookieStr:开始 - cookie
- noteUrl:循环获取笔记详情-note_url

2.4 使用「字幕获取」插件,提取视频文案

- 输入:
- url:获取笔记详情-video_h264_url
2.5 使用代码节点:将笔记数据整理成飞书表格格式
在这一步,我们会使用代码节点,将笔记数据整理成飞书表格格式。

- 输入:
- input:获取笔记详情-note
- data:提取视频文案-content
Python代码如下:
async def main(args: Args) -> Output:
input_data = args.params.get('input', {}) # 获取传入的 input 对象,如果不存在则返回空字典
data = args.params.get('data', '') # 直接从 args.params 中提取 data 参数
records = [] # 初始化 records 列表
# 提取 note 相关字段
title = input_data.get('note_display_title', '') # 标题
desc = input_data.get('note_desc', '') # 描述
url = input_data.get('note_url', '') # 链接
nickname = input_data.get('auther_nick_name', '') # 作者昵称
likedCount = input_data.get('note_liked_count', '0') # 点赞数
videoUrl = input_data.get('video_h264_url', '') # 视频地址
collectedCount = input_data.get('collected_count', '0') # 收藏数
imageList = input_data.get('note_image_list', []) # 图片列表
# 构建记录对象
record = {
"fields": {
"笔记链接": url,
"标题": title,
"内容": desc,
"作者": nickname,
"点赞数": likedCount,
"链接": {
"link": url,
"text": title
},
"收藏数": collectedCount,
"图片地址": '\n'.join(imageList), # 将图片列表拼接成字符串
"视频地址": videoUrl,
"视频文案": data # 将 data 放入 fields 中,定义为 "视频文案"
}
}
records.append(record) # 将记录对象添加到 records 列表中
# 构建输出对象
ret: Output = {
"records": records
}
return ret
2.6 使用飞书表格节点:将笔记数据写入飞书表格

- 输入:
- app_token:开始-foldUrl
- records:将笔记数据整理成飞书表格格式-records

2.7 结束节点

3.总结
通过这套工作流,你可以轻松实现小红书博主笔记的批量抓取,大大提升内容获取和分析效率。
整个过程只需简单配置,就能自动化完成繁琐的数据采集工作,为你节省大量时间。
在AI时代,技术门槛将越来越低,小白也能搭建智能体,用AI工具来提升工作效率。
用AI智能体不是未来,而是AI时代每个人的生存技能,学会AI智能体,人人都是超级个体。
如果你觉得这篇文章有帮助,别忘了点赞、关注、收藏哟,传统美德不能丢~
本文已收录于,我的技术博客:tangshiye.cn 里面有,AI 学习资料,Coze 智能体教程,算法 Leetcode 详解,BAT 面试真题,架构设计,等干货分享。
扣子Coze智能体实战:一键批量抓取小红书博主所有笔记,写入飞书表格!的更多相关文章
- Python3利用BeautifulSoup4批量抓取站点图片的代码
边学边写代码,记录下来.这段代码用于批量抓取主站下所有子网页中符合特定尺寸要求的的图片文件,支持中断. 原理很简单:使用BeautifulSoup4分析网页,获取网页<a/>和<im ...
- 使用HtmlAgilityPack批量抓取网页数据
原文:使用HtmlAgilityPack批量抓取网页数据 相关软件点击下载登录的处理.因为有些网页数据需要登陆后才能提取.这里要使用ieHTTPHeaders来提取登录时的提交信息.抓取网页 Htm ...
- Web自动化框架LazyUI使用手册(4)--控件抓取工具Elements Extractor详解(批量抓取)
概述 前面的一篇博文详细介绍了单个控件抓取的设计思路&逻辑以及使用方法,本文将详述批量控件抓取功能. 批量抓取:打开一个web页面,遍历页面上所有能被抓取的元素,获得每个元素的iframe.和 ...
- 如何上传Packages到PyPI并批量抓取
1.如何上传包到PyPI ? 更新中... 2.批量抓取simple网站第三方模块 https://pypi.python.org/simple/ 3. 第三方模块的安装和使用 python set ...
- Python爬虫实战四之抓取淘宝MM照片
原文:Python爬虫实战四之抓取淘宝MM照片其实还有好多,大家可以看 Python爬虫学习系列教程 福利啊福利,本次为大家带来的项目是抓取淘宝MM照片并保存起来,大家有没有很激动呢? 本篇目标 1. ...
- python实现列表页数据的批量抓取练手练手的
python实现列表页数据的批量抓取,练手的,下回带分页的 #!/usr/bin/env python # coding=utf-8 import requests from bs4 import B ...
- Hibernate批量抓取
------------------siwuxie095 Hibernate 批量抓取 以客户和联系人为例(一对多) 1.批量抓取 同时查询多个对象的关联对象,是 Hibernate 抓取策略的一种 ...
- Python爬虫实战六之抓取爱问知识人问题并保存至数据库
大家好,本次为大家带来的是抓取爱问知识人的问题并将问题和答案保存到数据库的方法,涉及的内容包括: Urllib的用法及异常处理 Beautiful Soup的简单应用 MySQLdb的基础用法 正则表 ...
- Hibernate学习---第十一节:Hibernate之数据抓取策略&批量抓取
1.hibernate 也可以通过标准的 SQL 进行查询 (1).将SQL查询写在 java 代码中 /** * 查询所有 */ @Test public void testQuery(){ // ...
- Hibernate的批量抓取
批量抓取理解:如果我们需要查找到客户的所有联系人的话,按照正常的思路,一般是首先查询所有的客户,得到返回的客户的List集合.然后遍历List集合,得到集合中的每一个客户,在取出客户中的联系人(客户表 ...
随机推荐
- ESP32S3内网实现 WebSocket
ESP32S3内网实现 WebSocket WebSocket 是一种网络通信协议,它提供了在单个 TCP 连接上进行全双工.双向通信的通道.它是为了在 Web 浏览器和服务器之间实现实时.高效的数据 ...
- 如何优雅的关闭channel?
一.channel使用存在的不方便地方 1.在不改变channel自身状态的情况下,无法获知一个channnel是否关闭. 2.关闭一个已经关闭的channel,会导致panic.因此,如果关闭cha ...
- 《Java基础——JDK的下载、安装以及环境变量的配置》
Java基础--JDK的下载.安装以及环境变量的配置 一.JDK的下载: 目前为止,JDK总共有三个LTS版本(长期支持版本) 版本 LTS时间 JDK 8 2030年12月 JDK 11 2026年 ...
- FFmpeg开发笔记(六十九)Windows给FFmpeg集成AV1编码器libaom
AV1是一种新兴的免费视频编码标准,它由开放媒体联盟(Alliance for Open Media,简称AOM)于2018年制定,融合了Google VP10.Mozilla Daala以及Cis ...
- SOD框架使用金仓数据库“踩坑记”
SOD框架使用金仓数据库"踩坑记",严格来说是使用金仓数据库过程的踩坑记,并不是使用SOD框架来访问金仓数据库才会发生的问题,SOD框架的网友多年前就封装了人大金仓(现在已经改名为 ...
- VUE加Vite创建项目
首先需要找到Vite 官网,然后点击开始 Vite 需要 Node.js 版本 >= 12.0.0. $ npm init vite@latest 不知道之前为什么不行,装了一下旧的版本,然后再 ...
- Java中的队列与参数传递
Java中的队列数据结构 定义: 队列(Queue)是一种先进先出(FIFQ)的线性数据结构 基本性质: 先进先出 主要操作 2.1 入队:向队尾插入元素 2.2 出队:从队首移除元素 只允许在队首删 ...
- Cascader 支持服务端搜索
server-search-cascader 描述 vue3版本的级联选择器,支持懒加载和服务端搜索 如果您用的是react,原理一样,看代码修改即可 The cascade selector of ...
- 前端开发系列076-JQuery篇之框架源码解读[插件]
这篇文章将主要介绍jQuery框架的插件机制,包括但不限于jQuery.extend和jQuery.fn.extend方法的设计和使用,JavaScript体系中的常用概念以及jQuery插件的使用等 ...
- SCAU 2019年校赛 部分题解
点击下方 veiw code 查看完整代码 18438 First Blood 题意:\(\sum_{i=1}^a\)\(\sum_{j=1}^b\)(i+j) , 求和. 思路:签到题,照着题目A就 ...