扣子Coze智能体实战:自动采集1000条小红书爆款笔记 ,自动写入飞书多维表格
大家好,我是汤师爷,专注AI智能体分享,致力于帮助100W人用智能体创富~
想要抓取小红书热门笔记,但一个个复制太耗时?
需要批量获取热门笔记数据,进行分析,却苦于没有高效的工具?
今天,我将为大家介绍一个超强的解决方案,利用Coze工作流,只需5个步骤,就能一键批量抓取小红书热门关键词的笔记,并自动写入飞书多维表格!
这套方案对于想要批量学习优质内容的创作者来说,绝对是个效率神器。
我们先看下工作流的执行效果:
1.整体工作流
1.跟进关键词获取小红书笔记
2.循环获取笔记详情
- 获取笔记详情
- 提取视频文案
- 将笔记数据整理成飞书多维表格格式
- 写入飞书多维表格
2.详细工作流节点
2.1 开始节点
开始节点有3个输入变量。
- 输入:
- foldUrl:飞书多维表格链接
- cookie:小红书cookie
- keywords:关键词
2.2 如何获取小红书cookie?
1.登陆https://www.xiaohongshu.com/
2.在页面空白处右击鼠标,选择「检查」
3.在刚刚打开的面板中,点击「网络」选项卡
4.刷新当前页面
5.点击第一条记录,在右侧「标头」部分向下滚动,找到cookie一行,将其内容复制下,这就是我们需要的cookieStr
2.3 获取博主所有小红书笔记
我们将使用【小红书】插件的xhs_search_notes功能。
通过这个功能,我们可以一键批量抓取热门关键词的笔记。
- 输入:
- cookieStr:开始 - cookie
- keywords:开始 - keywords
- noteType:1=视频
- sort:2=最热
- totalNumber:查询总数
2.4 批量获取笔记详情
1.使用循环节点,批量批量获取笔记详情
2.获取单个笔记详情
我们将使用【小红书】插件的xhs_note_detail功能。
通过这个功能,我们可以根据笔记链接获取笔记详情。
- 输入:
- cookieStr:开始 - cookie
- noteUrl:循环获取笔记详情-note_url
2.4 使用「字幕获取」插件,提取视频文案
- 输入:
- url:获取笔记详情-video_h264_url
2.5 使用代码节点:将笔记数据整理成飞书多维表格格式
在这一步,我们会使用代码节点,将笔记数据整理成飞书多维表格格式。
- 输入:
- input:获取笔记详情-note
- data:提取视频文案-content
Python代码如下:
async def main(args: Args) -> Output:
input_data = args.params.get('input', {}) # 获取传入的 input 对象,如果不存在则返回空字典
data = args.params.get('data', '') # 直接从 args.params 中提取 data 参数
records = [] # 初始化 records 列表
# 提取 note 相关字段
title = input_data.get('note_display_title', '') # 标题
desc = input_data.get('note_desc', '') # 描述
url = input_data.get('note_url', '') # 链接
nickname = input_data.get('auther_nick_name', '') # 作者昵称
likedCount = input_data.get('note_liked_count', '0') # 点赞数
videoUrl = input_data.get('video_h264_url', '') # 视频地址
collectedCount = input_data.get('collected_count', '0') # 收藏数
imageList = input_data.get('note_image_list', []) # 图片列表
# 构建记录对象
record = {
"fields": {
"笔记链接": url,
"标题": title,
"内容": desc,
"作者": nickname,
"点赞数": likedCount,
"链接": {
"link": url,
"text": title
},
"收藏数": collectedCount,
"图片地址": '\n'.join(imageList), # 将图片列表拼接成字符串
"视频地址": videoUrl,
"视频文案": data # 将 data 放入 fields 中,定义为 "视频文案"
}
}
records.append(record) # 将记录对象添加到 records 列表中
# 构建输出对象
ret: Output = {
"records": records
}
return ret
2.6 使用飞书多维表格节点:将笔记数据写入飞书多维表格
- 输入:
- app_token:开始-foldUrl
- records:将笔记数据整理成飞书多维表格格式-records
2.7 结束节点
通过这套工作流,你可以轻松实现关键词笔记的批量抓取,并写入飞书多维表格。
整个过程只需简单配置,就能自动化完成繁琐的数据采集工作,为你节省大量时间。
本文已收录于,我的技术博客:tangshiye.cn 里面有,AI 学习资料,Coze 智能体教程,算法 Leetcode 详解,BAT 面试真题,架构设计,等干货分享。
扣子Coze智能体实战:自动采集1000条小红书爆款笔记 ,自动写入飞书多维表格的更多相关文章
- 基于ROBO-MAS多智能体自主协同 高频投影定位系统
- 基于E-PUCK 2.0多智能体自主协同 高频投影定位系统
群体智能机器人是一种国际前沿的人工智能研究项目,由多个小型机器人组成的集群式解决系统,灵感源于蚂蚁.蜜蜂.鱼等群体生物,在没有统一领导的情况下,也能合作执行大量复杂的任务,比如组建一个图形,再在此基础 ...
- webpack快速入门——实战技巧:watch的正确使用方法,webpack自动打包
随着项目大了,后端与前端联调,我们不需要每一次都去打包,这样特别麻烦,我们希望的场景是,每次按保存键,webpack自动为我们打包,这个工具就是watch! 因为watch是webpack自带的插件, ...
- ARM-LINUX自动采集温湿度传感器数据
开机root自动登录 如果想在超级终端输入回车,登录后执行,则可以在/etc/profile中加入命令: 如果实现开机自动登录,在/etc/inittab中修改,每个开发板修改的方式可能都不同. ht ...
- 【SerpentAI:Python开源游戏智能体开发框架——相比OpenAI Universe可导入自己的游戏、可脱离Docker/VNC运行】
https://weibo.com/fly51fly?from=myfollow_all&is_all=1#1514439335614 [SerpentAI:Python开源游戏智能体开发框架 ...
- TensorFlow利用A3C算法训练智能体玩CartPole游戏
本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型.研究人员使用 tf.keras.OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advan ...
- 伯克利推出「看视频学动作」的AI智能体
伯克利曾经提出 DeepMimic框架,让智能体模仿参考动作片段来学习高难度技能.但这些参考片段都是经过动作捕捉合成的高度结构化数据,数据本身的获取需要很高的成本.而近日,他们又更进一步,提出了可以直 ...
- DRL 教程 | 如何保持运动小车上的旗杆屹立不倒?TensorFlow利用A3C算法训练智能体玩CartPole游戏
本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型.研究人员使用 tf.keras.OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advan ...
- 在linux上一行代码不用写实现自动采集+hadoop分词
在linux上一行代码不用写实现自动采集+hadoop分词 将下面的shell脚本保存成到xxx.sh,然后执行即可 cd /opt/hadoop mkdir spider wget -O spide ...
- STM32W108无线传感器网络节点自组织与移动智能体导航技术
使用STM32W108无线开发板及节点完毕大规模网络的自组建,网络模型选择树型,网络组建完毕之后,使用基于接收信号强度指示RSSI(ReceivedSignal Strength Indication ...
随机推荐
- WinForm 的ComBox下拉框自动提示、自动补全功能
https://blog.csdn.net/qiqingli/article/details/88992029 winformTextBox 下拉框自动提示.自动补全功能AutoCompleteCus ...
- 将各种实体类转成JSON(com.alibaba.fastjson.JSONObject)
当和其他系统对接时,因为某些原因,本系统需要根据不同条件查询不通的实体类,并以JSON格式传输数据,需要将各种实体类转成json 1 public <U> JSONObject proce ...
- idea集成翻译插件
在读开源代码时,英文注释看起来比较吃力,于是安装一个翻译插件第一步:安装TranslateHelper插件 配置 IDEA -> Preferences -> Plugins ,安装Tra ...
- inspector 只读属性
需要使用 Unity-ui-extensions 包 使用添加 [ReadOnly]就行
- 单片机和罗克韦尔Micro850实现Modbus\DF1\Ethernet/IP协议通信视频教程
单片机和罗克韦尔Micro850实现Modbus\DF1\Ethernet/IP协议通信视频教程 1.单片机+RS485模块和罗克韦尔AB Micro850实现Modbus RTU协议串口通信视频讲解 ...
- UNR 6. D2T2 神隐
\(\mathbf{Part. -1}\) 这是一道交互题. hehe 蚤决定花费几天时间,游览下山市的最著名的旅游景点 -- 吓山. 吓山,以高低纵横,崔巍秀丽,错综复杂的地形闻名.据说无论用什么地 ...
- java 面试锦集
Java集合22题 ArrayList 和 Vector 的区别. 说说 ArrayList,Vector,LinkedList 的存储性能和特性. 快速失败 (fail-fast) 和安全失败 (f ...
- 超级计算 CST DC分布式作业模型已经完成,但一直没有返回数据
问题:CST DC作业主要涉及到前端节点(登陆节点),主控制器,和求解器,也即是frontend(登陆节点)---DC maincontrol(MC节点)---DC Solver Servers(计算 ...
- 如何检查Solidworks装配体是否存在设计不合理地方?
Solidworks零件画完,在装配体组装好,一个模型就基本设计完成,那我们该如何检查装配图中是否存在设计不合理?零件与零件之间是否存在干涉呢? 操作步骤: 1.先用SolidWorks2023软件打 ...
- js函数中的this
特殊对象this 一.标准函数中,this引用的是把函数当成方法调用的上下文对象 window.color = 'red'; let o={ color:'blue' } function sayCo ...