『玩转Streamlit』--缓存机制
Streamlit 应用在运行时,每次用户交互都会触发整个脚本的重新执行。
这意味着一些耗时操作,如数据加载、复杂计算和模型训练等,可能会被重复执行,严重影响应用响应速度。
本文介绍的缓存机制能够帮助我们解决这些问题,提高Streamlit 应用的性能。
而Streamlit的缓存机制就像是给应用配备了一个“记忆助手”,它允许开发者将特定函数的计算结果保存下来,当下次相同输入再次调用该函数时,无需重新执行函数,直接返回缓存结果,极大地提高了应用运行效率,减少等待时间。
1. 为什么需要缓存
Streamlit的机制是每次用户交互或代码更改时都会重新运行脚本,这样就导致了:
- 重复计算:长时间运行的函数可能会被多次调用,导致应用响应变慢
- 资源浪费:频繁加载和处理大量数据会消耗大量内存和计算资源
- 用户体验差:应用加载时间过长,影响用户交互体验
为了解决这些问题,Streamlit提供了缓存机制。
缓存机制就像是给应用配备了一个“记忆助手”,它允许开发者将特定函数的计算结果保存下来,当下次相同输入再次调用该函数时,无需重新执行函数,直接返回缓存结果。
通过缓存函数的输出结果,避免重复计算,能够显著提高应用的性能和响应速度。
2. 两种缓存装饰器
Streamlit提供了两种缓存装饰器:st.cache_data和st.cache_resource,它们的主要区别在于缓存的对象类型和使用场景。
2.1. st.cache_data
st.cache_data是用于缓存数据的装饰器。
适用于缓存函数的输出结果,特别是那些返回可序列化数据对象的函数(如 Pandas DataFrame、NumPy 数组、字符串、整数等)。
它的主要参数有:
ttl:缓存的生存时间(以秒为单位)。超过该时间后,缓存将失效并重新计算。max_entries:缓存中允许的最大条目数。超出该数量时,最旧的缓存条目将被删除。persist:是否将缓存持久化到磁盘上。默认为False。show_spinner:是否显示加载动画。默认为True。allow_output_mutation:是否允许返回值被修改。默认为False,建议谨慎使用。
2.2. st.cache_resource
st.cache_resource是用于缓存资源的装饰器。
适用于缓存那些需要初始化但不需要频繁重新计算的对象,如数据库连接、模型加载等。
它的主要参数有:
ttl和max_entries:与st.cache_data相同。show_spinner:是否显示加载动画。默认为True。allow_output_mutation:是否允许返回值被修改。默认为False。
2.3. 两者区别总结
| st.cache_data | st.cache_resource | |
|---|---|---|
| 使用场景 | 适用于缓存函数的输出结果,特别是那些返回可序列化数据对象的函数 | 适用于缓存那些需要初始化但不需要频繁重新计算的对象,如数据库连接、模型加载等 |
| 特点 | 缓存的是函数的输出结果,适合频繁调用且输出结果可能变化的场景 | 缓存的是资源对象本身,适合初始化耗时但不需要频繁更新的场景 |
| 缓存内容示例 | 从 API 获取数据、加载 CSV 文件、数据处理等 | 加载预训练模型、建立数据库连接等 |
3. 缓存使用示例
下面通过示例来演示这两种缓存装饰器的使用。
3.1. st.cache_data示例
假设我们有一个应用,需要从API获取数据并展示给用户。
由于数据加载可能需要较长时间,我们可以使用st.cache_data来缓存结果。
import streamlit as st
import requests
import pandas as pd
# 使用 st.cache_data 缓存数据加载
@st.cache_data(ttl=3600) # 缓存 1 小时
def fetch_data(api_url):
response = requests.get(api_url)
data = response.json()
df = pd.DataFrame(data)
return df
# 用户界面部分
st.title("使用 st.cache_data 缓存数据加载")
api_url = "https://jsonplaceholder.typicode.com/posts"
df = fetch_data(api_url)
st.write(df)
在这个例子中,fetch_data函数被@st.cache_data装饰器修饰。
第一次调用时,数据会被加载并缓存,后续调用时直接从缓存中读取,避免重复请求 API,
直至1小时后,缓存失效之后才能重新请求。
3.2. st.cache_resource示例
假设我们有一个机器学习应用,需要加载一个预训练的模型。
由于模型加载可能需要较长时间,我们可以使用st.cache_resource来缓存模型对象。
import streamlit as st
import joblib
# 使用 st.cache_resource 缓存模型加载
@st.cache_resource
def load_model(model_path):
model = joblib.load(model_path)
return model
# 用户界面部分
st.title("使用 st.cache_resource 缓存模型加载")
model_path = "path/to/your/model.pkl"
model = load_model(model_path)
st.write("模型已加载,可以进行预测!")
在这个例子中,load_model函数被@st.cache_resource装饰器修饰。
模型加载后会被缓存,后续调用时直接从缓存中读取,避免重复加载。
4. 总结
Streamlit的缓存机制通过st.cache_data和st.cache_resource提供了强大的性能优化功能。
它们可以帮助开发者减少重复计算、节省资源,并显著提高应用的响应速度。
在实际开发中,开发者可以根据需求选择合适的缓存装饰器:
- 如果需要缓存函数的输出结果,使用
st.cache_data - 如果需要缓存初始化的资源对象,使用
st.cache_resource
合理使用缓存机制,可以让 Streamlit 应用更加高效和流畅,提升用户体验。
『玩转Streamlit』--缓存机制的更多相关文章
- Github 恶搞教程(一起『玩坏』自己的 Github 吧)
最近在伯乐在线读到一篇趣文,<如何在 Github『正确』做贡献>,里面各种能人恶搞 Github 的『Public contributions』,下面截取几个小伙伴的战绩: 顺藤摸瓜,发 ...
- MyBatis框架——动态SQL、缓存机制、逆向工程
MyBatis框架--动态SQL.缓存机制.逆向工程 一.Dynamic SQL 为什么需要动态SQL?有时候需要根据实际传入的参数来动态的拼接SQL语句.最常用的就是:where和if标签 1.参考 ...
- 『Asp.Net 组件』Asp.Net 服务器组件 的开发优势和劣势
在写<Asp.Net 服务器组件系列文档>之前,笔者不才,揣测微软战略用意: 微软利益诉求莫过于 微软产品和技术的市场份额: 因此,微软战略之一莫过于将 所有开发人员 团聚在 微软周围,以 ...
- 2018-2019-2 20165316 『网络对抗技术』Exp3:免杀原理与实践
2018-2019-2 20165316 『网络对抗技术』Exp3:免杀原理与实践 一 免杀原理与实践说明 (一).实验说明 任务一:正确使用msf编码器,msfvenom生成如jar之类的其他文件, ...
- 2017-2018-2 20155303『网络对抗技术』Final:Web渗透获取WebShell权限
2017-2018-2 『网络对抗技术』Final:Web渗透获取WebShell权限 --------CONTENTS-------- 一.Webshell原理 1.什么是WebShell 2.We ...
- 2017-2018-2 20155303『网络对抗技术』Exp7:网络欺诈防范
2017-2018-2 『网络对抗技术』Exp7:网络欺诈防范 --------CONTENTS-------- 一.原理与实践说明 1.实践目标 2.实践内容概述 3.基础问题回答 二.实践过程记录 ...
- 20155308『网络对抗技术』Exp7:网络欺诈防范
20155308『网络对抗技术』Exp7:网络欺诈防范 原理与实践说明 1.实践目标 本实践的目标是:理解常用网络欺诈背后的原理,以提高防范意识,并提出具体防范方法. 2.实践内容概述 简单应用SET ...
- # 2017-2018-2 20155319『网络对抗技术』Exp7:网络欺诈防范
2017-2018-2 20155319『网络对抗技术』Exp7:网络欺诈防范 一.原理与实践说明 1.实践目标 本实践的目标是:理解常用网络欺诈背后的原理,以提高防范意识,并提出具体防范方法. 2. ...
- # 2017-2018-2 20155319『网络对抗技术』Exp4:恶意代码分析
2017-2018-2 20155319『网络对抗技术』Exp4:恶意代码分析 实验目标与基础问题 ++1.实践目标++ 监控你自己系统的运行状态,看有没有可疑的程序在运行. 分析一个恶意软件,就分析 ...
- 『HTML5挑战经典』是英雄就下100层-开源讲座(二)危险!英雄
本篇为<『HTML5挑战经典』是英雄就下100层-开源讲座>第二篇,需要用到开源引擎lufylegend,可以到这里下载: 下载地址:http://lufylegend.googlecod ...
随机推荐
- 人工智能大语言模型起源篇,低秩微调(LoRA)
上一篇: <规模法则(Scaling Law)与参数效率的提高> 序言:您在找工作时会不会经常听到LoRA微调,这项技术的来源就是这里了. (12)Hu.Shen.Wallis.Allen ...
- openEuler欧拉配置Nacos集群
一.安装Nacos systemctl stop firewalld systemctl disable firewalld mkdir -p /home/nacos tar xvf nacos- ...
- 07C++选择结构(1)——教学
一.基础知识 1.关系运算符 因为我们要对条件进行判断,必然会用到关系运算符: 名称 大于 大于等于 小于 小于等于 等于 不等于 符号 > >= < <= == != 关系表 ...
- CreateElement vs DOM Parser
Benchmark: CreateElement vs DOM Parser - MeasureThat.net 可见 createElement 效率并不逊于 HTML.
- 【Python】【爬虫】爬虫问题:requests的content和text
爬虫问题:requests的content和text 通常来说,text获取的是Unicode编码的文本数据,content获取的是byte类型的二进制数据,比如获取图片本身.PDF文件之类的,可以用 ...
- 【报错解决】【Vue】与后端交互时,http与https跨域问题
问题 xhr.js:220 Mixed Content: The page at 'https://xxx' was loaded over HTTPS, but requested an insec ...
- Mybatis-plus 简单使用
Mybatis-plus 特点介绍: 1.无侵入:只做增强不做改变,引入它不会对现有工程产生影响 2.强大的CRUD操作:内置通用Mapper.Service,仅仅通过少量配置即可实现单表大部分CRU ...
- TNN-linux编译测试记录
Github: https://github.com/Tencent/TNN docs: https://github.com/Tencent/TNN/blob/master/doc/cn/user/ ...
- BotSharp 4.0 Sidecar:迈向更大规模化的AI Agent平台框架
BotSharp 是一个功能强大的开源项目,由 SciSharp[1] 社区开发和维护,旨在实现.NET技术栈下高度可定制的多智能体解决方案.为开发高效的对话式 AI 系统提供了极大的灵活性.通过其模 ...
- HashMap中哈希表的长度为什么需要是2的幂次方以及怎么实现
看过HashMap源码的人可能都用印象,就是hashMap的哈希表长度可以由自己指定也可以不指定使用默认长度,但是如果在了解或者发现tableSizeFor方法的话,你就会知道此方法会改变我们的输入长 ...