Streamlit 应用在运行时，每次用户交互都会触发整个脚本的重新执行。

这意味着一些耗时操作，如数据加载、复杂计算和模型训练等，可能会被重复执行，严重影响应用响应速度。

本文介绍的缓存机制能够帮助我们解决这些问题，提高Streamlit 应用的性能。

而Streamlit的缓存机制就像是给应用配备了一个“记忆助手”，它允许开发者将特定函数的计算结果保存下来，当下次相同输入再次调用该函数时，无需重新执行函数，直接返回缓存结果，极大地提高了应用运行效率，减少等待时间。

1. 为什么需要缓存

Streamlit的机制是每次用户交互或代码更改时都会重新运行脚本，这样就导致了：

重复计算：长时间运行的函数可能会被多次调用，导致应用响应变慢
资源浪费：频繁加载和处理大量数据会消耗大量内存和计算资源
用户体验差：应用加载时间过长，影响用户交互体验

为了解决这些问题，Streamlit提供了缓存机制。

缓存机制就像是给应用配备了一个“记忆助手”，它允许开发者将特定函数的计算结果保存下来，当下次相同输入再次调用该函数时，无需重新执行函数，直接返回缓存结果。

通过缓存函数的输出结果，避免重复计算，能够显著提高应用的性能和响应速度。

2. 两种缓存装饰器

Streamlit提供了两种缓存装饰器：st.cache_data和st.cache_resource，它们的主要区别在于缓存的对象类型和使用场景。

2.1. st.cache_data

st.cache_data是用于缓存数据的装饰器。

适用于缓存函数的输出结果，特别是那些返回可序列化数据对象的函数（如 Pandas DataFrame、NumPy 数组、字符串、整数等）。

它的主要参数有：

ttl：缓存的生存时间（以秒为单位）。超过该时间后，缓存将失效并重新计算。
max_entries：缓存中允许的最大条目数。超出该数量时，最旧的缓存条目将被删除。
persist：是否将缓存持久化到磁盘上。默认为False。
show_spinner：是否显示加载动画。默认为True。
allow_output_mutation：是否允许返回值被修改。默认为False，建议谨慎使用。

2.2. st.cache_resource

st.cache_resource是用于缓存资源的装饰器。

适用于缓存那些需要初始化但不需要频繁重新计算的对象，如数据库连接、模型加载等。

它的主要参数有：

ttl和max_entries：与st.cache_data相同。
show_spinner：是否显示加载动画。默认为True。
allow_output_mutation：是否允许返回值被修改。默认为False。

2.3. 两者区别总结

	st.cache_data	st.cache_resource
使用场景	适用于缓存函数的输出结果，特别是那些返回可序列化数据对象的函数	适用于缓存那些需要初始化但不需要频繁重新计算的对象，如数据库连接、模型加载等
特点	缓存的是函数的输出结果，适合频繁调用且输出结果可能变化的场景	缓存的是资源对象本身，适合初始化耗时但不需要频繁更新的场景
缓存内容示例	从 API 获取数据、加载 CSV 文件、数据处理等	加载预训练模型、建立数据库连接等

3. 缓存使用示例

下面通过示例来演示这两种缓存装饰器的使用。

3.1. st.cache_data示例

假设我们有一个应用，需要从API获取数据并展示给用户。

由于数据加载可能需要较长时间，我们可以使用st.cache_data来缓存结果。

import streamlit as st

import requests

import pandas as pd

# 使用 st.cache_data 缓存数据加载

@st.cache_data(ttl=3600)  # 缓存 1 小时

def fetch_data(api_url):

    response = requests.get(api_url)

    data = response.json()

    df = pd.DataFrame(data)

    return df

# 用户界面部分

st.title("使用 st.cache_data 缓存数据加载")

api_url = "https://jsonplaceholder.typicode.com/posts"

df = fetch_data(api_url)

st.write(df)

在这个例子中，fetch_data函数被@st.cache_data装饰器修饰。

第一次调用时，数据会被加载并缓存，后续调用时直接从缓存中读取，避免重复请求 API，

直至1小时后，缓存失效之后才能重新请求。

3.2. st.cache_resource示例

假设我们有一个机器学习应用，需要加载一个预训练的模型。

由于模型加载可能需要较长时间，我们可以使用st.cache_resource来缓存模型对象。

import streamlit as st

import joblib

# 使用 st.cache_resource 缓存模型加载

@st.cache_resource

def load_model(model_path):

    model = joblib.load(model_path)

    return model

# 用户界面部分

st.title("使用 st.cache_resource 缓存模型加载")

model_path = "path/to/your/model.pkl"

model = load_model(model_path)

st.write("模型已加载，可以进行预测！")

在这个例子中，load_model函数被@st.cache_resource装饰器修饰。

模型加载后会被缓存，后续调用时直接从缓存中读取，避免重复加载。

4. 总结

Streamlit的缓存机制通过st.cache_data和st.cache_resource提供了强大的性能优化功能。

它们可以帮助开发者减少重复计算、节省资源，并显著提高应用的响应速度。

在实际开发中，开发者可以根据需求选择合适的缓存装饰器：

如果需要缓存函数的输出结果，使用st.cache_data
如果需要缓存初始化的资源对象，使用st.cache_resource

合理使用缓存机制，可以让 Streamlit 应用更加高效和流畅，提升用户体验。

『玩转Streamlit』--缓存机制的更多相关文章

Github 恶搞教程（一起『玩坏』自己的 Github 吧）
最近在伯乐在线读到一篇趣文,<如何在 Github『正确』做贡献>,里面各种能人恶搞 Github 的『Public contributions』,下面截取几个小伙伴的战绩: 顺藤摸瓜,发 ...
MyBatis框架——动态SQL、缓存机制、逆向工程
MyBatis框架--动态SQL.缓存机制.逆向工程一.Dynamic SQL 为什么需要动态SQL?有时候需要根据实际传入的参数来动态的拼接SQL语句.最常用的就是:where和if标签 1.参考 ...
『Asp.Net 组件』Asp.Net 服务器组件的开发优势和劣势
在写<Asp.Net 服务器组件系列文档>之前,笔者不才,揣测微软战略用意: 微软利益诉求莫过于微软产品和技术的市场份额: 因此,微软战略之一莫过于将所有开发人员团聚在微软周围,以 ...
2018-2019-2 20165316 『网络对抗技术』Exp3：免杀原理与实践
2018-2019-2 20165316 『网络对抗技术』Exp3:免杀原理与实践一免杀原理与实践说明 (一).实验说明任务一:正确使用msf编码器,msfvenom生成如jar之类的其他文件, ...
2017-2018-2 20155303『网络对抗技术』Final：Web渗透获取WebShell权限
2017-2018-2 『网络对抗技术』Final:Web渗透获取WebShell权限 --------CONTENTS-------- 一.Webshell原理 1.什么是WebShell 2.We ...
2017-2018-2 20155303『网络对抗技术』Exp7：网络欺诈防范
2017-2018-2 『网络对抗技术』Exp7:网络欺诈防范 --------CONTENTS-------- 一.原理与实践说明 1.实践目标 2.实践内容概述 3.基础问题回答二.实践过程记录 ...
20155308『网络对抗技术』Exp7：网络欺诈防范
20155308『网络对抗技术』Exp7:网络欺诈防范原理与实践说明 1.实践目标本实践的目标是:理解常用网络欺诈背后的原理,以提高防范意识,并提出具体防范方法. 2.实践内容概述简单应用SET ...
# 2017-2018-2 20155319『网络对抗技术』Exp7：网络欺诈防范
2017-2018-2 20155319『网络对抗技术』Exp7:网络欺诈防范一.原理与实践说明 1.实践目标本实践的目标是:理解常用网络欺诈背后的原理,以提高防范意识,并提出具体防范方法. 2. ...
# 2017-2018-2 20155319『网络对抗技术』Exp4：恶意代码分析
2017-2018-2 20155319『网络对抗技术』Exp4:恶意代码分析实验目标与基础问题 ++1.实践目标++ 监控你自己系统的运行状态,看有没有可疑的程序在运行. 分析一个恶意软件,就分析 ...
『HTML5挑战经典』是英雄就下100层-开源讲座(二)危险！英雄
本篇为<『HTML5挑战经典』是英雄就下100层-开源讲座>第二篇,需要用到开源引擎lufylegend,可以到这里下载: 下载地址:http://lufylegend.googlecod ...

随机推荐

python -- json与dict
一.python中的dict 与 json 1.dict 的表现形式 dict中的 key和value,不论写的是双引号还是单引号,最后 python的dict都会转成单引号. 2.json ...
logback 中打印自定义参数（ip 服务名）
打印 application.properties 配置文件中的参数首先需要引入文件 <property resource="application.properties" ...
Qt开源作品7-高亮按钮控件
一.前言这个高亮按钮控件并非本人原创作品,是参考的Qt界的一个大师级人物公孙二狗的作品,各位有兴趣可以去搜索查看,在原作者的代码上,我只是改成了自己的控件的框架结构,然后完善了一些细节,比如增加了各 ...
IDEA利用阿里云插件部署Springboot项目
下载插件搜索 Alibaba Cloud Toolkit 插件,并安装. IDEA增加Run/Debug Configurations Add New Configuration - Deploy ...
安装opencv_contrib-3.4.9, fatal error: opencv2/xfeatures2d.hpp: 没有那个文件或目录. 解决方法
1. 在Opencv的CmakeLists.txt 中加入以下include语句: INCLUDE_DIRECTORIES("/home/yourusername/Dependencies/ ...
揭秘百度IM消息中台的全量用户消息推送技术改造实践
本文内容由百度技术团队分享,原题"基于公共信箱的全量消息实现",为了帮助理解,有较多修订.内容重组和重新排版. 1.引言百度的IM消息中台为百度APP以及厂内百度系产品提供即时通 ...
为什么在 Windows 下用 Ctrl+Z 退出 Python 而 Linux 下用 Ctrl+D 呢？
打开我们的命令行,输入 python ,我们会进入 python 的交互模式. 当我们想退出 python ,返回我们的 shell 时,你将如何退出? 如上,两个行之有效的方法是输入 exit() ...
使用Redis防止重复发送RabbitMQ消息
问题今天遇到一个问题,发送MQ消息的时候需要保证不会重复发送,注意不是可靠到达(可靠到达可以通过消息确认机制和回调接口保证),这里保证的是不会生产多条一样的消息. 方法综合讨论下来决定使用Redi ...
CDS标准视图：一次性账户的客户行项目 I_ONETIMEACCOUNTCUSTOMER
视图名称:一次性账户的客户行项目视图类型:基础视图代码: 点击查看代码 @EndUserText.label: 'One-Time Account Data for Customer Items' ...
uwp IProgress<T>进度通知。
主要是利用 Pp_ProgressChanged 报告进度: private void BtnDownload_Click(object sender, RoutedEventArgs e) { va ...

『玩转Streamlit』--缓存机制