关于 Serializable的探讨

前提引入

是由于软件测试上有同学提到说,什么该字段在程序刚运行时,导致jvm激增,所以吸引了我的注意

回顾代码

MybatisPlus Generator自动生成的entity中就经常带有这个,

而且我在开发代码的时候VO,以及DTO常常是直接复制对应的entity,所以也保不齐我对应的VO等对象也保留了这个(惭愧表情包),印象中之前就学过,不过忘得差不多了,所以就于此复习一下

问题

  1. 为什么要有 Serializable
  2. 其中的private static final long serialVersionUID = 1L;又有什么用?
  3. 跟序列化有关?是跟具体的某种序列化有关?还是全部?

回答

one,two

在Java中,implements Serializable和serialVersionUID是与对象序列化(serialization)相关的概念,特别是在需要将对象的状态持久化、传输或者缓存时会用到。下面详细解释这些概念以及在MyBatis-Plus中它们的使用场景。

  1. Serializable 接口

    Serializable 是一个标记接口(marker interface),没有任何方法定义,它的存在只是为了告诉JVM某个类的实例是可以被序列化的。序列化的主要用途包括:

持久化:将对象的状态保存到一个存储介质(如文件、数据库)中,以便后续可以恢复。

传输:通过网络传输对象,比如在分布式系统中,从一个JVM传递到另一个JVM。

缓存:将对象放入缓存中,以便于快速恢复对象状态。

  1. serialVersionUID 字段

    serialVersionUID 是一个静态的、最终的(final)长整型字段,用于标识序列化的版本。其作用如下:

版本控制:在反序列化时,JVM会检查传入的字节流中的serialVersionUID是否与本地对应类的serialVersionUID一致。如果一致,说明序列化的版本是兼容的,可以安全地进行反序列化。如果不一致,会抛出InvalidClassException,防止版本不兼容带来的问题。

手动定义serialVersionUID可以避免某些情况下因类的微小变动(如增加一个方法或字段)导致的反序列化失败。一个常见的定义方式是:

private static final long serialVersionUID = 1L;

three

对于不同的序列化机制,如JSON序列化、数据库存储以及其他的自定义序列化方案,serialVersionUID 并不起作用。下面详细讨论serialVersionUID在不同场景中的作用和局限性,以及其他场景中的序列化方式。

  1. JDK 自带的序列化器

    serialVersionUID 是Java内置的序列化机制的一部分,特别是用于 ObjectInputStream 和 ObjectOutputStream 时起作用。当使用这些流进行对象序列化和反序列化时,JVM会检查类的 serialVersionUID 是否匹配,以确保类的版本一致性。
  2. JSON 序列化

    在使用JSON(如通过 Gson、Jackson 或者其他库)进行序列化和反序列化时,serialVersionUID 并不起作用。这是因为JSON序列化器将对象转换为JSON字符串,并不保留Java类的版本信息。因此,在这种情况下,不需要 serialVersionUID。例如:
import com.fasterxml.jackson.databind.ObjectMapper;

public class User {
private String name;
private int age; // Getters and Setters
} ObjectMapper objectMapper = new ObjectMapper();
User user = new User();
user.setName("John");
user.setAge(30); // 序列化
String jsonString = objectMapper.writeValueAsString(user); // 反序列化
User user2 = objectMapper.readValue(jsonString, User.class);
  1. Redis 存储

    当使用Redis进行数据存储时,通常也会使用JSON字符串进行序列化和反序列化。因为Redis是一个键值存储,保存的是序列化后的数据字符串,而不是Java对象本身,因此 serialVersionUID 并不起作用。
  2. 数据库存储

    对于MySQL等关系型数据库,当对象被存储时,ORM(如MyBatis、Hibernate)会将对象的字段提取出来并生成相应的SQL语句进行存储和查询。在这种情况下,对象序列化是由ORM框架处理的,serialVersionUID 也并不起作用。

serialVersionUID 的适用场景

综上所述,serialVersionUID 的适用场景主要局限于Java内置的序列化机制。当你在分布式系统中使用Java对象的原生序列化和反序列化时,serialVersionUID 可以确保不同版本的类之间的兼容性。如果你的应用程序不使用Java内置的序列化机制,而是使用JSON、XML或其他格式进行序列化,那么 serialVersionUID 并不需要关注。

举个我在项目中遇到的例子

CountMinSketch

当时我在实现一个OJ系统,其中有个类似github,leetcode的提交记录等等的情况,我是懒得放到个人主页,于是我直接放到首页中,其中对应的数据该在后端中怎么存呢?

我联想到了bitmap,可惜他只能是二值,而我们需要保留提交记录中一天提交了多少次呀,所以是不可行的,那么bitmap不行,没有其他的数据结构能同样省空间了吗?有那就CountMinSketch,但是他是概率数据结构,也就是说可能会有误差(也就是误差率以及误差距离越小那么消耗更多的空间,底层思路实现和bloomfilter类似)

这是我当时写的小测试:

public class TestCountMinScratch {
public static void main(String[] args) {
CountMinSketch sketch = new CountMinSketch(0.001, 0.99, 1); // 对数据进行更新
sketch.add("2024-5-16",1);
sketch.add("2024-5-16",1);
sketch.add("2024-5-16",1); // 查询频率
long frequency = sketch.estimateCount("2024-5-16");
System.out.println("Frequency of 'example': " + frequency);
}
}

这个是当时最后没用上的代码,最后选择用了hash结合一定的编码来进行处理,考虑到通常展示的365个天数的提交记录应该也不会很耗时间,又能具有准确性

下面是之前使用CountMinSketch的代码:

@Component
public class CountMinSketchFactory {
/**
* 误差率:确保与最大为真实值*(1+epsOfTotalCount)
* 最小同理
*/
private final static double epsOfTotalCount=0.07;
/**
* 置信度:置信度为 0.99 意味着我们希望在 99% 的情况下,查询估计的误差在指定的误差率范围内。
* 也就是99%的情况在上面我们推出的范围中
*/
private final static double confidence=0.99;
/**
* 在随机数生成和某些概率数据结构中(如 CountMinSketch),种子(seed) 是一个初始值,用于初始化随机数生成器或哈希函数。它的作用是确保随机过程在相同的种子下每次运行都产生相同的结果。
*/
private final static int seed=1;
@Autowired
private BitmapRedisTemplate bitmapRedisTemplate;
public CountMinSketch getCountMinSketch(Long uid) {//todo:这里是否适合双检加锁?
String s = bitmapRedisTemplate.opsForValue().get(RedisConstant.USER_COMMIT_STATICS + uid);
if(s==null) {
return new CountMinSketch(epsOfTotalCount, confidence, seed);
}else{
return JSONUtil.toBean(s, CountMinSketch.class);
}
}
public void storeCountMinSketch(Long uid,CountMinSketch countMinSketch) {
bitmapRedisTemplate.opsForValue().set(RedisConstant.USER_COMMIT_STATICS + uid, JSONUtil.toJsonStr(countMinSketch));
}
}

对于这个情况我原本是打算使用redis来存储的,毕竟是微服务项目,于是我开始两个方案进行对比,分别是项目应用场景1年内的情况以及放大到10年内的提交次数,在序列化到redis之后,却发现countminSketch没有任何变化,原先我还觉得这数据结构这么厉害,结果打开数据一看,什么都没有,这可能也正是json序列化与jdk序列化的区别吧,而且在这次测试中hash在时间消耗上差距并不大,所以选用了hash

最后回到前提

每个serialVersionUID都是静态且final修饰,而且他们也不会被GC所清理,而且消耗空间也不会特别大,除非类爆炸现象,可能当时我没注意听,不然这个现象不可能是一个软件测试的问题,对了有必要的话,还是保留着,毕竟难免可能之后会用到

最后再提一嘴像那些dto什么的以及vo什么的就不需要了,因为你根本不会用到把他们当做一个对象传

关于对于Java中Entity以及VO,以及DTO中Request对象序列化的学习的更多相关文章

  1. java项目中VO和DTO以及Entity,各自是在什么情况下应用的

    j2ee中,经常提到几种对象(object),理解他们的含义有助于我们更好的理解面向对象的设计思维.     POJO(plain old java object):普通的java对象,有别于特殊的j ...

  2. java项目中VO、DTO以及Entity,各自是在什么情况下应用的

    按照标准来说: entity里的每一个字段,与数据库相对应 vo里的每一个字段,是和你前台页面相对应 dto,这是用来转换从entity到dto,或者从dto到entity的中间的东西 举个例子: h ...

  3. Java 之 Request 对象

    一.Request 对象和 Response 对象原理 request和response对象是由服务器创建的,供我们使用的. request对象是来获取请求消息,response对象是来设置响应消息. ...

  4. java项目中VO和DTO以及Entity,各自是在什么情况下应用

    1.entity里的每一个字段,与数据库相对应, 2.dto里的每一个字段,是和你前台页面相对应, 3.VO,这是用来转换从entity到dto,或者从dto到entity的中间的东西.   举个例子 ...

  5. Java Bean、POJO、 Entity、 VO 、PO、DAO

    Java Bean.POJO. Entity. VO , 其实都是java 对象,只不过用于不同场合罢了.    Java Bean: 就是一个普通的Java 对象, 只不过是加了一些约束条件.  声 ...

  6. 当实体类中entity/DTO/VO等类中,有枚举值,应该怎么输出?

    当实体类中entity/DTO/VO等类中,有枚举值,应该怎么输出? 问题: orderStatus 和 payStatus都是枚举类,并且枚举的个数达地10来个,我们不可能在模板页面(jsp/ftl ...

  7. Java中PO、BO、VO、DTO、POJO、DAO概念及其作用和项目实例图(转)

    PO(bean.entity等命名): Persistant Object持久对象,数据库表中的记录在java对象中的显示状态 最形象的理解就是一个PO就是数据库中的一条记录. 好处是可以把一条记录作 ...

  8. java中的vo 、dto 、dao--转

    原文地址:http://yinchunjian.iteye.com/blog/758196 O是跟数据库里表的映射,一个表对应一个VO DAO是用VO来访问真实的表,对数据库的操作都在DAO中完成 B ...

  9. java中的vo、dto 、dao

    VO是跟数据库里表的映射,一个表对应一个VO  DAO是用VO来访问真实的表,对数据库的操作都在DAO中完成  BO是业务层,做逻辑处理的 VO , PO , BO , QO, DAO ,POJO  ...

  10. java 中的VO,PO,DTO,DO对象

    经常会接触到VO,DO,DTO的概念,本文从领域建模中的实体划分和项目中的实际应用情况两个角度,对这几个概念进行简析. 得出的主要结论是:在项目应用中,VO对应于页面上需要显示的数据(表单),DO对应 ...

随机推荐

  1. std::thread 六:多线程&单例类

    为了避免单例类在多线程中重复的创建,下面提供了两种解决方法: 1.互斥锁+双重检查 2.std::call_once()   方法一:互斥锁+双重检查 #include <iostream> ...

  2. 面试连环炮系列(二十️五):RocketMQ怎么保证消息不丢失

    RocketMQ怎么保证消息不丢失? A. 从Producer的视角来看:如果消息未能正确的存储在MQ中,或者消费者未能正确的消费到这条消息,都是消息丢失. B. 从Broker的视角来看:如果消息已 ...

  3. Spring Cloud 核心组件之Spring Cloud Zuul:API网关服务

    Spring Cloud Zuul:API网关服务 SpringCloud学习教程 SpringCloud API网关 Spring Cloud Zuul 是Spring Cloud Netflix ...

  4. MMDeploy部署实战系列【第四章】:onnx,tensorrt模型推理

    MMDeploy部署实战系列[第四章]:onnx,tensorrt模型推理 这个系列是一个随笔,是我走过的一些路,有些地方可能不太完善.如果有那个地方没看懂,评论区问就可以,我给补充. 目录: 0️⃣ ...

  5. React中的key的作用

    一.是什么 首先,给出react组件中进行列表渲染的一个示例: const data = [ { id: 0, name: 'abc' }, { id: 1, name: 'def' }, { id: ...

  6. h5py这个坑-PyCharm Process finished with exit code -1073741819 (0xC0000005)

    在用pytorch和tensorflow做语音合成时,碰到了个很无解的bug, PyCharm 报错 Process finished with exit code -1073741819 (0xC0 ...

  7. 安全同学讲Maven间接依赖场景的仲裁机制

    简介: 去年的Log4j-core的安全问题,再次把供应链安全推向了高潮.在供应链安全的场景,蚂蚁集团在静态代码扫描平台-STC和资产威胁透视平台-哈勃这2款产品在联合合作下,优势互补,很好的解决了直 ...

  8. 关于 Data Lake 的概念、架构与应用场景介绍

    数据湖(Data Lake)概念介绍 什么是数据湖(Data Lake)? 数据湖的起源,应该追溯到2010年10月,由 Pentaho 的创始人兼 CTO, James Dixon 所提出,他提出的 ...

  9. Python内置数据类型性能分析

    timeit模块 timeit模块可以用来测试一小段Python代码的执行速度. class timeit.Timer(stmt='pass', setup='pass', timer=<tim ...

  10. 2019-8-31-C#-获取进程退出代码

    title author date CreateTime categories C# 获取进程退出代码 lindexi 2019-08-31 16:55:58 +0800 2019-02-13 09: ...