ssdb底层实现——ssdb底层是leveldb，leveldb根本上是skiplist（例如为存储多个list items，必然有多个item key，而非暴力string cat），用它来做redis的list和set等，势必在数据结构和算法层面上有诸多不适

 我已经在用ssdb的hash结构，存储了很多数据了，但是我现在的用法正确吗？ 我使用hash结构合理吗？

1. ssdb数据库说是类似redis，而且他们都有hash结构，但是他们的命名有点不同，ssdb 是（name，key，value），其实相对应的redis是（key，field，value），当然了对于使用函数上还是很像的；

   那么问题来了，ssdb的hash 和redis的hash结构，使用上一样吗？

   ssdb中（name，key）都是不能超过 SSDB_KEY_LEN_MAX= 255， redis就没这个限制。

2. ssdb中hash结构是（name，key，value），但leveldb是跳表结构(SkipList)存储的只有（key，value）；

  （leveldb的 key 实际上是好长的拼装，对应到ssdb 是 name+key，占用了很多空间）；

   std::string dbkey = encode_hash_key(name, key);

   leveldb::Status s = db->Get(leveldb::ReadOptions(), dbkey, val);

   std::string encode_hash_key(const Bytes &name, const Bytes &key){

    std::string buf;

    buf.append(1, DataType::HASH);

    buf.append(1, (uint8_t)name.size());

    buf.append(name.data(), name.size());

    buf.append(1, '=');

    buf.append(key.data(), key.size());

    return buf;

  }

3. ssdb中multi_hget 最好不要用，效率不高应该用 hscan，下面这段是multi_hget，看得出是在循环调用（ serv->ssdb->hget）

  int proc_multi_hget(NetworkServer *net, Link *link, const Request &req, Response *resp){

    CHECK_NUM_PARAMS(3);

    SSDBServer *serv = (SSDBServer *)net->data;

    resp->push_back("ok");

    Request::const_iterator it=req.begin() + 1;

    const Bytes name = *it;

    it ++;

    for(; it!=req.end(); it+=1){

       const Bytes &key = *it;

       std::string val;

       int ret = serv->ssdb->hget(name, key, &val);

       if(ret == 1){

         resp->push_back(key.String());

         resp->push_back(val);

       }

      }

      return 0;

    }

   应该使用hscan ，它的实现是这样的：

   HIterator* SSDBImpl::hscan(const Bytes &name, const Bytes &start, const Bytes &end, uint64_t limit){

    std::string key_start, key_end;

    key_start = encode_hash_key(name, start);

    if(!end.empty()){

        key_end = encode_hash_key(name, end);

    }

    return new HIterator(this->iterator(key_start, key_end, limit), name);

    }

    Iterator* SSDBImpl::iterator(const std::string &start, const std::string &end, uint64_t limit){

    leveldb::Iterator *it;

    leveldb::ReadOptions iterate_options;

    iterate_options.fill_cache = false;

    it = db->NewIterator(iterate_options);

    it->Seek(start);

    if(it->Valid() && it->key() == start){

       it->Next();

    }

    return new Iterator(it, end, limit);

    }

    template<typename Key, class Comparator>

    inline void SkipList<Key,Comparator>::Iterator::Next() {

     assert(Valid());

     node_ = node_->Next(0);

    }

原来看zset 的写入其实是更新了三个数据：

记录zset的记录总数。 std::string encode_zsize_key(const Bytes &name){ std::string buf; buf.append(1, DataType::ZSIZE); buf.append(name.data(), name.size()); return buf; }
按照分数排序的排行榜 key=（name+score+key） `std::string encode_zscore_key(const Bytes & name, const Bytes &key, const Bytes &score){ std::string buf; buf.append(1, DataType::ZSCORE); buf.append(1, (uint8_t)name.size()); buf.append(name.data(), name.size());
```
	int64_t s = score.Int64();

	if(s < 0){

		buf.append(1, '-');

	}else{

		buf.append(1, '=');

	}

	s = encode_score(s);

	buf.append((char *)&s, sizeof(int64_t));

	buf.append(1, '=');

	buf.append(key.data(), key.size());

	return buf;

}`
```
按照（name + key）对应score值的（kv存储） std::string encode_zset_key(const Bytes &name, const Bytes &key){ std::string buf; buf.append(1, DataType::ZSET); buf.append(1, (uint8_t)name.size()); buf.append(name.data(), name.size()); buf.append(1, (uint8_t)key.size()); buf.append(key.data(), key.size()); return buf; }

下面以zset写入命令看，是如何更新这个三块数据库的。 // returns the number of newly added items static int zset_one(SSDBImpl *ssdb, const Bytes &name, const Bytes &key, const Bytes &new_score, char log_type){ int found = ssdb->zget(name, key, &old_score); if(found == 0 || old_score != new_score){ if(found){ // delete zscore key k1 = encode_zscore_key(name, key, old_score); ssdb->binlogs->Delete(k1); } // add zscore key k2 = encode_zscore_key(name, key, new_score); ssdb->binlogs->Put(k2, ""); // update zset k0 = encode_zset_key(name, key); ssdb->binlogs->Put(k0, new_score); ssdb->binlogs->add_log(log_type, BinlogCommand::ZSET, k0); return found? 0 : 1; } return 0; } int SSDBImpl::zset(const Bytes &name, const Bytes &key, const Bytes &score, char log_type){ Transaction trans(binlogs); int ret = zset_one(this, name, key, score, log_type); if(ret >= 0){ if(ret > 0){ if(incr_zsize(this, name, ret) == -1){ return -1; } } leveldb::Status s = binlogs->commit(); if(!s.ok()){ log_error("zset error: %s", s.ToString().c_str()); return -1; } } return ret; }

发现这种查询用户排行多少这种时，效率就非常差了； int64_t SSDBImpl::zrrank(const Bytes &name, const Bytes &key){ ZIterator *it = ziterator(this, name, "", "", "", INT_MAX, Iterator::BACKWARD); uint64_t ret = 0; while(true){ if(it->next() == false){ ret = -1; break; } if(key == it->key){ break; } ret ++; } delete it; return ret; }

总结：按照score分数范围遍历是很高效的，查询用户score分数是很快的。但是查询用户的rank排行，效率就很差，要从小到大遍历。

转自：https://github.com/sunwsh/sunwsh.github.io/wiki/ssdb%E6%BA%90%E7%A0%81%E5%AD%A6%E4%B9%A0--%E7%AC%AC%E4%B8%80%E5%A4%A9%EF%BC%88hash%E7%BB%93%E6%9E%84%EF%BC%89

ssdb底层实现——ssdb底层是leveldb，leveldb根本上是skiplist（例如为存储多个list items，必然有多个item key，而非暴力string cat），用它来做redis的list和set等，势必在数据结构和算法层面上有诸多不适的更多相关文章

数据结构与算法Python版熟悉哈希表，了解Python字典底层实现
Hash Table 散列表(hash table)也被称为哈希表,它是一种根据键(key)来存储值(value)的特殊线性结构. 常用于迅速的无序单点查找,其查找速度可达到常数级别的O(1). 散列 ...
JAVA中调用LevelDB用于Linux和Window环境下快速存储KV结构
一.简介 JAVA中调用LevelDB用于Linux和Window环境下快速存储KV结构二.依赖 <!-- https://mvnrepository.com/artifact/org.fus ...
Redis源码阅读（五）集群-故障迁移（上）
Redis源码阅读(五)集群-故障迁移(上) 故障迁移是集群非常重要的功能:直白的说就是在集群中部分节点失效时,能将失效节点负责的键值对迁移到其他节点上,从而保证整个集群系统在部分节点失效后没有丢失数 ...
Redis 命令，键(key)，字符串(String)，哈希(Hash)，列表(List)，集合(Set)（二）
Redis 命令 Redis 命令用于在 redis 服务上执行操作. 要在 redis 服务上执行命令需要一个 redis 客户端.Redis 客户端在我们之前下载的的 redis 的安装包中. ...
大数据DDos检测——DDos攻击本质上是时间序列数据，t+1时刻的数据特点和t时刻强相关，因此用HMM或者CRF来做检测是必然！和一个句子的分词算法CRF没有区别！
DDos攻击本质上是时间序列数据,t+1时刻的数据特点和t时刻强相关,因此用HMM或者CRF来做检测是必然!——和一个句子的分词算法CRF没有区别!注:传统DDos检测直接基于IP数据发送流量来识别, ...
零元学Expression Blend 4 - Chapter 40 Flash做的到的Blend也可以!轻松制作拥有动画的MenuBar!(上)
原文:零元学Expression Blend 4 - Chapter 40 Flash做的到的Blend也可以!轻松制作拥有动画的MenuBar!(上) 一直以来都有人拿Flash的动画问我Blend ...
深入理解Mysql索引底层数据结构与算法
索引是帮助MySQL高效获取数据的排好序的数据结构索引数据结构对比二叉树左边子节点的数据小于父节点数据,右边子节点的数据大于父节点数据. 如果col2是索引,查找索引为89的行元素,那么只需要查 ...
hashMap 底层原理+LinkedHashMap 底层原理+常见面试题
1.源码 java1.7 hashMap 底层实现是数组+链表 java1.8 对上面进行优化数组+链表+红黑树 2.hashmap 是怎么保存数据的. 在hashmap 中有这样一个结构 ...
django做redis缓存
django中应用redis:pip3 install django-redis - 配置 CACHES = { "default": { "BACKEND": ...

随机推荐

Android开发初体验
本文通过开发一个应用来学习Android基本概念及构成应用的UI组件. 开发的应用名叫GeoQuiz,它能给出一道道地理知识问题.用户点击true或false按钮回答问题,应用即时做出反馈第一步请先 ...
iOS CoreData 开发之数据模型关系
接着上一篇,上一篇中,我们简单的实现了一个用户实体,本次添加一个用户信息实体,与用户实体相关联,关系为1:1. 新建一个实体UserInfo:
安卓发送图片文字，java后台接收
安卓使用retrofit2 和rxjava2 url: @Multipart @POST(UrlTools.STORYUPLOAD) Observable<Result> saveRepo ...
WinServer2008配置任务计划
window server 2008下配置任务计划打开window servers 2008下任务计划配置工具点击“开始”-->“管理工具”-->“任务计划程序”,打开任务计划配置工具 ...
JS——tab切换
排它思想: 1.先让所有的元素恢复默认值 2.再让选中的元素赋专有的值 3.干掉所有人,剩下我一个 <!DOCTYPE html> <html> <head lang=& ...
Python三方库xlrd，xlwd-Excel读写
恩,我是翻译汪,主要内容来自http://www.python-excel.org/ 在xlrd,xlwt这两个库中,Excel的结构表示为workbook整个Excel对象,sheet工作表,row ...
【转载】HTTP 缓存的四种风味与缓存策略
原文地址:https://segmentfault.com/a/1190000006689795 HTTP Cache 通过网络获取内容既缓慢,成本又高:大的响应需要在客户端和服务器之间进行多次往返通 ...
js 闭包定时器
; !function (win) { ; //内部私有 , ; //内部私有 //test.prototype.tt1 = 0;//共有变量 var test = function () {}; t ...
centos添加永久的环境变量
cd /etc/profile.d/ 创建一个sh文件 vi dotnetpath.sh 内容如下: export PATH=$PATH:/opt/dotnet 保存,重启,这就有了一个永久的环境变量
想学Python？这里有一个最全面的职位分析
Python从2015年开始,一直处于火爆的趋势,目前Python工程师超越Java.Web前端等岗位,起薪在15K左右,目前不管是小公司还是知名大公司都在热招中. 当然,每个城市对岗位的需求也不尽相 ...

ssdb底层实现——ssdb底层是leveldb，leveldb根本上是skiplist（例如为存储多个list items，必然有多个item key，而非暴力string cat），用它来做redis的list和set等，势必在数据结构和算法层面上有诸多不适

ssdb底层实现——ssdb底层是leveldb，leveldb根本上是skiplist（例如为存储多个list items，必然有多个item key，而非暴力string cat），用它来做redis的list和set等，势必在数据结构和算法层面上有诸多不适的更多相关文章

随机推荐

热门专题