持续的思考

redis-storage介绍

背景

当时我们正在做一个游戏项目,游戏项目相比于web项目,更追求的是单机的性能,而我们对单个请求的处理时间有着bt级的需求(一个完整的api请求控制在10ms以内)。当时我们的数据层用的是ttserver,但他在我们之前项目中有一些比较不好处理的问题,所以我一直在寻找的替代方向,而这时redis的横空出世,给nosql世界带来了不小的震动,相比于memcache, 丰富的数据结构,给了很多人更换cache层的理由,而数据能落地,使之有成为数据库的可能。后来新浪的大面积使用,稳定性得到保障,我果断在新项目中使用了redis。

问题

redis的一些丰富结构,特别适合游戏,我们当时用的非常爽。后来游戏也顺利上线了。性能也是非常好,但运营了将近一年后,我们发现了一个致命的问题,由于我们是偏社交游戏,没有分服,所有的用户都在一个服务器上,这里面有一个矛盾了:

  1)  数据在无止境的增长    (对内存的需求越来越多)

  2)  活跃用户( dau )基本稳定了  (热数据占比较小20%以内)

 

思考:

问题的根源在于redis提供的两种持久化机制,都只是起到备份作用,所有的数据都必需在内存中:

     1)  数据落地只是备份

     2)  redis服务在重启之后,需要把备份数据一次性load回内存(数据量很大需要load时间很长)

 

思路:

用一个成熟的持久化的存储引擎来替代。落地的数据能直接对外提供服务。而只要保证把热数据留在内存中,冷数据在持久化的存储引擎中。这样就可以解决几个问题:

 

   1 ) 对内存的需求基本只是热数据的需求

   2 ) redis服务重启,不需要再load回内存,可以空重启

 

方案:

最后经过一翻寻找对比,确定了用leveldb (关于leveldb的介绍自行google), 理由:

   1) 由google开源,而且有很多成熟应用,质量可靠。

   2) leveldb性能好,特别写性能,几乎和读性能一致。

   3) 提供c的api,方便直接嵌入到redis中

 

实现 :

 

1) leveldb的嵌入

封装一个方法,以便redis服务初始化的时候,把leveldb引擎载入

void ds_init() {
   if(!server.ds_open) {
       return ;
   }
   char *err = NULL;

   server.ds_cache = leveldb_cache_create_lru(server.ds_lru_cache * 1048576);
   server.ds_options = leveldb_options_create();

   server.policy = leveldb_filterpolicy_create_bloom(10);


   //leveldb_options_set_comparator(server.ds_options, cmp);
   leveldb_options_set_filter_policy(server.ds_options, server.policy);
   leveldb_options_set_create_if_missing(server.ds_options, server.ds_create_if_missing);
   leveldb_options_set_error_if_exists(server.ds_options, server.ds_error_if_exists);
   leveldb_options_set_cache(server.ds_options, server.ds_cache);
   leveldb_options_set_info_log(server.ds_options, NULL);
   leveldb_options_set_write_buffer_size(server.ds_options, server.ds_write_buffer_size * 1048576);
   leveldb_options_set_paranoid_checks(server.ds_options, server.ds_paranoid_checks);
   leveldb_options_set_max_open_files(server.ds_options, server.ds_max_open_files);
   leveldb_options_set_block_size(server.ds_options, server.ds_block_size * 1024);
   leveldb_options_set_block_restart_interval(server.ds_options, server.ds_block_restart_interval);
   leveldb_options_set_compression(server.ds_options, leveldb_snappy_compression);

   server.ds_db = leveldb_open(server.ds_options, server.ds_path, &err);
   if (err != NULL) {
       fprintf(stderr, "%s:%d: %s\n", __FILE__, __LINE__, err);
       leveldb_free(err);
       exit(1);
   }

   server.woptions = leveldb_writeoptions_create();
   server.roptions = leveldb_readoptions_create();
   leveldb_readoptions_set_verify_checksums(server.roptions, 0);
   leveldb_readoptions_set_fill_cache(server.roptions, 1);

   leveldb_writeoptions_set_sync(server.woptions, 0);
}

我们在redis.c里的initServer方法最后调用ds_init()即可。这样我们就可以在redis内部对leveldb进行操作了。

 

2) 一个简单的读取流程 (rl_get命令)

当client连上redis的时候,他的标准读取流程是:先从redis读取, 如果redis没有,则到leveldb读取。代码示例:

 

static void rl_getCommand(redisClient *c, int set) {
   //从redis里取数据
   robj *o;

   if ((o = lookupKeyRead(c->db, c->argv[1])) == NULL) {  //没有读取数据
       ds_getCommand(c, set);  //从leveldb读取
       checkRlTTL(c->db, c->argv[1]);
       return;
   }

   if (o->type == REDIS_STRING) {
       addReplyBulk(c, o);
       checkRlTTL(c->db, c->argv[1]);
       return;
   }

   addReply(c, shared.nullbulk);

}

 

3) 一个简单的写入流程(rl_set)

当client连上redis的时候,他的标准写入流程是:先写到leveldb中,写成功了,再写到redis中, 代码示例:

void rl_set(redisClient *c) {
   if(!server.ds_open) {
       addReplyError(c,"REDIS_STORAGE CLOSED");
       return;
   }
   char *key, *value;
   char *err = NULL;

   key = (char *) c->argv[1]->ptr;
   value = (char *) c->argv[2]->ptr;
   leveldb_put(server.ds_db, server.woptions, key, sdslen((sds) key), value, sdslen((sds) value), &err);
   if (err != NULL) {   //leveldb写入失败,直接返回错误
       addReplyError(c, err);
       leveldb_free(err);
       return;
   }
   //addReply(c,shared.ok);

   //存到redis
   setCommand(c);
   checkRlTTL(c->db, c->argv[1]);

}

 

4)各种组合:

=======string数据操作====== rl_get key (从redis或leveldb取值, 优先顺序:redis > leveldb) rl_getset key (返回同rl_get, 当leveldb有值,redis无值时,会回写到redis) rl_mget k1 k2 k3 (取redis和leveldb的并集,优先级:redis>leveldb) rl_mgetset k1 k2 k3 (返回同rl_mget, 当leveldb有值,redis无值,会回写到redis) rl_set key val (往redis和leveldb写值, 优先顺序:leveldb > redis, leveldb如果失败,将中断往redis写,返回错误) rl_mset k1 v1 k2 v2 (往redis和leveldb批量写值, 优先顺序:leveldb > redis, leveldb如果失败,将中断往redis写,返回错误) rl_del k1 k2 k3 (往redis和leveldb删值, 优先顺序:leveldb > redis) ========hash数据操作======== rl_hget key hk (从redis或leveldb取值, 优先顺序:redis > leveldb) rl_hgetset key hk (返回同rl_hget, 当leveldb有值,redis无值时,会回写到redis) rl_hmget key hk1 hk2 (往redis和leveldb批量写值,优先级:redis>leveldb) rl_hmgetset k1 k2 k3 (返回同rl_hmget, 当leveldb有值,redis无值,会回写到redis) rl_hset key hk hv (往redis和leveldb写值, 优先顺序:leveldb > redis, leveldb如果失败,将中断往redis写,返回错误) rl_hmset key hk1 hv1 hk2 hv2 (取redis和leveldb的并集,优先级:redis>leveldb) rl_hdel key hk1 hk2 hk3 (往redis和leveldb删值, 优先顺序:leveldb > redis)

 

冷数据自动淘汰

到现在为止,还有个关键的功能没有提到,就是如果保证热数据在redis中,冷数据在leveldb中。给出的方案是:在往redis里写入数据的时候,强制设置一个过期时间  ,强制的过期时间通过全局的redis.conf里的  rl:ttl  来设置。

另一个问题:

项目到了后期,活跃用户大部分都是老用户,也就是所谓的热数据,所以新增了一个全局配置: rl:ttlcheck ,如果某个key在rl:ttlcheck 至  rl:ttl 这段时间内被读取,则把这个key自动续期一个 rl:ttl 周期。

代码示例:
static void checkRlTTL(redisDb *db, robj *key) {
   if(server.rl_ttl) {   //如果配置了。
       if(server.rl_ttlcheck >= server.rl_ttl) {    //
           return;
       }
       long long expire = getExpire(db,key);                                  
       if(expire == -1 expire-mstime() < server.rl_ttlcheck*1000) {     //如果时间>rl:ttlcheck,则自动续期                       
           expire = server.rl_ttl * 1000;                                                                            
           setExpire(db, key, mstime()+expire);    //强制设置过期时间。
       }
   }
}

示例: rl:ttl 60  rl:ttlcheck 40  代表: redis里的数据过期时间为60s,  如果一个key在创建的第40s ~ 60s 之前被读取到,则自动续期至 60s

 

redis-stroage 总结:

1) 可直接对外提供服务的持久化存储。

2) redis空重启

3) 冷数据自动淘汰,热数据自动续期,麻麻再也不用担心我的内存了。

4) 只做新增命令,完全兼容redis原有命令和主从机制

 

后记:

经过这一个改造之后,后面的几个项目都采用redis-storage做数据库,稳定使用超过一年了,在稳定性和内存的使用方便都达到了预期的效果。现项目已开源: https://github.com/shenzhe/redis-storage

   
评论
热度(1)