fasionchan

读万卷书,行万里路,品万味肴,撸万行码。

[译文]MongoDB WiredTiger引擎调优技巧

| Comments

MongoDB3.0开始引入可插拔存储引擎的概念。 当前,有不少存储引擎可供选择:MMAPV1WiredTigerMongoRocksTokuSE等等。 每个存储引擎都有自己的优势,你需要根据性能要求及应用特征挑选最适合的一个。

3.2.x开始,WiredTiger成为默认的存储引擎。 最为MongoDB目前最流行的存储引擎,WiredTiger与原先的MMAPV1相比有以下优势:

  • 性能&并发:在大多数工作负载下,WiredTiger的性能要比MMAPV1高很多。 WiredTiger引擎为现代多核系统量身定制,更好地发挥多核系统的处理能力。 MMAPV1引擎使用表级锁,因此,当某个单表上有并发的操作,吞吐将受到限制。 WiredTiger使用文档级锁,由此带来并发及吞吐的提高。 对于典型的应用,切到WiredTiger引擎,可带来5-10倍的性能提升。
  • 压缩&加密MMAPV1引擎要求数据在内存和在磁盘的形式一致(map磁盘内存映射)。 因此,它并不支持压缩和加密。WiredTiger并没有这层限制,可以更好地支持。

  • 索引前缀压缩WiredTiger存储索引时使用前缀压缩——相同的前缀只存一次。 由此带来的效果是:索引更小了,对物理内存使用也更少了。

接下来,我会展示几个用来调优WiredTiger引擎性能的关键参数。

调优Cache Size

WiredTiger最重要的调优参数就是cache规模。 默认,MongoDB3.x开始会保留可用物理内存的50%(3.2是60%)作为数据cache。 虽然,默认的设置可以应对大部分的应用,通过调节为特定应用找到最佳配置值还是非常值得的。 cache的规模必须足够大,以便保存应用整个工作集(working set)。

除了这个cacheMongoDB在做诸如聚合、排序、连接管理等操作时需要额外的内存。 因此,必须确保有足够的内存可供使用,否则,MongoDB进程有被OOM killer杀死的风险。

调节这个参数,首先要理解在默认配置下,cache的使用情况。运行以下命令,可以获得cache统计:

1
db.serverStatus().wiredTiger.cache

命令输出结果例子如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
{
   "tracked dirty bytes in the cache" : 409861,
   "tracked bytes belonging to internal pages in the cache" : 738956332,
   "bytes currently in the cache" : 25769360777,
   "tracked bytes belonging to leaf pages in the cache" : 31473298388,
   "maximum bytes configured" : 32212254720,
   "tracked bytes belonging to overflow pages in the cache" : 0,
   "bytes read into cache" : 29628550664,
   "bytes written from cache" : 34634778285,
   "pages evicted by application threads" : 0,
   "checkpoint blocked page eviction" : 102,
   "unmodified pages evicted" : 333277,
   "page split during eviction deepened the tree" : 0,
   "modified pages evicted" : 437117,
   "pages selected for eviction unable to be evicted" : 44825,
   "pages evicted because they exceeded the in-memory maximum" : 74,
   "pages evicted because they had chains of deleted items" : 33725,
   "failed eviction of pages that exceeded the in-memory maximum" : 1518,
   "hazard pointer blocked page eviction" : 34814,
   "internal pages evicted" : 21623,
   "maximum page size at eviction" : 10486876,
   "eviction server candidate queue empty when topping up" : 8235,
   "eviction server candidate queue not empty when topping up" : 3020,
   "eviction server evicting pages" : 191708,
   "eviction server populating queue, but not evicting pages" : 2996,
   "eviction server unable to reach eviction goal" : 0,
   "pages split during eviction" : 8821,
   "pages walked for eviction" : 157970002,
   "eviction worker thread evicting pages" : 563015,
   "in-memory page splits" : 52,
   "percentage overhead" : 8,
   "tracked dirty pages in the cache" : 9,
   "pages currently held in the cache" : 1499798,
   "pages read into cache" : 2260232,
   "pages written from cache" : 3018846
}

第一个要关注的数值试,cache中脏数据的百分比。 如果这个百分比比较高,那么调大cache规模很有可能可以提升性能。 如果应用是重读的,可再关注bytes read into cache这个指标。 如果这个指标比较高,那么调大cache规模很有可能可以提升读性能。

调节cache规模不一定非得重启服务,我们可以动态调整:

1
db.adminCommand( { "setParameter": 1, "wiredTigerEngineRuntimeConfig": "cache_size=xxG"})

如果你想让调整在重启后也有效,那么你需要将配置文件也相应调整一下。

控制Read/Write Tickets

WiredTiger使用tickets来控制可以同时被存储引擎处理的读/写操作数。 默认值是128,在大部分情况下表现良好。 如果这个值经常掉到0,所有后续操作将会被排队等待。 例如,观察到读tickets下降,系统可能有大量长耗时的操作(未索引操作)。 如果你想找出有哪些慢操作,可以用一些第三方工具。 你可以根据系统需要和性能影响上下调节tickets

运行以下命令可以确认tickets的使用情况:

1
db.serverStatus().wiredTiger.concurrentTransactions

下面是一个输出例子:

1
2
3
4
5
6
7
8
9
10
11
12
{
   "write" : {
      "out" : 0,
      "available" : 128,
      "totalTickets" : 128
   },
   "read" : {
      "out" : 3,
      "available" : 128,
      "totalTickets" : 128
   }
}

同样,可以动态调节tickets

1
2
db.adminCommand( { setParameter: 1, wiredTigerConcurrentReadTransactions: xx } )
db.adminCommand( { setParameter: 1, wiredTigerConcurrentWriteTransactions: xx } )

一旦做出调整,注意要观察系统的性能监控确保影响是符合预期的。

Comments