国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

MYSQL 深潛 - 剖析 Performance Schema 內存管理

數據庫 MySQL
MYSQL Performance schema(PFS)是mysql提供的強大的性能監控診斷工具,提供了一種能夠在運行時檢查server內部執行情況的特方法。PFS通過監視server內部已注冊的事件來收集信息,一個事件理論上可以是server內部任何一個執行行為或資源占用,比如一個函數調用、一個系統調用wait、SQL查詢中的解析或排序狀態,或者是內存資源占用等。

 [[426340]]

一 引言

MYSQL Performance schema(PFS)是mysql提供的強大的性能監控診斷工具,提供了一種能夠在運行時檢查server內部執行情況的特方法。PFS通過監視server內部已注冊的事件來收集信息,一個事件理論上可以是server內部任何一個執行行為或資源占用,比如一個函數調用、一個系統調用wait、SQL查詢中的解析或排序狀態,或者是內存資源占用等。

PFS將采集到的性能數據存儲在performance_schema存儲引擎中,performance_schema存儲引擎是一個內存表引擎,也就是所有收集的診斷信息都會保存在內存中。診斷信息的收集和存儲都會帶來一定的額外開銷,為了盡可能小的影響業務,PFS的性能和內存管理也顯得非常重要了。

本文主要是通過對PFS引擎的內存管理的源碼的閱讀,解讀PFS內存分配及釋放原理,深入剖析其中存在的一些問題,以及一些改進思路。本文源代碼分析基于Mysql-8.0.24版本。

二 內存管理模型

PFS內存管理有幾個關鍵特點:

內存分配以Page為單位,一個Page內可以存儲多條record
系統啟動時預先分配部分pages,運行期間根據需要動態增長,但page是只增不回收的模式
record的申請和釋放都是無鎖的

1 核心數據結構

PFS_buffer_scalable_container是PFS內存管理的核心數據結構,整體結構如下圖:

Container中包含多個page,每個page都有固定個數的records,每個record對應一個事件對象,比如PFS_thread。每個page中的records數量是固定不變的,但page個數會隨著負載增加而增長。

2 Allocate時Page選擇策略

PFS_buffer_scalable_container是PFS內存管理的核心數據結構

涉及內存分配的關鍵數據結構如下:

  1. PFS_PAGE_SIZE  // 每個page的大小, global_thread_container中默認為256PFS_PAGE_COUNT // page的最大個數,global_thread_container中默認為256class PFS_buffer_scalable_container {  PFS_cacheline_atomic_size_t m_monotonic;            // 單調遞增的原子變量,用于無鎖選擇page  PFS_cacheline_atomic_size_t m_max_page_index;       // 當前已分配的最大page index  size_t m_max_page_count;                            // 最大page個數,超過后將不再分配新page  std::atomic< array_type *> m_pages[PFS_PAGE_COUNT];  // page數組  native_mutex_t m_critical_section;                  // 創建新page時需要的一把鎖} 

首先m_pages是一個數組,每個page都可能有free的records,也有可能整個page都是busy的,Mysql采用了比較簡單的策略,輪訓挨個嘗試每個page是否有空閑,直到分配成功。如果輪訓所有pages依然沒有分配成功,這個時候就會創建新的page來擴充,直到達到page數的上限。

輪訓并不是每次都是從第1個page開始尋找,而是使用原子變量m_monotonic記錄的位置開始查找,m_monotonic在每次在page中分配失敗是加1。

核心簡化代碼如下:

  1. value_type *allocate(pfs_dirty_state *dirty_state) {  current_page_count = m_max_page_index.m_size_t.load();    monotonic = m_monotonic.m_size_t.load();  monotonicmonotonic_max = monotonic + current_page_count;  while (monotonic < monotonic_max) {    index = monotonic % current_page_count;    array = m_pages[index].load();    pfs = array->allocate(dirty_state);    if  (pfs) {      // 分配成功返回      return pfs;    } else {      // 分配失敗,嘗試下一個page,       // 因為m_monotonic是并發累加的,這里有可能本地monotonic變量并不是線性遞增的,有可能是從1 直接變為 3或更大,      // 所以當前while循環并不是嚴格輪訓所有page,很大可能是跳著嘗試,換者說這里并發訪問下大家一起輪訓所有的page。      // 這個算法其實是有些問題的,會導致某些page被跳過忽略,從而加劇擴容新page的幾率,后面會詳細分析。      monotonic = m_monotonic.m_size_t++;    }  }    // 輪訓所有Page后沒有分配成功,如果沒有達到上限的話,開始擴容page  while (current_page_count < m_max_page_count) {    // 因為是并發訪問,為了避免同時去創建新page,這里有一個把同步鎖,也是整個PFS內存分配唯一的鎖    native_mutex_lock(&m_critical_section);    // 拿鎖成功,如果array已經不為null,說明已經被其它線程創建成功    array = m_pages[current_page_count].load();    if (array == nullptr) {      // 搶到了創建page的責任      m_allocator->alloc_array(array);      m_pages[current_page_count].store(array);      ++m_max_page_index.m_size_t;    }    native_mutex_unlock(&m_critical_section);        // 在新的page中再次嘗試分配    pfs = array->allocate(dirty_state);    if (pfs) {      // 分配成功并返回      return pfs;    }    // 分配失敗,繼續嘗試創建新的page直到上限  }} 

我們再詳細分析下輪訓page策略的問題,因為m_momotonic原子變量的累加是并發的,會導致一些page被跳過輪訓它,從而加劇了擴容新page的幾率。

舉一個極端一些的例子,比較容易說明問題,假設當前一共有4個page,第1、4個page已滿無可用record,第2、3個page有可用record。

當同時來了4個線程并發Allocate請求,同時拿到了的m_monotonic=0.

monotonic = m_monotonic.m_size_t.load();

這個時候所有線程嘗試從第1個page分配record都會失敗(因為第1個page是無可用record),然后累加去嘗試下一個page

monotonic = m_monotonic.m_size_t++;

這個時候問題就來了,因為原子變量++是返回最新的值,4個線程++成功是有先后順序的,第1個++的線程后monotonic值為2,第2個++的線程為3,以次類推。這樣就看到第3、4個線程跳過了page2和page3,導致3、4線程會輪訓結束失敗進入到創建新page的流程里,但這個時候page2和page3里是有空閑record可以使用的。

雖然上述例子比較極端,但在Mysql并發訪問中,同時申請PFS內存導致跳過一部分page的情況應該還是非常容易出現的。

3 Page內Record選擇策略

PFS_buffer_default_array是每個Page維護一組records的管理類。

關鍵數據結構如下:

  1. class PFS_buffer_default_array {PFS_cacheline_atomic_size_t m_monotonic;      // 單調遞增原子變量,用來選擇free的recordsize_t m_max;                                 // record的最大個數T *m_ptr;                                     // record對應的PFS對象,比如PFS_thread} 

每個Page其實就是一個定長的數組,每個record對象有3個狀態FREE,DIRTY, ALLOCATED,FREE表示空閑record可以使用,ALLOCATED是已分配成功的,DIRTY是一個中間狀態,表示已被占用但還沒分配成功。

Record的選擇本質就是輪訓查找并搶占狀態為free的record的過程。

核心簡化代碼如下:

  1. value_type *allocate(pfs_dirty_state *dirty_state) {  // 從m_monotonic記錄的位置開始嘗試輪序查找  monotonic = m_monotonic.m_size_t++;  monotonicmonotonic_max = monotonic + m_max;  while (monotonic < monotonic_max) {    index = monotonic % m_max;    pfs = m_ptr + index;      // m_lock是pfs_lock結構,free/dirty/allocated三狀態是由這個數據結構來維護的    // 后面會詳細介紹它如何實現原子狀態遷移的    if (pfs->m_lock.free_to_dirty(dirty_state)) {      return pfs;    }    // 當前record不為free,原子變量++嘗試下一個    monotonic = m_monotonic.m_size_t++;  }} 

選擇record的主體主體流程和選擇page基本相似,不同的是page內record數量是固定不變的,所以沒有擴容的邏輯。

當然選擇策略相同,也會有同樣的問題,這里的m_monotonic原子變量++是多線程并發的,同樣如果并發大的場景下會有record被跳過選擇了,這樣導致page內部即便有free的record也可能沒有被選中。

所以也就是page選擇即便是沒有被跳過,page內的record也有幾率被跳過而選不中,雪上加霜,更加加劇了內存的增長。

4 pfs_lock

每個record都有一個pfs_lock,來維護它在page中的分配狀態(free/dirty/allocated),以及version信息。

關鍵數據結構:

struct pfs_lock {
std::atomic m_version_state;
}

pfs_lock使用1個32位無符號整型來保存version+state信息,格式如下:

state

低2位字節表示分配狀態。

state PFS_LOCK_FREE = 0x00
state PFS_LOCK_DIRTY = 0x01
state PFS_LOCK_ALLOCATED = 0x11

version

初始version為0,每分配成功一次加1,version就能表示該record被分配成功的次數
主要看一下狀態遷移代碼:

  1. // 下面3個宏主要就是用來位操作的,方便操作state或version#define VERSION_MASK 0xFFFFFFFC#define STATE_MASK 0x00000003#define VERSION_INC 4bool free_to_dirty(pfs_dirty_state *copy_ptr) {  uint32 old_val = m_version_state.load();  // 判斷當前state是否為FREE,如果不是,直接返回失敗  if ((old_val & STATE_MASK) != PFS_LOCK_FREE) {    return false;  }  uint32 new_val = (old_val & VERSION_MASK) + PFS_LOCK_DIRTY;  // 當前state為free,嘗試將state修改為dirty,atomic_compare_exchange_strong屬于樂觀鎖,多個線程可能同時  // 修改該原子變量,但只有1個修改成功。  bool pass =      atomic_compare_exchange_strong(&m_version_state, &old_val, new_val);  if (pass) {    // free to dirty 成功    copy_ptr->m_version_state = new_val;  }  return pass;}void dirty_to_allocated(const pfs_dirty_state *copy) {  /* Make sure the record was DIRTY. */  assert((copy->m_version_state & STATE_MASK) == PFS_LOCK_DIRTY);  /* Increment the version, set the ALLOCATED state */  uint32 new_val = (copy->m_version_state & VERSION_MASK) + VERSION_INC +                   PFS_LOCK_ALLOCATED;  m_version_state.store(new_val);} 

狀態遷移過程還是比較好理解的, 由dirty_to_allocated和allocated_to_free的邏輯是更簡單的,因為只有record狀態是free時,它的狀態遷移是存在并發多寫問題的,一旦state變為dirty,當前record相當于已經被某一個線程占有,其它線程不會再嘗試操作該record了。

version的增長是在state變為PFS_LOCK_ALLOCATED時

5 PFS內存釋放

PFS內存釋放就比較簡單了,因為每個record都記錄了自己所在的container和page,調用deallocate接口,最終將狀態置為free就完成了。

最底層都會進入到pfs_lock來更新狀態:

  1. struct pfs_lock {  void allocated_to_free(void) {    /*      If this record is not in the ALLOCATED state and the caller is trying      to free it, this is a bug: the caller is confused,      and potentially damaging data owned by another thread or object.    */    uint32 copy = copy_version_state();    /* Make sure the record was ALLOCATED. */    assert(((copy & STATE_MASK) == PFS_LOCK_ALLOCATED));    /* Keep the same version, set the FREE state */    uint32 new_val = (copy & VERSION_MASK) + PFS_LOCK_FREE;    m_version_state.store(new_val);  }} 

三 內存分配的優化

前面我們分析到無論是page還是record都有幾率出現跳過輪訓的問題,即便是緩存中有free的成員也會出現分配不成功,導致創建更多的page,占用更多的內存。最主要的問題是這些內存一旦分配就不會被釋放。

為了提升PFS內存命中率,盡量避免上述問題,有一些思路如下:

  1. while (monotonic < monotonic_max) {    index = monotonic % current_page_count;    array = m_pages[index].load();    pfs = array->allocate(dirty_state);    if  (pfs) {       // 記錄分配成功的index       m_monotonic.m_size_t.store(index);      return pfs;    } else {      // 局部變量遞增,避免掉并發累加而跳過某些pages      monotonic++;    }  } 

另外一點,每次查找都是從最近一次分配成功的位置開始,這樣必然導致并發訪問的沖突,因為大家都從同一個位置開始找,起始查找位置應該加入一定的隨機性,這樣可以避免大量的沖突重試。

總結如下:

每次Allocate是從最近一次分配成功的index開始查找,或者隨機位置開始查找
每個Allocate嚴格輪訓所有pages或records

四 內存釋放的優化

PFS內存釋放的最大的問題就是一旦創建出的內存就得不到釋放,直到shutdown。如果遇到熱點業務,在業務高峰階段分配了很多page的內存,在業務低峰階段依然得不到釋放。

要實現定期檢測回收內存,又不影響內存分配的效率,實現一套無鎖的回收機制還是比較復雜的。

主要有如下幾點需要考慮:

釋放肯定是要以page為單位的,也就是釋放的page內的所有records都必須保證都為free,而且要保證待free的page不會再被分配到
內存分配是隨機的,整體上內存是可以回收的,但可能每個page都有一些busy的,如何更優的協調這種情況
釋放的閾值怎么定,也要避免頻繁分配+釋放的問題
針對PFS內存釋放的優化,PolarDB已經開發并提供了定期回收PFS內存的特性,鑒于本篇幅的限制,留在后續再介紹了。

責任編輯:梁菲 來源: 阿里云云棲號
相關推薦

2021-08-25 11:25:41

MySQLData Dictio數據庫

2021-08-26 10:44:31

MySQL MySQL Data 阿里云

2022-03-11 09:12:06

MySQLMDL

2009-09-03 16:58:49

C#內存管理

2011-07-18 17:14:16

Objective-C 內存 Cocoa

2011-07-19 15:15:09

Objective-C 內存

2011-07-21 09:42:27

Objective-C 內存 Autoreleas

2013-04-11 14:37:36

Objective-CiOS內存管理系統自動創建新的aut

2013-04-11 14:32:00

Objective-CiOS開發內存管理@synthesize

2025-05-30 02:00:00

2024-12-12 09:24:28

RocksDB服務器

2022-06-01 16:01:58

MySQL內存管理系統

2013-04-11 14:16:57

Objective-CiOS開發內存管理

2021-05-31 16:09:31

MySQLSchema設計

2019-05-09 14:22:01

華云數據大數據

2013-04-11 13:57:27

Objective-CiOS開發內存管理

2013-10-11 17:32:18

Linux運維內存管理

2018-07-23 09:26:08

iOS內存優化

2025-06-16 09:46:06

2017-01-26 20:48:14

MySQL復制MySQL程序壓縮
點贊
收藏

51CTO技術棧公眾號

亚洲精品wwwww| 自拍偷拍精品| 日韩少妇内射免费播放18禁裸乳| 北条麻妃一区二区三区中文字幕| 中文字幕日韩欧美精品高清在线| 激情福利在线| 91视频九色网站| 日韩午夜在线观看| 精品国产导航| 伊人国产在线| 一本色道无码道dvd在线观看| 免费亚洲精品视频| 精品国产乱码久久久久久郑州公司| 久久久91精品国产一区二区精品| 久久青草久久| 国产欧美日韩久久| 欧美另类久久久品| 国产精品嫩草视频| 欧美狂野激情性xxxx在线观| 在线观看国产v片| 日韩毛片免费观看| 红桃视频欧美| 欧美国产日韩亚洲一区| 亚洲老板91色精品久久| 92福利视频午夜1000合集在线观看| 欧美日韩国产综合在线| 99热都是精品| aaa免费看大片| 国产黄色片在线观看| 精精国产xxx在线视频app| 国产一二三在线| 啪啪国产精品| 成人羞羞视频在线看网址| 超碰cao国产精品一区二区| 欧美91大片| 蜜臀91精品一区二区三区 | 在线看小视频| 嫩草影院永久入口| 免费成人三级| 亚洲国产精品一区二区久久恐怖片 | 精品日韩欧美在线| 久久精品999| 久久激情视频| 国产91精品露脸国语对白| 国产三级一区二区| www.国产精品一区| 一区二区中文| 久久久精品2019中文字幕之3| 欧美一级高清片| 亚洲一区二区三区sesese| 欧美在线观看成人| 免费一区二区三区四区| 爽好多水快深点欧美视频| 在线区一区二视频| 国产欧美久久久久久| 好吊妞无缓冲视频观看| 精品国产免费人成网站| 亚洲大胆在线| 亚洲欧洲精品成人久久奇米网| 欧美视频中文一区二区三区在线观看 | av一区二区三区在线| 亚洲最大成人综合| 欧美国产日韩在线| 亚洲精品一卡二卡三卡四卡| 伊人色综合网| jizz久久久久久| 91九色精品| 国产高清一区日本| 午夜精品福利一区二区三区av| 伊人一区二区三区久久精品| 五月天av在线播放| 天堂√中文最新版在线| 国产精品成人国产| 亚洲人体av| 欧美体内she精视频在线观看| 免费看黄裸体一级大秀欧美| 亚洲午夜精品一区二区国产 | 欧美最猛黑人xxxxx猛交| 欧美日韩精品一区二区三区| 久久综合伊人77777蜜臀| 久久涩涩网站| 日本中文在线| 超碰97在线免费观看| 久久中文字幕一区二区| 国产精品超碰97尤物18| 91精品久久久久久久久久另类| 激情在线视频| 男女精品视频| 日韩最新在线视频| 日本aⅴ中文| 久久九九电影| 久热精品视频在线免费观看| 无码内射中文字幕岛国片| 国产精品一区高清| 天涯成人国产亚洲精品一区av| 久久久最新网址| 538在线视频观看| 国精一区二区| 亚洲制服欧美中文字幕中文字幕| 久久久亚洲精选| 91视频免费版污| 国产精品一级在线观看| 99久久精品情趣| 欧美成人亚洲成人日韩成人| 国产福利在线免费| 在线观看欧美| 国产91色综合久久免费分享| 麻豆精品一二三| 日韩美女av在线| 波多野结衣在线中文| 色阁综合av| 久久激情五月激情| www污污在线| 日韩一级精品视频在线观看| 日本不卡一区二区三区| 国产精品一区二区三区视频网站| 久久精品国产理论片免费| 亚洲激情中文1区| 在线看片欧美| 日韩免费在线电影| 黄www在线观看| 99理论电影网| 欧美精品一区二区三| 国产精品99在线观看| 免费av毛片在线看| 伊人久久大香线蕉午夜av| 色偷偷偷亚洲综合网另类| 成人在线视频首页| 国产综合av| 美女黄视频在线播放| 亚洲精品欧美精品| 国产一区二区三区三区在线观看 | 一区二区三区日韩视频| 亚洲天堂男人天堂| 精品久久久视频| 波波电影院一区二区三区| 精品国产精品国产偷麻豆| 交视频在线观看国产| 亚洲综合大片69999| 欧美人与z0zoxxxx视频| 成人一二三区视频| 国产欧美日韩精品一区二区三区| 九九综合九九| 51精品国自产在线| 熟女视频一区二区三区| 久久丁香综合五月国产三级网站| 九九精品视频在线| 桥本有菜亚洲精品av在线| 久久久久高潮毛片免费全部播放| 久久精品电影网站| 精品1区2区3区4区| 99热热99| 国产一区二区三区在线观看网站| 欧美黄色aaaa| 性欧美视频videos6一9| 国产一区久久精品| 亚洲精品视频一区| 精品视频免费在线播放| 久久久国产精品一区二区中文| 国产高清一区视频| 林ゆな中文字幕一区二区| 日韩欧美国产麻豆| 香蕉视频在线网站| 国产性做久久久久久| 欧美日韩一区二区三区在线观看免 | 成人午夜电影在线播放| 天堂а在线中文在线无限看推荐| 视频精品导航| 97精品国产露脸对白| 欧美成人三级视频网站| 欧美日韩在线中文字幕| 欧美视频官网| 日韩一二三四区| 手机成人av在线| 精品视频久久| 欧美成人精品在线视频| 成年在线电影| 中文字幕一区二区三区四区| 欧美大片免费观看| av电影免费在线观看| 99re热这里只有精品视频| 欧美在线一区二区三区四| 视频午夜在线| 99久久婷婷国产综合精品| 久久久久久久久久av| 久久久久久久影视| 狠狠久久亚洲欧美| 国产欧美日韩专区发布| 巨大黑人极品videos精品| 欧美日韩在线免费视频| 最新av电影| 成人免费高清视频在线观看| 青草成人免费视频| 91精品国产综合久久久久久豆腐| 高清在线成人网| 国产91精品网站| eeuss鲁片一区二区三区| 亚洲欧洲偷拍精品| 成人免费观看www在线| 亚洲专区在线|