新聞中心
上篇文章介紹了Mongo讀取數據的策略(??MongoDB讀數據策略??),主要是readconcern、readpreference兩參數,其中readconcern作用于服務端,決定了什么時候能讀取到數據;readpreference在客戶端配置,決定讀哪個節(jié)點的數據。本文將要介紹Mongo的寫入策略,在介紹寫入策略前,先簡單說明MongoDB的Journaling特性。

成都創(chuàng)新互聯(lián)公司服務項目包括上高網站建設、上高網站制作、上高網頁制作以及上高網絡營銷策劃等。多年來,我們專注于互聯(lián)網行業(yè),利用自身積累的技術優(yōu)勢、行業(yè)經驗、深度合作伙伴關系等,向廣大中小型企業(yè)、政府機構等提供互聯(lián)網行業(yè)的解決方案,上高網站推廣取得了明顯的社會效益與經濟效益。目前,我們服務的客戶以成都為中心已經輻射到上高省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!
Journaling介紹
MongoDB也有防carsh能力,和MySQL類似,也是通過預先寫日志(WAL)到文件實現(xiàn),這文件就是Journaling功能。
To provide durability in the event of a failure, MongoDB uses write ahead logging to on-disk journal files.
?日志文件?
開啟Journaling功能后,Mongo 會在數據庫目錄下創(chuàng)建 journal目錄,用來存放journal日志,以WiredTiger引擎為例,文件格式是WiredTigerLog.
?日志記錄?
journal記錄有這幾個特點:
它包括由初始寫入引起的任何內部寫入操作。例如,對集合中文檔的更新可能會導致對索引的修改;WiredTiger創(chuàng)建單個日志記錄,其中包含更新操作及其關聯(lián)的索引修改。
每個記錄都有一個唯一的標識符。
WiredTiger的最小日志記錄大小為128字節(jié)。
另外,為了提高存儲效率,MongoDB犧牲了一些CPU性能,對WiredTiger引擎對日志數據使用壓縮存儲,默認壓縮方式是snappy壓縮,也支持其他壓縮方式,比如:zstd、zlib等,可以通過下面方式設置。
storage.wiredTiger.engineConfig.journalCompressor
總之,Journaling 是MongoDB中非常重要的一項功能,類似于關系數據庫中的事務日志。Journaling能夠使MongoDB由于意外故障后快速恢復。在2.0版本后,默認開啟了該功能。和MySQL一樣,Mongo 實例啟動時會檢查journal日志文件,確認是否有需要恢復的數據。不過由于提交journal日志會產生寫入阻塞,所以它對寫入的操作有性能影響,但在生產環(huán)境中通常還是開啟Journaling的。
數據寫入策略
writeconcern 是Mongo針對寫操作的參數,表示寫請求對 mongod 實例的確認級別,決定數據的持久性。它可以用下面三個選項表示。
{ w: , j: , wtimeout: }
?writeconcern 選項?
w指定寫操作需要應用到多少個數據節(jié)點才能返回成功,可以為0、1、2、3或者majority。
- w: 0 表示客戶端不需要收到任何有關寫操作,就直接返回成功。
- w: 1 表示寫主成功,就直接返回成功。
- w: majority 需要收到多數節(jié)點(含主節(jié)點)關于操作執(zhí)行成功的確認,具體個數根據復制集配置自動得出。比如,一主兩從3節(jié)點的集群,則需要2個節(jié)點確認寫入成功即可。
- w: N(N > 1)表示N個數據節(jié)點確認才返回成功。w 值越大,對客戶端來說,數據的安全性保證越強,同時寫操作的延遲越大。w 設置的節(jié)點數越多,等待的延遲也就越大。如果 w 等于總節(jié)點數,那么一旦其中某個節(jié)點出現(xiàn)故障就會導致整個寫入失敗,這也是有風險的。另外,針對Hidden、delayed和priority為0的數據節(jié)點,官方也特別做了說明,如下:
NOTE
Hidden, delayed, and priority 0 members can acknowledge w:
Delayed secondaries can return write acknowledgment no earlier than the configured slaveDelay.
注意:
a、副本集中Hidden、delayed和priority為0的成員,可以確認w:
b、延遲節(jié)點的返回寫ack,不會早于配置的slavedelay值 。
如果集群有 3 三個數據節(jié)點,在w: majority模式下 ,只需要寫入兩個數據節(jié)點即可返回,流程如下:
j表示寫操作是否要被持久化,只能選填 true 或 false。
- j:false 表示寫操作到cache即算作成功。
- j:true 表示寫操作到文件中才算成功。
從3.2版本后,如果指定j:true,即使 w:0 ,只有在請求的成員數(包括主成員)寫入日志后才返回數據。因此,j:true設置保證了MongoDB的數據持久化。
Changed in version 3.2: With j: true, MongoDB returns only after the requested number of members, including the primary, have written to the journal.
另外,僅僅j:true 不保證集群 failover 時發(fā)生回滾的寫操作。
j: true does not by itself guarantee that the write will not be rolled back due to replica set primary failover.
wtimeout:返回確認的超時時間,單位為毫秒。
如果寫入操作超過該值,則返回錯誤,即使最終寫入是成功了,但數據庫不會撤銷超時寫入的數據。如果沒有指定 wtimeout 值,則寫入操作將無限期阻塞,wtimeout:0 等同于該選項未設置值。同時,這個參數和 WriteConncern 的w值有關,并且只適用于w大于0的情況。比如:w:0,表示可以超時無限大,則不返回錯誤;w:1,只和主節(jié)點確認的超時時間;w:majority,表示需要和多數節(jié)點確認超時時間。
?數據提交策略?
MongoDB也有和MySQL有類似的提交策略,是由 commitIntervalMs 參數控制,它是日志持久化的間隔時間(以毫秒為單位)。如果想要更好的數據安全,可以設為每毫秒對cache中的數據做硬盤層面的sync;如果需要更好的寫入性能,最大可以改為每500毫秒做一次sync。它的取值范圍是1 ~ 500毫秒,默認值是100毫秒,不支持in-memory 存儲引擎。
總結
MongoDB 寫入策略包括以下幾個方面:
- w:指定寫入數據后需要在多少個節(jié)點上同步寫入成功后,才返回確認信息。
- j:設置 j:true 會將數據寫入日志中,可以在節(jié)點宕機時恢復數據。但是 j:true 并不保證數據已經寫入磁盤文件中。
- wtimeout:指定寫入超時時間。當寫入操作達到超時時間時,即使最終成功寫入也會返回錯誤信息。
在實際使用中,可以根據具體的業(yè)務需求和系統(tǒng)環(huán)境來選擇適合的寫入策略,以達到最佳的性能和可靠性。例如,在數據一致性要求高的場景中,可以使用 majority 寫入確認來保證數據同步的可靠性。而在性能要求高、數據不敏感的場景中,可以使用 w 值較小的寫入關注點來提高寫入性能。
本文轉載自微信公眾號「云數據庫技術」,可以通過以下二維碼關注。轉載本文請聯(lián)系云數據庫技術公眾號。
分享標題:MongoDB寫入數據策略
標題網址:http://m.5511xx.com/article/cdjsohe.html


咨詢
建站咨詢
