久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

        手機(jī)站
        千鋒教育

        千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

        千鋒教育

        掃一掃進(jìn)入千鋒手機(jī)站

        領(lǐng)取全套視頻
        千鋒教育

        關(guān)注千鋒學(xué)習(xí)站小程序
        隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

        當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > ES底層數(shù)據(jù)持久化的過(guò)程?

        ES底層數(shù)據(jù)持久化的過(guò)程?

        來(lái)源:千鋒教育
        發(fā)布人:wjy
        時(shí)間: 2022-09-19 16:30:11 1663576211

          通過(guò)分步驟看數(shù)據(jù)持久化過(guò)程:write -> refresh -> flush -> merge

          write 過(guò)程

        ES底層數(shù)據(jù)持久化的過(guò)程1

         

          一個(gè)新文檔過(guò)來(lái),會(huì)存儲(chǔ)在 in-memory buffer 內(nèi)存緩存區(qū)中,順便會(huì)記錄 Translog(Elasticsearch 增加了一個(gè) translog ,或者叫事務(wù)日志,在每一次對(duì) Elasticsearch 進(jìn)行操作時(shí)均進(jìn)行了日志記錄)。

          這時(shí)候數(shù)據(jù)還沒(méi)到 segment ,是搜不到這個(gè)新文檔的。數(shù)據(jù)只有被 refresh 后,才可以被搜索到。

          refresh 過(guò)程

        ES底層數(shù)據(jù)持久化的過(guò)程2

         

          refresh 默認(rèn) 1 秒鐘,執(zhí)行一次上圖流程。ES 是支持修改這個(gè)值的,通過(guò) index.refresh_interval 設(shè)置 refresh (沖刷)間隔時(shí)間。refresh 流程大致如下:

          1.in-memory buffer 中的文檔寫(xiě)入到新的 segment 中,但 segment 是存儲(chǔ)在文件系統(tǒng)的緩存中。此時(shí)文檔可以被搜索到

          2.最后清空 in-memory buffer。注意: Translog 沒(méi)有被清空,為了將 segment 數(shù)據(jù)寫(xiě)到磁盤(pán)

          3.文檔經(jīng)過(guò) refresh 后, segment 暫時(shí)寫(xiě)到文件系統(tǒng)緩存,這樣避免了性能 IO 操作,又可以使文檔搜索到。refresh 默認(rèn) 1 秒執(zhí)行一次,性能損耗太大。一般建議稍微延長(zhǎng)這個(gè) refresh 時(shí)間間隔,比如 5 s。因此,ES 其實(shí)就是準(zhǔn)實(shí)時(shí),達(dá)不到真正的實(shí)時(shí)。

          flush 過(guò)程

          每隔一段時(shí)間—例如 translog 變得越來(lái)越大—索引被刷新(flush);一個(gè)新的 translog 被創(chuàng)建,并且一個(gè)全量提交被執(zhí)行

        ES底層數(shù)據(jù)持久化的過(guò)程3

         

          上個(gè)過(guò)程中 segment 在文件系統(tǒng)緩存中,會(huì)有意外故障文檔丟失。那么,為了保證文檔不會(huì)丟失,需要將文檔寫(xiě)入磁盤(pán)。那么文檔從文件緩存寫(xiě)入磁盤(pán)的過(guò)程就是 flush。寫(xiě)入磁盤(pán)后,清空 translog。具體過(guò)程如下:

          所有在內(nèi)存緩沖區(qū)的文檔都被寫(xiě)入一個(gè)新的段。緩沖區(qū)被清空。一個(gè)Commit Point被寫(xiě)入硬盤(pán)。文件系統(tǒng)緩存通過(guò) fsync 被刷新(flush)。老的 translog 被刪除。

          merge 過(guò)程

          由于自動(dòng)刷新流程每秒會(huì)創(chuàng)建一個(gè)新的段 ,這樣會(huì)導(dǎo)致短時(shí)間內(nèi)的段數(shù)量暴增。而段數(shù)目太多會(huì)帶來(lái)較大的麻煩。 每一個(gè)段都會(huì)消耗文件句柄、內(nèi)存和cpu運(yùn)行周期。更重要的是,每個(gè)搜索請(qǐng)求都必須輪流檢查每個(gè)段;所以段越多,搜索也就越慢。

          Elasticsearch通過(guò)在后臺(tái)進(jìn)行Merge Segment來(lái)解決這個(gè)問(wèn)題。小的段被合并到大的段,然后這些大的段再被合并到更大的段。

          當(dāng)索引的時(shí)候,刷新(refresh)操作會(huì)創(chuàng)建新的段并將段打開(kāi)以供搜索使用。合并進(jìn)程選擇一小部分大小相似的段,并且在后臺(tái)將它們合并到更大的段中。這并不會(huì)中斷索引和搜索。

        ES底層數(shù)據(jù)持久化的過(guò)程4

         

          一旦合并結(jié)束,老的段被刪除:

          新的段被刷新(flush)到了磁盤(pán)。 ** 寫(xiě)入一個(gè)包含新段且排除舊的和較小的段的新提交點(diǎn)。新的段被打開(kāi)用來(lái)搜索。老的段被刪除。

        ES底層數(shù)據(jù)持久化的過(guò)程5

          合并大的段需要消耗大量的I/O和CPU資源,如果任其發(fā)展會(huì)影響搜索性能。Elasticsearch在默認(rèn)情況下會(huì)對(duì)合并流程進(jìn)行資源限制,所以搜索仍然 有足夠的資源很好地執(zhí)行。

        tags:
        聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
        10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
        請(qǐng)您保持通訊暢通,專(zhuān)屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
        免費(fèi)領(lǐng)取
        今日已有369人領(lǐng)取成功
        劉同學(xué) 138****2860 剛剛成功領(lǐng)取
        王同學(xué) 131****2015 剛剛成功領(lǐng)取
        張同學(xué) 133****4652 剛剛成功領(lǐng)取
        李同學(xué) 135****8607 剛剛成功領(lǐng)取
        楊同學(xué) 132****5667 剛剛成功領(lǐng)取
        岳同學(xué) 134****6652 剛剛成功領(lǐng)取
        梁同學(xué) 157****2950 剛剛成功領(lǐng)取
        劉同學(xué) 189****1015 剛剛成功領(lǐng)取
        張同學(xué) 155****4678 剛剛成功領(lǐng)取
        鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
        董同學(xué) 138****2867 剛剛成功領(lǐng)取
        周同學(xué) 136****3602 剛剛成功領(lǐng)取
        相關(guān)推薦HOT
        Visual Studio Online和GitHub有什么區(qū)別?

        1.定位不同Visual Studio Online,現(xiàn)更名為Visual Studio Codespaces,是微軟提供的一款在線開(kāi)發(fā)環(huán)境,允許開(kāi)發(fā)者在云端進(jìn)行編程和調(diào)試工作。而...詳情>>

        2023-10-15 00:21:42
        什么是域控制器?

        一、域控制器的定義域控制器是指在Windows Server操作系統(tǒng)中部署Active Directory服務(wù)的服務(wù)器。Active Directory是微軟公司開(kāi)發(fā)的目錄服務(wù),用...詳情>>

        2023-10-15 00:10:28
        深度學(xué)習(xí)模型權(quán)重h5、weights、ckpt、pth有什么區(qū)別?

        1.來(lái)源框架不同h5格式通常用于Keras和TensorFlow框架,weights用于Darknet框架,ckpt是TensorFlow框架的一種格式,而pth則主要用于PyTorch框架...詳情>>

        2023-10-15 00:05:17
        大數(shù)據(jù)測(cè)試工程師需要具備哪些技能?

        一、理解大數(shù)據(jù)概念大數(shù)據(jù)測(cè)試工程師需要理解大數(shù)據(jù)的基本概念和原理,如分布式存儲(chǔ)、MapReduce、實(shí)時(shí)計(jì)算等。他們還需要了解如何處理大規(guī)模的...詳情>>

        2023-10-14 23:43:03
        為什么SpringBoot的 jar 可以直接運(yùn)行?

        一、JAR文件的結(jié)構(gòu)與執(zhí)行方式Spring Boot的JAR包是Java Archive的縮寫(xiě),它是一種壓縮文件格式,可以將Java項(xiàng)目的類(lèi)文件、資源文件以及依賴(lài)庫(kù)等...詳情>>

        2023-10-14 23:01:49
        快速通道
        城市| 湖口县| 凌云县| 舞钢市| 南漳县| 彩票| 浏阳市| 兴隆县| 荔浦县| 萍乡市| 鲁山县| 永年县| 庄浪县| 繁峙县| 平陆县| 玛多县| 普格县| 襄樊市| 义乌市| 大关县| 大冶市| 巫山县| 马边| 洪泽县| 纳雍县| 阿坝| 岳池县| 西平县| 宁国市| 怀化市| 克拉玛依市| 金乡县| 彝良县| 靖江市| 金坛市| 卢龙县| 岳西县| 怀化市| 陵川县| 江都市| 迭部县|