久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

        手機站
        千鋒教育

        千鋒學習站 | 隨時隨地免費學

        千鋒教育

        掃一掃進入千鋒手機站

        領(lǐng)取全套視頻
        千鋒教育

        關(guān)注千鋒學習站小程序
        隨時隨地免費學習課程

        當前位置:首頁  >  技術(shù)干貨  > ES遇到什么性能問題,如何優(yōu)化的?

        ES遇到什么性能問題,如何優(yōu)化的?

        來源:千鋒教育
        發(fā)布人:wjy
        時間: 2022-09-19 16:30:14 1663576214

          分幾個方向說幾個點:

          硬件配置優(yōu)化 包括三個因素:CPU、內(nèi)存和 IO。

          CPU: 大多數(shù) Elasticsearch 部署往往對 CPU 要求不高; CPUs 和更多的核數(shù)之間選擇,選擇更多的核數(shù)更好。多個內(nèi)核提供的額外并發(fā)遠勝過稍微快一點點的時鐘頻率。

          內(nèi)存:

          配置: 由于 ES 構(gòu)建基于 lucene,而 lucene 設(shè)計強大之處在于 lucene 能夠很好的利用操作系統(tǒng)內(nèi)存來緩存索引數(shù)據(jù),以提供快速的查詢性能。lucene 的索引文件 segements 是存儲在單文件中的,并且不可變,對于 OS 來說,能夠很友好地將索引文件保持在 cache 中,以便快速訪問;因此,我們很有必要將一半的物理內(nèi)存留給 lucene;另一半的物理內(nèi)存留給 ES(JVM heap)。

          禁止 swap 禁止 swap,一旦允許內(nèi)存與磁盤的交換,會引起致命的性能問題。可以通過在 elasticsearch.yml 中 bootstrap.memory_lock: true,以保持 JVM 鎖定內(nèi)存,保證 ES 的性能。

          垃圾回收器: 已知JDK 8附帶的HotSpot JVM的早期版本存在一些問題,當啟用G1GC收集器時,這些問題可能導(dǎo)致索引損壞。受影響的版本早于JDK 8u40隨附的HotSpot版本。如果你使用的JDK8較高版本,或者JDK9+,我推薦你使用G1 GC; 因為我們目前的項目使用的就是G1 GC,運行效果良好,對Heap大對象優(yōu)化尤為明顯。

          磁盤 在經(jīng)濟壓力能承受的范圍下,盡量使用固態(tài)硬盤(SSD)

        ES遇到什么性能問題,如何優(yōu)化的?

          索引方面優(yōu)化

          批量提交 當有大量數(shù)據(jù)提交的時候,建議采用批量提交(Bulk 操作);此外使用 bulk 請求時,每個請求不超過幾十M,因為太大會導(dǎo)致內(nèi)存使用過大。

          增加 Refresh 時間間隔 為了提高索引性能,Elasticsearch 在寫入數(shù)據(jù)的時候,采用延遲寫入的策略,即數(shù)據(jù)先寫到內(nèi)存中,當超過默認1秒(index.refresh_interval)會進行一次寫入操作,就是將內(nèi)存中 segment 數(shù)據(jù)刷新到磁盤中,此時我們才能將數(shù)據(jù)搜索出來,所以這就是為什么 Elasticsearch 提供的是近實時搜索功能,而不是實時搜索功能。如果我們的系統(tǒng)對數(shù)據(jù)延遲要求不高的話,我們可以通過延長 refresh 時間間隔,可以有效地減少 segment 合并壓力,提高索引速度。比如在做全鏈路跟蹤的過程中,我們就將 index.refresh_interval 設(shè)置為30s,減少 refresh 次數(shù)。再如,在進行全量索引時,可以將 refresh 次數(shù)臨時關(guān)閉,即 index.refresh_interval 設(shè)置為-1,數(shù)據(jù)導(dǎo)入成功后再打開到正常模式,比如30s。

          索引緩沖的設(shè)置可以控制多少內(nèi)存分配 indices.memory.index_buffer_size 接受一個百分比或者一個表示字節(jié)大小的值。默認是10%

          translog 相關(guān)的設(shè)置 控制數(shù)據(jù)從內(nèi)存到硬盤的操作頻率,以減少硬盤 IO??蓪?sync_interval 的時間設(shè)置大一些。默認為5s。也可以控制 tranlog 數(shù)據(jù)塊的大小,達到 threshold 大小時,才會 flush 到 lucene 索引文件。默認為512m。

          _id 字段的使用 _id 字段的使用,應(yīng)盡可能避免自定義 _id,以避免針對 ID 的版本管理;建議使用 ES 的默認 ID 生成策略或使用數(shù)字類型 ID 做為主鍵。

          _all 字段及 _source 字段的使用 _all 字段及 _source 字段的使用,應(yīng)該注意場景和需要,_all 字段包含了所有的索引字段,方便做全文檢索,如果無此需求,可以禁用;_source 存儲了原始的 document 內(nèi)容,如果沒有獲取原始文檔數(shù)據(jù)的需求,可通過設(shè)置 includes、excludes 屬性來定義放入 _source 的字段。

          合理的配置使用 index 屬性 合理的配置使用 index 屬性,analyzed 和 not_analyzed,根據(jù)業(yè)務(wù)需求來控制字段是否分詞或不分詞。只有 groupby 需求的字段,配置時就設(shè)置成 not_analyzed,以提高查詢或聚類的效率。

          查詢方面優(yōu)化

          Filter VS Query

          深度翻頁 使用 Elasticsearch scroll 和 scroll-scan 高效滾動的方式來解決這樣的問題。也可以結(jié)合實際業(yè)務(wù)特點,文檔 id 大小如果和文檔創(chuàng)建時間是一致有序的,可以以文檔 id 作為分頁的偏移量,并將其作為分頁查詢的一個條件。

          避免層級過深的聚合查詢, 層級過深的aggregation , 會導(dǎo)致內(nèi)存、CPU消耗,建議在服務(wù)層通過程序來組裝業(yè)務(wù),也可以通過pipeline的方式來優(yōu)化。

          通過開啟慢查詢配置定位慢查詢

        tags:
        聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
        10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
        請您保持通訊暢通,專屬學習老師24小時內(nèi)將與您1V1溝通
        免費領(lǐng)取
        今日已有369人領(lǐng)取成功
        劉同學 138****2860 剛剛成功領(lǐng)取
        王同學 131****2015 剛剛成功領(lǐng)取
        張同學 133****4652 剛剛成功領(lǐng)取
        李同學 135****8607 剛剛成功領(lǐng)取
        楊同學 132****5667 剛剛成功領(lǐng)取
        岳同學 134****6652 剛剛成功領(lǐng)取
        梁同學 157****2950 剛剛成功領(lǐng)取
        劉同學 189****1015 剛剛成功領(lǐng)取
        張同學 155****4678 剛剛成功領(lǐng)取
        鄒同學 139****2907 剛剛成功領(lǐng)取
        董同學 138****2867 剛剛成功領(lǐng)取
        周同學 136****3602 剛剛成功領(lǐng)取
        相關(guān)推薦HOT
        Visual Studio Online和GitHub有什么區(qū)別?

        1.定位不同Visual Studio Online,現(xiàn)更名為Visual Studio Codespaces,是微軟提供的一款在線開發(fā)環(huán)境,允許開發(fā)者在云端進行編程和調(diào)試工作。而...詳情>>

        2023-10-15 00:21:42
        什么是域控制器?

        一、域控制器的定義域控制器是指在Windows Server操作系統(tǒng)中部署Active Directory服務(wù)的服務(wù)器。Active Directory是微軟公司開發(fā)的目錄服務(wù),用...詳情>>

        2023-10-15 00:10:28
        深度學習模型權(quán)重h5、weights、ckpt、pth有什么區(qū)別?

        1.來源框架不同h5格式通常用于Keras和TensorFlow框架,weights用于Darknet框架,ckpt是TensorFlow框架的一種格式,而pth則主要用于PyTorch框架...詳情>>

        2023-10-15 00:05:17
        大數(shù)據(jù)測試工程師需要具備哪些技能?

        一、理解大數(shù)據(jù)概念大數(shù)據(jù)測試工程師需要理解大數(shù)據(jù)的基本概念和原理,如分布式存儲、MapReduce、實時計算等。他們還需要了解如何處理大規(guī)模的...詳情>>

        2023-10-14 23:43:03
        為什么SpringBoot的 jar 可以直接運行?

        一、JAR文件的結(jié)構(gòu)與執(zhí)行方式Spring Boot的JAR包是Java Archive的縮寫,它是一種壓縮文件格式,可以將Java項目的類文件、資源文件以及依賴庫等...詳情>>

        2023-10-14 23:01:49
        快速通道
        德兴市| 旅游| 葵青区| 兴隆县| 罗江县| 濮阳县| 资阳市| 静乐县| 灌云县| 太湖县| 大连市| 齐齐哈尔市| 宿迁市| 凯里市| 铅山县| 呼图壁县| 佛山市| 金昌市| 商水县| 武城县| 日照市| 莱西市| 胶州市| 天津市| 昌吉市| 黄陵县| 咸丰县| 库伦旗| 纳雍县| 安陆市| 静海县| 仙游县| 临漳县| 定安县| 平陆县| SHOW| 固安县| 临安市| 广宗县| 漳平市| 桃园市|