久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > ES遇到什么性能問題,如何優(yōu)化的?

ES遇到什么性能問題,如何優(yōu)化的?

來源:千鋒教育
發(fā)布人:wjy
時間: 2022-09-19 16:30:14 1663576214

  分幾個方向說幾個點:

  硬件配置優(yōu)化 包括三個因素:CPU、內(nèi)存和 IO。

  CPU: 大多數(shù) Elasticsearch 部署往往對 CPU 要求不高; CPUs 和更多的核數(shù)之間選擇,選擇更多的核數(shù)更好。多個內(nèi)核提供的額外并發(fā)遠(yuǎn)勝過稍微快一點點的時鐘頻率。

  內(nèi)存:

  配置: 由于 ES 構(gòu)建基于 lucene,而 lucene 設(shè)計強(qiáng)大之處在于 lucene 能夠很好的利用操作系統(tǒng)內(nèi)存來緩存索引數(shù)據(jù),以提供快速的查詢性能。lucene 的索引文件 segements 是存儲在單文件中的,并且不可變,對于 OS 來說,能夠很友好地將索引文件保持在 cache 中,以便快速訪問;因此,我們很有必要將一半的物理內(nèi)存留給 lucene;另一半的物理內(nèi)存留給 ES(JVM heap)。

  禁止 swap 禁止 swap,一旦允許內(nèi)存與磁盤的交換,會引起致命的性能問題??梢酝ㄟ^在 elasticsearch.yml 中 bootstrap.memory_lock: true,以保持 JVM 鎖定內(nèi)存,保證 ES 的性能。

  垃圾回收器: 已知JDK 8附帶的HotSpot JVM的早期版本存在一些問題,當(dāng)啟用G1GC收集器時,這些問題可能導(dǎo)致索引損壞。受影響的版本早于JDK 8u40隨附的HotSpot版本。如果你使用的JDK8較高版本,或者JDK9+,我推薦你使用G1 GC; 因為我們目前的項目使用的就是G1 GC,運行效果良好,對Heap大對象優(yōu)化尤為明顯。

  磁盤 在經(jīng)濟(jì)壓力能承受的范圍下,盡量使用固態(tài)硬盤(SSD)

ES遇到什么性能問題,如何優(yōu)化的?

  索引方面優(yōu)化

  批量提交 當(dāng)有大量數(shù)據(jù)提交的時候,建議采用批量提交(Bulk 操作);此外使用 bulk 請求時,每個請求不超過幾十M,因為太大會導(dǎo)致內(nèi)存使用過大。

  增加 Refresh 時間間隔 為了提高索引性能,Elasticsearch 在寫入數(shù)據(jù)的時候,采用延遲寫入的策略,即數(shù)據(jù)先寫到內(nèi)存中,當(dāng)超過默認(rèn)1秒(index.refresh_interval)會進(jìn)行一次寫入操作,就是將內(nèi)存中 segment 數(shù)據(jù)刷新到磁盤中,此時我們才能將數(shù)據(jù)搜索出來,所以這就是為什么 Elasticsearch 提供的是近實時搜索功能,而不是實時搜索功能。如果我們的系統(tǒng)對數(shù)據(jù)延遲要求不高的話,我們可以通過延長 refresh 時間間隔,可以有效地減少 segment 合并壓力,提高索引速度。比如在做全鏈路跟蹤的過程中,我們就將 index.refresh_interval 設(shè)置為30s,減少 refresh 次數(shù)。再如,在進(jìn)行全量索引時,可以將 refresh 次數(shù)臨時關(guān)閉,即 index.refresh_interval 設(shè)置為-1,數(shù)據(jù)導(dǎo)入成功后再打開到正常模式,比如30s。

  索引緩沖的設(shè)置可以控制多少內(nèi)存分配 indices.memory.index_buffer_size 接受一個百分比或者一個表示字節(jié)大小的值。默認(rèn)是10%

  translog 相關(guān)的設(shè)置 控制數(shù)據(jù)從內(nèi)存到硬盤的操作頻率,以減少硬盤 IO??蓪?sync_interval 的時間設(shè)置大一些。默認(rèn)為5s。也可以控制 tranlog 數(shù)據(jù)塊的大小,達(dá)到 threshold 大小時,才會 flush 到 lucene 索引文件。默認(rèn)為512m。

  _id 字段的使用 _id 字段的使用,應(yīng)盡可能避免自定義 _id,以避免針對 ID 的版本管理;建議使用 ES 的默認(rèn) ID 生成策略或使用數(shù)字類型 ID 做為主鍵。

  _all 字段及 _source 字段的使用 _all 字段及 _source 字段的使用,應(yīng)該注意場景和需要,_all 字段包含了所有的索引字段,方便做全文檢索,如果無此需求,可以禁用;_source 存儲了原始的 document 內(nèi)容,如果沒有獲取原始文檔數(shù)據(jù)的需求,可通過設(shè)置 includes、excludes 屬性來定義放入 _source 的字段。

  合理的配置使用 index 屬性 合理的配置使用 index 屬性,analyzed 和 not_analyzed,根據(jù)業(yè)務(wù)需求來控制字段是否分詞或不分詞。只有 groupby 需求的字段,配置時就設(shè)置成 not_analyzed,以提高查詢或聚類的效率。

  查詢方面優(yōu)化

  Filter VS Query

  深度翻頁 使用 Elasticsearch scroll 和 scroll-scan 高效滾動的方式來解決這樣的問題。也可以結(jié)合實際業(yè)務(wù)特點,文檔 id 大小如果和文檔創(chuàng)建時間是一致有序的,可以以文檔 id 作為分頁的偏移量,并將其作為分頁查詢的一個條件。

  避免層級過深的聚合查詢, 層級過深的aggregation , 會導(dǎo)致內(nèi)存、CPU消耗,建議在服務(wù)層通過程序來組裝業(yè)務(wù),也可以通過pipeline的方式來優(yōu)化。

  通過開啟慢查詢配置定位慢查詢

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
快速通道