久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

^{<style id="76ofp"></style>}

<style id="76ofp"></style>

<rt id="76ofp"></rt>

<form id="76ofp"><optgroup id="76ofp"></optgroup></form>

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站

千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻

千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

行業(yè)頭條

哈爾濱選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

哈密選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼和浩特選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼倫貝爾選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吳忠選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呂梁選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吉安選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

合肥選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

臺州選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

廈門選擇鴻蒙培訓機構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

400-811-9990 全國咨詢熱線

首頁精品課程

Java

鴻蒙開發(fā)

HTML5

物聯(lián)網(wǎng)

云計算

Python

軟件測試

網(wǎng)絡安全

大數(shù)據(jù)

Unity

UI/UE設計

全媒體營銷

影視剪輯

游戲原畫

區(qū)塊鏈

產(chǎn)品經(jīng)理

商業(yè)插畫

PMP認證

紅帽RHCE

軟考認證

華為認證

出國留學

安全認證

更多課程

免費教程
HTML5視頻教程 Java視頻教程 Python視頻教程 UI視頻教程云計算視頻教程軟件測試視頻教程大數(shù)據(jù)視頻教程物聯(lián)網(wǎng)視頻教程 Unity視頻教程網(wǎng)絡安全視頻教程全媒體視頻教程影視剪輯視頻教程
教研實力
教研院項目庫師資團隊項目大賽
校企服務
企業(yè)內(nèi)訓高校合作學科共建
就業(yè)服務
就業(yè)服務雙選會上門招聘人才定制促就業(yè)行動
認證考試
PMP?培訓軟考培訓紅帽RHCE認證學歷提升
千鋒問問行業(yè)資訊技術(shù)干貨熱點話題
零基礎學IT IT培訓機構(gòu) IT面試題 IT就業(yè)前景
關于千鋒
千鋒簡介鋒益公益大賽組織品牌活動
聯(lián)系我們

當前位置：首頁 > 技術(shù)干貨 > 按照query的頻度排序文件

按照query的頻度排序文件

來源：千鋒教育

發(fā)布人：wjy

時間： 2022-09-14 15:49:35 1663141775

　　有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query，每個文件的query都可能重復。要求你按照query的頻度排序?

　　方案1:

　　hash映射: 順序讀取10個文件，按照hash(query)%10的結(jié)果將query寫入到另外10個文件(記為a0,a1,..a9)中。這樣新生成的文件每個的大小大約也1G(假設hash函數(shù)是隨機的)。

　　hash_map統(tǒng)計: 找一臺內(nèi)存在2G左右的機器，依次對用hash_map(query, query_count)來統(tǒng)計每個query出現(xiàn)的次數(shù)。注: hash_map(query,query_count)是用來統(tǒng)計每個query的出現(xiàn)次數(shù)，不是存儲他們的值，出現(xiàn)一次，則count+1。

　　堆/快速/歸并排序: 利用快速/堆/歸并排序按照出現(xiàn)次數(shù)進行排序，將排序好的query和對應的query_cout輸出到文件中，這樣得到了10個排好序的文件(記為)。最后，對這10個文件進行歸并排序(內(nèi)排序與外排序相結(jié)合)。

　　方案2:

　　一般query的總量是有限的，只是重復的次數(shù)比較多而已，可能對于所有的query，一次性就可以加入到內(nèi)存了。這樣，我們就可以采用trie樹/hash_map等直接來統(tǒng)計每個query出現(xiàn)的次數(shù)，然后按出現(xiàn)次數(shù)做快速/堆/歸并排序就可以了。

　　方案3:

　　與方案1類似，但在做完hash，分成多個文件后，可以交給多個文件來處理，采用分布式的架構(gòu)來處理(比如MapReduce)，最后再進行合并。 ¶ 給定a、b兩個文件，各存放50億個u

tags:

聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

10年以上業(yè)內(nèi)強師集結(jié)，手把手帶你蛻變精英

請您保持通訊暢通，專屬學習老師24小時內(nèi)將與您1V1溝通

免費領取

今日已有369人領取成功

劉同學 138****2860 剛剛成功領取

王同學 131****2015 剛剛成功領取

張同學 133****4652 剛剛成功領取

李同學 135****8607 剛剛成功領取

楊同學 132****5667 剛剛成功領取

岳同學 134****6652 剛剛成功領取

梁同學 157****2950 剛剛成功領取

劉同學 189****1015 剛剛成功領取

張同學 155****4678 剛剛成功領取

鄒同學 139****2907 剛剛成功領取

董同學 138****2867 剛剛成功領取

周同學 136****3602 剛剛成功領取

上一篇

海量數(shù)據(jù)分布在100臺電腦中，想個辦法高效統(tǒng)計出這批數(shù)據(jù)的TOP10？

下一篇

有哪些基本的垃圾回收算法？

免費打包獲取

相關推薦HOT

怎樣投抖加不花錢？別人能看出來嗎？

抖音一些視頻為了獲取更多點擊，一些博主機會投抖加。其實抖加的投放沒有絕對正確的方法，而不同賬號和視頻投放的策略都是不一樣的，不過一般情...詳情>>

2023-09-19 08:00:10

抖店入駐收費多少？開抖店費用是多少？

如果要開通抖音小店，需要先把抖音賬號開通商品櫥窗功能。入駐之后，可以選擇頭條賬號、抖音賬號、火山賬號任一類型注冊或登錄。那開個抖店要多...詳情>>

2023-09-19 07:50:26

想做直播帶貨的貨源哪里來？怎么找貨源？

現(xiàn)如今直播推廣的方式是非?；鸬?，有著非常多的賣家都是利用直播推廣店鋪產(chǎn)品，效果也是非常不錯。但很多賣家想要了解現(xiàn)在直播帶貨的話什么產(chǎn)品...詳情>>

2023-09-19 07:47:16

適合三農(nóng)領域的名字？有何技巧？

現(xiàn)在在抖音上很多博主會選擇直播來賺取更多的流量以及利潤，直播間的東西也有很多讓消費者信任并且喜歡的，而且隨著越來越多人直播，很多農(nóng)產(chǎn)品...詳情>>

2023-09-19 07:06:05

抖店商品發(fā)布違規(guī)怎么申訴？有何規(guī)則？

抖店服務市場服務商發(fā)布違禁信息如何處理?情節(jié)嚴重程度判定原則：違規(guī)嚴重等級主要通過服務商違規(guī)次數(shù)、造成后果的嚴重程度、獲利或?qū)е聯(lián)p失的...詳情>>

2023-09-19 06:59:55

快速通道更多>>

課程介紹
點擊獲取大綱
就業(yè)前景
查看就業(yè)薪資
學習費用
了解課程價格
優(yōu)惠活動
領取優(yōu)惠券
學習資源
領3000G教程
師資團隊
了解師資團隊
實戰(zhàn)項目
獲取項目源碼
開班地區(qū)
查看來校路線

開班信息

北京校區(qū)

北京校區(qū)
大連校區(qū)
廣州校區(qū)
成都校區(qū)
杭州校區(qū)
長沙校區(qū)
合肥校區(qū)
南京校區(qū)
上海校區(qū)
深圳校區(qū)
武漢校區(qū)
鄭州校區(qū)
西安校區(qū)
青島校區(qū)
重慶校區(qū)
太原校區(qū)
沈陽校區(qū)
南昌校區(qū)
哈爾濱校區(qū)

熱門推薦

新手直播帶貨怎么做起來？有何技巧？

做視頻創(chuàng)作者怎么賺錢？個人怎么靠流量賺錢？

怎樣投抖加不花錢？別人能看出來嗎？

抖店怎么攔截快遞？線下結(jié)算是什么？

抖店平臺商戶被退店還能退貨嗎？如何提高評分？

抖店入駐收費多少？開抖店費用是多少？

想做直播帶貨的貨源哪里來？怎么找貨源？

抖店沒有營業(yè)執(zhí)照怎么辦？類型有哪些？

女孩子拍什么最容易火?拍視頻怎么賺錢的？

怎樣投抖加不花錢，有哪些技巧？

技術(shù)干貨更多>>

如何實現(xiàn)服務器負載均衡

2023-12-06

linux有哪些優(yōu)勢和劣勢

2023-12-06

linux需要驅(qū)動嗎

2023-12-06

android與linux的區(qū)別

2023-12-06

如何搭建基于容器的深度學習環(huán)境

2023-12-06

職場就業(yè) 更多>>

網(wǎng)絡安全軟件開發(fā)的就業(yè)前景

2023-12-09

學會python工程師后的就業(yè)前景

2023-12-09

學會java工程師后的就業(yè)前景

2023-12-09

云計算技術(shù)就業(yè)前景以及發(fā)展方向怎樣？

2023-08-07

千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

勐海县| 天柱县| 博湖县| 长阳| 西平县| 南投县| 明星| 阿尔山市| 洪雅县| 扎鲁特旗| 宁晋县| 连南| 台安县| 从化市| 平南县| 白河县| 新邵县| 尼木县| 阿拉善左旗| 靖州| 永定县| 辽阳县| 长宁区| 宜城市| 莫力| 阳谷县| 新田县| 宁安市| 任丘市| 宜春市| 光泽县| 泗水县| 关岭| 且末县| 建阳市| 永宁县| 武威市| 廊坊市| 呼伦贝尔市| 保亭| 临夏县|