久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質的職業(yè)教育機構

        手機站
        千鋒教育

        千鋒學習站 | 隨時隨地免費學

        千鋒教育

        掃一掃進入千鋒手機站

        領取全套視頻
        千鋒教育

        關注千鋒學習站小程序
        隨時隨地免費學習課程

        當前位置:首頁  >  技術干貨  > PythonDask(第2部分)

        PythonDask(第2部分)

        來源:千鋒教育
        發(fā)布人:xqq
        時間: 2023-07-21 17:03:10 1689930190

        在上一個教程中,我們已經理解了分布式計算的概念和 Dask 簡介。除了 Dask 接口的介紹,我們還了解了什么是 Dask 集群以及如何安裝 Dask。

        桌面界面

        正如我們已經討論過的,Dask 接口有多種用于分布式計算的并行算法集。數(shù)據科學從業(yè)者很少使用基本的用戶界面來擴展 NumPy、Pandas 和 scikit-learn:

          陣列:并行 NumPy

          數(shù)據幀:平行 Pandas

          機器學習:并行 Scikit-Learn

        我們已經在前面的教程中介紹了 Dask Array 讓我們直接進入 Dask 數(shù)據幀。

        搜索簡歷

        【超參數(shù)調整】 被認為是建立模型的重要一步,可以極大地改變模型的實現(xiàn)。機器學習模型有各種各樣的超參數(shù),很難理解哪個參數(shù)在特定情況下表現(xiàn)更好。手動執(zhí)行這項任務是相當令人厭煩的工作。然而,Scikit-Learn 庫提供了網格搜索,以簡化超參數(shù)調整的任務。用戶必須提供參數(shù), Gridsearch 將提供這些參數(shù)的最佳組合。

        讓我們考慮一個例子,在這個例子中,我們需要選擇一種隨機森林技術來適應數(shù)據集。該模型有三個重要的可調參數(shù)——第一參數(shù)、第二參數(shù)和第三參數(shù)。

        現(xiàn)在,讓我們在下面設置這些參數(shù)的值:

        第一個參數(shù)-自舉=真

        第二參數(shù)-最大深度- [8,9]

        第三參數(shù)-n _ 估計量:[50,100,200]

        1。sklearn Gridsearch: 對于每一個參數(shù)組合,Scikit-learn Gridsearch 都會執(zhí)行任務,有時最終會多次迭代單個任務。下圖表明,這并不是最有效的方法:

        2。Dask-Search CV: 與 sklearn 的grid Search CV不同,Dask 提供了一個名為 Dask-Search CV 的庫。為了減少重復,Dask-Search CV 合并了這些步驟。我們可以通過以下步驟安裝 Dask-search :

        使用 conda 安裝 Dask-搜索 CV

        
        conda install dask-searchcv -c conda-forge
        

        使用 pip 安裝 Dask-搜索 CV

        
        $ pip install dask-searchcv
        

        下圖展示了 Dask-Search CV 的工作原理:

        Spark 和 Dask 的區(qū)別

        以下是 Spark 和 Dask 的一個關鍵區(qū)別:

        | 南號碼 | 火花 | 達斯克 | | one | Spark 是用 Scala 編程語言編寫的。 | Dask 是用 Python 編程語言編寫的。 | | Two | Spark 提供對 R 和 Python 的支持。 | Dask 只支持 Python。 | | three | Spark 提供了自己的生態(tài)系統(tǒng)。 | Dask 是 Python 生態(tài)系統(tǒng)的組成部分之一。 | | four | Spark 提供了自己的 API。 | Dask 重新利用 Pandas 的 API | | five | 對于 Scala 和 SQL 用戶來說,Spark 很容易理解和實現(xiàn)。 | Python 從業(yè)者通常更喜歡 Dask。 | | six | Spark 本身不支持多維數(shù)組。 | Dask 為可擴展多維陣列的 NumPy 模型提供全面支持。 |

        tags: python教程
        聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
        10年以上業(yè)內強師集結,手把手帶你蛻變精英
        請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
        免費領取
        今日已有369人領取成功
        劉同學 138****2860 剛剛成功領取
        王同學 131****2015 剛剛成功領取
        張同學 133****4652 剛剛成功領取
        李同學 135****8607 剛剛成功領取
        楊同學 132****5667 剛剛成功領取
        岳同學 134****6652 剛剛成功領取
        梁同學 157****2950 剛剛成功領取
        劉同學 189****1015 剛剛成功領取
        張同學 155****4678 剛剛成功領取
        鄒同學 139****2907 剛剛成功領取
        董同學 138****2867 剛剛成功領取
        周同學 136****3602 剛剛成功領取
        相關推薦HOT
        南乐县| 沙雅县| 马龙县| 景德镇市| 信阳市| 大港区| 鹿泉市| 广东省| 平泉县| 杭州市| 得荣县| 新乐市| 板桥市| 丰顺县| 蓝田县| 故城县| 库尔勒市| 蒙城县| 浮梁县| 沂源县| 綦江县| 台州市| 额济纳旗| 荥经县| 兴安县| 凤翔县| 夹江县| 临颍县| 杭州市| 高邮市| 肇庆市| 田东县| 旬邑县| 兴海县| 广平县| 嘉黎县| 洛隆县| 汉源县| 阜南县| 洛川县| 太仆寺旗|