久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > pythonpandas的5種使用技巧

pythonpandas的5種使用技巧

來源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-11-05 18:14:37 1699179277

Python正迅速成為數(shù)據(jù)科學(xué)家們更為鐘愛的編程語言。形成該現(xiàn)狀的理由非常充分:Python提供了一種覆蓋范圍更為廣闊的編程語言生態(tài)系統(tǒng),以及具有一定計(jì)算深度且性能良好的科學(xué)計(jì)算庫。

在Python自帶的科學(xué)計(jì)算庫中,Pandas模塊是最適于數(shù)據(jù)科學(xué)相關(guān)操作的工具。本文著重介紹了Python中數(shù)據(jù)處理的5種方法。

首先導(dǎo)入相關(guān)模塊并加載數(shù)據(jù)集到Python環(huán)境中:

importpandasaspd

importnumpyasnp

data=pd.read_csv("***.csv",index_col="Loan_ID")

1、Apply函數(shù)

Apply函數(shù)是處理數(shù)據(jù)和建立新變量的常用函數(shù)之一。在向數(shù)據(jù)框的每一行或每一列傳遞指定函數(shù)后,Apply函數(shù)會(huì)返回相應(yīng)的值。這個(gè)由Apply傳入的函數(shù)可以是系統(tǒng)默認(rèn)的或者用戶自

defnum_missing(x):

returnsum(x.isnull())

#Applyingpercolumn:

print"Missingvaluespercolumn:"

printdata.apply(num_missing,axis=0)

2、填補(bǔ)缺失值

fillna()函數(shù)可一次性完成填補(bǔ)功能。它可以利用所在列的均值/眾數(shù)/中位數(shù)來替換該列的缺失數(shù)據(jù)。下面利用“Gender”、“Married”、和“Self_Employed”列中各自的眾數(shù)值填補(bǔ)對(duì)應(yīng)列的缺失數(shù)據(jù)。

fromscipy.statsimportmode

mode(data['Gender'])

3、數(shù)據(jù)透視表

Pandas可建立MSExcel類型的數(shù)據(jù)透視表。例如在下文的代碼段里,關(guān)鍵列“LoanAmount”存在缺失值。我們可以根據(jù)“Gender”,“Married”和“Self_Employed”分組后的平均金額來替換。“LoanAmount”的各組均值可由如下方法確定

4、復(fù)合索引

如果您注意觀察#3計(jì)算的輸出內(nèi)容,會(huì)發(fā)現(xiàn)它有一個(gè)奇怪的性質(zhì)。即每個(gè)索引均由三個(gè)數(shù)值的組合構(gòu)成,稱為復(fù)合索引。它有助于運(yùn)算操作的快速進(jìn)行。

從#3的例子繼續(xù)開始,已知每個(gè)分組數(shù)據(jù)值但還未進(jìn)行數(shù)據(jù)填補(bǔ)。具體的填補(bǔ)方式可結(jié)合此前學(xué)到的多個(gè)技巧來完成。

fori,rowindata.loc[data['LoanAmount'].isnull(),:].iterrows():

ind=tuple([row['Gender'],row['Married'],row['Self_Employed']])

data.loc[i,'LoanAmount']=impute_grps.loc[ind].values[0]

#Nowcheckthe#missingvaluesagaintoconfirm:

printdata.apply(num_missing,axis=0)

5、Crosstab函數(shù)

該函數(shù)用于獲取數(shù)據(jù)的初始印象(直觀視圖),從而驗(yàn)證一些基本假設(shè)。例如在本例中,“Credit_History”被認(rèn)為會(huì)顯著影響貸款狀態(tài)。這個(gè)假設(shè)可以通過如下代碼生成的交叉表進(jìn)行驗(yàn)證:

pd.crosstab(data["Credit_History"],data["Loan_Status"],margins=True)

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
pythonpandas是干什么用的?

Python中pandas是什么?Pandas是基于numpy的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas納入了大量的庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供...詳情>>

2023-11-05 20:45:49
VB.NET和Python有什么區(qū)別?

我想大家都知道VB.NET和Python都是編程語言,都是面向?qū)ο蟮木幊陶Z言,那么VB.NET和Python有什么區(qū)別呢?請(qǐng)看下文。其實(shí)Python不用過多介紹,大...詳情>>

2023-11-05 20:24:13
Python自動(dòng)化辦公有哪些值得使用的庫?

眾所周知,Python的使用場(chǎng)景非常廣泛,無論是生活還是工作,都可以使用Python來幫助我們。Python主要可以用在爬蟲、后端開發(fā)、人工智能、機(jī)器學(xué)...詳情>>

2023-11-05 20:06:13
Python爬蟲框架有哪些?

Python被稱為爬蟲首選語言的主要原因是Python擁有眾多的爬蟲框架,不僅功能齊全,優(yōu)勢(shì)眾多,還能幫助程序員用更少的代碼實(shí)現(xiàn)更多的功能,讓工作...詳情>>

2023-11-05 19:55:25
Python有哪些方法可以實(shí)現(xiàn)拼接字符串的功能?

Python作為一門新型的編程語言,其熱度也是不亞于Java的,它也是面向?qū)ο箢愋偷模赑ython也有很多數(shù)據(jù)類型,如字符串、列表、數(shù)組等,今天我們...詳情>>

2023-11-05 19:37:25