如何對(duì)Python數(shù)據(jù)表進(jìn)行檢查
在python中處理的數(shù)據(jù)量通常會(huì)比較大,例如千萬級(jí)數(shù)據(jù),而且我們不能一目了然地了解整個(gè)數(shù)據(jù)表,而且必須通過某種方法獲得關(guān)于數(shù)據(jù)表的關(guān)鍵信息。DataTableCheck的另一個(gè)用途是了解數(shù)據(jù)的總體情況,如整個(gè)數(shù)據(jù)表的大小、占用的空間、數(shù)據(jù)格式、是否有空值、重復(fù)項(xiàng)和具體的數(shù)據(jù)內(nèi)容。準(zhǔn)備好進(jìn)行后續(xù)清潔和預(yù)處理。
1、數(shù)據(jù)維度(行列)
Excel中可以通過CTRL+向下的光標(biāo)鍵,和CTRL+向右的光標(biāo)鍵來查看行號(hào)和列號(hào)。Python中使用shape函數(shù)來查看數(shù)據(jù)表的維度,也就是行數(shù)和列數(shù),
2、數(shù)據(jù)表信息
使用info函數(shù)在這里可以看到數(shù)據(jù)表的總體信息,其中包含更多的信息,包括數(shù)據(jù)維度、列名、數(shù)據(jù)格式和占用的空間。
3、查看數(shù)據(jù)格式
Excel中通過選中單元格并查看開始菜單中的數(shù)值類型來判斷數(shù)據(jù)的格式。Python中使用dtypes函數(shù)來返回?cái)?shù)據(jù)格式。
Dtypes是一個(gè)查看數(shù)據(jù)格式的函數(shù),可以一次性查看數(shù)據(jù)表中所有數(shù)據(jù)的格式,也可以指定一列來單獨(dú)查看。
以上就是Python數(shù)據(jù)表進(jìn)行檢查的方法,希望能對(duì)大家有所幫助,更多Python學(xué)習(xí)教程請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。