pythonint64
Ⅰ python學習筆記:(一)pandas數據讀取、查看和選擇
首先,導入pandas數據包
pandas有兩種數據結構,作為數據的容器:
series:包括數據和索引兩個部分。生成series時,若為值列表,會默認生成整數索引;若為字典,則自動將字典的key作為數據的索引,值作為數據。
輸出:默認生成的索引從0開始,依次遞增,最後一行dtype:int64,表示數據類型為整型。
DataFrame:如果說series是值的集合,那麼DataFrame就是series的集合。每一行或每一列都是一個series。生成DataFrame時,會自動生成行索引和列索引。也可以在生成DataFrame時指定行索引和列索引,通過index和columns參數進行設置。
DataFrame的每一行/列可以是不同的數據類型。生成Dataframe時,如果僅有一個值,該值會被復制到所有對應的列。
文件讀取與寫入:
to_csv函數可以將數據保存為csv格式。讀取csv文件時,可以指定以某列的值作為索引。
對於excel文件,使用to_excel函數進行寫入,讀取excel文件使用read_excel函數。要將數據寫入同一個excel文件的不同sheet中,應使用ExcelWriter對象作為參數。
數據查看:
df.info()列印DataFrame的簡要摘要。
df.describe()生成描述性統計信息,對於數值類型數據返回均值、標准差、最大值、最小值、分位數等;對於類別數據,返回各類別的數目、最高數量的類別及出現次數等。
df.head(n) 和 df.tail(n)分別顯示數據的前n行和後n行,省略n時默認為5行。
df.shape輸出數據的大小(行數, 列數)。
df.values數據的值輸出為narray形式。
df.columns和df.index分別顯示數據的列標簽和行標簽。
df.to_numpy()輸出底層數據的Numpy對象。
數據選擇和訪問:
最基本的訪問方式為[]。對於DataFrame,可以通過提取一個或多個行或列;通過列標簽提取列,通過行的切片提取行。對於Series,[ ]還可以完成賦值操作。
DataFrame.loc[行,列]:按標簽訪問一組行和列。允許的輸入包括單個標簽、標簽的列表或數組、帶有標簽的切片對象以及布爾數組。
DataFrame.iloc:按整數位置訪問一組行和列。允許的輸入包括單個整數、整數的列表或數組、帶有整數的切片對象以及布爾數組。
DataFrame.at:按標簽訪問行/列對的單個值。
DataFrame.iat:按整數位置訪問行/列對的單個值。
Ⅱ python numpy.int64 是什麼類型
numpy.int64是numpy模塊的int類,與python本身的int基本類型並不同。使用type()判斷。
import numpy as np
nparr = np.array([1,2,3,4]) ;numpyint = nparr[0]
pyint = 1234
type(pyint) 不等於 type(numpyint)