Bootstrap

Python中的pandas库

1.用pandas打开.csv或者.xlsx文件
.csv文件是以","作为分隔符的文件,可以用Excel打开(2003或者2007)

from pandas import *

fp = DataFrame(read_csv('food_info.csv')) #打开.csv文件
print(fp.head(1)) #打印数据的头1行,fp.tail(3) #打印数据的最后3行
print(fp.shape)

在这里插入图片描述

df = pd.DataFrame(pd.read_excel('name.xlsx')) #打开.文件xlsx

2.打印行信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.loc[0]) #打印第0行
print(fp.loc[0:3]) #打印0-3行,这和python不一样,python中[0:3]左包右不包
print(fp.loc[[2,5,6,8,9]]) #打印2,5,6,8,9行

3.打印列信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.columns.tolist()) #打印列名,并转化为列表形式
print(fp["NDB_No"]) #打印列名为NDB_No这一列
print(fp[["NDB_No","Water_(g)","Sugar_Tot_(g)"]])#打印列名为NDB_No,Water_(g),Sugar_Tot_(g)这3列

4.小练习:查找数据中列是以(g)为单位的

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))

col_names = fp.columns.tolist()
print(col_names) #打印列名,并转化为列表形式

#查找哪些列单位是(g)为结尾
columns_g = [] #存储列名

f
;