MCM/ICM preparation -two

MCM/ICM preparation

second(numpy & pandas)


numpy

1.深浅拷贝

深拷贝:a=np.array([...]) b=a   则b is a 为True  传的是引用
浅拷贝:b=a.copy()  则b is a 为Flase 

pandas

1.对于pd.Series() 以及pd.DateFrame() 的使用

对所生成的数据进行排序,进行数据的简单处理与查看,进行对于index 与 columns 的查看与使用, 按照index与colums的方式来进行排序的方法.

2.选择数据

#select by label: df.loc  
#select by position: df.iloc
#select by mixed selection:df.ix(在新的pandas中,ix方式已经不建议被使用,将被移除)
#bool indexing  利用df.A>num 来进行选择某些值

3.设置值

利用iloc,loc,以及bool indexing来进行修改
直接添加一行或者一列,那么就可以直接用df['E']=...来进行添加

4.处理丢失数据

df.dropna()   df.fillna()  df.isnull()   np.any(df.isnull==True)/df.isnull().any()
这四种方式对于丢失的数据进行处理,1.丢掉 2,填充 3、4.判断是否有丢失

5.储存数据
read_csv/to_csv

6.合并数据

利用concat([df1,df2,df3],axis=0,ignore_index=True)#aixs=0竖向合并
利用join参数  join='outer'/'inner' 这两个如果是outer,则都显示,inner则只是显示都共有的index与columns
利用参数join_axes,按照某一个具体的来进行考虑
append()的方法,将具体某些加到原pandas中。

merge 
利用merge()函数中的on参数进行合并
注意on的参数类型可以使多样的,比如单独的一个是字符串,多个的话就是列表
合并的时候是用inner 的方式来进行的
注意indicator这个参数为True时能够展示合并的方式(left_only,both,right_only)
注意区别index 和column两个的合并,参数有一点小小的不同
添加标签-> suffixes

7.pandas 绘图

利用pandas直接plot(),不需要plt
对于scatter,是直接在plot()后的属性,而不是一个特别的方式。