MCM/ICM preparation
second(numpy & pandas)
numpy
1.深浅拷贝
深拷贝:a=np.array([...]) b=a 则b is a 为True 传的是引用
浅拷贝:b=a.copy() 则b is a 为Flase
pandas
1.对于pd.Series() 以及pd.DateFrame() 的使用
对所生成的数据进行排序,进行数据的简单处理与查看,进行对于index 与 columns 的查看与使用, 按照index与colums的方式来进行排序的方法.
2.选择数据
#select by label: df.loc
#select by position: df.iloc
#select by mixed selection:df.ix(在新的pandas中,ix方式已经不建议被使用,将被移除)
#bool indexing 利用df.A>num 来进行选择某些值
3.设置值
利用iloc,loc,以及bool indexing来进行修改
直接添加一行或者一列,那么就可以直接用df['E']=...来进行添加
4.处理丢失数据
df.dropna() df.fillna() df.isnull() np.any(df.isnull==True)/df.isnull().any()
这四种方式对于丢失的数据进行处理,1.丢掉 2,填充 3、4.判断是否有丢失
5.储存数据
read_csv/to_csv
6.合并数据
利用concat([df1,df2,df3],axis=0,ignore_index=True)#aixs=0竖向合并
利用join参数 join='outer'/'inner' 这两个如果是outer,则都显示,inner则只是显示都共有的index与columns
利用参数join_axes,按照某一个具体的来进行考虑
append()的方法,将具体某些加到原pandas中。
merge
利用merge()函数中的on参数进行合并
注意on的参数类型可以使多样的,比如单独的一个是字符串,多个的话就是列表
合并的时候是用inner 的方式来进行的
注意indicator这个参数为True时能够展示合并的方式(left_only,both,right_only)
注意区别index 和column两个的合并,参数有一点小小的不同
添加标签-> suffixes
7.pandas 绘图
利用pandas直接plot(),不需要plt
对于scatter,是直接在plot()后的属性,而不是一个特别的方式。