Pandas是最流行的用于数据分析的 Python 库。它提供高度优化的性能,后端源代码完全用C或Python编写。
我们可以通过以下方式分析 pandas 中的数据:
1.Series
2.数据帧
Series 是 pandas 中定义的一维(1-D)数组,可用于存储任何数据类型。
创建 Series
# 创建 Series 的程序
# 导入 Panda 库
import pandas as pd
# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)
登录后复制
在这里,数据可以是:
注意:默认情况下,索引从 0、1、2、...(n-1) 开始,其中 n 是数据长度。
当 Data 包含标量值时
# 使用标量值创建 Series 的程序
# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]
# 使用默认索引值创建系列
s = pd.Series(Data)
# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']
# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)
登录后复制
输出:
具有默认索引的标量数据
带索引的标量数据
当数据包含字典时
# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
# 创建字典类型 Series
sd = pd.Series(dictionary)
登录后复制
输出:
字典类型数据
当 Data 包含 Ndarray
# 创建 ndarray series 的程序
# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]
# 创建一系列二维数组
snd = pd.Series(Data)
登录后复制
输出:
数据作为 Ndarray
DataFrames是 pandas 中定义的二维(2-D)数据结构,由行和列组成。
创建 DataFrame
# 创建 DataFrame 的程序
# 导入库
import pandas as pd
# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
登录后复制
在这里,数据可以是:
当数据是字典时
# 使用两个字典创建数据框的程序
# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}
# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}
# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}
# 创建数据框
df = pd.DataFrame(Data)
登录后复制
输出:
带有两个字典的 DataFrame
当数据是Series时
# 创建三个系列的Dataframe的程序
import pandas as pd
# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])
# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])
# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])
# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}
# 创建 DataFrame
dfseries = pd.DataFrame(Data)
登录后复制
输出:
三个 Series 的 DataFrame
当 Data 为 2D-numpy ndarray注意:在创建 2D 数组的 DataFrame 时必须保持一个约束 - 2D 数组的维度必须相同。
# 从二维数组创建 DataFrame 的程序
# 导入库
import pandas as pd
# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]
# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]
# 定义 Data
Data ={'first': d1, 'second': d2}
# 创建 DataFrame
df2d = pd.DataFrame(Data)
登录后复制
输出:
带有 2d ndarray 的 DataFrame
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
长按识别二维码并关注微信
更方便到期提醒、手机管理