求教 groupby() 函数分组统计均值
给定如下 dataframe df:
df = pd.dataframe({'major':['math','physics','math','math','physics','math','math','physics','demograghy'],'grade':['3','2','2','1','1','3','3','2','2'],'age':[20,18,19,21,20,19,19,18,20]})
登录后复制
现希望利用 groupby() 函数按照 “major” 列分组,并计算 “grade” 列的均值。最终结果应如下所示:
grade 1 2 3 major demography<br> math<br> pyhsics
登录后复制
解决方案:
要实现上述需求,可以设置 groupby() 函数的参数如下:
df.groupby(["Major"]).mean("Grade")
登录后复制
步骤解析:
- groupby([“major”]):按照 “major” 列分组,返回一个 dataframegroupby 对象。
- mean(“grade”):在分组对象上计算 “grade” 列的均值。
最终,groupby([“major”]).mean(“grade”) 会返回一个新的 dataframe,其中 “grade” 列的值为分组后的均值。
以上就是如何使用 groupby() 函数对 DataFrame 进行分组并计算 "Grade" 列的均值?的详细内容,更多请关注php中文网其它相关文章!