Seaborn - 核心密度估计
-
简述
核心密度估计 (KDE) 是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。设置hist标记为 False indistplot将产生核心密度估计图。 -
例子
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.distplot(df['petal_length'],hist=False) plt.show()
-
输出
-
拟合参数分布
distplot()用于可视化数据集的参数分布。例子
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.distplot(df['petal_length']) plt.show()
输出
-
绘制二元分布
双变量分布用于确定两个变量之间的关系。这主要处理两个变量之间的关系以及一个变量相对于另一个变量的行为。在 seaborn 中分析二元分布的最佳方法是使用jointplot()功能。Jointplot 创建了一个多面板图,该图可以投影两个变量之间的双变量关系,以及每个变量在不同轴上的单变量分布。 -
散点图
散点图是可视化分布的最方便方法,其中每个观测值通过 x 和 y 轴以二维图表示。例子
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df) plt.show()
输出
上图显示了两者之间的关系petal_length和petal_width在 Iris 数据中。图中的趋势表明所研究的变量之间存在正相关。六边形图
当数据密度稀疏时,即当数据非常分散且难以通过散点图进行分析时,六边形分箱用于双变量数据分析。一个称为“种类”和值“十六进制”的附加参数绘制 hexbin 图。例子
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex') plt.show()
-
核心密度估计
核心密度估计是一种估计变量分布的非参数方法。在 seaborn 中,我们可以使用jointplot().将值“kde”传递给参数种类以绘制内核心图。例子
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex') plt.show()
输出