Seaborn - 核心密度估计

  • 简述

    核心密度估计 (KDE) 是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。
    设置hist标记为 False indistplot将产生核心密度估计图。
  • 例子

    
    import pandas as pd
    import seaborn as sb
    from matplotlib import pyplot as plt
    df = sb.load_dataset('iris')
    sb.distplot(df['petal_length'],hist=False)
    plt.show()
    
  • 输出

    图形
  • 拟合参数分布

    distplot()用于可视化数据集的参数分布。

    例子

    
    import pandas as pd
    import seaborn as sb
    from matplotlib import pyplot as plt
    df = sb.load_dataset('iris')
    sb.distplot(df['petal_length'])
    plt.show()
    

    输出

    直方图
  • 绘制二元分布

    双变量分布用于确定两个变量之间的关系。这主要处理两个变量之间的关系以及一个变量相对于另一个变量的行为。
    在 seaborn 中分析二元分布的最佳方法是使用jointplot()功能。
    Jointplot 创建了一个多面板图,该图可以投影两个变量之间的双变量关系,以及每个变量在不同轴上的单变量分布。
  • 散点图

    散点图是可视化分布的最方便方法,其中每个观测值通过 x 和 y 轴以二维图表示。

    例子

    
    import pandas as pd
    import seaborn as sb
    from matplotlib import pyplot as plt
    df = sb.load_dataset('iris')
    sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
    plt.show()
    

    输出

    条形图和直方图
    上图显示了两者之间的关系petal_lengthpetal_width在 Iris 数据中。图中的趋势表明所研究的变量之间存在正相关。

    六边形图

    当数据密度稀疏时,即当数据非常分散且难以通过散点图进行分析时,六边形分箱用于双变量数据分析。
    一个称为“种类”和值“十六进制”的附加参数绘制 hexbin 图。

    例子

    
    import pandas as pd
    import seaborn as sb
    from matplotlib import pyplot as plt
    df = sb.load_dataset('iris')
    sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
    plt.show()
    
    六边形和条形
  • 核心密度估计

    核心密度估计是一种估计变量分布的非参数方法。在 seaborn 中,我们可以使用jointplot().
    将值“kde”传递给参数种类以绘制内核心图。

    例子

    
    import pandas as pd
    import seaborn as sb
    from matplotlib import pyplot as plt
    df = sb.load_dataset('iris')
    sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
    plt.show()
    

    输出

    X射线