小提琴图
小提琴图是箱线图与核密度估计的组合。因此,这些图更容易分析和理解数据的分布。
让我们使用调用的提示数据集来了解更多关于小提琴图的信息。该数据集包含与餐厅客户提供的提示相关的信息。
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.violinplot(x = "day", y = "total_bill", data=df)
plt.show()
输出
箱线图中的四分位数和胡须值显示在小提琴内部。由于小提琴图使用 KDE,小提琴的较宽部分表示较高的密度,较窄的区域表示相对较低的密度。箱线图中的四分位数范围和 kde 中的较高密度部分落在每个小提琴图类别的同一区域。
上图显示了 total_bill 在一周中的四天的分布。但是,除此之外,如果我们想了解分布在性别方面的表现,让我们在下面的示例中进行探索。
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.violinplot(x = "day", y = "total_bill",hue = 'sex', data = df)
plt.show()
输出
现在我们可以清楚地看到男性和女性之间的消费行为。我们可以很容易地说,通过看情节,男人比女人赚更多的钱。
而且,如果色调变量只有两个类别,我们可以通过在给定日期将每把小提琴分成两把而不是两把小提琴来美化情节。小提琴的任何一个部分都引用了色调变量中的每个类。
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.violinplot(x = "day", y="total_bill",hue = 'sex', data = df)
plt.show()
输出