学习网站:

http://seaborn.pydata.org/examples/scatterplot_matrix.html

一、Anscombe’s quartet(安斯库姆四重奏)

1973年,统计学家F.J. Anscombe构造出了四组奇特的数据。它告诉人们,数据分析之前,描绘数据所对应的可视化图形有多么的重要!下面绘制出这四组数据的散点图和线性拟合图

import seaborn as snssns.set_theme(style="ticks")# 加载 “安斯库姆四重奏” 数据集df = sns.load_dataset("anscombe")# 画出四组数据的散点图以及线性回归拟合图像sns.lmplot(    data = df, x = 'x', y = 'y', col = 'dataset', hue = 'dataset',    col_wrap = 2, palette = 'muted', ci = None,    height = 4, scatter_kws = {'s' : 50, 'alpha' : 1})

画出散点图后,可以发现这四组数据完全不同,但线性回归的拟合方程却一样,这告诉我们在做回归之前进行数据探索的重要。

参考

  • https://blog.csdn.net/Together_CZ/article/details/86522960
  • https://www.zhihu.com/question/67493742