频道导航

第一章单一变量

2020-05-16 设计模式前端之家

前端之家收集整理的这篇文章主要介绍了第一章单一变量，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

抖动图

重叠数据偏移展示。不能读取定量信息（quantitative）

直方图

矩形组（bin）

参数：矩阵的宽度、矩阵的对齐方式。

矩阵宽度 Scott 规则

（数据集服从高斯分布）

相关图－频率多边形

问题：

分组丢失信息、直方图不是唯一的、不易反馈计算机处理、不易处理异常；

核密度估计KDE

核函数：和为1的函数可做为核函数。

Gaussian:

步骤：

移动核函数，把它移到每个点所在的位置；

选择核函数带宽；

KDE公式

直方图、核密度估计

直观、找某个特定数据点。

累积分布函数CDF

Xi <= x的所有xi;

汇总统计量、箱形图

平均数、中位数、标准差、百分位数

重点学习核密度估计的使用。可以通过Python numPy来实现。

核密度估计是为了用一定的量来表现所有数据的场合。

总结：

在单一变量的情况下。做数据分析可以做的就是密度统计。因为只有一个数据。除了最大值、最小值、平均值外，我们可以看到的就是统计它们的区间了。在这个情况下。我们最先使用的是点图。这个最简单。但是问题是如果有多个重复的值。我们很难表现，所以之后就有了抖动图、气抖动图是将重复的点用一定的偏移，使重复数据可以在图上表现出来。但是如果数据较多。就不能很直观的看出问题。所以就有了直方图。直方图是将数据点进行简单聚类的产物。这样可以看到每个区间的数据分布情况。但是直方图会省略很多数据、并且图的选取不同。产生的结果也是不一样的。会很大程度上影响结果。所以就有了核密度估计。也从这开始。数据变得可以自已展现数据的情况了。也是我了解的第一个数据分析图。一个变量，核密度可以非常直观的表现数据的密度情况。并且配合CDF。就可以清晰的展现数据了。

上一篇：防范 APT 不能只依赖防火墙、ISP 和下一篇：缓存依赖中cachedependency对象及周

猜你在找的设计模式相关文章

适配器模式-让不兼容的接口得以适配

适配器模式将一个类的接口转换成客户期望的另一个接口，使得原本接口不兼容的类可以相互合...

作者：前端之家时间：2021-02-24

策略模式-定义一个算法族

策略模式定义了一系列算法族，并封装在类中，它们之间可以互相替换，此模式让算法的变化独...

作者：前端之家时间：2021-02-24

设计模式之高质量代码

设计模式讲的是如何编写可扩展、可维护、可读的高质量代码，它是针对软件开发中经常遇到的...

作者：前端之家时间：2021-02-24

模板方法模式-封装一套算法流程

模板方法模式在一个方法中定义一个算法的骨架，而将一些步骤延迟到子类中，使得子类可以在...

作者：前端之家时间：2021-02-24

迭代器模式-统一集合的遍历方式

迭代器模式提供了一种方法，用于遍历集合对象中的元素，而又不暴露其内部的细节。

作者：前端之家时间：2021-02-24

单例模式的五种实现方式及优缺点

单例模式（Singleton Design Pattern）保证一个类只能有一个实例，并提供一个全局访问点。

作者：前端之家时间：2021-02-24

组合模式-统一的处理个别对象与组合对象

组合模式可以将对象组合成树形结构来表示“整体-部分”的层次结构，使得客户可以用一致的方...

作者：前端之家时间：2021-02-24

装饰者模式-动态的包装原有对象的行为

装饰者模式能够更灵活的，动态的给对象添加其它功能，而不需要修改任何现有的底层代码。

作者：前端之家时间：2021-02-24

观察者模式-将消息通知给观察者

观察者模式（Observer Design Pattern）定义了对象之间的一对多依赖，当对象状态改变的时候...

作者：前端之家时间：2021-02-24

代理模式-访问对象的代理而非其本身

代理模式为对象提供一个代理，来控制对该对象的访问。代理模式在不改变原始类代码的情况下...

作者：前端之家时间：2021-02-24

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章