分类数据与数值数据
数据是为参考或分析目的收集的事实或信息。通常,这些数据是作为相关主题的属性收集的。此属性可以从一个到另一个属性,因此可以将其变化的属性视为变量。变量可以假设不同形式的值,并且这些值在收集的数据中是固有的。
变量可以是定性的或quantitative; i.e. if the variable is quantitative, the answers are numbers and the magnitude of the attribute measured can be stated with a certain degree of accuracy. The other type, the qualitative variables measure the qualitative attributes and the values assumed by the variables cannot be given in terms of size or magnitude. The variables itself are known as categorical variables and the data collected by means of a categorical variable are categorical data.
有关数值数据的更多信息
数值数据基本上是从变量获得的定量数据,并且该值具有大小/幅度的感觉。根据斯坦利·史密斯·史蒂文斯(Stanley Smith Stevens)开发的理论,将获得的数值数据进一步分为三个类别。数值数据可以是序数,间隔或比率。数据的类型取决于值的测量方法,类型称为测量水平。
一个人的重量,两个点,温度和股票价格之间的距离是数值数据的示例。
在统计数据中,大多数方法是用于分析数值数据的。基本的描述性统计和回归和其他推论方法主要用于分析数值数据。
有关分类数据的更多信息
分类数据是定性变量的值,通常是数字,单词或符号。他们提出了这样一个事实,即被考虑的情况中的变量属于可用的几种选择之一。因此,它们属于其中一个类别。因此,名称分类。
一个人的政治隶属关系,一个人的国籍,一个人最喜欢的颜色以及患者的血统是定性属性。有时,可以作为分类值获得数字,但是数字本身并不代表测量属性的大小。邮政编码是一个示例。
同样,任何分类值属于名义数据类型,这是基于测量级别的另一种类型。用于分析分类数据的方法与数值数据不同,但基本原理可能相同。
分类数据和数值数据有什么区别?
•数值数据是针对定量变量获得的值,并且具有与变量上下文相关的数量级(因此,它们始终是具有数值值的数字或符号)。分类数据是定性变量获得的值;分类数据编号不会带来数量级。
• Numerical data always belong to either ordinal, ratio, or interval type, whereas categorical data belong to nominal type.
•用于分析定量数据的方法与用于分类数据的方法不同,即使原理是相同的,至少该应用程序具有显着差异。
•使用描述性统计,回归,时间序列等中的统计方法分析数值数据。
•对于分类数据,通常采用描述性方法和图形方法。还使用了一些非参数测试。
发表评论