变量及变量相关参数是数据的组织逻辑
一 变量名称
变量:在数据结构中,每一列是一个标签,也就是一个变量,每一行则是一条数据
stata的命名规则:
- 变量名最多32个字符,16个汉字
- 字符组成:A~Z,a~z,0~9,以及下划线“-”
- 区别变量名的大小写
二 变量的取值类型
字符串变量
- 字符变量通常是一些需要用文字描述的信息,常由字母或一些特殊符号组成
- 字符串变量也可以由数字来组成,但数字在这里仅代表一些符号而不再是数字
- 字符串变量通常以英文引号""标注,而且引号不属于字符串的一部分,字符串最多可达244个字符,一般用str#来表示字符的
数值型变量
数值型变量按其精度又可分为五种类型:byte、int、long、float、double。类似于Access中的字节型、整型、长整型、浮点型和双精度型。不同的精度对应着不同的计算运算误差。
缺失数据
stata有27个代码表示缺失值:,,a,b,c,......,z 一般用","
三 变量的显示方式
数值型变量的显示格式
f格式(固定格式)
显示方式:%w.df %w.dfc
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
c:可加可不加,加了后则是数据带“,”
g格式(普通格式)
显示方式:%w.dg %w.dgc
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
c:可加可不加,加了后则是数据带“,”
变化格式:自动调节d值
e格式(科学计数法格式)
显示方式:%w.de
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
字符型的变量显示格式
f格式(固定格式)
显示方式:%#s
#:字符个数
s:表示字符串显示格式
%22s:表示22个字符的字符变量显示格式
使用format命令规范变量的显示格式
显示变量的格式
Format[var] var指变量
更改变量的格式
Format[var]%fmt fmt为更改后
四 数据显示
describe命令
产生一个对数据集的简明总结表格
函数介绍
describe[varlist] [, memory-options]
stata中的一些逻辑
- “[.]”、[,..]”都属于数的参数,只要是被“[]”框住的,都是可有可无
- 重要的命令:help,例如:“help describe” 可调出该命令的表示函数相关信息
- 在帮助中,看options 例:
仅显示变量名称
- “simple”下划线代表缩写
list命令
显示变量的数值,后面可以加显示什么变量
函数介绍
list [varlist] [irl in] [, options]
常用的options
- noobs,不显示观测值的数值
- clean,不显示分隔线
- sepby(var),每当var变量发生变化时画一条分割线
codebook命令
详尽地描述变量内容,包括名称,标签和复制
函数介绍
codebook [varlist] [if] [in] [, options]