在GAUSS中准备和清除FRED数据
FRED数据库提供了访问经济时间序列数据。它被广泛应用于社会科学,经济学和金融等多个领域的研究中。
该数据在使用前进行预处理和清理。这是数据分析中费时又乏味的部分。
使用FRED数据库中的季度实际GDP数据集,探索了GAUSS的新数据管理工具。
研究了如何:
-
处理不规则的数据集标题
-
更改变量名称
-
过滤日期并更改日期显示
数据导入示例
从FRED数据库下载真实GDP序列已存储并存储在文件中。开始通过在“项目文件夹”选项卡中双击文件名,在“数据导入”窗口中打开数据集。
这将打开“数据导入”工具:
数据预览窗口指示原始数据集中有问题需要解决:
-
原始数据不规则的标题
-
变量名称不正确
新的标题行
可以在数据预览中看到,适合变量名称位于第11行。可以使用“导入选项”卡上的“标题行”文本框进行指定:
变量名称在预览中会自动改变名称,以反映行名称。注意,“行范围”输入会自动更新为12,在标题行的后面。
汇入资料
FRED实际GDP数据现在可以导入了,选择Import将数据导入GAUSS工作区。
请注意,当我们这样做时,导入数据的GAUSS代码是自动生成的,可用于复制我们执行的交互步骤。
可以通过几种不同的方式访问自动生成的代码:
1. 命令历史记录。要将代码从命令历史记录发送到文件,请在“历史记录”列表中右键单击该命令,然后选择“发送到文件”。
2. 程序的输入/输出窗口。选择代码段,单击鼠标右键,然后选择复制,可以直接复制代码段。
清除内存中的数据
假设在导入实际GDP数据之后,决定要执行一些数据清理步骤。
具体来说,让我们考虑执行以下操作:
-
更改变量的名称。
-
更改的显示格式。
-
按日期过滤以1970年或以下的观测值。
先在左侧的“符号”窗口中双击以在符号编辑器中将其打开。
改变量名
要改变量名称,请单击变量名称旁边的三角形GCPC1以打开“变量设置”菜单,然后选择“重命名”:
在“重命名列”对话框中输入新的变量名,然后选择确定:
注意:单击“确定”后,现在在“变量”选项卡中以红色显示。红色文本表示有未保存的更改。要保存更改,我们单击Apply。
更改日期显示格式
当前在中的季度数据的观察日期以ISO-8601(“年-月-日”)格式显示。由于我们使用的是季度数据,因此我们对其进行改变以显示年份和季度1947-Q1。
这可以通过展开变量设置菜单并选择属性来完成。这将打开“指定日期格式”对话框:
我们在日期显示文本框中输入新的日期显示格式,然后单击确定。
数据编辑器预览现在显示:
矩阵名称选项卡上的星号表示我们的数据框尚未保存更改。
筛选日期
为了完成我们真实的GDP FRED数据清理示例,让我们过滤数据框以1970年和以后的观测值。
为此,选择“过滤器”选项卡并设置:
变量等于(这是默认值)
该操作对
该值等于
注意日期变量的“值”组合框,您手动输入日期或使用“日历”小部件选择日期。要打开日历日期选择器,请单击“值”框右下角的向下箭头。
设置完成过滤器的三个部分后,我们单击+按钮以添加过滤器。当我们这样做时,数据预览会改变,以指示在单击Apply之后将哪些值: