
|
headings 10
Tests 24
add
adf
bds
bkw
chow
coeffsum
coint
cusum
difftest
johansen
kpss
leverage
levinlin
meantest
modtest
normtest
omit
panspec
qlrtest
reset
restrict
runs
vartest
vif
Graphs 10
boxplot
gnuplot
graphpg
hfplot
panplot
plot
qqplot
rmplot
scatters
textplot
Statistics 14
anova
corr
corrgm
fractint
freq
hurst
mahal
pca
pergm
pvalue
spearman
summary
xcorrgm
xtab
Dataset 18
append
data
dataset
delete
genr
info
join
labels
markers
nulldata
open
rename
setinfo
setmiss
setobs
smpl
store
varlist
Estimation 34
ar
ar1
arch
arima
arma
biprobit
dpanel
duration
equation
estimate
garch
gmm
heckit
hsk
intreg
lad
logistic
logit
midasreg
mle
mpols
negbin
nls
ols
panel
poisson
probit
quantreg
system
tobit
tsls
var
vecm
wls
Programming 21
break
catch
clear
continue
elif
else
end
endif
endloop
flush
foreign
funcerr
function
if
include
loop
makepkg
mpi
run
set
setopt
Transformations 10
diff
discrete
dummify
lags
ldiff
logs
orthdev
sdiff
square
stdize
Utilities 6
eval
help
modeltab
pkg
quit
shell
Printing 7
eqnprint
modprint
outfile
print
printf
sprintf
tabprint
Prediction 1
fcast
# add Tests
Argumento: listavariables
Opcións: --lm (Fai unha proba de ML; só con MCO)
--quiet (Presenta só os resultados básicos da proba)
--silent (Non presenta nada)
--vcv (Presenta a matriz de covarianzas do modelo ampliado)
--both (Só para estimación VI; mira abaixo)
Exemplos: add 5 7 9
add xx yy zz --quiet
Debes de solicitar esta instrución despois de executar unha instrución de
estimación. Realiza unha proba conxunta (cuxos resultados podes obter cos
accesorios "$test" e "$pvalue") sobre a adición das variables indicadas no
argumento, ao derradeiro modelo estimado.
Por defecto, estímase unha versión "ampliada" do modelo orixinal, que
resulta ao engadirlle a este as variables do argumento listavariables, como
regresores. Neste caso, a proba é de tipo Wald sobre o modelo ampliado,
pasando a ser este o "modelo vixente" en troques do orixinal. Debes de ter
isto en conta, por exemplo, para usar $uhat porque este permite recuperar os
erros do que sexa o modelo vixente en cada momento, ou para facer probas
posteriores.
Alternativamente, se indicas a opción --lm (que só está dispoñible para
aqueles modelos estimados mediante MCO), realízase unha proba de
Multiplicadores de Lagrange. Para iso, execútase unha regresión auxiliar
na que o erro de estimación do derradeiro modelo tómase como variable
dependente; e as variables independentes son as dese derradeiro modelo máis
as de listavariables. Baixo a hipótese nula de que as variables engadidas
non teñen unha capacidade explicativa adicional, o estatístico formado
multiplicando o tamaño da mostra polo R-cadrado desta regresión, ten a
distribución dunha variable khi-cadrado con tantos graos de liberdade como
o número de regresores engadidos. Neste caso, o modelo orixinal non se
substitúe polo modelo da regresión auxiliar.
A opción --both é específica do método de estimación de Mínimos
Cadrados en 2 Etapas. Indica que as novas variables deben de engadirse tanto
á lista dos regresores como á lista dos instrumentos, posto que cando non
se indica nada, engádense por defecto só á de regresores.
Ruta do menú: Xanela de modelo: Probas/Engadir variables
# adf Tests
Argumentos: nivel listavariables
Opcións: --nc (Sen constante)
--c (Con constante)
--ct (Con constante máis tendencia)
--ctt (Con constante, máis tendencia linear e cadrada)
--seasonals (Inclúe variables ficticias estacionais)
--gls (Detrae a media ou a tendencia usando MCX)
--verbose (Amosa os resultados da regresión)
--quiet (Non presenta os resultados)
--difference (Usa as primeiras diferenzas da variable)
--test-down[=criterio] (Nivel de retardos automático)
--perron-qu (Mira abaixo)
Exemplos: adf 0 y
adf 2 y --nc --c --ct
adf 12 y --c --test-down
Mira tamén jgm-1996.inp
As opcións que se amosan máis abaixo e a discusión que segue, se
corresponden principalmente co uso da instrución adf con datos de típicas
series temporais. Para utilizar esta instrución con datos de panel, mira
máis abaixo a sección titulada "Datos de panel".
Esta instrución calcula un conxunto de probas de Dickey-Fuller sobre cada
unha das variables do argumento, sendo a hipótese nula a existencia dunha
raíz unitaria. (Agora ben, cando escolles a opción --difference,
calcúlase a primeira diferenza da(s) variable(s) antes de facer a proba, e
a discusión de abaixo debes de entendela como referida á(s) variable(s)
transformada(s).)
Por defecto, amósanse dúas variantes da proba: unha baseada nunha
regresión que utiliza unha constante, e outra que utiliza unha constante
máis unha tendencia linear. Podes controlar as variantes que se presentan
especificando un ou máis dos indicadores de opción: --nc, --c, --ct, ou
--ctt.
Podes utilizar a opción --gls xunto con algunha das dúas opcións --c e
--ct (con constante, e con constante máis tendencia). O efecto desta
opción é que a serie que se quere probar, detráese da media ou da
tendencia usando o procedemento de Mínimos Cadrados Xeneralizados proposto
por Elliott, Rothenberg e Stock (1996), que proporciona unha proba de maior
potencia que a aproximación estándar de Dickey-Fuller. Esta opción non é
compatible con --nc, --ctt nin --seasonals.
En tódolos casos, a variable dependente na regresión da proba, é a
primeira diferenza da serie indicada (y), e a variable independente chave é
o primeiro retardo de y. A regresión fórmase de xeito que o coeficiente da
variable y retardada, é igual á raíz en cuestión, α, menos 1. Por
exemplo, o modelo con constante pode escribirse como
(1 - L)y(t) = b0 + (a-1)y(t-1) + e(t)
Baixo a hipótese nula de existencia dunha raíz unitaria, o coeficiente da
variable y retardada é igual a cero. Baixo a hipótese alternativa de que y
é estacionaria, este coeficiente é negativo. Daquela a proba é
propiamente dunha cola.
Selección do nivel de retardos
A versión máis sinxela da proba de Dickey-Fuller asume que a perturbación
aleatoria da regresión que se utiliza na proba non ten autocorrelación. Na
práctica, isto non é probable que aconteza polo que a especificación da
regresión habitualmente amplíase incluíndo un ou máis retardos da
variable dependente, orixinando unha proba de Dickey-Fuller ampliada (ADF).
O argumento nivel determina o número deses retardos (k), eventualmente
dependendo do tamaño da mostra (T).
Para usar un valor fixo de k, especificado polo usuario: indica un valor
non negativo para nivel.
Para usar un valor de k dependente de T: indica nivel igual a -1. Así o
nivel establécese segundo o consello de Schwert (1989): concretamente
tómase a parte enteira de calcular 12(T/100)^0.25.
Porén, en xeral non se sabe cantos retardos serán necesarios para
"branquear" o erro da regresión de Dickey-Fuller. En consecuencia é
habitual especificar o máximo valor de k, e deixar que os datos 'decidan' o
número concreto de retardos que se van incluír. Isto pódese facer
mediante a opción --test-down. E tamén podes establecer o criterio co que
se determine un valor óptimo para k, utilizando o parámetro para esta
opción que deberá ser un a escoller entre AIC (por defecto), BIC ou tstat.
Cando pides que se probe cara atrás mediante AIC ou BIC, o nivel de
retardos final para a ecuación ADF é o que optimiza o criterio de
información que escollas (de Akaike ou Bayesiano de Schwarz). O
procedemento exacto dependerá de se indicas ou non a opción --gls. Cando
se especifica GLS (MCX), os criterios AIC e BIC son as versións
"modificadas" descritas en Ng e Perron (2001); se non, son as versións
estándar. No caso de MCX, dispós dun refinamento. Cando indicas a opción
adicional --perron-qu, a selección do nivel de retardo realízase mediante
o método revisado que recomendaron Perron e Qu (2007). Neste caso, os datos
se detraen primeiro mediante OLS (MCO) da media ou da tendencia; GLS (MCX)
se aplica unha vez que se haxa determinado o nivel de retardo.
Cando pides que se probe cara atrás mediante o método do estatístico t, o
procedemento é como se indica deseguido:
1. Estímase a regresión de Dickey-Fuller utilizando k retardos da variable
dependente.
2. É significativo o último retardo? Se o é, execútase a proba cun nivel
de retardos k. Se non o é, faise que k = k - 1, e vólvese ao paso 1 cun
retardo menos. O proceso repítese ata que sexa significativo o último
retardo dunha regresión, ou ata que k sexa 0 (faríase a proba cun nivel
de retardos igual a 0).
No contexto do paso 2 de arriba, "significativo" quere dicir que o
estatístico t do derradeiro retardo ten un valor p asintótico de dúas
colas igual ou menor a 0.10, fronte á distribución Normal.
En resumo, se admitimos os diferentes argumentos de Perron, Ng, Qu e Schwert
indicados arriba, a instrución preferible para probar unha serie y é
probable que sexa:
adf -1 y --c --gls --test-down --perron-qu
(Ou substituíndo --ct en troques de --c se a serie semella presentar unha
tendencia.) O nivel de retardo para a proba será entón determinado
comprobándoo cara atrás, mediante os cambios no AIC a partir do máximo de
Schwert, co refinamento de Perron-Qu.
As Probabilidades Asociadas (valores P) para as probas de Dickey-Fuller
están baseadas en estimacións de tipo superficie de resposta. Cando non se
aplica MCX (GLS), se toman de MacKinnon (1996). Noutro caso, tómanse de
Cottrell (2015) ou, cando se realiza a comprobación cara atrás, de Sephton
(2021). As Probabilidades Asociadas son específicas para o tamaño da
mostra, agás que estean etiquetadas como asintóticas.
Datos de Panel
Cando se utiliza a instrución adf con datos de panel para facer unha proba
de raíz unitaria de panel, as opcións aplicables e os resultados que se
amosan son algo diferentes.
Primeiro, mentres que podes indicar unha lista de variables para probar no
caso de series temporais típicas, con datos de panel só podes probar unha
variable por cada instrución. Segundo, as opcións que manexan a inclusión
de termos determinísticos pasan a ser mutuamente excluíntes: debes de
escoller unha entre sen constante, con constante, e con constante máis
tendencia; por defecto é con constante. Ademais, a opción --seasonals non
está dispoñible. Terceiro, a opción --verbose aquí ten un significado
diferente: produce un breve informe da proba para cada serie temporal
individual (sendo este por defecto unha presentación só do resultado
global).
Calcúlase a proba global (Hipótese nula: A serie en cuestión ten unha
raíz unitaria para todas as unidades do panel) dunha ou as dúas formas
seguintes: utilizando o método de Im, Pesaran e Shin (Journal of
Econometrics, 2003) ou a de Choi (Journal of International Money and
Finance, 2001) A proba de Choi require que estean dispoñibles as
probabilidades asociadas (valores P) para as probas individuais; se este non
é o caso (dependendo das opcións escollidas), omítese. O estatístico
concreto proporcionado para a proba de Im, Pesaran e Shin varía do xeito
seguinte: se o nivel de retardo para a proba non é cero, amósase o seu
estatístico W; por outra banda, se as longuras das series de tempo difiren
dun individuo a outro, amósase o seu estatístico Z; se non, amósase o seu
estatístico t-barra. Consulta tamén a instrución "levinlin".
Ruta do menú: /Variable/Probas de raíz unitaria/Proba ampliada de Dickey-Fuller
# anova Statistics
Argumentos: resposta tratamento [ control ]
Opción: --quiet (Non presenta os resultados)
Análise da Varianza: O argumento resposta deberá de ser unha serie que
mida algún efecto de interese, e tratamento deberá de ser unha variable
discreta que codifique dous ou máis tipos de tratamento (ou non
tratamento). Para un ANOVA de dous factores, a variable control (que tamén
será discreta) deberá de codificar os valores dalgunha variable de
control.
Agás cando indicas a opción --quiet, esta instrución presenta unha táboa
amosando as sumas de cadrados e os cadrados da media xunto cunha proba F.
Podes recuperar o estatístico da proba F e a súa probabilidade asociada,
utilizando os accesorios "$test" e "$pvalue", respectivamente.
A hipótese nula da proba F é que a resposta media é invariante con
respecto ao tipo de tratamento ou, noutras palabras, que o tratamento non
ten efecto. Falando estritamente, a proba só é válida cando a varianza da
resposta é a mesma para tódolos tipos de tratamento.
Cae na conta de que os resultados que amosa esta instrución son de feito un
subconxunto da información ofrecida polo seguinte procedemento, que podes
preparar doadamente no GRETL. (1) Xera un conxunto de variables ficticias
que codifiquen todos os tipos de tratamento agás un. Para un ANOVA de dous
factores, xera ademais un conxunto de variables ficticias que codifiquen
todos os bloques de "control" agás un. (2) Fai a regresión de resposta
sobre unha constante e as variables ficticias utilizando "ols". Cun só
factor, preséntase a táboa ANOVA mediante a opción --anova nesa función
ols. No caso de dous factores, a proba F relevante atópala utilizando a
instrución "omit" logo da regresión. Por exemplo, (asumindo que resposta
é y, que xt codifica o tratamento, e que xb codifica os bloques de
"control"):
# Un factor
list Fict_xt = dummify(xt)
ols y 0 Fict_xt --anova
# Dous factores
list Fict_xb = dummify(xb)
ols y 0 Fict_xt Fict_xb
# Proba de significación conxunta de Fict_xt
omit Fict_xt --quiet
Ruta do menú: /Modelar/Outros Modelos Lineais/ANOVA
# append Dataset
Argumento: nomeficheiro
Opcións: --time-series (Mira abaixo)
--fixed-sample (Mira abaixo)
--update-overlap (Mira abaixo)
--quiet (Non presenta nada)
Mira abaixo para opcións adicionais especiais
Abre un ficheiro de datos e agrega o contido ao conxunto vixente de datos,
se os novos datos son compatibles. O programa tentará detectar o formato do
ficheiro de datos (propio, texto plano, CSV, Gnumeric, Excel, etc.).
Os datos engadidos poden ter ben o formato de observacións adicionais sobre
series xa presentes no conxunto de datos, e/ou ben o formato de novas
series. No caso de engadir series, a compatibilidade require (a) que o
número de observacións dos novos datos sexa igual ao número de datos
actuais, ou (b) que os novos datos carrexen clara información das
observacións de xeito que GRETL poda deducir como colocar os valores.
Un caso que non se admite é aquel no que os novos datos comezan antes e
rematan despois ca os datos orixinais. Para engadir series nesa situación,
podes utilizar a opción --fixed-sample; isto ten como efecto que se suprime
o engadido de observacións, polo que así restrínxese a operación
unicamente a engadir series novas.
Admítese unha característica especial cando se engaden datos a un conxunto
de datos de panel. Sirva n para denotar o número de unidades atemporais no
panel, T para denotar o número de períodos de tempo, e m para denotar o
número de observacións dos novos datos. Se m = n, os novos datos
considéranse invariantes no tempo, e cópianse repetidos para cada período
de tempo. Por outra banda, se m = T os datos trátanse como invariantes
entre as unidades atemporais, e cópianse repetidos para cada unidade
atemporal. Se o panel é "cadrado", e m é igual tanto a n como a T, aparece
unha ambigüidade. Por defecto, neste caso trátanse os novos datos como
invariantes no tempo, pero podes forzar a que GRETL trate os novos datos
como series temporais coa a opción --time-series. (Esta posibilidade
ignórase en tódolos outros casos.)
Cando se selecciona un ficheiro de datos para agregar, pode haber un area de
solapamento co conxunto de datos existente; é dicir, unha ou máis series
poden ter unha ou máis observacións en común entre as dúas orixes. Cando
indicas a opción --update-overlap, a instrución append substitúe calquera
observación solapada cos valores do ficheiro de datos escollido; se non, os
valores que nese momento xa están no seu sitio non se ven afectados.
As opcións especiais adicionais --sheet, --coloffset, --rowoffset e
--fixed-cols funcionan do mesmo xeito que con "open"; consulta esa
instrución para obter máis explicacións.
Consulta tamén "join" para un manexo máis sofisticado de orixes de datos
múltiples.
Ruta do menú: /Ficheiro/Engadir datos
# ar Estimation
Argumentos: retardos ; depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--quiet (Non presenta as estimacións dos parámetros)
Exemplo: ar 1 3 4 ; y 0 x1 x2 x3
Calcula as estimacións dos parámetros utilizando o procedemento iterativo
xeneralizado de Cochrane-Orcutt; consulta a Sección 9.5 de Ramanathan
(2002). As iteracións rematan cando a sucesión de sumas de erros cadrados
non difire dun termo ao seguinte en máis do 0.005 por cento, ou despois de
20 iteracións.
Con "retardos" tes que indicar unha lista de retardos do termo de
perturbación, rematada por un punto e coma. No exemplo de arriba, o termo
de perturbación especifícase como
u(t) = rho(1)*u(t-1) + rho(3)*u(t-3) + rho(4)*u(t-4)
Ruta do menú: /Modelar/Series temporais univariantes/Perturbacións AR (MCX)
# ar1 Estimation
Argumentos: depvar indepvars
Opcións: --hilu (Utiliza o procedemento de Hildreth-Lu)
--pwe (Utiliza o estimador de Prais-Winsten)
--vcv (Presenta a matriz de covarianzas)
--no-corc (Non afina os resultados con Cochrane-Orcutt)
--loose (Utiliza un criterio de converxencia menos preciso)
--quiet (Non presenta nada)
Exemplos: ar1 1 0 2 4 6 7
ar1 y 0 xlista --pwe
ar1 y 0 xlista --hilu --no-corc
Calcula estimacións MCX que sexan viables para un modelo no que o termo de
perturbación asúmese que sigue un proceso autorregresivo de primeira orde.
O método utilizado por defecto é o procedemento iterativo de
Cochrane-Orcutt; por exemplo, consulta a sección 9.4 de Ramanathan (2002).
O criterio para acadar a converxencia é que as estimacións sucesivas do
coeficiente de autocorrelación, non difiran en máis de 1e-6 ou, cando
indicas a opción --loose, en máis de 0.001. Se isto non se acada antes de
que se fagan as 100 iteracións, amósase un fallo.
Cando indicas a opción --pwe, utilízase o estimador de Prais-Winsten. Isto
implica unha iteración similar á de Cochrane-Orcutt; a diferenza está en
que mentres que o método de Cochrane-Orcutt descarta a primeira
observación, o método de Prais-Winsten fai uso dela. Para obter máis
detalles consulta, por exemplo, o capítulo 13 de Greene (2000).
Cando indicas a opción --hilu, utilízase o procedemento de procura de
Hildreth-Lu. Nese caso afínanse os resultados utilizando o método de
Cochrane-Orcutt, agás que especifiques a opción --no-corc. Esta opción
--no-corc ignórase para estimadores diferentes ao do método de
Hildreth-Lu.
Ruta do menú: /Modelar/Series temporais univariantes/Perturbacións AR (MCX)
# arch Estimation
Argumentos: nivel depvar indepvars
Opción: --quiet (Non presenta nada)
Exemplo: arch 4 y 0 x1 x2 x3
Neste momento, esta instrución mantense por compatibilidade con versións
anteriores, pero saes gañando se utilizas o estimador máximo verosímil
que ofrece a instrución "garch". Se queres estimar un modelo ARCH sinxelo,
podes usar o GARCH facendo que o seu primeiro parámetro sexa 0.
Estima a especificación indicada do modelo permitindo ARCH
(Heterocedasticidade Condicional Autorregresiva). Primeiro, estímase o
modelo mediante MCO, e logo execútase unha regresión auxiliar, na que se
regresa o erro cadrado da primeira sobre os seus propios valores retardados.
O paso final é a estimación por mínimos cadrados ponderados, utilizando
como ponderacións as inversas das varianzas dos erros axustados coa
regresión auxiliar. (Se a varianza que se predí para algunha observación
da regresión auxiliar, non é positiva, entón utilízase no seu lugar o
erro cadrado correspondente).
Os valores alpha presentados debaixo dos coeficientes son os parámetros
estimados do proceso ARCH coa regresión auxiliar.
Consulta tamén "garch" e "modtest" (opción --arch).
# arima Estimation
Argumentos: p d q [ ; P D Q ] ; depvar [ indepvars ]
Opcións: --verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
--vcv (Presenta a matriz de covarianzas)
--hessian (Mira abaixo)
--opg (Mira abaixo)
--nc (Sen constante)
--conditional (Utiliza Máxima Verosimilitude condicional)
--x-12-arima (Utiliza ARIMA X-12 ou X-13 na estimación)
--lbfgs (Utiliza o maximizador L-BFGS-B)
--y-diff-only (ARIMAX especial; mira abaixo)
Exemplos: arima 1 0 2 ; y
arima 2 0 2 ; y 0 x1 x2 --verbose
arima 0 1 1 ; 0 1 1 ; y --nc
Mira tamén armaloop.inp, bjg.inp
Advertencia: arma é un alcume aceptable para esta instrución.
Cando non indicas a lista indepvars, estímase un modelo univariante ARIMA
(Autorregresivo, Integrado, de Medias móbiles). Os valores p, d e q
representan o nivel autorregresivo (AR), a orde de diferenciación e o nivel
de medias móbiles (MA), respectivamente. Podes indicar estes valores en
formato numérico, ou como nomes de variables escalares xa existentes. Por
exemplo, un valor de 1 para d significa que, antes de estimar os parámetros
do ARMA, debe de tomarse a primeira diferenza da variable dependente.
Se queres incluír no modelo só retardos AR ou MA específicos (en
contraposición a todos os retardos ata un nivel indicado) podes substituír
por p e/ou q ben (a) o nome dunha matriz definida previamente que contén un
conxunto de valores enteiros, ou ben (b) unha expresión tal como {1,4}; é
dicir, un conxunto de retardos separados con comas e contornados entre
chaves.
Os valores enteiros P, D e Q (opcionais) representan o nivel AR estacional,
a orde de diferenciación estacional e o nivel MA estacional,
respectivamente. Estas ordes só as podes aplicar cando os datos teñen unha
frecuencia maior ca 1 (por exemplo, con datos trimestrais ou mensuais); e
podes indicalas en formato numérico ou como variables escalares.
No caso univariante, por defecto inclúese no modelo unha ordenada na orixe,
pero podes eliminar isto por medio da opción --nc. Cando engades indepvars,
o modelo vólvese un ARMAX; neste caso, debes de incluír a constante
explicitamente se queres ter a ordenada na orixe (como no segundo exemplo de
arriba).
Dispós dunha forma alternativa de sintaxe para esta instrución: se non
queres aplicar diferenzas (nin estacionais nin non estacionais), podes
omitir os dous campos d e D á vez, mellor que introducir explicitamente 0.
Ademais, arma é un alias ou sinónimo de arima e así, por exemplo, a
seguinte instrución é un xeito válido de especificar un modelo ARMA(2,
1):
arma 2 1 ; y
Por defecto, utilízase a funcionalidade ARMA "propia" de GRETL, coa
estimación Máximo Verosímil (MV) exacta; pero dispós da opción de facer
a estimación mediante MV condicional. (Se o programa ARIMA X-12 está
instalado no ordenador, tes a posibilidade de utilizalo en vez do código
propio. Ten en conta que, do mesmo xeito, o máis recente X13 pode funcionar
coma un recambio automático.) Para outros detalles relacionados con estas
opcións, consulta o Manual de usuario de Gretl (Capítulo 31).
Cando se utiliza código propio de MV exacta, as desviacións padrón
estimadas baséanse por defecto nunha aproximación numérica á (inversa
negativa da) matriz Hessiana, cun último recurso ao Produto Externo do
vector Gradiente (PEG) se o cálculo da matriz Hessiana numérica puidera
fallar. Podes utilizar dous indicadores de opción (mutuamente excluíntes)
para forzar esta cuestión: mentres que a opción --opg forza a utilización
do método PEG, sen intentar calcular a matriz Hessiana, a opción --hessian
inhabilita o último recurso a PEG. Ten en conta que un fallo no cálculo da
matriz Hessiana numérica, é xeralmente un indicador de que un modelo está
mal especificado.
A opción --lbfgs é específica da estimación que utiliza código ARMA
propio e Máxima Verosimilitude exacta; e solicita que se utilice o
algoritmo de "memoria limitada" L-BFGS-B en vez do maximizador BFGS
habitual. Isto pode ser de axuda nalgúns casos nos que a converxencia é
difícil de acadar.
A opción --y-diff-only é específica da estimación de modelos ARIMAX
(modelos con orde de integración non nula, nos que se inclúen regresores
esóxenos) e aplícase só cando se utiliza a Máxima Verosimilitude exacta
propia de GRETL. Para eses modelos, o comportamento por defecto consiste en
calcular as primeiras diferenzas tanto da variable dependente como dos
regresores; pero cando indicas esta opción, só se calcula para a variable
dependente, quedando os regresores en niveis.
O valor do AIC de Akaike indicado en conexión con modelos ARIMA, calcúlase
de acordo coa definición que utiliza o ARIMA X-12, concretamente
AIC = -2L + 2k
onde L é o logaritmo da verosimilitude e k é o número total de
parámetros estimados. Observa que o ARIMA X-12 non produce criterios de
información tales como AIC cando a estimación é por Máxima
Verosimilitude condicional.
As raíces AR e MA amosadas en conexión coa estimación ARMA baséanse na
seguinte representación dun proceso ARMA(p, q):
(1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y =
c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t
Polo tanto, as raíces AR son as solucións a
1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0
e a estabilidade require que estas raíces se atopen fóra do círculo de
radio unitario.
A cantidade "Frecuencia" presentada en conexión coas raíces AR e MA, é o
valor lambda que soluciona z = r * exp(i*2*pi*lambda) onde z é a raíz en
cuestión e r é o seu módulo.
Ruta do menú: /Modelar/Series temporais univariantes/ARIMA
# arma Estimation
Consulta "arima"; arma é un alcume.
# bds Tests
Argumentos: orde x
Opcións: --corr1=rho (Mira abaixo)
--sdcrit=multiple (Mira abaixo)
--boot=N (Mira abaixo)
--matrix=m (Usa unha entrada matricial)
--quiet (Suprime a presentación de resultados)
Exemplos: bds 5 x
bds 3 --matrix=m
bds 4 --sdcrit=2.0
Realiza a proba BDS (Brock, Dechert, Scheinkman e LeBaron, 1996) de non
linearidade para a serie x. No contexto econométrico, isto aplícase
habitualmente para comprobar se as perturbacións dunha regresión incumpren
a condición IID (distribución idéntica e independente). A proba baséase
nun conxunto de integrais de correlación, amañadas para detectar a non
linearidade de dimensión progresivamente maior; e establécese o número
desas integrais co argumento orde. Estas deben de ser polo menos 2; coa
primeira integral establécese unha referencia de partida, pero sen que
permita unha proba. A proba BDS é de tipo "portmanteau": axeitada para
detectar toda clase de desvíos respecto da linearidade, pero non
clarificadora do xeito exacto no que se incumpre a condición.
En troques de indicar x como serie, podes usar a opción --matrix para
especificar unha matriz como entrada, que debe ter forma de vector (columna
ou fila).
Criterio de proximidade
As integrais de correlación están baseadas nunha medida de "proximidade"
entre os puntos dos datos, de xeito que se consideran próximos a dous deses
puntos se están situados un do outro a menos de ε. Dado que a proba
necesita que se especifique ε, por defecto, GRETL segue a recomendación de
Kanzler (1999): ε elíxese de modo que a integral de correlación de
primeira orde estea arredor de 0.7. Unha alternativa habitual (que require
menos cálculos) consiste en especificar ε como un múltiplo da desviación
padrón da serie de interese. A opción --sdcrit permite este derradeiro
método; así, no terceiro exemplo indicado máis arriba, ε establécese
que sexa igual a dúas veces a desviación padrón de x. A opción --corr1
implica a utilización do método de Kanzler pero permite outra correlación
obxectivo diferente de 0.7. Debería quedarche claro que estas dúas
opcións exclúense mutuamente.
Mostraxe repetida
Os estatísticos da proba BDS teñen distribución asintótica de tipo
N(0,1), pero a proba rexeita demasiado a hipótese nula de xeito moi notable
con mostras de tamaño entre pequeno e moderado. Por ese motivo, os valores
P obtéñense por defecto mediante mostraxe repetida (bootstrapping) cando x
ten unha longura menor que 600 (e con referencia á distribución Normal,
noutro caso). Se queres utilizar a mostraxe repetida con mostras máis
longas, podes forzar esta cuestión indicando un valor non nulo para a
opción --boot. Pola contra, se non queres que se faga a mostraxe repetida
coas mostras máis pequenas, indica un valor de cero para --boot.
Cando se fai a mostraxe repetida, o número de iteracións por defecto é de
1999; pero podes especificar un número diferente indicando un valor maior
ca 1 coa opción --boot.
Matriz accesoria
Cando se completa con éxito a execución desta instrución, "$result"
proporciona os resultados da proba en forma dunha matriz con dúas filas e
orde - 1 columnas. A primeira fila contén os estatísticos de proba e a
segunda os valores P, de cada unha das probas por dimensión, baixo a
hipótese nula de que x é linear/IID.
# biprobit Estimation
Argumentos: depvar1 depvar2 indepvars1 [ ; indepvars2 ]
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para aclaración)
--opg (Mira abaixo)
--save-xbeta (Mira abaixo)
--verbose (Presenta información adicional)
Exemplos: biprobit y1 y2 0 x1 x2
biprobit y1 y2 0 x11 x12 ; 0 x21 x22
Mira tamén biprobit.inp
Estima un modelo probit bivariante utilizando o método de Newton-Raphson
para maximizar a verosimilitude.
A lista de argumentos comeza coas dúas variables (binarias) dependentes,
seguidas dunha lista de regresores. Cando indicas unha segunda lista
(separada por un punto e coma) se entende como un grupo de regresores
específicos da segunda ecuación, sendo indepvars1 específica da primeira
ecuación; se non, indepvars1 considérase que representa un conxunto de
regresores común.
Por defecto, as desviacións padrón calcúlanse utilizando a matriz
Hessiana analítica ao converxer. Pero se indicas a opción --opg, a matriz
de covarianzas baséase no Produto Externo do vector Gradiente (PEG ou OPG);
ou se indicas a opción --robust, calcúlanse as desviacións padrón case
máximo verosímiles (QML), utilizando un "emparedado" entre a inversa da
matriz Hessiana e o PEG.
Cae na conta de que a estimación de rho (a correlación dos termos de erro
entre as dúas ecuacións) inclúese no vector de coeficientes; é o
derradeiro elemento dos accesorios coeff, stderr e vcv.
Logo dunha estimación correcta, o accesorio $uhat permite recuperar unha
matriz con 2 columnas que contén os erros xeneralizados das dúas
ecuacións; é dicir, os valores agardados das perturbacións condicionadas
aos resultados observados e ás variables covariantes. Por defecto, $yhat
permite recuperar unha matriz con 4 columnas que contén as probabilidades
estimadas dos 4 posibles resultados conxuntos para (y_1, y_2), na orde
(1,1), (1,0), (0,1), (0,0). Alternativamente, cando indicas a opción
--save-xbeta, entón $yhat ten 2 columnas e contén os valores das funcións
índice das ecuacións respectivas.
O resultado inclúe unha proba da hipótese nula de que as perturbacións
das dúas ecuacións non están correlacionadas. Esta é unha proba de
Razón de Verosimilitudes agás que se solicite o estimador case máximo
verosímil (QML) da varianza, en cuxo caso utilízase a proba de Wald.
# bkw Tests
Opción: --quiet (Non presenta nada)
Exemplos: longley.inp
Debe de ir despois da estimación dun modelo que conteña cando menos dúas
variables explicativas. Calcula e presenta información de diagnóstico en
relación á multicolinearidade, en concreto a Táboa BKW que está baseada
no traballo de Belsley, Kuh e Welsch (1980). Esta táboa presenta unha
sofisticada análise do grao e das causas da multicolinearidade, mediante o
exame dos autovalores da inversa da matriz de correlacións. Para ter unha
explicación polo miúdo do enfoque BKW en relación a GRETL, e con diversos
exemplos, consulta Adkins, Waters e Hill (2015).
Despois de utilizar esta instrución, podes usar o accesorio "$result" para
recuperar a táboa BKW en forma de matriz. Consulta tamén a instrución
"vif" para obter un enfoque máis sinxelo da diagnose da multicolinearidade.
Hai tamén unha función chamada "bkw" que ofrece unha maior flexibilidade.
Ruta do menú: Xanela de modelo: Análise/Multicolinearidade
# boxplot Graphs
Argumento: listavariables
Opcións: --notches (Amosa o intervalo do 90 por cento para a mediana)
--factorized (Mira abaixo)
--panel (Mira abaixo)
--matrix=nome (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Estas gráficas amosan a distribución dunha variable. Unha caixa central
encerra o 50 por cento central dos datos; i.e. está deslindada polo
primeiro e terceiro cuartís. Un "bigote" esténdese desde cada límite da
caixa cun rango igual a 1.5 veces o rango intercuartil. As observacións que
están fóra dese rango considéranse valores atípicos e represéntanse
mediante puntos. Debúxase unha liña ao largo da caixa na mediana. O signo
"+" utilízase para indicar a media. Se escolles a opción de amosar un
intervalo de confianza para a mediana, este calcúlase mediante o método
bootstrap e amósase con formato de liñas con raias horizontais por arriba
e/ou abaixo da mediana.
A opción --factorized te permite examinar a distribución da variable
elixida condicionada ao valor de algún factor discreto. Por exemplo, se un
conxunto de datos contén unha variable cos salarios e unha variable
ficticia co xénero, podes escoller a dos salarios como obxectivo e a do
xénero como o factor, para ver así as gráficas de caixas de salarios de
homes e mulleres, unha a carón da outra, como en
boxplot salario xenero --factorized
Ten en conta que neste caso debes de especificar exactamente só dúas
variables, co factor indicado en segundo lugar.
Cando tes un conxunto vixente de datos de panel e especificas só unha
variable, a opción --panel produce unha serie de gráficas de caixas (unha
a carón da outra) na que cada unha se corresponde cun grupo ou "unidade" do
panel.
Xeralmente requírese o argumento listavariables que se refire a unha ou
máis series do conxunto vixente de datos (indicadas ben polo nome ou ben
polo número ID). Pero se, mediante a opción --matrix, indicas unha matriz
xa definida, este argumento convértese en opcional pois, por defecto,
debúxase unha gráfica para cada columna da matriz especificada.
As gráficas de caixas en GRETL xéranse utilizando a instrución gnuplot, e
resulta posible especificar con maior detalle a gráfica engadindo
instrucións adicionais de Gnuplot, contornadas entre chaves. Para obter
máis detalles, consulta a axuda para a instrución "gnuplot".
En modo interactivo, o resultado amósase inmediatamente. En modo de
procesamento por lotes, o proceder por defecto consiste en escribir un
ficheiro de instrucións de Gnuplot no cartafol de traballo do usuario, cun
nome co padrón gpttmpN.plt, comezando con N = 01. Podes xerar as gráficas
máis tarde utilizando o gnuplot (ou ben wgnuplot baixo MS Windows). Podes
modificar este comportamento mediante o uso da opción
--output=nomeficheiro. Se queres obter máis detalles, consulta a
instrución "gnuplot".
Ruta do menú: /Ver/Gráfica de variables indicadas/Gráficas de caixa
# break Programming
Fuxida dun bucle. Podes utilizar esta instrución só dentro dun bucle; iso
provoca que a execución de instrucións fuxa do bucle actual (do máis
interior, se hai varios aniñados). Consulta tamén "loop", "continue".
# catch Programming
Sintaxe: catch command
Esta non é unha instrución por si mesma, pero podes utilizala como prefixo
na maioría das instrucións habituais: o seu efecto é o de previr que
remate dun guión de instrucións se ocorre un fallo ao executar unha delas.
Se aparece un fallo, isto rexístrase cun código de fallo interno ao que
podes acceder con $error (un valor de 0 indica éxito). Inmediatamente
despois de utilizar catch deberías de verificar sempre cal é o valor de
$error, e realizar unha acción axeitada se fallou unha das instrucións.
Non podes utilizar a palabra chave catch antes de if, elif ou endif.
Ademais, non debe de utilizarse en peticións a funcións definidas polo
usuario, pois preténdese utilizala só coas instrucións de GRETL e coas
peticións aos operadores ou funcións "internos". Máis aínda, non podes
usar catch combinada coa asignación mediante "frecha atrás" de modelos ou
gráficas, a iconas de sesión (consulta o Manual de usuario de Gretl
(Capítulo 3)).
# chow Tests
Variantes: chow obs
chow dummyvar --dummy
Opcións: --dummy (Utiliza unha variable ficticia xa existente)
--quiet (Non presenta as estimacións do modelo ampliado)
--limit-to=lista (Limita a proba a un subconxunto de regresores)
Exemplos: chow 25
chow 1988:1
chow muller --dummy
Debe de ir a continuación dunha regresión MCO (OLS). Se indicas un número
de observación ou unha data, proporciona unha proba respecto á hipótese
nula de que non existe cambio estrutural no punto de corte indicado. O
procedemento consiste en crear unha variable ficticia que toma o valor 1
desde o punto de corte especificado por obs ata o final da mostra, e 0
noutro caso, así como xerar termos de interacción entre esa ficticia e os
regresores orixinais. Se indicas unha ficticia, próbase esa hipótese nula
de homoxeneidade estrutural respecto desa variable ficticia, e tamén
engádense termos de interacción. En cada caso execútase unha regresión
ampliada incluíndo os termos adicionais.
Por defecto, calcúlase un estatístico F, considerando a regresión
ampliada como o modelo sen restricións e o modelo orixinal como o
restrinxido. Pero se o modelo orixinal utilizou un estimador robusto para a
matriz de covarianzas, o estatístico de proba é un de Wald con
distribución khi-cadrado; co seu valor baseado nun estimador robusto da
matriz de covarianzas da regresión ampliada.
Podes utilizar a opción --limit-to para limitar o conxunto de termos de
interacción coa variable ficticia de corte, a un subconxunto dos regresores
orixinais. O argumento para esta opción debe de ser unha lista xa definida
na que todos os seus elementos estean entre os regresores orixinais, e non
debe de incluír a constante.
Ruta do menú: Xanela de modelo: Probas/Proba de Chow
# clear Programming
Opcións: --dataset (Libra só o conxunto de datos)
--functions (Elimina as funcións (unicamente))
Por defecto, esta instrución quita da memoria o conxunto de datos vixente
(se hai algún), amais de todas as variables gardadas (escalares, matrices,
etc.). Ten en conta que tamén tes este efecto ao abrir un novo conxunto de
datos, ou ao utilizar a instrución "nulldata" para crear un conxunto de
datos baleiro; por iso normalmente non necesitas facer uso explícito de
"clear".
Cando indicas a opción --dataset, entón só se limpa o conxunto de datos
(máis calquera lista de series definida); outros obxectos gardados como
matrices, escalares ou feixes, vanse conservar.
Cando indicas a opción --functions, entón se elimina da memoria calquera
función definida polo usuario e calquera función definida nos paquetes que
teñas cargados. O conxunto de datos e outras variables non se ven
afectados.
# coeffsum Tests
Argumento: listavariables
Opción: --quiet (Non presenta nada)
Exemplos: coeffsum xt xt_1 xr_2
Mira tamén restrict.inp
Debe de ir despois dunha regresión. Calcula a suma dos coeficientes das
variables do argumento listavariables. Presenta esta suma xunto coa súa
desviación padrón e a probabilidade asociada ao estatístico para probar a
hipótese nula de que a suma é cero.
Ten en conta a diferenza entre isto e a instrución "omit", pois esta
última te permite probar a hipótese nula de que os coeficientes dun
subconxunto especificado de variables independentes son todos nulos.
A opción --quiet pódeche ser útil se o único que queres é acceder aos
valores de "$test" e de "$pvalue" que se rexistran logo de terminar a
estimación con éxito.
Ruta do menú: Xanela de modelo: Probas/Suma dos coeficientes
# coint Tests
Argumentos: nivel depvar indepvars
Opcións: --nc (Sen constante)
--ct (Con constante e tendencia)
--ctt (Con constante máis tendencia linear e cadrada)
--seasonals (Con variables ficticias estacionais)
--skip-df (Sen probas DF sobre as variables individuais)
--test-down[=criterio] (Nivel de retardos automático)
--verbose (Presenta detalles adicionais das regresións)
--silent (Non presenta nada)
Exemplos: coint 4 y x1 x2
coint 0 y x1 x2 --ct --skip-df
Proba de cointegración de Engle-Granger (1987). O proceso por defecto
consiste en: (1) realizar as probas de Dickey-Fuller respecto á hipótese
nula de que cada unha das variables enumeradas ten unha raíz unitaria; (2)
estimar a regresión de cointegración; e (3) facer unha proba DF respecto
aos erros que comete a regresión de cointegración. Cando se indica a
opción --skip-df, omítese o paso (1).
Se o nivel especificado de retardos é positivo, todas as probas de
Dickey-Fuller usan ese nivel pero con este requisito: cando se indica a
opción --test-down, o valor indicado tómase como un máximo, e o nivel
concreto de retardos que se utilizará en cada caso obtense probando cara
abaixo. Consulta a instrución "adf" para obter máis detalles sobre este
procedemento.
Por defecto, a regresión de cointegración contén unha constante pero, se
queres eliminar a constante, engade a opción --nc. Se queres ampliar a
lista de termos determinísticos na regresión de cointegración con
tendencia linear (ou linear e cadrada), engade a opción --ct (ou --ctt).
Estes indicadores de opción son mutuamente excluíntes. Tamén tes a
posibilidade de engadir variables ficticias estacionais (no caso de utilizar
datos trimestrais ou mensuais).
Os valores P (probabilidades asociadas) desta proba baséanse en MacKinnon
(1996). O código relevante inclúese co amable permiso do propio autor.
Para obter as probas de cointegración de Søren Johansen, consulta
"johansen".
Ruta do menú: /Modelar/Series temporais multivariantes
# continue Programming
Podes usar esta instrución só dentro dun bucle; o seu efecto consiste en
saltarse os enunciados posteriores que haxa dentro da iteración vixente do
bucle (máis interno) vixente. Consulta tamén "loop", "break".
# corr Statistics
Variantes: corr [ listavariables ]
corr --matrix=nomematriz
Opcións: --uniform (Garante unha mostra uniforme)
--spearman (Rho de Spearman)
--kendall (Tau de Kendall)
--verbose (Presenta xerarquías)
--plot=modo-ou-nomeficheiro (Mira abaixo)
--triangle (Representa só a metade inferior, mira abaixo)
Exemplos: corr y x1 x2 x3
corr ylista --uniform
corr x y --spearman
corr --matrix=X --plot=display
Por defecto, presenta os coeficientes de correlación (correlación
produto-momento de Pearson) por pares das variables de listavariables, ou de
tódalas variables do conxunto de datos se non indicas listavariables. O
comportamento típico desta instrución consiste en utilizar tódalas
observacións dispoñibles para calcular cada coeficiente por parellas de
variables, pero cando indicas a opción --uniform, a mostra limítase (se é
necesario) de xeito que se utiliza o mesmo conxunto de observacións para
todos os coeficientes. Esta opción é adecuada só cando hai un número
diferente de valores ausentes nas variables utilizadas.
As opcións --spearman e --kendall (que son mutuamente excluíntes) permiten
calcular, respectivamente, o coeficiente rho de correlación por rangos de
Spearman e o coeficiente tau de correlación por rangos de Kendall en
troques do coeficiente de Pearson (por defecto). Cando indicas algunha
destas opcións, listavariables debe de conter só dúas variables.
Cando se calcula unha correlación por rangos, podes utilizar a opción
--verbose para presentar os datos orixinais e a súa xerarquía (se non,
esta alternativa ignórase).
Se listavariables contén máis de dúas series e o programa non está en
modo de procesamento por lotes, amósase unha gráfica de "mapa de calor" da
matriz de correlacións. Podes axustar isto mediante a opción --plot, na
que os parámetros que se admiten son: none (para non amosar a gráfica),
display (para presentar a gráfica mesmo cando se estea en modo de
procesamento por lotes), ou un nome de ficheiro. O efecto de indicar un nome
de ficheiro é como o descrito para a opción --output da instrución
"gnuplot". Cando activas a representación da gráfica, podes utilizar a
opción --triangle para amosar só o mapa de calor do triángulo inferior da
matriz.
Cando indicas unha forma alternativa, utilizando unha matriz xa definida en
lugar dunha lista de series, as opcións --spearman e --kendall non están
dispoñibles (pero consulta a función "npcorr").
Podes usar o accesorio "$result" para obter as correlacións en forma de
matriz.
Ruta do menú: /Ver/Matriz de correlacións
Outro acceso: Xanela principal: Menú emerxente (tras selección múltiple)
# corrgm Statistics
Argumentos: serie [ nivel ]
Opcións: --bartlett (Utiliza as desviacións padrón de Bartlett)
--plot=modo-ou-nomeficheiro (Mira abaixo)
--quiet (Non presenta a gráfica)
Exemplo: corrgm x 12
Presenta os valores da función de autocorrelación (FAC) do argumento
serie, que pode especificarse polo seu nome ou seu número. Os valores
defínense como rho(u_t, u_t-s) onde u_t é a t-ésima observación da
variable u e s denota o número de retardos.
Tamén se presentan as autocorrelacións parciais (FACP, que se calculan
utilizando o algoritmo de Durbin-Levinson), e que están libres dos efectos
dos retardos intermedios. Ademais, preséntase o estatístico Q de Ljung-Box
que podes utilizar para probar a hipótese nula de que a serie é un "ruído
branco", e que se distribúe asintoticamente como unha khi-cadrado con
tantos graos de liberdade como o número de retardos utilizados.
Utilízanse asteriscos para indicar a significación estatística das
autocorrelacións individuais. Por defecto, isto avalíase utilizando unha
desviación padrón igual ao cociente entre 1 e a raíz cadrada do tamaño
da mostra; pero cando indicas a opción --bartlett, entón utilízanse as
desviacións padrón de Bartlett para a FAC. Se resulta aplicable, esta
opción tamén determina a banda de confianza que se debuxa na gráfica da
FAC.
Se especificas un valor para nivel, a lonxitude do correlograma limítase
ata ese número de retardos como máximo; se non, a longura determínase
automaticamente como unha función da frecuencia dos datos e do número de
observacións.
Por defecto, xérase unha gráfica do correlograma: unha gráfica de Gnuplot
en modo interactivo ou unha gráfica ASCII en modo de procesamento por
lotes. Isto podes axustalo mediante a opción --plot na que os parámetros
que se admiten son: none (para non amosar a gráfica), ascii (para presentar
unha gráfica de texto mesmo en modo interactivo), display (para presentar
unha gráfica de Gnuplot mesmo en modo de procesamento por lotes); ou un
nome de ficheiro. O efecto de indicar un nome de ficheiro é como o descrito
para a opción --output da instrución "gnuplot".
Cando se completa con éxito esta instrución, os accesorios "$test" e
"$pvalue" conteñen os dous valores respectivos da proba de Ljung-Box para o
máximo nivel de retardo presentado. Se unicamente queres calcular o
estatístico Q, ten en conta que probablemente será preferible que utilices
en troques a función "ljungbox".
Ruta do menú: /Variable/Correlograma
Outro acceso: Xanela principal: Menú emerxente (selección única)
# cusum Tests
Opcións: --squares (Realiza a proba CUSUMSQ)
--quiet (Só presenta a proba de Harvey-Collier)
--plot=Modo-ou-nomeficheiro (Mira abaixo)
Debe de ir despois da estimación dun modelo mediante MCO. Te permite levar
adiante a proba CUSUM de estabilidade dos parámetros (ou a proba CUSUMSQ se
indicas a opción --squares). Vas obter unha serie cos erros de predición
adiantados un paso, executando unha serie de regresións. Na primeira
regresión se utilizan as primeiras k observacións e permíteche xerar a
predición da variable dependente na observación k + 1; na segunda se
utilizan as primeiras k + 1 observacións e xérase unha predición para a
observación k + 2, e así sucesivamente (onde k é o número de parámetros
do modelo orixinal).
Preséntase a suma acumulada dos erros de predición escalados (ou os
cadrados destes erros). A hipótese nula de estabilidade dos parámetros
rexéitase cun nivel de significación do 5 por cento cando a suma acumulada
se afasta da banda de confianza do 95 por cento.
No caso da proba CUSUM, tamén se presenta o estatístico t de
Harvey-Collier para probar a hipótese nula de estabilidade dos parámetros.
Consulta o libro Econometric Analysis de Greene para obter máis detalles.
Para a proba CUSUMSQ, calcúlase a banda de confianza do 95 por cento
utilizando o algoritmo indicado en Edgerton e Wells (1994).
Por defecto, cando o programa non está en modo de procesamento por lotes,
amósase unha gráfica coa serie acumulada e o intervalo de confianza. Podes
axustar isto mediante a opción --plot. Os parámetros admisibles para esta
opción son none (para omitir a gráfica); display (para visualizar unha
gráfica mesmo estando en modo de procesamento por lotes); ou o nome dun
ficheiro. O efecto de proporcionar o nome dun ficheiro é como o descrito
para a opción --output da instrución "gnuplot".
Ruta do menú: Xanela de modelo: Probas/Proba CUSUM(SQ)
# data Dataset
Argumento: listavariables
Opcións: --compact=método (Especifica o método para compactar)
--quiet (Non amosa os resultados agás no caso de fallo)
--name=identificador (Renomea series importadas)
--odbc (Importa dun banco de datos ODBC)
--no-align (Específico para ODBC, mira abaixo)
Le as variables de listavariables dun ficheiro de banco de datos (propio de
GRETL, RATS 4.0 ou PcGive) que debe de abrirse previamente utilizando a
instrución "open". Podes usar a instrución data para importar series de
DB.NOMICS ou dun banco de datos ODBC; para obter detalles sobre estas
variantes consulta gretl + DB.NOMICS ou o Manual de usuario de Gretl
(Capítulo 42), respectivamente.
Podes establecer a frecuencia dos datos e o rango da mostra mediante as
instrucións "setobs" e "smpl", antes de utilizar esta instrución. Este é
un exemplo:
open fedstl.bin
setobs 12 2000:01
smpl ; 2019:12
data unrate cpiaucsl
As instrucións de arriba abren o banco de datos (que se ofrece con GRETL)
chamado fedstl.bin, determinan que os datos son mensuais, que comezan en
xaneiro de 2000, que a mostra finaliza en decembro de 2019, e que se
importan as series denominadas unrate (taxa de desemprego) e cpiaucsl (IPC
de todos).
Se non especificas setobs e smpl deste xeito, a frecuencia dos datos e o
rango da mostra establécense utilizando a primeira variable que se le do
banco de datos.
Se as series que se van ler son de frecuencia maior que o conxunto de datos
de traballo, podes especificar un método para compactar como aquí debaixo:
data LHUR PUNEW --compact=average
Os cinco métodos que permiten compactar dos que dispós son estes:
"average" (toma a media das observacións de alta frecuencia), "last"
(utiliza a última observación), "first", "sum" e "spread", pero se non
especificas ningún método, por defecto utilízase a media. O método
"spread" é especial pois con el non se perde ningunha información, senón
que máis ben esta espállase entre varias series, unha por cada
subperíodo. Así con ela cando engades, por exemplo, unha serie mensual a
un conxunto de datos trimestrais, xéranse 3 series (unha por cada mes do
trimestre) cuxos nomes conteñen os sufixos m01, m02 e m03.
Cando as series que se len son de frecuencia menor que a do conxunto de
datos de traballo, os valores dos datos engadidos sinxelamente repítense
segundo se necesite; pero cae na conta de que podes utilizar a función
"tdisagg" para solicitar que se faga unha distribución ou unha
interpolación ("desagregación temporal ").
No caso de bancos de datos propios (unicamente) de GRETL, podes utilizar os
caracteres "xenéricos", * e ? en listavariables para importar series que
coincidan co padrón indicado. Por exemplo, a seguinte expresión vai
importar todas as series do banco de datos cuxos nomes comecen por cpi:
data cpi*
Podes usar a opción --name para determinar un nome distinto do nome
orixinal no banco de datos, para a seire importada. O parámetro debe de ser
un identificador válido de GRETL. Esta opción restrínxese ao caso no que
especificas unha única serie a importar.
A opción --no-align aplícase só para importar series mediante ODBC. Por
defecto, necesítase que a solicitude ODBC devolva información que indique
a GRETL en que filas do conxunto de datos situar os datos que se reciben (ou
que o número de valores que se reciben coincida, cando menos, ben coa
longura do conxunto de datos ou ben coa longura do rango da mostra vixente).
Determinando a opción --no-align reláxase este requisito: se non se
cumpren estas condicións mencionadas, os valores que se reciben sitúanse
simplemente de xeito consecutivo, comezando na primeira fila do conxunto de
datos. Se o número deses valores é menor que o de filas no conxunto de
datos, as filas do final énchense con NAs; se o número é maior que o de
filas, se descartan os valores extra. Para obter máis información sobre
como importar con ODBC, consulta o Manual de usuario de Gretl (Capítulo
42).
Ruta do menú: /Ficheiro/Bancos de datos
# dataset Dataset
Argumentos: chave parámetros
Opción: --panel-time (Mira abaixo 'addobs')
Exemplos: dataset addobs 24
dataset addobs 2 --panel-time
dataset insobs 10
dataset compact 1
dataset compact 4 last
dataset expand
dataset transpose
dataset sortby x1
dataset resample 500
dataset renumber x 4
dataset pad-daily 7
dataset unpad-daily
dataset clear
Realiza diversas operacións no conxunto de datos como un todo, dependendo
da chave indicada, que debe de ser: addobs, insobs, clear, compact, expand,
transpose, sortby, dsortby, resample, renumber, pad-daily ou unpad-daily.
Advertencia: Coa excepción da opción clear, estas accións non están
dispoñibles mentres teñas unha submostra do conxunto de datos, escollida
por selección dos casos segundo algún criterio booleano.
addobs: Debe de estar seguido dun enteiro positivo, digamos n. Engade as n
observacións adicionais ao final do conxunto de datos de traballo. Isto
está pensado principalmente co propósito de facer predicións. Os valores
da maioría das variables ao longo do rango engadido vanse estipular como
ausentes, pero certas variables determinísticas se recoñecen, e o seu
contido esténdese ao rango engadido; en concreto, as variables con
tendencia linear simple e as variables ficticias periódicas. Se o conxunto
de datos ten a estrutura dun panel, a acción predeterminada consiste en
engadir n unidades de sección cruzada ao panel; pero se indicas a opción
--panel-time, o efecto consiste en engadir n observacións ás series
temporais para cada unidade.
insobs: Debe de estar seguido dun enteiro positivo (non maior ca o número
vixente de observacións) que especifica a posición na que se insire unha
única observación. Todos os datos posteriores desprázanse un lugar e o
conxunto de datos amplíase nunha observación. Agás á constante,
dánselle valores ausentes a todas as variables na nova observación. Esta
acción non está dispoñible para conxuntos de datos de panel.
clear: Non necesita ningún parámetro. Libra todos os datos vixentes,
devolvendo o GRETL a o seu estado "baleiro" inicial.
compact: Debe de estar seguido dun enteiro positivo que represente a nova
frecuencia dos datos, e que debe de ser menor que a frecuencia vixente (por
exemplo, indicar un valor de 4 cando a frecuencia vixente é 12, indica que
se van compactar os datos de mensuais a trimestrais). Esta instrución só
está dispoñible para datos de series temporais e compacta todas as series
do conxunto de datos a unha nova frecuencia. Tamén podes indicar un segundo
parámetro, en concreto un de entre sum, first, last ou spread. Estes
permiten especificar que se vai compactar utilizando, respectivamente: a
suma dos valores de frecuencia maior, o valor de inicio-de-período, o valor
de fin-de-período, ou espallando os valores de frecuencia maior entre
varias series (unha por cada subperíodo), pois por defecto faise usando a
media.
expand: Esta instrución só está dispoñible para datos de series
temporais anuais ou trimestrais, pois os datos anuais pódense estender a
trimestrais ou mensuais, e os datos trimestrais a mensuais. Todas as series
do conxunto de datos énchense coa nova frecuencia repetindo os valores
existentes. Se o banco de datos orixinal é anual, a extensión por defecto
é a trimestral, pero a función expand pode estar seguida de 12 para
solicitar que sexa a mensual.
transpose: Non necesita ningún parámetro adicional. Traspón o conxunto
vixente de datos, é dicir, cada observación (fila) do conxunto vixente de
datos vaise tratar como unha variable (columna), e cada variable como unha
observación. Esta instrución pode serte útil se os datos se leron
dalgunha orixe externa na que as filas da táboa de datos representan
variables.
sortby: Requírese o nome dunha única serie ou lista. Cando indicas unha
serie, as observacións de todas as variables do conxunto de datos vólvense
ordenar segundo os valores ascendentes da serie especificada. Cando indicas
unha lista, a reordenación faise xerarquicamente: se hai observacións
empatadas ao reordenarse segundo a primeira variable chave, entón a segunda
chave utilízase para rachar o empate, e así sucesivamente ata que se rache
o empate ou se esgoten as chaves. Cae na conta de que esta instrución está
dispoñible só para datos sen data.
dsortby: Funciona como sortby agás que a reordenación faise segundo os
valores descendentes da serie chave.
resample: Constrúe un novo conxunto de datos mediante mostraxe aleatoria
(con substitución) das filas do conxunto vixente de datos, e require que
indiques como argumento o número concreto de filas que queres incluír.
Este pode ser menor, igual ou maior ca o número de observacións dos datos
orixinais. Podes recuperar o conxunto orixinal de datos mediante a
instrución smpl full.
renumber: Require o nome dunha serie xa existente seguida dun número
enteiro entre 1 e o número de series do conxunto de datos menos 1. Move a
serie especificada á posición indicada do conxunto de datos, volvendo
numerar as demais series conforme a isto. (A posición 0 ocúpase coa
constante, que non pode moverse.)
pad-daily: Válido só cando o conxunto vixente de datos contén datos con
datas diarias cun calendario incompleto. Ten como efecto encher os datos nun
calendario completo inserindo filas en branco (é dicir, filas que non
conteñen nada agás NAs). Esta opción require un número enteiro como
parámetro, concretamente o número de días por semana (5, 6 ou 7), e que
debe de ser maior ou igual que a frecuencia vixente dos datos. Cando se
completa con éxito, o calendario de datos vai estar "completo" en relación
a este valor. Por exemplo, se días-por-semana é igual a 5, entón
represéntanse tódolos días laborables, haxa ou non algún dato
dispoñible para eses días.
unpad-daily: Válido só cando o conxunto vixente de datos contén datos con
datas diarias, en cuxo caso isto realiza a operación inversa a pad-daily.
Isto é, elimínase calquera fila que non conteña NAs, mentres que se
conserva a propiedade de series temporais do conxunto de datos xunto coas
datas das observacións individuais.
Ruta do menú: /Datos
# delete Dataset
Variantes: delete listavariables
delete nomevar
delete --type=tipo
delete nomepaquete
Opcións: --db (Elimina series do banco de datos)
--force (Mira abaixo)
Esta instrución é un destrutor. Deberías de utilizala con precaución
pois non se pide confirmación.
Na primeira variante de arriba, listavariables é unha lista de series,
indicada polo seu nome ou número ID. Ten en conta que cando eliminas
series, vólvese a numerar calquera serie cuxo número ID sexa maior que os
das series da lista que se elimina. Se indicas a opción --db, as series da
lista non se eliminan con esta instrución do conxunto vixente de datos,
pero si do banco de datos de GRETL (supoñendo que se abriu un deles e que o
usuario ten permisos para escribir no ficheiro en cuestión). Consulta
tamén a instrución "open".
Na segunda variante, podes indicar o nome dun escalar, dunha matriz, dunha
cadea de texto ou dun feixe, para que se elimine. A opción --db non pode
aplicarse neste caso. Ten en conta que non debes de mesturar series e
variables de diferentes tipos nunha mesma chamada a delete.
Na terceira variante, a opción --type debes de acompañala con algún dos
seguintes nomes de tipos: matrix, bundle, string, list, scalar ou array; e o
seu efecto consiste en eliminar tódalas variables do tipo indicado. Neste
caso non debes de indicar ningún argumento que non sexa a opción.
Podes usar a cuarta variante para descargar un paquete de funcións. Neste
caso, debes de proporcionar o sufixo .gfn como en
delete somepkg.gfn
Cae na conta de que isto non elimina o ficheiro de paquete; unicamente
descarga o paquete da memoria.
Eliminar variables nun bucle
En xeral, non se permite eliminar variables no contexto dun bucle, posto que
isto pode supor un risco para a integridade do código do propio bucle.
Porén, se tes total confianza en que a eliminación dunha determinada
variable vai ser inocua, podes anular esta prohibición engadindo a opción
--force á instrución delete.
Ruta do menú: Xanela principal: Menú emerxente (selección única)
# diff Transformations
Argumento: listavariables
Exemplos: penngrow.inp, sw_ch12.inp, sw_ch14.inp
Con esta instrución obtés a primeira diferenza de cada variable de
listavariables, e o resultado gárdase nunha nova variable co prefixo d_.
Así "diff x y" xera as novas variables
d_x = x(t) - x(t-1)
d_y = y(t) - y(t-1)
Ruta do menú: /Engadir/Primeiras diferenzas das variables seleccionadas
# difftest Tests
Argumentos: serie1 serie2
Opcións: --sign (Proba dos signos, por defecto)
--rank-sum (Proba da suma de rangos de Wilcoxon)
--signed-rank (Proba dos rangos con signo de Wilcoxon)
--verbose (Presenta resultados adicionais)
--quiet (Suprime a presentación de resultados)
Exemplos: ooballot.inp
Leva a cabo unha proba non paramétrica sobre a diferenza entre dúas
poboacións ou grupos, na que a proba concreta depende da opción
seleccionada.
Coa opción --sign, realízase a proba dos signos. Esta proba baséase no
feito de que, cando se extraen dúas mostras, x e y, de forma aleatoria
dunha mesma distribución, a probabilidade de que x_i > y_i, para cada
observación i, deberá de ser igual a 0.5. O estatístico de proba é w, é
dicir, o número de observacións para as que se cumpre que x_i > y_i. Baixo
a hipótese nula, este estatístico segue unha distribución de
probabilidade Binomial con parámetros (n, 0.5), onde n indica o número de
observacións.
Coa opción --rank-sum, realízase a proba da suma de rangos de Wilcoxon.
Esta proba desenvólvese determinando o rango en xerarquía das
observacións de ambas mostras xuntas, desde a de menor valor ata a de
maior, e logo calculando a suma dos rangos das observacións dunha calquera
das dúas mostras. Non é necesario que as dúas mostras teñan o mesmo
tamaño e, se son diferentes, utilízase a mostra máis pequena para
calcular a suma dos rangos. Baixo a hipótese nula de que as mostras
proceden de poboacións coa mesma mediana, a distribución de probabilidade
da suma de rangos pode calcularse para calquera tamaño de mostra que se
indique; e para mostras razoablemente longas, existe unha estreita
aproximación Normal.
Coa opción --signed-rank, realízase a proba dos rangos con signo de
Wilcoxon, que está ideada para pares de datos ligados como, por exemplo, os
pares de valores dunha mesma variable nunha mostra de individuos, antes e
despois dalgún tratamento. A proba desenvólvese calculando as diferenzas
entre as observacións emparelladas x_i - y_i, e determinando o rango destas
diferenzas segundo o seu valor absoluto, ademais de asignándolle a cada
par, un rango cun signo que coincide co signo da diferenza. A continuación
calcúlase a suma dos rangos con signo positivo (W_+). De igual xeito que na
proba da suma de rangos, baixo a hipótese nula de que a diferenza das
medianas é cero, este estatístico segue unha distribución de
probabilidade ben definida, que converxe á Normal para mostras de tamaño
razoable.
Para as probas de Wilcoxon, cando indicas a opción --verbose, entón
preséntase a ordenación. (Esta opción non ten efecto cando se selecciona
a proba dos signos.)
Ao completarse con éxito, vas a ter dispoñibles os accesorios "$test" e
"$pvalue". Se unicamente queres obter estes valores, podes engadir a opción
--quiet á instrución.
# discrete Transformations
Argumento: listavariables
Opción: --reverse (Marca as variables como continuas)
Exemplos: ooballot.inp, oprobit.inp
Marca cada variable de listavariables como discreta pois, por defecto, todas
as variables trátanse como continuas. Ao facer que unha variable sexa
discreta, iso afecta ao xeito no que se manexa esa variable nas gráficas de
frecuencia, e tamén te permite escoller a variable para a instrución
"dummify".
Cando especificas a opción --reverse, a operación invértese; é dicir, as
variables contidas en listavariables márcanse como continuas.
Ruta do menú: /Variable/Editar atributos
# dpanel Estimation
Argumento: p ; depvar indepvars [ ; instrumentos ]
Opcións: --quiet (Non amosa o modelo estimado)
--vcv (Presenta a matriz de covarianzas)
--two-step (Realiza a estimación MXM (GMM) en 2 etapas)
--system (Engade ecuacións en niveis)
--collapse (Mira abaixo)
--time-dummies (Engade variables ficticias temporais)
--dpdstyle (Imita o paquete DPD para Ox)
--asymptotic (Desviacións padrón asintóticas sen corrixir)
--keep-extra (Mira abaixo)
Exemplos: dpanel 2 ; y x1 x2
dpanel 2 ; y x1 x2 --system
dpanel {2 3} ; y x1 x2 ; x1
dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3)
Mira tamén bbond98.inp
Realiza a estimación de modelos dinámicos con datos de panel (é dicir,
modelos de panel que inclúen un ou máis retardos da variable dependente)
utilizando ben o método MXM-DIF ou ben MXM-SYS.
O parámetro p representa o nivel de autorregresión para a variable
dependente. No caso máis sinxelo, este parámetro é un valor escalar, pero
tamén podes indicar unha matriz definida previamente para este argumento,
para especificar con elo un conxunto de retardos (posiblemente non
consecutivos) a utilizar.
Debes de indicar a variable dependente e os regresores cos seus valores en
niveis, pois xa se van diferenciar automaticamente (dado que este estimador
utiliza a diferenciación para eliminar os efectos individuais).
O último campo (opcional) da instrución é para especificar os
instrumentos. Se non indicas ningún instrumento, asúmese que tódalas
variables independentes son estritamente esóxenas. Se especificas calquera
instrumento, debes de incluír na lista calquera variable independente
estritamente esóxena. Para os regresores predeterminados podes utilizar a
función GMM para incluír un rango específico de retardos co estilo
diagonal por bloques, como se ilustra no terceiro exemplo de arriba. O
primeiro argumento de GMM é o nome da variable en cuestión, o segundo é o
retardo mínimo que se utiliza como instrumento, e o terceiro é o retardo
máximo. Podes utilizar a mesma sintaxe coa función GMMlevel para
especificar instrumentos de tipo MXM para as ecuacións en niveis.
Podes usar a opción --collapse para limitar o inzamento de instrumentos de
"estilo GMM", o que podería chegar a ser un problema con este estimador. O
seu efecto consiste en reducir ese tipo de instrumentos, de un por cada
retardo e por observación, a un por cada retardo.
Por defecto, preséntanse os resultados da estimación en 1 etapa (coas
desviacións padrón robustas) pero tes a opción de escoller a estimación
en 2 etapas. En ambos casos, preséntanse as probas de autocorrelación de
nivel 1 e 2 , así como as probas de Sargan e/ou Hansen de
sobreidentificación, e o estatístico da proba de Wald para a
significación conxunta dos regresores. Ten en conta que neste modelo en
diferenzas, a autocorrelación de primeiro nivel non é unha ameaza para a
validez do modelo, pero a autocorrelación de segundo nivel infrinxe os
supostos estatísticos vixentes.
No caso da estimación en 2 etapas, as desviacións padrón calcúlanse por
defecto utilizando a corrección de mostra finita suxerida por Windmeijer
(2005). Xeralmente considérase que as desviacións padrón asintóticas
estándar asociadas ao estimador do método en 2 etapas, son unha guía
pouco fiable para a inferencia, pero se por algunha razón queres velas,
podes utilizar a opción --asymptotic para desactivar a corrección de
Windmeijer.
Se indicas a opción --time-dummies, engádese un conxunto de variables
ficticias temporais aos regresores especificados. O número destas variables
ficticias é unha menos que o número máximo de períodos usados na
estimación, para evitar que haxa multicolinearidade perfecta coa constante.
As variables ficticias introdúcense en forma de diferenzas agás que se
indique a opción --dpdstyle, en cuxo caso introdúcense en niveis.
De igual xeito que con outras instrucións para facer a estimación, dispós
dun feixe "$model" logo de facela. No caso de dpanel, podes usar a opción
--keep-extra para gardar información que queiras engadir nese feixe, por
exemplo as matrices de ponderacións e de instrumentos MXM.
Para obter outros detalles e exemplos, consulta o Manual de usuario de Gretl
(Capítulo 24).
Ruta do menú: /Modelar/Panel/Modelo de Panel Dinámico
# dummify Transformations
Argumento: listavariables
Opcións: --drop-first (Exclúe da codificación ao valor máis baixo)
--drop-last (Exclúe da codificación ao valor máis alto)
Para calquera variable adecuada de listavariables, xera un conxunto de
variables ficticias que codifican os distintos valores desa variable. As
variables adecuadas son aquelas que se marcan explicitamente como discretas
ou aquelas que teñen un número claramente pequeno de valores, dos que
todos eles estean "claramente arredondados" (múltiplos de 0.25).
Por defecto, engádese unha variable ficticia por cada valor diferente da
variable en cuestión. Por exemplo, se unha variable discreta x ten 5
valores diferentes, engádense 5 variables ficticias ao conxunto de datos,
cos nomes Dx_1, Dx_2, etcétera. A primeira variable ficticia vai ter o
valor 1 nas observacións onde x toma o seu valor máis pequeno e 0 noutro
caso; a seguinte variable ficticia vai ter o valor 1 nas observacións onde
x toma o seu segundo valor máis pequeno, etcétera. Se engades un dos
indicadores de opción --drop-first ou --drop-last, entón omítese do
proceso de codificación ben o valor máis baixo ou ben o valor máis alto
de cada variable, respectivamente (o que pode serte útil para evitar a
"trampa das variables ficticias").
Tamén podes inserir esta instrución no contexto da especificación dunha
regresión. Por exemplo, a seguinte liña especifica un modelo onde y se
regresa sobre o conxunto de variables ficticias que se codifican para x.
(Non podes aplicar os indicadores de opción a "dummify" neste contexto.)
ols y dummify(x)
Outro acceso: Xanela principal: Menú emerxente (selección única)
# duration Estimation
Argumentos: depvar indepvars [ ; censuravar ]
Opcións: --exponential (Utiliza a distribución exponencial)
--loglogistic (Utiliza a distribución log-loxística)
--lognormal (Utiliza a distribución log-normal)
--medians (Os valores axustados son as medianas)
--robust (Desviacións padrón robustas: CMV (QML))
--cluster=clustervar (Consulta "logit" para explicación)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta nada)
Exemplos: duration y 0 x1 x2
duration y 0 x1 x2 ; cens
Mira tamén weibull.inp
Estima un modelo de duración no que a variable dependente (que debe de ser
positiva) representa a duración dalgún estado dun asunto; por exemplo, a
duración do período de desemprego para unha sección cruzada de
enquisados. Por defecto, utilízase a distribución de Weibull pero tamén
están dispoñibles as distribucións exponencial, log-loxística e
log-normal.
Se algunhas das medidas de duración están censuradas pola dereita (e.g. o
período do desemprego dun individuo aínda non rematou dentro do período
de observación), entón debes de indicar no argumento posterior censuravar,
unha serie na que os valores non nulos indiquen os casos censurados pola
dereita.
Por defecto, os valores axustados que obtés mediante o accesorio $yhat son
as medias condicionadas das duracións, pero cando indicas a opción
--medians entón $yhat te proporciona as medianas condicionadas no seu
lugar.
Consulta o Manual de usuario de Gretl (Capítulo 38) para obter máis
detalles.
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de Duración
# elif Programming
Consulta "if".
# else Programming
Consulta "if". Ten en conta que a instrución "else" necesita unha liña
para ela mesma, antes da seguinte instrución condicional. Podes engadirlle
un comentario, como en
else # Correcto, fai algo distinto
Pero non podes engadirlle unha instrución, como en
else x = 5 # Incorrecto!
# end Programming
Termina un bloque de instrucións dalgunha clase. Por exemplo, "end system"
termina un sistema de ecuacións ("system").
# endif Programming
Consulta "if".
# endloop Programming
Marca a fin dun bucle de instrucións. Consulta "loop".
# eqnprint Printing
Opcións: --complete (Xera un documento completo)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Debe de ir despois da estimación dun modelo e presenta o modelo estimado en
formato dunha ecuación LaTeX. Se especificas o nome dun ficheiro utilizando
a opción --output, o resultado diríxese a ese ficheiro; se non, diríxese
a un ficheiro cun nome co estilo equation_N.tex, onde N é o número de
modelos estimados ata ese momento na sesión vixente. Consulta tamén
"tabprint".
O ficheiro resultante vai escribirse no cartafol de traballo ("workdir")
establecido nese momento, agás que a cadea nomeficheiro conteña unha
especificación completa da ruta.
Cando especificas a opción --complete, o ficheiro LaTeX é un documento
completo (listo para procesar); se non, debes de incluílo nun documento.
Ruta do menú: Xanela de modelo: LaTeX
# equation Estimation
Argumentos: depvar indepvars
Exemplo: equation y x1 x2 x3 const
Te permite especificar unha das ecuacións dun sistema delas (consulta
"system"). A sintaxe para especificar unha ecuación dun sistema SUR é a
mesma que para, e.g., "ols". Pero para unha das ecuacións dun sistema a
estimar con Mínimos Cadrados en 3 etapas, podes: (a) indicar unha
especificación dunha ecuación como se estima con MCO e proporcionar unha
lista normal de instrumentos utilizando a palabra chave "instr" (de novo,
consulta "system"), ou (b) utilizar a mesma sintaxe de ecuacións que para
"tsls".
# estimate Estimation
Argumentos: [ nomesistema ] [ estimador ]
Opcións: --iterate (Reitera ata a converxencia)
--no-df-corr (Sen corrección dos graos de liberdade)
--geomean (Mira abaixo)
--quiet (Non presenta os resultados)
--verbose (Presenta os detalles das iteracións)
Exemplos: estimate "Klein Model 1" method=fiml
estimate Sys1 method=sur
estimate Sys1 method=sur --iterate
Solicita a estimación dun sistema de ecuacións que debes de definir
previamente usando a instrución "system". Debes de indicar primeiro o nome
do sistema, contornado entre comiñas se o nome contén espazos. O estimador
debe de ser un dos seguintes: "ols", "tsls", "sur", "3sls", "fiml" ou
"liml"; e debes de poñerlle antes a cadea de texto method=. Estes
argumentos son optativos se o sistema en cuestión xa se estimou, e ocupa o
lugar do "último modelo"; nese caso, o estimador que se toma por defecto
será o utilizado previamente.
Se o sistema en cuestión tivo aplicadas un conxunto de restricións
(consulta a instrución "restrict"), a estimación estará suxeita ás
restricións especificadas.
Se o método de estimación é "sur" ou "3sls", e especificas a opción
--iterate, vaise calcular o estimador iterativamente. No caso de SUR, se o
procedemento converxe, os resultados son as estimacións máximo
verosímiles. A iteración de Mínimos Cadrados en 3 Etapas (3sls), porén,
en xeral non converxe aos resultados da máxima verosimilitude con
información completa (fiml). A opción --iterate ignórase para outros
métodos de estimación.
Se elixes os estimadores de ecuación a ecuación "ols" ou "tsls", por
defecto aplícase unha corrección dos graos de liberdade cando se calculan
as desviacións padrón, mais podes eliminar isto utilizando a opción
--no-df-corr. Esta opción non ten efecto cos outros estimadores, e así non
se aplica a corrección dos graos de liberdade en ningún caso.
Por defecto, a fórmula utilizada para calcular os elementos da matriz de
covarianzas das ecuacións cruzadas é
sigma(i,j) = u(i)' * u(j) / T
Cando indicas a opción --geomean, aplícase unha corrección dos graos de
liberdade co que a fórmula nese caso é
sigma(i,j) = u(i)' * u(j) / sqrt((T - ki) * (T - kj))
onde as ks denotan o número de parámetros independentes en cada ecuación.
Cando indicas a opción --verbose e especificas un método iterativo,
preséntanse detalles das iteracións.
# eval Utilities
Argumento: expresión
Exemplos: eval x
eval inv(X'X)
eval sqrt($pi)
Esta instrución fai que GRETL funcione como unha sofisticada calculadora. O
programa avalía expresión e presenta o seu valor. O argumento pode ser o
nome dunha variable, ou algo máis complicado. En calquera caso, debe de ser
unha expresión que podas poñer correctamente como o lado dereito dun
enunciado de asignación (igualdade).
No uso interactivo (por exemplo coa consola de GRETL), un signo igual
funciona como unha abreviatura de eval, como en
=sqrt(x)
(con ou sen espazo despois de "="). Pero esta variante non se admite no modo
de edición de guións xa que podería agochar doadamente fallos de
codificación.
Na maioría dos contextos, podes usar a instrución "print" no canto de eval
para obter o mesmo efecto. Consulta tamén "printf" para aqueles casos nos
que queiras combinar resultados de texto e numéricos.
# fcast Prediction
Variantes: fcast [obsinicio obsfin] [nomev]
fcast [obsinicio obsfin] pasosadiante [nomev] --recursive
Opcións: --dynamic (Xera a predición dinámica)
--static (Xera a predición estática)
--out-of-sample (Xera a predición postmostral)
--no-stats (Non presenta as estatísticas de predición)
--stats-only (Presenta só as estatísticas de predición)
--quiet (Non presenta nada)
--recursive (Mira abaixo)
--plot=nomeficheiro (Mira abaixo)
Exemplos: fcast 1997:1 2001:4 f1
fcast fit2
fcast 2004:1 2008:3 4 rfcast --recursive
Mira tamén gdp_midas.inp
Debe de ir despois dunha instrución de estimación. As predicións xéranse
para certo rango de observacións que será, ben o definido cando indicas
obsinicio e obsfin (de ser posible), ben o definido polas observacións que
van a continuación do rango sobre o que se estimou o modelo cando indicas a
opción --out-of-sample, ou ben, se non, o rango da mostra definido nese
momento. Cando solicitas unha predición 'out-of-sample' pero non hai
dispoñibles observacións relevantes, amósase un fallo. Dependendo da
natureza do modelo, tamén poden xerarse as desviacións padrón (mira
abaixo). Tamén mira abaixo para indagar sobre o efecto especial da opción
--recursive.
Se o derradeiro modelo estimado ten unha única ecuación, entón o
argumento nomev (opcional) ten o seguinte efecto: non se presentan os
valores da predición, senón que se gardan no conxunto de datos co nome
indicado. Se o último modelo é un sistema de ecuacións, nomev ten un
efecto distinto xa que, concretamente, escolle unha variable endóxena en
particular para facer a predición (pois por defecto xéranse as predicións
para todas as variables endóxenas). No caso dun sistema ou se non indicas
nomev, podes recuperar os valores de predición utilizando o accesorio
"$fcast" e, se están dispoñibles, as desviacións padrón mediante
"$fcse".
A elección entre unha predición estática ou dinámica aplícase
unicamente no caso de modelos dinámicos, cunha perturbación cun proceso
autorregresivo e/ou que inclúan un ou máis valores retardados da variable
dependente como regresores. As predicións estáticas son un paso adiantadas
(baseadas nos valores acadados no período previo), mentres que as
predicións dinámicas empregan a regra da cadea de predición. Por exemplo,
se unha predición para y en 2008 require como entrada un valor de y en
2007, unha predición estática é imposible sen datos actualizados para
2007, pero unha predición dinámica para 2008 é posible se podes
substituír unha predición previa para y en 2007.
Por defecto proporciónase: (a) unha predición estática para algunha
porción do rango de predición que cae dentro do rango da mostra sobre o
que se estima o modelo, e (b) unha predición dinámica (se é relevante)
fóra da mostra. A opción --dynamic solicita unha predición dinámica a
partir da data o máis temperá posible, e a opción --static solicita unha
predición estática aínda fóra da mostra.
A opción --recursive está actualmente dispoñible só para modelos dunha
soa ecuación, estimados mediante MCO. Cando indicas esta opción as
predicións son recursivas; é dicir, cada predición xérase a partir dunha
estimación do modelo indicado, utilizando os datos a partir dun punto de
inicio fixado (en concreto, o inicio do rango da mostra para a estimación
orixinal) ata a data de predición menos k, o número de pasos adiantados
que debes de indicar no argumento pasosadiante. As predicións sempre son
dinámicas se iso é pertinente. Cae na conta de que debes de indicar o
argumento pasosadiante unicamente xunto coa opción --recursive.
A opción --plot (dispoñible só no caso da estimación dunha única
ecuación) solicita que se produza un ficheiro gráfico, que contén unha
representación gráfica da predición. O sufixo do argumento nomeficheiro
desta opción controla o formato da gráfica: .eps para EPS, .pdf para PDF,
.png para PNG, e .plt para un ficheiro de instrucións Gnuplot. Podes
utilizar o título display en substitución do nome de ficheiro para forzar
a representación da gráfica nunha xanela. Por exemplo,
fcast --plot=fc.pdf
vai xerar unha gráfica con formato PDF. Respéctanse os nomes de rutas que
non ofrezan dúbidas; se non, os ficheiros escríbense no cartafol de
traballo de GRETL.
A natureza das desviacións padrón das predicións (se están dispoñibles)
depende da natureza do modelo e da predición. En modelos lineais
estáticos, as desviacións padrón calcúlanse utilizando o método
bosquexado por Davidson e MacKinnon (2004); eles incorporan tanto a
incerteza debida ao proceso da perturbación como a incerteza nos
parámetros (resumida na matriz de covarianzas dos estimadores dos
parámetros). En modelos dinámicos, as desviacións padrón das predicións
calcúlanse unicamente no caso dunha predición dinámica, e non incorporan
a incerteza nos parámetros. Para modelos non lineais, as desviacións
padrón das predicións non están dispoñibles actualmente.
Ruta do menú: Xanela de modelo: Análise/Predicións
# flush Programming
Esta sinxela instrución (sen argumentos, sen opcións) está ideada para
usarse en guións que levan algo de tempo, e que deben de executarse coa
Interface Gráfica de Usuario (GUI) de GRETL (o programa de liñas de
instrución o ignora), para darlle ao usuario un indicio visual de que as
cousas estanse movendo e GRETL non está "parado".
Xeralmente, se lanzas un guión na Interface Gráfica de Usuario (GUI), non
se amosa o resultado ata que se complete a súa execución, pero o efecto de
invocar flush é como se indica deseguido:
Na primeira chamada, GRETL abre unha xanela, amosa os resultados ata o
presente e engade a mensaxe "Procesando...".
Tras invocacións posteriores, actualízase o texto que se amosa na xanela
de resultados, e engádese unha nova mensaxe "Procesando".
Cando se completa a execución do guión, calquera resultado que quede
pendente descárgase automaticamente na xanela de texto.
Ten en conta que non ten senso que utilices flush en guións que tarden
menos de (digamos) 5 segundos en executarse. Tamén cae na conta de que non
deberías de utilizar esta instrución nun lugar do guión onde non hai
resultados posteriores que presentar, xa que a mensaxe "Procesando" será
entón enganosa para o usuario.
O seguinte código ilustra o uso que se pretende con flush:
set echo off
scalar n = 10
loop i=1..n
# Facer unha operación que leve algo de tempo
loop 100 --quiet
a = mnormal(200,200)
b = inv(a)
endloop
# Presentar algúns resultados
printf "Iteración %2d feita\n", i
if i < n
flush
endif
endloop
# foreign Programming
Sintaxe: foreign language=ling
Opcións: --send-data[=lista] (Carga previamente os datos; mira abaixo)
--quiet (Elimina os resultados do programa externo)
Esta instrución abre un modo especial no que se admiten instrucións que
van executarse con outro programa. Podes saír deste modo con end foreign e,
nese punto, execútanse as instrucións acumuladas.
Actualmente os programas "externos" aos que se lles dá sostén deste xeito
son GNU R (language=R), Python, Julia, GNU Octave (language=Octave), Ox de
Jurgen Doornik e Stata. Os nomes das linguaxes recoñécense en termos que
non distinguen maiúsculas e minúsculas.
Xunto con R, Octave e Stata, a opción --send-data ten como efecto o de
facer accesibles os datos do espazo de traballo do GRETL dentro do programa
sinalado. Por defecto, se envía o conxunto completo de datos, pero ti podes
limitar os datos que se van enviar indicando o nome dunha lista de series
definida previamente. Por exemplo:
list Rlist = x1 x2 x3
foreign language=R --send-data=Rlist
Consulta o Manual de usuario de Gretl (Capítulo 44) para obter máis
detalles e exemplos.
# fractint Statistics
Argumentos: serie [ nivel ]
Opcións: --gph (Fai a proba de Geweke e Porter-Hudak)
--all (Fai ambas probas)
--quiet (Non presenta os resultados)
Comproba a integración fraccional ("memoria longa") das series
especificadas probando a hipótese nula de que a orde de integración da
serie é cero. Por defecto, utilízase o Estimador Local Whittle (Robinson,
1995), pero cando indicas a opción --gph, realízase a proba GPH (Geweke e
Porter-Hudak, 1983) en troques. Cando decidas indicar a opción --all,
entón vanse presentar os resultados de ámbalas dúas probas.
Para obter máis detalles sobre esta clase de proba, consulta Phillips e
Shimotsu (2004).
Cando non indicas o argumento nivel (opcional), o nivel para a(s) proba(s)
establécese automaticamente como o número menor entre T/2 e T^0.6.
As ordes estimadas de integración fraccional e as desviacións padrón
correspondentes están dispoñibles mediante o accesorio "$result". Coa
opción --all, atoparás a estimación Local Whittle na primeira fila e a
estimación GPH na segunda.
Podes recuperar os resultados da proba utilizando os accesorios "$test" e
"$pvalue". Estes valores baséanse no Estimador Local Whittle agás cando
indicas a opción --gph.
Ruta do menú: /Variable/Probas de raíz unitaria/Integración fraccional
# freq Statistics
Argumento: variable
Opcións: --nbins=n (Especifica o número de intervalos)
--min=valormínimo (Especifica o mínimo, mira abaixo)
--binwidth=ancho (Especifica o ancho do intervalo, mira abaixo)
--normal (Proba a distribución Normal)
--gamma (Proba a distribución Gamma)
--silent (Non presenta nada)
--matrix=nomematriz (Utiliza unha columna da matriz indicada)
--plot=modo-ou-nomeficheiro (Mira abaixo)
--quiet (Non presenta a gráfica)
Exemplos: freq x
freq x --normal
freq x --nbins=5
freq x --min=0 --binwidth=0.10
Se non indicas opcións, amosa a distribución de frecuencias da serie
variable (indicada polo seu nome ou número), co número de intervalos e os
seus tamaños elixidos automaticamente.
Cando indicas a opción --matrix, entón variable debe de ser un número
enteiro e interprétase neste caso como un índice que escolle unha columna
da matriz indicada. Se a matriz en cuestión é realmente un vector columna,
podes omitir este argumento variable.
Para controlar a presentación da distribución podes especificar, ou ben o
número de intervalos, ou ben o valor mínimo xunto co ancho dos intervalos,
como se amosou nos dous últimos exemplos de arriba. A opción --min
establece o límite inferior do intervalo situado máis á esquerda.
Cando indicas a opción --normal, calcúlase o estatístico khi-cadrado de
Doornik-Hansen para probar a Normalidade. Cando indicas a opción --gamma, a
proba de Normalidade substitúese pola proba non paramétrica de Locke
respecto á hipótese nula de que unha variable segue unha distribución
Gamma; consulta Locke (1976), e tamén Shapiro e Chen (2001). Cae na conta
de que a forma na que se indican en GRETL os parámetros da distribución
Gamma utilizada é (forma, escala).
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica da distribución, pero podes axustar isto mediante a
opción --plot. Os parámetros admisibles para esta opción son: none (para
suprimir a gráfica), display (para amosar unha gráfica mesmo cando esteas
en modo de procesamento por lotes), ou un nome de ficheiro. O efecto de
indicar un nome de ficheiro é como se describe para a opción --output da
instrución "gnuplot".
A opción --silent elimina o resultado de texto habitual. Podes utilizar
isto xunto con unha ou outra das opcións para probas de distribución;
entón rexístranse o estatístico de proba máis a súa probabilidade
asociada, e podes recuperalos utilizando os accesorios "$test" e "$pvalue".
Tamén podes usar isto xunto coa opción --plot se unicamente queres un
histograma e non te interesa mirar o texto que o acompaña.
Ten en conta que GRETL non ten unha función que se corresponda con esta
instrución, pero resulta posible utilizar a función "aggregate" para
acadar o mesmo obxectivo. Amais, podes obter a distribución de frecuencias
que se xera coa instrución freq, en forma de matriz, mediante o accesorio
"$result".
Ruta do menú: /Variable/Distribución de frecuencias
# funcerr Programming
Argumento: [ mensaxe ]
Só é aplicable no contexto dunha función definida polo usuario (consulta
"function"). Provoca que a execución da function actual, remate coa
sinalización dunha condición de fallo.
O argumento mensaxe (opcional) pode ter a forma dunha cadea de texto
literal, ou do nome dunha variable de cadea; se está presente, preséntase
como parte da mensaxe de fallo que se lle amosa a quen invoca a función.
Consulta tamén a función que está estreitamente vencellada, "errorif".
# function Programming
Argumento: nomefunción
Abre un bloque de expresións nas que se define unha función. Este bloque
debe de estar rematado con end function. (Como excepción está o caso no
que queiras eliminar unha función definida polo usuario, pois o podes
conseguir mediante a sinxela liña de instrución function foo delete para a
función chamada "foo".) Consulta o Manual de usuario de Gretl (Capítulo
14) para obter máis detalles.
# garch Estimation
Argumentos: p q ; depvar [ indepvars ]
Opcións: --robust (Desviacións padrón robustas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta nada)
--vcv (Presenta a matriz de covarianzas)
--nc (Sen constante)
--stdresid (Tipifica os erros)
--fcp (Utiliza o algoritmo de Fiorentini, Calzolari e Panattoni)
--arma-init (Parámetros iniciais da varianza partindo de ARMA)
Exemplos: garch 1 1 ; y
garch 1 1 ; y 0 x1 x2 --robust
Mira tamén garch.inp, sw_ch14.inp
Estima un modelo GARCH (GARCH, Heterocedasticidade Condicional
Autorregresiva Xeneralizada), ben nun modelo univariante ou ben incluíndo
as variables esóxenas indicadas se especificas indepvars. Os valores
enteiros p e q (que podes indicar en formato numérico ou con nomes de
variables escalares xa existentes) representan os niveis de retardo na
ecuación de varianza condicional:
h(t) = a(0) + sum(i=1 to q) a(i)*u(t-i)^2 + sum(j=1 to p) b(j)*h(t-j)
Así, o parámetro p representa o nivel Xeneralizado (ou "AR"), mentres que
q representa o nivel normal ARCH (ou "MA"). Cando p é non nulo, q tamén
debe ser non nulo; se non, o modelo non está identificado. Con todo, podes
estimar un modelo ARCH normal establecendo que q é un valor positivo, e que
p é cero. A suma de p e q non debe de ser maior ca 5. Ten en conta que se
inclúe automaticamente unha constante na ecuación media, agás cando
indiques a opción --nc.
Por defecto, utilízase o propio código de GRETL para estimar os modelos
GARCH, pero tamén tes a opción de usar o algoritmo de Fiorentini,
Calzolari e Panattoni (1996). O primeiro utiliza o maximizador BFGS mentres
que o último usa a matriz de información para maximizar a verosimilitude,
cunha posta a punto mediante a matriz Hessiana.
Con esta instrución dispós de diversas variantes da matriz estimada das
covarianzas dos estimadores. Por defecto, utilízase a matriz Hessiana agás
que indiques a opción --robust, en cuxo caso vaise usar a matriz de
covarianzas CMV (QML de White). Tamén podes especificar outras
posibilidades (e.g. a matriz de información ou o estimador de
Bollerslev-Wooldridge) utilizando a instrución "set".
Por defecto, as estimacións dos parámetros da varianza inícianse usando a
varianza da perturbación non condicionada dunha estimación inicial por MCO
(para a constante) e valores positivos pequenos (para os coeficientes que
acompañan aos valores pasados tanto das perturbacións cadradas como da
varianza da perturbación). A opción --arma-init solicita que, para
establecer os valores iniciais destes parámetros, se utilice un modelo
inicial ARMA, explotando a relación entre GARCH e ARMA exposta no capítulo
21 do libro Time Series Analysis de Hamilton. Nalgúns casos, isto pode
mellorar as posibilidades de converxencia.
Podes recuperar os erros GARCH e a varianza condicionada estimada con $uhat
e $h, respectivamente. Por exemplo, para obter a varianza condicional:
series ht = $h
Cando indicas a opción --stdresid, divídense os valores de $uhat pola
raíz cadrada de h_t.
Ruta do menú: /Modelar/Series temporais univariantes/GARCH
# genr Dataset
Argumentos: novavariable = fórmula
NOTA: Esta instrución experimentou numerosos cambios e melloras desde que
se escribiu o seguinte texto de axuda, por iso para comprender e actualizar
a información sobre esta instrución, deberás de seguir a referencia do
Manual de usuario de Gretl (Capítulo 10). Por outra banda, esta axuda non
contén nada actualmente incorrecto, polo que interpreta o que sigue como
"tes isto, e máis".
Para esta instrución e no contexto apropiado, as expresións series,
scalar, matrix, string, bundle e array son sinónimos.
Xera novas variables, habitualmente mediante transformacións das variables
xa existentes. Consulta tamén "diff", "logs", "lags", "ldiff", "sdiff" e
"square" como atallos. No contexto dunha fórmula genr, debes facer
referencia ás variables xa existentes mediante o seu nome, non co seu
número ID. A fórmula debe de ser unha combinación ben feita de nomes de
variables, constantes, operadores e funcións (descrito máis abaixo). Ten
en conta que podes atopar máis detalles sobre algúns aspectos desta
instrución no Manual de usuario de Gretl (Capítulo 10).
Unha instrución genr pode producir un resultado escalar ou unha serie. Por
exemplo, a fórmula x2 = x * 2 naturalmente produce unha serie cando a
variable x é unha serie, e un escalar cando x é un escalar. As fórmulas x
= 0 e mx = mean(x) naturalmente devolven escalares. Baixo certas
circunstancias, podes querer ter un resultado escalar ampliado a unha serie
ou vector; isto podes facelo utilizando series coma un "alcume" para a
instrución genr. Por exemplo, series x = 0 produce unha serie na que todos
os seus valores póñense a 0. Tamén podes utilizar scalar coma alcume de
genr. Non é posible forzar a un resultado en forma de vector que sexa un
escalar, pero a utilización desta palabra chave indica que o resultado
debera ser un escalar: se non o é, xorde un fallo.
Cando unha fórmula produce un resultado en forma de serie, o rango sobre o
que se escribe ese resultado na variable obxectivo depende da configuración
vixente da mostra. Polo tanto, podes definir unha serie feita a cachos
utilizando a instrución smpl xunto con genr.
Se admiten os operadores aritméticos, en orde de prioridade: ^ (elevar á
potencia); *, / e % (módulo ou resto); + e -.
Os operadores booleanos dispoñibles son (de novo, en orde de prioridade): !
(negación), && (E lóxico), || (OU lóxico), >, <, == (igual a), >= (maior
ou igual que), <= (menor ou igual que) e != (non igual). Tamén podes
utilizar os operadores booleanos na construción de variables ficticias: por
exemplo, (x > 10) devolve 1 no caso de que x > 10, e 0 noutro caso.
As constantes integradas son pi e NA. A última é o código de valor
ausente: podes iniciar unha variable co valor ausente mediante scalar x =
NA.
A instrución genr admite un amplo rango de funcións matemáticas e
estatísticas, incluíndo todas as habituais máis varias que son especiais
de Econometría. Ademais, ofrece acceso a moitas variables internas que se
definen durante a execución das regresións, a realización de probas de
hipóteses, etcétera. Para obter unha listaxe de funcións e accesorios,
escribe "help functions".
Ademais dos operadores e das funcións indicados arriba, hai algúns usos
especiais de "genr":
"genr time" xera unha variable de tendencia temporal (1,2,3,...) chamada
"time". E "genr index" ten o mesmo efecto, salvo que a variable chámase
index.
"genr dummy" xera tantas variables ficticias como sexa a periodicidade dos
datos. No caso de dispoñer datos trimestrais (periodicidade 4), o
programa xera dq1 = 1 para o primeiro trimestre e 0 para os outros
trimestres, dq2 = 1 para o segundo trimestre e 0 para os outros
trimestres, etcétera. Con datos mensuais, as variables ficticias
noméanse dm1, dm2, etcétera; con datos diarios, noméanse dd1, dd2,
etcétera; e con outras frecuencias, os nomes son dummy_1, dummy_2, etc.
"genr unitdum" e "genr timedum" xeran conxuntos de variables ficticias
especiais para utilizar con datos de panel, codificando as unidades de
sección cruzada coa primeira e o período de tempo das observacións coa
segunda.
Advertencia: Co programa en liñas de instrución, as instrucións "genr"
que recuperan datos relacionados cun modelo, sempre se refiren ao modelo que
se estimou máis recentemente. Isto tamén é certo no programa de Interface
Gráfica de Usuario (GUI), cando utilizas "genr" na "consola de GRETL"ou se
introduces unha fórmula usando a opción "Definir nova variable" baixo o
menú Engadir na xanela principal. Coa GUI, porén, tes a opción de
recuperar datos de calquera dos modelos que se amosan nese momento nunha
xanela (sexa ou non sexa o modelo estimado máis recentemente). Podes facer
isto baixo o menú "Gardar" da xanela do modelo correspondente.
A variable especial obs serve como índice para as observacións. Por
exemplo, series dum = (obs==15) xera unha variable ficticia que ten valor 1
para a observación 15, e o valor 0 noutro caso. Tamén podes usar esta
variable para escoller observacións concretas por data ou nome. Por
exemplo, series d = (obs>1986:4), series d = (obs>"2008-04-01"), ou series d
= (obs=="CA"). Cando utilizas datas diarias ou marcadores de observación
neste contexto, debes de contornalas entre comiñas, pero podes usar as
datas trimestrais e mensuais (cos dous puntos) sen comiñas. Ten en conta
que, no caso de datos de series temporais anuais, o ano non se distingue
sintacticamente dun sinxelo número enteiro. Polo tanto, se queres comparar
observacións fronte a obs por ano, debes de usar a función obsnum para
converter así o ano nun valor índice en base 1, como se fai en series d =
(obs>obsnum(1986)).
Podes sacar os valores escalares dunha serie no contexto dunha fórmula
genr, utilizando a sintaxe varname[obs] na que podes indicar o valor obs por
número ou data. Exemplos: x[5], CPI[1996:01]. Para datos diarios, debes de
usar a forma YYYY-MM-DD; e.g. ibm[1970-01-23].
Podes modificar unha observación individual dunha serie mediante genr. Para
facer isto, debes de engadir un número válido de observación ou de data,
entre corchetes, ao nome da variable no lado esquerdo da fórmula. Por
exemplo, genr x[3] = 30 ou genr x[1950:04] = 303.7.
Fórmula Comentario
------- -------
y = x1^3 x1 ao cubo
y = ln((x1+x2)/x3)
z = x>y z(t) = 1 se x(t) > y(t), se non 0
y = x(-2) x retardada 2 períodos
y = x(+2) x adiantada 2 períodos
y = diff(x) y(t) = x(t) - x(t-1)
y = ldiff(x) y(t) = log x(t) - log x(t-1), a taxa de crecemento
instantáneo de x
y = sort(x) Ordena x en orde ascendente e gárdao en y
y = dsort(x) Ordena x en orde descendente
y = int(x) Tronza x e garda o seu valor enteiro como y
y = abs(x) Garda os valores absolutos de x
y = sum(x) Suma os valores de x excluíndo as entradas ausentes
NA
y = cum(x) Acumulación: y(t) = suma desde s=1 ata s=t de x(s)
aa = $ess Establece aa igual á Suma de Erros Cadrados da
derradeira regresión
x = $coeff(sqft) Apaña o coeficiente estimado da variable sqft da
derradeira regresión
rho4 = $rho(4) Apaña o coeficiente autorregresivo de orde 4 do
derradeiro modelo (asume un modelo ar)
cvx1x2 = $vcv(x1, x2) Apaña a covarianza estimada dos coeficientes das
variables x1 e x2 do derradeiro modelo
foo = uniform() Variable pseudoaleatoria Uniforme no rango 0-1
bar = 3 * normal() Variable pseudoaleatoria Normal, mu = 0, sigma = 3
samp = ok(x) = 1 para as observacións onde x non está ausente
Ruta do menú: /Engadir/Definir nova variable
Outro acceso: Xanela principal: Menú emerxente
# gmm Estimation
Opcións: --two-step (Estimación en 2 etapas)
--iterate (MXM (GMM) reiterados)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta nada)
--lbfgs (Utiliza L-BFGS-B en lugar do BFGS normal)
Exemplos: hall_cbapm.inp
Realiza a estimación co Método Xeneralizado dos Momentos (MXM ou GMM)
utilizando o algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Debes de
especificar: (a) unha ou máis instrucións para actualizar as cantidades
relevantes (tipicamente erros MXM), (b) un ou máis conxuntos de condicións
de ortogonalidade, (c) unha matriz inicial de ponderacións, e (d) unha
listaxe cos parámetros a estimar, todo contornado entre as etiquetas gmm e
end gmm. Calquera opción deberá de engadirse á liña end gmm.
Consulta o Manual de usuario de Gretl (Capítulo 27) para obter máis
detalles sobre esta instrución. Aquí simplemente o ilustramos cun exemplo
sinxelo.
gmm e = y - X*b
orthog e ; W
weights V
params b
end gmm
No exemplo de arriba, asumimos que tanto y como X son matrices de datos, b
é un vector de valores dos parámetros coa dimensión adecuada, W é unha
matriz de instrumentos, e V é unha matriz axeitada de ponderacións. A
expresión
orthog e ; W
indica que o vector de erros (e) é ortogonal, en principio, a cada un dos
instrumentos que constitúen as columnas de W.
Nomes dos parámetros
Ao estimar un modelo non linear, frecuentemente resulta conveniente que
nomees os parámetros de xeito conciso. Ao presentar os resultados, porén,
pode que desexes utilizar etiquetas máis informativas. Podes acadar isto
mediante a palabra chave adicional param_names dentro do bloque de
instrución. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser unha cadea de texto literal entre comiñas que
conteña k nomes separados por espazos, o nome dunha variable de cadea que
conteña k deses nomes, ou o nome dun arranxo con k cadeas de texto.
Ruta do menú: /Modelar/Variables Instrumentais/Método Xeneralizado Momentos
# gnuplot Graphs
Argumentos: yvars xvar [ varficticia ]
Opcións: --with-lines[=varspec] (Utiliza liñas, non puntos)
--with-lp[=varspec] (Utiliza liñas e puntos)
--with-impulses[=varspec] (Utiliza barras finas verticais)
--with-steps[=varspec] (Utiliza segmentos de liñas perpendiculares (pasos))
--time-series (Representa fronte ao tempo)
--single-yaxis (Forza o uso dun único eixe de ordenadas)
--ylogscale[=base] (Utiliza a escala logarítmica para o eixe vertical)
--dummy (Mira abaixo)
--fit=espaxuste (Mira abaixo)
--font=espfonte (Mira abaixo)
--band=espfranxa (Mira abaixo)
--band-style=estilofranxa (Mira abaixo)
--matrix=nomematriz (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
--input=nomeficheiro (Colle a entrada de datos desde un ficheiro especificado)
Exemplos: gnuplot y1 y2 x
gnuplot x --time-series --with-lines
gnuplot wages educ gender --dummy
gnuplot y x --fit=quadratic
gnuplot y1 y2 x --with-lines=y2
As variables da lista yvars debúxanse fronte a xvar. Para unha gráfica
dunha serie temporal podes ben propoñer time en lugar de xvar, ou ben
utilizar o indicador de opción --time-series. Consulta tamén as
instrucións"plot" e "panplot".
Por defecto, as posicións dos datos amósanse con puntos, pero podes anular
isto indicando unha das seguintes opcións: --with-lines, --with-lp,
--with-impulses ou --with-steps. Cando vas representar máis dunha variable
no eixe da y, podes limitar o efecto destas opcións a un subconxunto das
variables utilizando o parámetro varspec. Este deberá de ter o formato
dunha listaxe cos nomes ou números (en ambos casos separados por comas) das
variables que se van representar de xeito alternativo. Poñamos por caso, no
último exemplo de arriba se amosa como representar y1 e y2 fronte a x, de
tal xeito que y2 represéntase cunha liña mentres y1 con símbolos.
Cando selecciones a opción --dummy, debes de indicar exactamente tres
variables: unha variable y simple, unha variable x e dvar, unha variable
discreta. O efecto disto consiste en representar yvar fronte a xvar cos
puntos amosados con cores diferentes dependendo do valor de varficticia na
observación indicada.
Podes escoller que a escala do eixe 'y' sexa logarítmica en troques de
linear, utilizando a opción --ylogscale, xunto cun parámetro de base. Por
exemplo,
gnuplot y x --ylogscale=2
representa os datos de xeito que o eixe vertical se expresa con potencias de
2. Se omites a base, por defecto, establécese igual a 10.
Collendo datos dunha matriz
Xeralmente requírense os argumentos yvars e xvar que se refiren a series do
conxunto vixente de datos (indicados ben polo nome ou ben polo número ID).
Pero se mediante a opción --matrix, indicas unha matriz xa definida, estes
argumentos convértense en opcionais: se a matriz especificada ten k
columnas, por defecto trátanse as primeiras k - 1 columnas como as yvars, e
a última columna trátase como xvar. Porén, cando indicas a opción
--time-series, todas as k columnas represéntanse fronte ao tempo. Se queres
representar columnas escollidas da matriz, debes de especificar yvars e xvar
co formato de números de columna enteiros positivos. Por exemplo, se queres
unha gráfica de dispersión da columna 2 da matriz M fronte á columna 1,
podes facer:
gnuplot 2 1 --matrix=M
Amosar a liña do mellor axuste
A opción --fit é só aplicable en gráficas de dispersión de dúas
variables e en gráficas de series temporais individuais. Por defecto, o
procedemento nunha gráfica de dispersión consiste en amosar o axuste MCO
se o coeficiente da pendente é significativo a un nivel do 10 por cento,
mentres que o proceder para as series temporais é non amosar ningunha liña
de axuste. Podes solicitar un comportamento diferente utilizando esta
opción xunto con algún dos seguintes valores dos parámetros espaxuste.
Ten en conta que se a gráfica é para unha serie temporal individual, o
lugar de x o ocupa 'time'.
linear: Amosa o axuste MCO independentemente do nivel de significación
estatística.
none: Non amosa ningunha liña de axuste.
inverse, quadratic, cubic, semilog ou linlog: Amosan unha liña de axuste
baseada na regresión do tipo especificado. Con semilog queremos dicir
unha regresión do logaritmo de y sobre x; entón a liña axustada
representa a esperanza condicionada de y, obtida mediante a función
exponencial. Con linlog quérese dicir unha regresión de y sobre o
logaritmo de x.
loess: Amosa o axuste dunha regresión robusta localmente ponderada (que
tamén coñécese ás veces como "lowess").
Representando unha franxa
Podes utilizar a opción --band para representar cero ou máis series
acompañadas dunha "franxa" dalgún tipo (tipicamente representa un
intervalo de confianza). Esta opción require dous parámetros separados
cunha coma: o nome ou o número ID dunha serie que represente o centro da
franxa, e o nome ou ID dunha serie que indique o largo da franxa: o efecto
disto consiste en debuxar unha franxa con ordenadas y que son iguais ao
centro máis/menos o largo. Podes utilizar un terceiro parámetro opcional
(de novo separado cunha coma) co formato dunha constante numérica ou o nome
dunha variable escalar, para indicar un múltiplo da dimensión de largura.
Así, por exemplo, o seguinte caso permite representar y xunto cunha franxa
de máis/menos 1.96 veces se_y:
gnuplot y --time-series --band=y,se_y,1.96 --with-lines
Cando indicas a opción --band, podes usar a opción compañeira
--band-style para controlar a representación da franxa. Por defecto, os
límites superior e inferior amósanse con liñas sólidas, pero os
parámetros fill, dash, bars ou step provocan que a franxa se debuxe
respectivamente como unha área sombreada, utilizando liñas con raias,
utilizando barras de erro ou utilizando chanzos. Ademais, podes engadir
(despois dunha coma) ou substituír unha especificación da cor. Aquí tes
algúns exemplos de estilo:
gnuplot ... --band-style=fill
gnuplot ... --band-style=dash,0xbbddff
gnuplot ... --band-style=,black
gnuplot ... --band-style=bars,blue
O primeiro exemplo produce unha área sombreada na cor establecida por
defecto; o segundo pasa a usar liñas con raias cunha cor específica gris
azulada; o terceiro utiliza liñas negras sólidas; e o derradeiro amosa
barras azuis. Ten en conta que podes indicar as cores ben como valores RGB
hexadecimais, ou ben polo nome; e podes acceder á lista de nomes de cores
recoñecidas por Gnuplot dando a instrución "show colornames" no propio
Gnuplot ou, na propia consola de GRETL, facendo
eval readfile("@gretldir/data/gnuplot/gpcolors.txt")
Franxas de recesión
Tamén podes utilizar as opcións "band" que se describiron máis arriba,
para engadir "franxas de recesión" a unha gráfica. Deste xeito estámonos
a referir a franxas verticais que ocupan todo o rango da dimensión y da
gráfica, e que indican a presenza (coa franxa) ou ausencia (sen a franxa)
dalgunha característica cualitativa, nunha gráfica de series temporais.
Estas franxas utilízanse habitualmente para indicar períodos de recesión;
pero tamén podes usalas para sinalar períodos de guerra, ou calquera cousa
que poda codificarse cunha variable ficticia 0/1.
Neste contexto, a opción --band require un único parámetro: o
identificador dunha serie que teña valores 0 e 1, onde o 1 indica
"presenza" e o 0 indica "ausencia". Podes utilizar a opción --band-style
para especificar unha cor para as franxas, indicada ben mediante formato
hexadecimal, ou ben mediante un nome que resulte recoñecible por gnuplot
(consulta a sección previa). Debaixo amósase un exemplo para representar
unha única franxa:
open AWM17 --quiet
series dum = obs >= 1990:1 && obs <= 1994:2
gnuplot YER URX --with-lines --time-series \
--band=dum --band-style=0xcccccc --output=display \
{set key top left;}
Controlando o resultado
En modo interactivo, a gráfica amósase inmediatamente, mais en modo de
procesamento por lotes, o modo de proceder por defecto consiste en escribir
un ficheiro de instrucións Gnuplot no cartafol de traballo do usuario, cun
nome co padrón gpttmpN.plt, comezando con N = 01. Podes xerar as gráficas
reais máis tarde utilizando gnuplot (baixo MS Windows, wgnuplot). E podes
modificar este proceder utilizando a opción --output=nomeficheiro. Esta
opción controla o nome de ficheiro utilizado, e ao mesmo tempo te permite
especificar un formato concreto para o resultado mediante a extensión de
tres letras do nome do ficheiro, do seguinte xeito: .eps da como resultado a
xénese dun ficheiro Encapsulated PostScript (EPS); .pdf produce un PDF;
.png xera un con formato PNG, .emf solicita que sexa EMF (Enhanced
MetaFile), .fig pide que sexa un ficheiro Xfig, e .svg que sexa un SVG
(Scalable Vector Graphics). Cando indicas o nome ficticio de ficheiro
"display", entón a gráfica amósase na pantalla, como no modo interactivo.
E cando indicas un nome de ficheiro con calquera extensión diferente ás
que acaban de mencionarse, escríbese un ficheiro de instrucións Gnuplot.
Especificando unha fonte
Podes utilizar a opción --font para especificar unha fonte concreta para a
gráfica. O parámetro espfonte debe de ter a forma do nome dunha fonte,
seguida opcionalmente por un número que indique o tamaño en puntos,
separado do nome por unha coma ou espazo, todo elo contornado entre
comiñas, como en
--font="serif,12"
Ten en conta que as fontes dispoñibles para Gnuplot varían dependendo da
plataforma, e se estás escribindo unha instrución de gráfica que
pretendes que sexa transportable, é mellor restrinxir o nome da fonte ás
xenéricas sans ou serif.
Engadindo instrucións Gnuplot
Dispós dunha opción engadida desta instrución pois, a continuación da
especificación das variables que se van debuxar e do indicador de opción
(se hai algún), podes engadir instrucións literais de Gnuplot para
controlar a aparencia da gráfica (por exemplo, establecendo o título da
gráfica e/ou rangos dos eixes). Estas instrucións deben de estar
contornadas entre chaves, e debes de rematar cada instrución Gnuplot cun
punto e coma. Podes utilizar unha barra inversa para continuar un conxunto
de instrucións Gnuplot ao longo de máis dunha liña. Aquí tes un exemplo
da sintaxe:
{ set title 'Meu Título'; set yrange [0:1000]; }
Ruta do menú: /Ver/Gráfica de variables indicadas
Outro acceso: Xanela principal: Menú emerxente, botón de gráficas na barra de ferramentas
# graphpg Graphs
Variantes: graphpg add
graphpg fontscale escala
graphpg show
graphpg free
graphpg --output=nomeficheiro
A sesión "Páxina de gráficas" vai funcionar só cando teñas instalado o
sistema de composición tipográfica LaTeX, e ademas podas xerar e ver un
resultado PDF ou PostScript.
Na xanela de iconas da sesión, podes arrastrar ata 8 gráficas sobre a
icona de páxina de gráficas. Cando premas un dobre clic sobre a páxina de
gráficas (ou premas o botón dereito e elixas "Amosar"), vaise compoñer
unha páxina que contén as gráficas seleccionadas e vaise abrir cun visor
adecuado. Dende aí deberías de poder imprimir a páxina.
Para limpar a páxina de gráficas, preme o botón dereito do rato sobre a
súa icona e selecciona "Limpar".
Ten en conta que en sistemas diferentes a MS Windows, poderías ter que
axustar a configuración do programa utilizado para ver ficheiros PDF ou
PostScript. Atópao baixo a lapela "Programas" na caixa de diálogo das
Preferencias xerais de GRETL (baixo o menú Ferramentas da xanela
principal).
Tamén é posible traballar na páxina de gráficas mediante un guión, ou
utilizando a consola (no programa de Interface Gráfica de Usuario, GUI).
Dáselle apoio ás seguintes instrucións e opcións:
Para engadir unha gráfica á páxina de gráficas, podes indicar a
instrución graphpg add logo de gardar unha gráfica definida, como en
grf1 <- gnuplot Y X
graphpg add
Para amosar a páxina de gráficas: graphpg show.
Para limpar a páxina de gráficas: graphpg free.
Para axustar a escala da fonte utilizada na páxina de gráficas, usa
graphpg fontscale escala, onde escala é un múltiplo (por defecto igual a
1.0). Deste xeito, para facer que o tamaño da fonte sexa un 50 por cento
maior ca o tamaño por defecto, podes facer
graphpg fontscale 1.5
Para solicitar a impresión da páxina da gráfica nun ficheiro, usa a
opción --output= máis un nome de ficheiro; este nome debería de ter a
extensión ".pdf", ".ps" ou ".eps". Por exemplo:
graphpg --output="myfile.pdf"
O ficheiro resultante vai escribirse no cartafol establecido nese momento
("workdir"), agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Neste contexto, para o resultado se utilizan liñas de cores por defecto;
para utilizar padróns punto/raia en vez de cores podes engadir a opción
--monochrome.
# heckit Estimation
Argumentos: depvar indepvars ; ecuaciondeseleccion
Opcións: --quiet (Non presenta os resultados)
--two-step (Realiza a estimación en 2 etapas)
--vcv (Presenta a matriz de covarianzas)
--opg (Desviacións padrón PEG (OPG))
--robust (Desviacións padrón CMV (QML))
--cluster=clustvar (Consulta "logit" para máis explicacións)
--verbose (Presenta resultados adicionais)
Exemplos: heckit y 0 x1 x2 ; ys 0 x3 x4
Mira tamén heckit.inp
Modelo de selección de tipo Heckman. Ao especificar esta instrución, a
lista antes do punto e coma representa as variables da ecuación resultante,
e a segunda lista representa as variables da ecuación de selección. A
variable dependente da ecuación de selección (ys no exemplo de arriba)
debe de ser unha variable binaria.
Por defecto, os parámetros estímanse polo método de máxima
verosimilitude. A matriz de covarianzas dos estimadores dos parámetros
calcúlase utilizando a inversa negativa da matriz Hessiana. Se queres facer
a estimación en 2 etapas, utiliza a opción --two-step. Neste caso, a
matriz de covarianzas dos estimadores dos parámetros da ecuación
resultante axústase de modo adecuado segundo Heckman (1979).
Ruta do menú: /Modelar/Variable Dependente Limitada/Heckit
# help Utilities
Variantes: help
help functions
help instrución
help función
Opción: --func (Escolle a axuda sobre as funcións)
Se non indicas ningún argumento, presenta a lista de instrucións
dispoñibles. Se indicas o argumento simple "functions", presenta a lista de
funcións dispoñibles (consulta "genr").
A expresión help instrución describe cada instrución indicada (e.g. help
smpl). A expresión help función describe cada función indicada (e.g. help
ldet). Algunhas funcións teñen os mesmos nomes que as instrucións
relacionadas (e.g. diff); nese caso, por defecto preséntase a axuda para a
instrución, pero podes obter axuda para a función utilizando a opción
--func.
Ruta do menú: /Axuda
# hfplot Graphs
Argumentos: listaaltafrec [ ; listabaixafrec ]
Opcións: --with-lines (Gráfica con liñas)
--time-series (Pon o tempo no eixe de abscisas)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Proporciona un medio de debuxar unha serie de alta frecuencia, tal vez xunto
a unha ou máis series observadas coa frecuencia base do conxunto de datos.
O primeiro argumento debe de ser unha "MIDAS list"; e os termos adicionais
listabaixafrec (opcionais) deberán de ser series habituais ("de baixa
frecuencia"), despois dun punto e coma.
Para obter máis detalles sobre o efecto da opción --output, consulta a
instrución "gnuplot".
# hsk Estimation
Argumentos: depvar indepvars
Opcións: --no-squares (Mira abaixo)
--vcv (Presenta a matriz de covarianzas)
--quiet (Non presenta nada)
Esta instrución é aplicable cando existe heterocedasticidade en forma
dunha función descoñecida dos regresores, que pode aproximarse por medio
dunha relación cuadrática. Nese contexto, ofrece a posibilidade de obter
desviacións padrón consistentes e estimacións máis eficientes dos
parámetros, en comparación con MCO.
O procedemento implica (a) a estimación MCO do modelo de interese, seguido
de (b) unha regresión auxiliar para xerar unha estimación da varianza da
perturbación, e finalmente (c) mínimos cadrados ponderados, utilizando
como ponderación a inversa da varianza estimada.
Na regresión auxiliar de (b), se regresa o logaritmo dos erros cadrados da
primeira estimación MCO, sobre os regresores orixinais e os seus cadrados
(por defecto), ou só sobre os regresores orixinais (se indicas a opción
--no-squares). A transformación logarítmica realízase para asegurar que
as varianzas estimadas son todas non negativas. Denominando u^* aos valores
axustados por esta regresión, a serie coas ponderacións para a estimación
MCP (WLS) final fórmase entón como 1/exp(u^*).
Ruta do menú: /Modelar/Outros Modelos Lineais/Con Corrección de Heterocedasticidade
# hurst Statistics
Argumento: serie
Opción: --plot=modo-ou-nomeficheiro (Mira abaixo)
Calcula o expoñente de Hurst (unha medida de persistencia ou memoria longa)
para unha variable de tipo serie temporal que teña polo menos 128
observacións. Podes obter o resultado (xunto coa súa desviación padrón)
mediante o accesorio "$result".
Mandelbrot (1983) discute sobre o expoñente de Hurst. En termos teóricos,
este é o expoñente (H) da relación
RS(x) = an^H
onde RS expresa o "rango que se volve a escalar" da variable x en mostras de
tamaño n e a é unha constante. O rango reescalado é o rango (valor
máximo menos mínimo) do valor acumulado ou suma parcial de x (logo da
subtracción da súa media mostral) no período da mostra, dividida pola
desviación padrón mostral.
Como punto de referencia, se x é unha variable ruído branco (con media e
persistencia nulas) entón o rango do seu "paseo" (forma un paseo aleatorio)
acumulado e escalado pola súa desviación padrón, ten un crecemento igual
á raíz cadrada do tamaño da mostra, proporcionando un expoñente de Hurst
agardado de 0.5. Os valores do expoñente que estean significativamente por
encima de 0.5 indican persistencia, e os menores ca 0.5 indican
"antipersistencia" (autocorrelación negativa). En principio, o expoñente
está acoutado entre 0 e 1, aínda que en mostras finitas é posible obter
un expoñente estimado maior ca 1.
En GRETL, o expoñente estímase utilizando submostraxe binaria: comézase
co rango completo de datos, despois coas dúas metades do rango, despois cos
4 cuartos, etcétera. Para tamaños da mostra menores que o rango de datos,
o valor RS é a media entre as mostras dispoñibles. O expoñente estímase
así como o coeficiente da pendente, nunha regresión do logaritmo de RS
sobre o logaritmo do tamaño da mostra.
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica do rango reescalado pero podes axustar isto mediante
a opción --plot. Os parámetros que se admiten para esta opción son none
(para suprimir a gráfica); display (para presentar unha gráfica mesmo en
caso de procesar por lotes); ou un nome de ficheiro. O efecto de indicar un
nome de ficheiro é como o descrito para a opción --output da instrución
"gnuplot".
Ruta do menú: /Variable/Expoñente de Hurst
# if Programming
Control de fluxo para a execución de instrucións. Admítense 3 tipos de
construción, como as indicadas deseguido.
# Forma simple
if (poñer a condición)
instrucións
endif
# Dúas ramas
if (poñer a condición)
instrucións 1
else
instrucións 2
endif
# Tres ou máis ramas
if (poñer a condición 1)
instrucións 1
elif (poñer a condición 2)
instrucións 2
else
instrucións 3
endif
A condición ("condition") debe de ser unha expresión booleana; para a súa
sintaxe consulta "genr". Podes incluír máis dun bloque "elif". Ademais,
podes aniñar os bloques if ... endif.
# include Programming
Argumento: nomeficheiro
Opción: --force (Forza a volver ler desde o ficheiro)
Exemplos: include myfile.inp
include sols.gfn
Ideado para utilizar nun guión de instrucións, principalmente para
incluír definicións de funcións. O nome do ficheiro (nomeficheiro)
debería de ter a extensión inp (un guión de texto plano) ou gfn (un
paquete de funcións de GRETL). As instrucións de nomeficheiro execútanse
e logo o control devólvese ao guión principal.
A opción --force é específica dos ficheiros gfn e o seu efecto consiste
en forzar a GRETL a que volva ler o paquete de funcións desde o ficheiro,
mesmo aínda que xa estea cargado na memoria. (Os ficheiros de texto plano
inp sempre lense e procésanse en resposta a esta instrución.)
Consulta tamén "run".
# info Dataset
Presenta calquera información complementaria gardada co ficheiro vixente de
datos.
Ruta do menú: /Datos/Información do conxunto de datos
Outro acceso: Xanelas do procurador de datos
# intreg Estimation
Argumentos: minvar maxvar indepvars
Opcións: --quiet (Non presenta os resultados)
--verbose (Presenta os detalles das iteracións)
--robust (Desviacións padrón robustas)
--opg (Mira máis abaixo)
--cluster=clustvar (Consulta "logit" para máis explicacións)
Exemplos: intreg lo hi const x1 x2
Mira tamén wtp.inp
Estima un modelo de regresión por intervalos. Este modelo xurde cando a
variable dependente está imperfectamente observada para algunhas
observacións (posiblemente todas). Noutras palabras, asúmese que o proceso
xerador de datos é
y* = x b + u
pero só observamos m <= y* <= M (o intervalo pode non ter límite pola
esquerda ou pola dereita). Cae na conta de que para algunhas observacións m
pode ser igual a M. As variables minvar e maxvar deben de conter NAs para as
observacións sen límite pola esquerda ou pola dereita, respectivamente.
O modelo estímase mediante Máxima Verosimilitude, asumindo a distribución
Normal do termo de perturbación aleatoria.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Cando especificas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimada é un "emparedado"
entre a inversa da matriz Hessiana estimada e o produto externo do vector
gradiente. Como alternativa podes indicar a opción--opg, en cuxo caso as
desviacións padrón baséanse unicamente no produto externo do vector
gradiente.
Ruta do menú: /Modelar/Variable Dependente Limitada/Regresión por intervalos
# johansen Tests
Argumentos: nivel ylista [ ; xlista ] [ ; rxlista ]
Opcións: --nc (Sen constante)
--rc (Constante restrinxida)
--uc (Constante non restrinxida)
--crt (Constante e tendencia restrinxida)
--ct (Constante e tendencia non restrinxida)
--seasonals (Inclúe variables ficticias estacionais centradas)
--asy (Garda os valores p asintóticos)
--quiet (Presenta só as probas)
--silent (Non presenta nada)
--verbose (Presenta detalles das regresións auxiliares)
Exemplos: johansen 2 y x
johansen 4 y x1 x2 --verbose
johansen 3 y x1 x2 --rc
Mira tamén hamilton.inp, denmark.inp
Leva a cabo a proba de cointegración de Johansen entre as variables de
ylista para o nivel de retardos seleccionado. Para obter máis detalles
sobre esta proba, consulta o Manual de usuario de Gretl (Capítulo 33) ou o
capítulo 20 de Hamilton (1994). As probabilidades asociadas (valores p)
calcúlanse mediante a aproximación Gamma de Doornik (Doornik, 1998).
Amósanse dous conxuntos de valores p para a proba da traza: valores
asintóticos directos e valores axustados polo tamaño da mostra. Por
defecto, o accesorio "$pvalue" xera a variante axustada, pero podes utilizar
a opción --asy para obter no seu lugar os valores asintóticos.
A inclusión de termos determinísticos no modelo contrólase mediante os
indicadores de opción. Por defecto, se non especificas ningunha opción,
inclúese unha "constante non restrinxida", que permite a presenza dunha
ordenada na orixe non nula nas relacións de cointegración, así como unha
tendencia nos niveis das variables endóxenas. Na literatura xerada a partir
do traballo de Johansen (por exemplo, consulta o seu libro de 1995)
refírese esta situación como o "caso 3". As 4 primeiras opcións indicadas
arriba, que son mutuamente excluíntes, producen respectivamente os casos 1,
2, 4 e 5. Tanto o significado destes casos como o criterio para seleccionar
un caso explícanse no Manual de usuario de Gretl (Capítulo 33).
As listas xlista e rxlista (opcionais) te permiten controlar as variables
esóxenas especificadas, e así estas entran no sistema ben sen restricións
(xlista) ou ben restrinxidas ao espazo de cointegración (rxlista). Estas
listas sepáranse de ylista e unhas das outras mediante un punto e coma.
A opción --seasonals, que podes combinar con calquera das outras opcións,
especifica a inclusión dun conxunto de variables ficticias estacionais
centradas. Esta opción está dispoñible só para datos trimestrais ou
mensuais.
A seguinte táboa ofrécese como guía para a interpretación dos resultados
da proba que se amosan, para o caso con 3 variables. H0 denota a hipótese
nula, H1 a hipótese alternativa, e c o número de relacións de
cointegración.
Rango Proba traza Proba Lmáx
H0 H1 H0 H1
---------------------------------------
0 c = 0 c = 3 c = 0 c = 1
1 c = 1 c = 3 c = 1 c = 2
2 c = 2 c = 3 c = 2 c = 3
---------------------------------------
Consulta tamén a instrución "vecm"; e a instrución "coint" se queres
obter a proba de cointegración de Engle-Granger.
Ruta do menú: /Modelar/Series temporais multivariantes
# join Dataset
Argumentos: nomeficheiro nomevar
Opcións: --data=nomecolumna (Mira abaixo)
--filter=expresión (Mira abaixo)
--ikey=claveinterna (Mira abaixo)
--okey=claveexterna (Mira abaixo)
--aggr=método (Mira abaixo)
--tkey=nomecoluma,cadeaformato (Mira abaixo)
--verbose (Informe en marcha)
Esta instrución incorpora unha ou máis series desde a orixe nomeficheiro
(que debe de ser ben un ficheiro de datos co texto delimitado, ou ben un
ficheiro de datos "propio" de GRETL), co nome nomevar. Para obter máis
detalles, consulta o Manual de usuario de Gretl (Capítulo 7) pois aquí
damos só un breve resumo das opcións dispoñibles. Consulta tamén
"append" para operacións de anexión máis simples.
Podes utilizar a opción --data para especificar o encabezamento dos datos
do ficheiro de orixe, se difire do nome polo que os datos deberan de
coñecerse en GRETL.
Podes usar a opción --filter para especificar un criterio para filtrar os
datos de orixe (é dicir, para escoller un subconxunto das observacións).
Podes utilizar as opcións --ikey e --okey para especificar unha
equivalencia entre as observacións do conxunto vixente de datos e as
observacións da fonte de datos (por exemplo, os individuos poden facerse
corresponder co fogar ao que pertencen).
A opción --aggr utilízase cando a equivalencia entre as observacións do
conxunto vixente de datos e as da orixe non é de unha a unha.
A opción --tkey aplícase só cando o conxunto vixente de datos ten unha
estrutura de serie temporal. Podes usala para especificar, ben o nome dunha
columna que conteña datas que van ser emparelladas co conxunto de datos,
e/ou ben o formato no que as datas se representan nesa columna.
Incorporación de máis dunha serie á vez
Coa instrución "join" podes manexar a incorporación de varias series ao
mesmo tempo. Isto acontece se o argumento nomevar: (a) consiste nunha lista
de nomes separados por espazos, en troques dun único nome; ou (b) apunta a
un arranxo de cadeas de texto, cuxos elementos deben ser os nomes das series
que se quere incorporar.
Porén, este método ten algunha limitación como o feito de que a opción
--data neste caso non está dispoñible. E cando incorporas múltiples
series, estás obrigado a aceptar os nomes "externos" que xa teñen. As
demais opcións se aplican de xeito uniforme a todas as series que se
incorporan mediante unha instrución concreta.
# kpss Tests
Argumentos: nivel listavariables
Opcións: --trend (Inclúe unha tendencia)
--seasonals (Inclúe variables ficticias estacionais)
--verbose (Presenta os resultados da regresión)
--quiet (Non presenta os resultados)
--difference (Utiliza a primeira diferenza da variable)
Exemplos: kpss 8 y
kpss 4 x1 --trend
Para utilizar esta instrución con datos de panel, consulta a sección final
destas anotacións.
Calcula a proba de estacionariedade KPSS (Kwiatkowski et al, Journal of
Econometrics, 1992) para cada unha das variables indicadas (ou para as súas
primeiras diferenzas, se escolles a opción --difference). A hipótese nula
é que a variable en cuestión é estacionaria, ben arredor dun nivel ou, se
marcas a opción --trend, arredor dunha tendencia linear determinística.
O argumento nivel determina o tamaño da xanela utilizada para o suavizado
de Bartlett. Cando indicas un valor negativo, iso tómase como sinal para
que se utilice unha xanela automática de tamaño 4(T/100)^0.25, onde T é o
tamaño da mostra.
Se escolles a opción --verbose, preséntanse os resultados da regresión
auxiliar xunto coa varianza estimada da compoñente de paseo aleatorio da
variable.
Os puntos críticos amosados para o estatístico de proba baséanse en
superficies de resposta estimadas do xeito establecido por Sephton
(Economics Letters, 1995), que son máis fiables para mostras pequenas ca os
valores indicados no artigo orixinal de KPSS. Cando o estatístico de proba
cae entre os puntos críticos do 1 e do 10 por cento, amósase unha
probabilidade asociada (valor p) que se obtén mediante interpolación
linear e non debe de tomarse demasiado literalmente. Consulta a función
"kpsscrit" para ver un medio de obter eses puntos críticos coa axuda do
programa.
Datos de panel
Cando se utiliza a instrución kpss con datos de panel, para realizar unha
proba de raíz unitaria de panel, as opcións aplicables e os resultados
amosados son algo diferentes. Mentres que no caso habitual de series
temporais, podes indicar unha lista de variables para comprobar, con datos
de panel só podes comprobar unha variable por cada instrución. E a opción
--verbose ten un significado diferente, pois xera unha breve presentación
da proba para cada serie temporal individual (xa que, por defecto, só se
amosa o resultado global).
Cando é posible, calcúlase a proba global (Hipótese nula: O PE da serie
en cuestión é estacionario para todas as unidades do panel) utilizando
para elo o método de Choi (Journal of International Money and Finance,
2001). Isto non sempre é sinxelo pois a dificultade está en que, mentres
que a proba de Choi se basea nas probabilidades asociadas das probas coas
series individuais, non temos actualmente un xeito de calcular as
probabilidades asociadas para o estatístico de proba KPSS; debemos de
apoiarnos nuns poucos puntos críticos.
Se o estatístico de proba con unha determinada serie, cae entre os puntos
críticos do 1 e do 10 por cento, podemos interpolar unha probabilidade
asociada. Pero se o valor do estatístico da proba cae por debaixo do
correspondente ao 10 por cento ou se excede ao do 1 por cento, non se pode
interpolar e como moito pódese establecer un límite sobre a proba de Choi
global. Se o valor do estatístico de proba individual cae por debaixo do
correspondente ao 10 por cento para unhas unidades e excede ao do 1 por
cento para outras, nin sequera se pode calcular un límite para a proba
global.
Ruta do menú: /Variable/Probas de raíz unitaria/Proba KPSS
# labels Dataset
Variantes: labels [ listavariables ]
labels --to-file=nomeficheiro
labels --from-file=nomeficheiro
labels --delete
Exemplos: oprobit.inp
Coa primeira forma, se presentan as etiquetas informativas (se existen) das
series de listavariables, ou de todas as series do conxunto de datos cando
non especificas listavariables.
Coa opción --to-file se escriben no ficheiro indicado, as etiquetas de
todas as series do conxunto de datos, unha etiqueta por cada liña. Se non
hai ningunha etiqueta, amósase un fallo; e se algunhas series teñen
etiqueta e outras non, preséntase unha liña en branco para as series sen
etiqueta. O ficheiro resultante vaise escribir no cartafol "workdir" vixente
nese momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Coa opción --from-file, lese o ficheiro especificado (que debe de ser de
texto plano) e asígnanse etiquetas ás series do conxunto de datos,
léndose unha etiqueta por liña e usando liñas en branco para indicar
etiquetas en branco.
A opción --delete fai o que cabería agardar pois elimina todas as
etiquetas das series do conxunto de datos.
Ruta do menú: /Datos/Etiquetas de variables
# lad Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--no-vcv (Non calcula a matriz de covarianzas)
--quiet (Non presenta nada)
Calcula unha regresión que minimiza a suma das desviacións absolutas dos
valores axustados respecto aos valores observados da variable dependente. As
estimacións dos coeficientes derívanse utilizando o algoritmo do simplex
de Barrodale-Roberts; e preséntase unha advertencia se a solución non é
única.
As desviacións padrón dedúcense utilizando o procedemento 'bootstrap' con
500 extraccións. A matriz de covarianzas dos estimadores dos parámetros,
que se presenta cando indicas --vcv, baséase no mesmo 'bootstrap'. Dado que
esta é unha operación custosa dabondo, a opción --no-vcv proporciónase
para aqueles casos nos que non se precisa a matriz de covarianzas; cando
indicas esta opción, as desviacións padrón no van estar dispoñibles.
Ten en conta que este método pode resultar lento cando a mostra é moi
longa ou cando hai moitos regresores. Por iso, neses casos, pode ser mellor
utilizar a instrución "quantreg". Dadas unha variable dependente y e unha
lista X de regresores, as seguintes instrucións son basicamente
equivalentes, coa excepción de que o método "quantreg" utiliza o algoritmo
máis rápido de Frisch-Newton, e que proporciona as desviacións padrón
analíticas en lugar das de "bootstrapping".
lad y const X
quantreg 0.5 y const X
Ruta do menú: /Modelar/Estimación Robusta/Mínima Desviación Absoluta
# lags Transformations
Argumentos: [ nivel ; ] listaretardos
Opción: --bylag (Ordena os termos por retardo)
Exemplos: lags x y
lags 12 ; x y
lags 4 ; x1 x2 x3 --bylag
Mira tamén sw_ch12.inp, sw_ch14.inp
Xera novas series que conteñen os valores retardados de cada unha das
series de listavariables. Por defecto, o número de retardos que se crean é
igual á periodicidade dos datos. Por exemplo, se a periodicidade é 4
(trimestral), a instrución "lags x" xera
x_1 = x(t-1)
x_2 = x(t-2)
x_3 = x(t-3)
x_4 = x(t-4)
Podes controlar o número de retardos xerados mediante o primeiro parámetro
opcional (que, se existe, debe de estar seguido dun punto e coma).
A opción --bylag ten sentido só cando listavariables contén máis dunha
serie e o nivel máximo de retardos é maior ca 1. Por defecto, engádense
os termos retardados ao conxunto de datos, por variable: primeiro todos os
retardos da primeira serie da lista, despois todos os retardos da segunda
serie, etcétera. Pero cando indicas --bylag, a ordenación faise por
retardos: primeiro o retardo 1 de todas as series da lista, despois o
retardo 2 de todas as series da lista, etcétera.
Esta prestación tamén está dispoñible como función: consulta "lags".
Ruta do menú: /Engadir/Retardos das variables seleccionadas
# ldiff Transformations
Argumento: listavariables
Obtense a primeira diferenza do logaritmo natural de cada unha das series de
listavariables, e o resultado gárdase nunha nova serie co prefixo ld_. Así
"ldiff x y" xera as novas variables
ld_x = log(x) - log(x(-1))
ld_y = log(y) - log(y(-1))
Ruta do menú: /Engadir/Diferenzas de logaritmos das variables seleccionadas
# leverage Tests
Opcións: --save (Garda as series resultantes)
--overwrite (Conformidade para sobrescribir series xa existentes)
--quiet (Non presenta os resultados)
--plot=Modo-ou-nomeficheiro (Mira abaixo)
Exemplos: leverage.inp
Debe de ir despois dunha instrución de MCO ("ols"). Calcula o pancamento
(h, que debe de caer no rango entre 0 e 1) para cada punto de datos da
mostra sobre a que se estimou o modelo previo. Amosa o erro (u) para cada
observación xunto co seu pancamento e unha medida da súa influencia nas
estimacións, uh/(1 - h). Os "puntos de Leverage" para os que o valor de h
supera 2k/n (onde k é o número de parámetros que se estiman e n é o
tamaño da mostra) destácanse mediante un asterisco. Para obter máis
detalles sobre os conceptos de pancamento e influencia, consulta o capítulo
2 do libro de Davidson e MacKinnon (1993).
Tamén se calculan os valores DFFITS: estes son iguais aos Erros tipificados
(erros divididos polos seus desvíos padrón) multiplicados pola raíz
cadrada de h(1 - h). Proporcionan unha medida da diferenza no axuste da
observación i dependendo de se esa observación está incluída ou non na
mostra da estimación. Para máis información sobre este apartado, consulta
o capítulo 12 do libro de Maddala Introduction to Econometrics ou Belsley,
Kuh e Welsch (1980). Para máis detalles sobre os Erros tipificados consulta
máis abaixo, a sección titulada Matriz mediante accesorio.
Cando especificas a opción --save xunto con esta instrución, os valores de
pancamento, influencia e DFFITS engádense ao conxunto vixente de datos;
neste contexto, podes utilizar a opción --quiet para eliminar a
presentación dos resultados. Os nomes por defecto das series gardadas son
lever, influ e dffits, respectivamente. Se xa existen series con eses nomes,
o que aconteza dependerá de se indicas a opción --overwrite, pois nese
caso vanse sobrescribir as series xa existentes. En caso contrario, os nomes
vanse axustar para poder garantir a unicidade, e as series novas xeradas
serán as tres series con números ID máis grandes do conxunto de datos.
Logo da execución, o accesorio "$test" devolve o criterio de validación
cruzada, que se define como a suma das desviacións cadradas da variable
dependente con relación aos seus valores de predición, estando a
predición para cada observación baseada nunha mostra da que se exclúe esa
observación. (Este é o coñecido como estimador deixar-un-fóra). Para
unha discusión máis ampla sobre o criterio de validación cruzada,
consulta o libro de Davidson e MacKinnon Econometric Theory and Methods,
páxinas 685-686, e as referencias que contén.
Por defecto, se fas unha chamada interactiva a esta instrución, amósase
unha gráfica cos valores de pancamento e influencia. Podes axustar isto
mediante a opción --plot. Os parámetros que se admiten para esta opción
son none (para suprimir a gráfica), display (para amosar unha gráfica
mesmo ao estar en modo de guións), ou un nome de ficheiro. O efecto de
indicar un nome de ficheiro é como o descrito para a opción --output da
instrución "gnuplot".
Matriz mediante accesorio
Amais da opción --save sinalada antes, podes recuperar os resultados desta
instrución en formato dunha matriz de tres columnas por medio do accesorio
"$result". As dúas primeiras columnas da mencionada matriz conteñen os
valores de pancamento e de influencia (como con --save), pero a terceira
columna contén os Erros tipificados, en troques dos valores DFFITS. Estes
son erros "Tipificados externamente" ou "anavallados (jackknifed)" -- isto
é, o desvío padrón que está no divisor para a observación i utiliza a
media dos cadrados dos erros, omitindo esa observación. Ese tipo de erro
pode interpretarse como un estatístico de proba t para a hipótese de que
unha variable ficticia 0/1 que codifica de xeito especial a observación i,
tería un coeficiente real nulo. Para obter máis detalles sobre a
discusión adicional arredor dos Erros tipificados, consulta Chatterjee e
Hadi (1986).
Os valores DFFITS tamén poden obterse a partir da matriz de $result do
seguinte xeito:
R = $result
dffits = R[,3] .* sqrt(R[,1] ./ (1-R[,1]))
Ou utilizando series:
series h = $result[,1] # Pancamento
series sr = $result[,3] # Erro tipificado
series dffits = sr * sqrt(h/(1-h))
Ruta do menú: Xanela de modelo: Análise/Observacións influentes
# levinlin Tests
Argumentos: nivel serie
Opcións: --nc (Sen constante)
--ct (Con constante e tendencia)
--quiet (Non presenta os resultados)
--verbose (Presenta os resultados por unidade)
Exemplos: levinlin 0 y
levinlin 2 y --ct
levinlin {2,2,3,3,4,4} y
Realiza a proba de raíz unitaria para panel descrita por Levin, Lin e Chu
(2002). A hipótese nula é que todas as series temporais individuais
presentan unha raíz unitaria, e a alternativa é que ningunha das series
ten unha raíz unitaria. (É dicir, asúmese un mesmo coeficiente común de
AR(1), aínda que noutros aspectos se permite que as propiedades
estatísticas das series varíen duns individuos a outros.)
Por defecto, as regresións da proba ADF inclúen unha constante. Para
eliminar a constante utiliza a opción --nc e para incluíla xunto cunha
tendencia linear utiliza a opción --ct. (Consulta a instrución "adf" para
unha explicación das regresións do ADF.)
Podes indicar o nivel de retardo con nivel (non negativo) para facer a proba
(controlando así o número de retardos da variable dependente a incluír
nas regresións do ADF) dunha destas dúas formas. Cando indicas un valor
escalar, isto aplícase a tódolos individuos do panel. A alternativa é
proporcionar unha matriz que conteña un nivel específico de retardos para
cada individuo; esta debe de ser un vector con tantos elementos como
individuos haxa no rango da mostra vixente. Podes especificar esa matriz co
nome ou construíla utilizando chaves, como se ilustrou no último exemplo
de arriba.
Cando indicas a opción --verbose, preséntanse os seguintes resultados para
cada unidade do panel: delta, o coeficiente do nivel retardado en cada
regresión ADF; s2e, a varianza estimada das innovacións; e s2y, a varianza
estimada a longo prazo da serie diferenciada.
Cae na conta de que as probas de raíz unitaria nun panel tamén podes
realizalas utilizando as instrucións "adf" e "kpss".
Ruta do menú: /Variable/Probas de raíz unitaria/Proba de Levin-Lin-Chu
# logistic Estimation
Argumentos: depvar indepvars
Opcións: --ymax=máximo (Especifica o máximo da variable dependente)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para unha explicación)
--vcv (Presenta a matriz de covarianzas)
--fixed-effects (Mira abaixo)
--quiet (Non presenta nada)
Exemplos: logistic y const x
logistic y const x --ymax=50
Regresión loxística: Leva a cabo unha regresión MCO utilizando a
transformación loxística da variable dependente,
log(y/(y* - y))
No caso de usar datos de panel, a especificación pode incluír os efectos
fixos individuais.
A variable dependente debe de ser estritamente positiva. Se todos os seus
valores están entre 0 e 1, por defecto utilízase un valor de y^* (o
máximo asintótico da variable dependente) igual a 1; se os seus valores
están entre 0 e 100, entón y^* é 100 por defecto.
Se queres establecer un máximo diferente, utiliza a opción --ymax. Ten en
conta que o valor que indiques debe de ser maior ca todos os valores
observados da variable dependente.
Os valores axustados e os erros da regresión transfórmanse automaticamente
utilizando a inversa da transformación loxística:
y =~ E(y* / (1 + exp(-x)))
onde x representa un valor axustado ou un erro, obtidos da regresión MCO
que utiliza a variable dependente loxística. Deste xeito podes comparar os
valores que se presentan cos da variable dependente orixinal. A
aproximación é necesaria pois a transformación inversa non é linear, e
polo tanto a esperanza non se corresponde exactamente.
A opción --fixed-effects só é aplicable cando o conxunto de datos ten
forma de panel. Nese caso, réstanselle as medias de grupo da
transformación loxística da variable dependente, e a estimación continúa
como adoita facerse con efectos fixos.
Ten en conta que se a variable dependente é binaria, debes de utilizar no
seu lugar a instrución "logit".
Ruta do menú: /Modelar/Variable Dependente Limitada/Loxística
Ruta do menú: /Modelar/Panel/Loxística EF
# logit Estimation
Argumentos: depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--multinomial (Estima un logit multinomial)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
--p-values (Amosa os valores p en vez das pendentes)
--estrella (Escolle a variante pseudo-R-cadrado)
Exemplos: keane.inp, oprobit.inp
Se a variable dependente é unha variable binaria (todos os seus valores son
0 ou 1), obtéñense estimacións máximo verosímiles dos coeficientes das
variables de indepvars mediante o método de Newton-Raphson. Como o modelo
é non linear, as pendentes están condicionadas polos valores das variables
independentes. Por defecto, calcúlanse as pendentes con respecto a cada
unha das variables independentes (nas medias desas variables), e estas
pendentes substitúen os valores p habituais no resultado da regresión.
Podes prescindir deste proceder indicando a opción --p-values. O
estatístico khi-cadrado proba a hipótese nula de que todos os coeficientes
son cero, agás o da constante.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Se indicas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimadas é un
"emparedado" entre a inversa da matriz Hessiana estimada e o produto externo
do vector gradiente; consulta o capítulo 10 do libro de Davidson e
MacKinnon (2004). Pero cando indicas a opción --cluster, entón xéranse as
desviacións padrón "robustas por agrupación"; consulta o Manual de
usuario de Gretl (Capítulo 22) para obter máis detalles.
Por defecto, vaise amosar o estatístico pseudo-R-cadrado que foi suxerido
por McFadden (1974); mais no caso binario, se indicas a opción --estrella
vaise amosar en troques a variante recomendada por Estrella (1998). Esta
variante previsiblemente imita de xeito máis semellante as propiedades do
R^2 habitual no contexto da estimación de mínimos cadrados.
Se a variable dependente non é binaria senón discreta, entón por defecto
interprétase como unha resposta ordinal e obtéñense as estimacións cun
Logit Ordenado. Porén, cando indicas a opción --multinomial, a variable
dependente interprétase como unha resposta sen ordenar e xéranse as
estimacións cun Logit Multinomial. (Noutro caso, se a variable escollida
como dependente non é de tipo discreto, amósase un fallo.) No caso
multinomial, o accesorio $mnlprobs está dispoñible despois da estimación,
para conseguir unha matriz que conteña as probabilidades estimadas dos
posibles valores da variable dependente para cada observación (coas
observacións por filas e os posibles valores por columnas).
Se queres utilizar un Logit para a análise de proporcións onde, para cada
observación, a variable dependente é a proporción de casos que teñen
unha determinada característica (en vez dunha variable con 1 ou 0 para
indicar se está presente ou non a característica), non debes de utilizar a
instrución "logit", senón máis ben construír a variable logit, como en
series lgt_p = log(p/(1 - p))
e utilizar esta como a variable dependente dunha regresión MCO. Consulta o
capítulo 12 de Ramanathan (2002).
Ruta do menú: /Modelar/Variable Dependente Limitada/Logit
# logs Transformations
Argumento: listavariables
Permite obter o logaritmo natural de cada unha das series de listavariables
e o resultado gárdase nunha nova serie co prefixo l_ ("ele" e guión
baixo). Por exemplo, "logs x y" xera as novas variables l_x = ln(x) e l_y =
ln(y).
Ruta do menú: /Engadir/Logaritmos das variables seleccionadas
# loop Programming
Argumento: control
Opcións: --progressive (Permite formas especiais de certas instrucións)
--verbose (Reflicte as instrucións e amosa mensaxes confirmatorios)
Exemplos: loop 1000
loop 1000 --progressive
loop while essdiff > .00001
loop i=1991..2000 --verbose
loop for (r=-.99; r<=.99; r+=.01)
loop foreach i listaX
Mira tamén armaloop.inp, keane.inp
Esta instrución abre un modo especial no que o programa admite que as
instrucións se executen repetidas veces. Terminas o proceso de ir
introducindo as instrucións do bucle con "endloop" e neste punto
execútanse as instrucións apiñadas.
O parámetro "control" pode ter calquera das 5 formas seguintes, tal como se
amosa nos exemplos: (a) un número enteiro que indica as veces a repetir as
instrucións dun bucle; (b) a palabra "while" máis unha condición
booleana; (c) un rango de valores enteiros para o índice; (d) a palabra
"for" máis 3 expresións dentro dunha paréntese, separadas con punto e
comas (que imita a orde for na linguaxe de programación C); ou (e) a
palabra "foreach" máis unha variable índice e unha lista.
Consulta o Manual de usuario de Gretl (Capítulo 13) para obter outros
detalles e exemplos. Aí explícase o efecto da opción --progressive (que
está deseñada para utilizarse con simulacións de tipo Monte Carlo). Non
podes utilizar todas as instrucións de GRETL dentro dun bucle; por iso as
instrucións dispoñibles neste contexto tamén se expoñen aí.
Por defecto, a execución de instrucións faise de xeito máis silandeiro
dentro de bucles ca noutros contextos. Se queres máis retroalimentación co
que estea a pasar nun bucle, indica a opción --verbose.
# mahal Statistics
Argumento: listavariables
Opcións: --quiet (Non presenta nada)
--save (Engade as distancias ao conxunto de datos)
--vcv (Presenta a matriz de covarianzas)
Calcula as distancias de Mahalanobis entre as series indicadas en
listavariables. A distancia de Mahalanobis é a distancia entre dous puntos
nun espazo de dimensión k, escalada pola variación estatística en cada
dimensión do espazo. Por exemplo, se p e q son dúas observacións dun
conxunto de k variables con matriz de covarianzas C, entón a distancia de
Mahalanobis entre as observacións ven dada por
sqrt((p - q)' * C-inverse * (p - q))
onde (p - q) é un vector de dimensión k. Isto redúcese á distancia
euclidiana en caso de que a matriz de covarianzas sexa unha matriz
identidade.
O espazo para o que se calculan as distancias está definido polas variables
seleccionadas. Para cada observación do rango vixente da mostra, a
distancia calcúlase entre a observación e o centroide das variables
escollidas. Esta distancia é a contrapartida multidimensional dunha
puntuación z estándar, e podes utilizala para xulgar se unha observación
dada "ten un sitio" xunto a un grupo doutras observacións.
Cando indicas a opción --vcv, preséntanse tanto a matriz de covarianzas
como a súa inversa. Cando indicas a opción --save, as distancias gárdanse
no conxunto de datos co nome mdist (ou mdist1, mdist2 e así sucesivamente,
se xa existe unha variable con ese nome).
Ruta do menú: /Ver/Distancias de Mahalanobis
# makepkg Programming
Argumento: nomeficheiro
Opcións: --index (Escribe o ficheiro índice, auxiliar)
--translations (Escribe o ficheiro de cadeas de texto, auxiliar)
--quiet (Funciona silandeiramente)
Dá soporte á creación dun paquete de funcións de GRETL mediante a liña
de instrucións. O modo de funcionamento desta instrución depende da
extensión do nomeficheiro, que debe de ser ben .gfn ou ben .zip.
Modo gfn
Escribe un ficheiro gfn. Asúmese que pode accederse a un ficheiro de
especificación dun paquete, que ten o mesmo nome base ca nomeficheiro pero
coa extensión .spec, xunto con calquera ficheiro auxiliar ao que faga
referencia. Tamén asúmese que todas as funcións a empaquetar léronse na
memoria.
Modo zip
Escribe un ficheiro comprimido zip dun paquete (un gfn máis outros
elementos). En caso de acharse un ficheiro gfn co mesmo nome base que
nomeficheiro, GRETL comproba os ficheiros correspondentes inp e spec, e se
os atopa a ambos, sendo polo menos un deles máis novo ca o ficheiro gfn,
entón vólvese xerar o gfn; se non, utilízase o gfn existente. Cando non
se atopa ese ficheiro, GRETL tenta primeiro xerar o gfn.
Opcións de gfn
Os indicadores de opcións admiten a escritura de ficheiros auxiliares,
pensados para utilizar cos "engadidos" de GRETL. O ficheiro índice é un
curto documento XML que contén información básica sobre o paquete, e que
ten o seu mesmo nome como base ademáis da extensión .xml. O ficheiro de
traducións contén as cadeas de texto do paquete (en formato C) que
poderían ser apropiadas para a tradución; para un paquete foo este
ficheiro chámase foo-i18n.c. Estes ficheiros non se xeran se a instrución
opera en modo zip, e se utiliza un ficheiro gfn que xa existía.
Para obter máis detalles sobre todo isto, consulta o Manual de paquetes de
funcións de GRETL.
Ruta do menú: /Ficheiro/Paquetes de funcións/Novo paquete
# markers Dataset
Variantes: markers --to-file=nomeficheiro
markers --from-file=nomeficheiro
markers --to-array=nome
markers --from-array=nome
markers --from-series=nome
markers --delete
As opcións --to-file e --to-array proporcionan xeitos de gardar as cadeas
de texto que son marcadores das observacións do conxunto vixente de datos,
ben no ficheiro ou ben no arranxo que indiques. Se non existe ningunha desas
cadeas, amósase un fallo. No caso do ficheiro, as cadeas escríbense unha
por cada liña nese ficheiro, e este gárdase no cartafol ("workdir")
establecido nese momento, agás que a cadea nomeficheiro conteña unha
especificación completa da ruta. No caso do arranxo, se nome é o
identificador dun arraxo de cadeas de texto xa existente, ese arranxo vaise
sobrescribir; noutro caso, vaise crear un novo.
Coa opción --from-file, lese o ficheiro especificado (que debe de ser de
texto UTF-8) e asígnanse os marcadores de observación contidos neste, un
por cada liña, ás filas do conxunto de datos. En xeral, debería de haber
como mínimo tantos marcadores no ficheiro como observacións no conxunto de
datos; pero se o conxunto de datos é de tipo panel, tamén se acepta que o
número de marcadores no ficheiro coincida co número de unidades de
sección cruzada (en cuxo caso os marcadores repítense para cada período
de tempo.) A opción --from-array funciona de xeito similar, facendo a
lectura a partir dun arranxo de cadeas de texto determinado.
A opción --from-series ofrece un xeito apropiado de crear marcadores de
observación, copiándoos dunha serie con valores en forma de cadeas de
texto. Amósase un fallo cando a serie indicada non ten valores de cadea de
texto.
A opción --delete fai o que xa agardarías, é dicir, eliminar as cadeas de
texto que marcan cada observación do conxunto de datos.
Ruta do menú: /Datos/Marcadores das observacións
# meantest Tests
Argumentos: serie1 serie2
Opción: --unequal-vars (Asume que as varianzas non son iguais)
Calcula o estatístico t para probar a hipótese nula de que as medias na
poboación son iguais para as variables serie1 e serie2, e amosa a súa
probabilidade asociada (valor p).
Por defecto, o estatístico de proba calcúlase baixo o suposto de que as
varianzas son iguais para as dúas variables.Coa opción --unequal-vars
asúmese que as varianzas son diferentes; e neste caso, os graos de
liberdade do estatístico de proba aproxímanse consonte a Satterthwaite
(1946).
Ruta do menú: /Ferramentas/Calculadora de estatísticos de proba
# midasreg Estimation
Argumentos: depvar indepvars ; termosMIDAS
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--quiet (Non presenta os resultados)
--levenberg (Mira abaixo)
Exemplos: midasreg y 0 y(-1) ; mds(X, 1, 9, 1, theta)
midasreg y 0 y(-1) ; mds(X, 1, 9, 0)
midasreg y 0 y(-1) ; mdsl(XL, 2, theta)
Mira tamén gdp_midas.inp
Leva a cabo a estimación por mínimos cadrados (ben MCNL ou ben MCO,
dependendo da especificación) dun modelo MIDAS (Mixed Data Sampling). Este
tipo de modelos inclúe unha ou máis variables independentes que se
observan cunha frecuencia maior que a variable dependente; para unha boa e
breve introdución consulta Armesto, Engemann e Owyang (2010).
As variables de indepvars deben de ter a mesma frecuencia que a variable
dependente. Esta lista normalmente debe incluír const ou 0 (ordenada na
orixe), e habitualmente inclúe un ou máis retardos da variable dependente.
Os termos de alta frecuencia indícanse despois dun punto e coma; cada un
ten o formato duns cuantos argumentos entre parénteses, separados con
comas, precedidos ben por mds ou ben por mdsl.
mds: Esta variante xeralmente require 5 argumentos, do xeito seguinte: o
nome dunha "MIDAS list", dous enteiros que indican os retardos mínimo e
máximo de alta frecuencia, un enteiro entre 0 e 4 (ou unha cadea de texto,
mira baixo) que especifica o tipo de disposición dos parámetros que se vai
usar, e o nome dun vector que contén os valores iniciais dos parámetros. O
exemplo de abaixo solicita os retardos do 3 ao 11 das series de alta
frecuencia representadas na lista X, utilizando para elo unha disposición
dos parámetros de tipo 1 (Almon exponencial, mira abaixo) co vector de
inicio theta.
mds(X, 3, 11, 1, theta)
mdsl: Xeralmente require 3 argumentos: o nome dunha lista de retardos MIDAS,
un número enteiro (ou unha cadea de texto, mira baixo) para especificar o
tipo de disposición dos parámetros e o nome dun vector de inicio. Neste
caso, os retardos máximo e mínimo están implícitos no argumento inicial
da lista. No exemplo de abaixo Xlags debe de ser unha lista que xa conteña
todos os retardos que se necesiten; podes construír unha lista dese tipo
utilizando a función "hflags".
mdsl(XLags, 1, theta)
Os tipos de disposición de parámetros que se admiten amósanse abaixo. No
contexto das especificacións mds e mdsl, podes indicalos en forma dos
códigos numéricos, ou das cadeas de texto entre comiñas que se amosan
despois dos números:
0 ou "umidas": MIDAS sen restricións ou U-MIDAS, no que cada retardo ten o
seu propio coeficiente.
1 ou "nealmon": Almon exponencial normalizada, que require polo menos un
parámetro e habitualmente utiliza dous.
2 ou "beta0": Beta normalizada cun derradeiro retardo nulo, que require
exactamente dous parámetros.
3 ou "betan": Beta normalizada cun derradeiro retardo non nulo, que require
exactamente tres parámetros.
4 ou "almonp": Polinomio de Almon (non normalizada), que require polo menos
un parámetro.
5 or "beta1": Similar a beta0, mais co primeiro parámetro fixado en 1
(deixando un único parámetro libre).
Cando a disposición de parámetros é U-MIDAS, non é necesario o vector de
inicio do último argumento. Noutros casos, podes solicitar unha iniciación
automática substituíndo o nome do vector de parámetros inicial por
algunha destas dúas formas:
A palabra chave null: isto só é admisible cando a disposición dos
parámetros ten un número fixo de termos (os casos Beta, con 2 ou 3
parámetros). Tamén se acepta no caso do Almon exponencial, o que implica
que ese é o valor por defecto dos dous parámetros.
Un valor enteiro que indica o número requirido de parámetros.
O método de estimación que utiliza esta instrución depende da
especificación dos elementos de alta frecuencia. No caso de U-MIDAS, o
método é MCO (OLS); noutro caso, é mínimos cadrados non lineais (MCNL ou
NLS). Cando especificas as disposicións de parámetros Almon exponencial
normalizada ou Beta normalizada, o método MCNL por defecto é unha
combinación de BFGS restrinxido e MCO, pero podes indicar a opción
--levenberg para forzar que se utilice o algoritmo de Levenberg-Marquardt.
Ruta do menú: /Modelar/Series temporais univariantes/MIDAS
# mle Estimation
Argumentos: función logaritmo-verosimilitude [ derivadas ]
Opcións: --quiet (Non amosa o modelo estimado)
--vcv (Presenta a matriz de covarianzas)
--hessian (Basea a matriz de covarianzas na Hessiana)
--robust[=hac] (Matriz de covarianzas CMV (QML) ou HAC)
--cluster=clustvar (Matriz de covarianzas robusta por agrupación)
--verbose (Presenta os detalles das iteracións)
--no-gradient-check (Mira abaixo)
--auxiliary (Mira abaixo)
--lbfgs (Utiliza L-BFGS-B en vez do BFGS habitual)
Exemplos: weibull.inp, biprobit_via_ghk.inp, frontier.inp, keane.inp
Realiza a estimación de Máxima Verosimilitude (MV ou ML) utilizando ben o
algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno) ou ben o método de
Newton. Debes de especificar a función logaritmo de verosimilitude. E debes
de expresar os parámetros desta función, e asignarlles valores iniciais
antes da estimación. Opcionalmente, o usuario pode especificar as derivadas
da función logaritmo de verosimilitude con respecto a cada un dos
parámetros; se non indicas as derivadas analíticas, calcúlase unha
aproximación numérica.
Este texto de axuda asume que se utiliza, por defecto, o maximizador BFGS.
Para obter máis información sobre o uso do método de Newton, por favor
consulta o Manual de usuario de Gretl (Capítulo 26).
Exemplo sinxelo: Supón que temos unha serie X con valores 0 ou 1, e
queremos obter a estimación máximo verosímil da probabilidade (p) de que
X = 1. (Neste caso sinxelo, pódese adiantar que a estimación MV de p será
simplemente equivalente á proporción de Xs iguais a 1, na mostra.)
Débese primeiro engadir o parámetro p ao conxunto de datos, e indicar o
seu valor inicial. Por exemplo, scalar p = 0.5.
A continuación, configúrase o bloque de instrucións de estimación EMV:
mle loglik = X*log(p) + (1-X)*log(1-p)
deriv p = X/p - (1-X)/(1-p)
end mle
A primeira liña de arriba especifica a función logaritmo de
verosimilitude. Comeza coa palabra chave mle, logo especifícase a variable
dependente e indícase unha expresión para o logaritmo da verosimilitude
(usando a mesma sintaxe que na instrución "genr"). A seguinte liña (que é
opcional) comeza coa palabra chave deriv e proporciona a derivada da
función logaritmo de verosimilitude con respecto ao parámetro p. Se non
indicas as derivadas, debes de incluír unha orde utilizando a palabra chave
params que identifique os parámetros libres: estes enuméranse nunha liña,
separados por espazos e poden ser ben escalares, ben vectores, ou ben
calquera combinación dos dous. Por exemplo, podes mudar o de arriba por:
mle loglik = X*log(p) + (1-X)*log(1-p)
params p
end mle
en cuxo caso utilizaríanse derivadas numéricas.
Ten en conta que calquera indicador de opción debe de engadirse á liña
final do bloque EMV (MLE). Por exemplo:
mle loglik = X*log(p) + (1-X)*log(1-p)
params p
end mle --quiet
Matriz de covarianzas e desviacións padrón
Cando a función do logaritmo da verosimilitude devolve unha serie ou un
vector que proporciona valores por observación, entón as desviacións
padrón estimadas baséanse por defecto no Produto Externo do vector
Gradiente (PEG); mentres que se indicas a opción --hessian, baséanse pola
contra na inversa negativa da matriz Hessiana, que se aproxima
numericamente. Cando indicas a opción --robust, utilízase un estimador CMV
(QML, un "emparedado" entre a inversa negativa da matriz Hessiana e o PEG).
Se ademais engades o parámetro hac a esta opción, o PEG se incrementa do
xeito de Newey e West para permitir autocorrelación do gradente. (Isto
unicamente ten sentido con datos de series de tempo.) Agora ben, cando a
función do logaritmo da verosimilitude unicamente devolve un valor escalar,
o PEG non está dispoñible (polo tanto tampouco o estimador CMV), e as
desviacións padrón teñen que calcularse necesariamente utilizando a
matriz Hessiana numérica.
No caso de que unicamente queiras as estimacións do parámetro primario,
podes indicar a opción --auxiliary, que elimina o cálculo da matriz de
covarianzas e das desviacións padrón. Isto vai aforrar algúns ciclos de
CPU e uso de memoria.
Comprobando as derivadas analíticas
Se proporcionas as derivadas analíticas, por defecto GRETL executa unha
verificación numérica da súa credibilidade. Algunhas veces isto pode
producir falsos positivos, por situacións nas que as derivadas correctas
semellan ser incorrectas e a estimación rexéitase. Para ter isto en conta
ou para acadar unha pouca velocidade adicional, podes indicar a opción
--no-gradient-check. Obviamente, debes de facer isto só cando teñas
certeza de que o vector gradiente que especificaches é correcto.
Nomes de parámetros
Ao estimar un modelo non linear, con frecuencia é conveniente nomear os
parámetros de forma sucinta. Agora ben, ao presentar os resultados, pode
que desexes utilizar etiquetas máis informativas. Isto o podes lograr
mediante a palabra chave adicional param_names dentro do bloque de
instrucións. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser unha cadea de texto literal entre comiñas que
conteña k nomes separados por espazos, o nome dunha variable de cadea que
conteña k deses nomes, ou o nome dun arranxo con k cadeas de texto.
Para unha descrición máis en profundidade da estimación "mle" consulta o
Manual de usuario de Gretl (Capítulo 26).
Ruta do menú: /Modelar/Máxima Verosimilitude
# modeltab Utilities
Variantes: modeltab add
modeltab show
modeltab free
modeltab --output=nomeficheiro
Permite manexar a "Táboa de modelos" de GRETL; consulta o Manual de usuario
de Gretl (Capítulo 3) para obter máis detalles. As instrucións
subordinadas teñen os seguintes efectos: "add" engade o derradeiro modelo
estimado á táboa de modelos, cando sexa posible; "show" amosa a táboa de
modelos nunha xanela; e "free" limpa a táboa.
Para solicitar que se garde a táboa de modelos, usa a opción --output=
máis un nome de ficheiro. Cando o nome do ficheiro teña o sufixo ".tex", o
resultado vai estar en formato TeX; cando o sufixo sexa ".rtf", o resultado
terá formato RTF; e se non, vai estar en texto plano. No caso dun resultado
TeX, por defecto xérase un "anaco" axeitado para incluír nun documento; en
cambio, se queres un documento independente, usa a opción --complete, como
por exemplo
modeltab --output="myfile.tex" --complete
Ruta do menú: Xanela de iconas de sesión: icona de Táboa de modelos
# modprint Printing
Argumentos: matrizcoef nomes [ estadicionais ]
Opción: --output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Presenta a táboa de coeficientes e estatísticos adicionais optativos para
un modelo estimado "á man"; é útil sobre todo para funcións escritas
polo usuario.
O argumento matrizcoef debe de ser unha matriz de dimensión k por 2, que
contén k coeficientes e k desviacións padrón asociadas. O argumento nomes
debe de proporcionar polo menos k nomes para etiquetar os coeficientes.
Podes indicalo co formato: (a) dunha cadea de texto literal (contornada
entre comiñas) ou dunha variable de cadea, que conteña os nomes separados
por comas ou espazos, ou (b) un arranxo xa definido de cadeas de texto.
O argumento estadicionais (opcional) é un vector que contén p
estatísticos adicionais que se amosan debaixo da táboa de coeficientes. Se
indicas este argumento, entón nomes debe de conter k + p nomes, de forma
que os p nomes agregados se asocien aos estatísticos adicionais.
Se non indicas o argumento estadicionais e a matriz matrizcoef ten adxuntos
os nomes das filas, entón podes omitir o argumento nomes.
Para colocar o resultado nun ficheiro, utiliza a opción --output= máis un
nome de ficheiro. Cando o nome de ficheiro teña o sufixo ".tex", o
resultado vai estar en formato TeX; cando o sufixo sexa ".rtf", o resultado
terá formato RTF; e se non, vai estar en texto plano. No caso dun resultado
TeX, por defecto xérase un "anaco" axeitado para incluír nun documento; en
cambio, se queres un documento independente, usa a opción --complete.
O ficheiro resultante escríbese no cartafol ("workdir") establecido nese
momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
# modtest Tests
Argumento: [ nivel ]
Opcións: --normality (Normalidade das perturbacións)
--logs (Non linearidade: logaritmos)
--squares (Non linearidade: cadrados)
--autocorr (Autocorrelación)
--arch (ARCH)
--white (Heterocedasticidade: proba de White)
--white-nocross (Proba de White: só cadrados)
--breusch-pagan (Heterocedasticidade: proba de Breusch-Pagan)
--robust (Estimación con varianzas robustas para Breusch-Pagan)
--panel (Heterocedasticidade: por grupos)
--comfac (Restrición de factor común: só modelos AR1)
--xdepend (Dependencia de sección cruzada: só con datos de panel)
--quiet (Non presenta os detalles)
--silent (Non presenta nada)
Exemplos: credscore.inp
Debe de seguir inmediatamente a unha instrución de estimación. A
discusión de abaixo aplícase á utilización desta instrución a
continuación da estimación dun modelo dunha única ecuación; consulta o
Manual de usuario de Gretl (Capítulo 32) para unha exposición de como
opera "modtest" despois da estimación dun VAR.
Dependendo da opción que indiques, esta instrución efectúa unha destas
accións: a proba de Normalidade da perturbación de Doornik-Hansen; unha
proba de Non Linearidade (logaritmos ou cadrados) con Multiplicadores de
Lagrange; a proba de Heterocedasticidade de White (con ou sen produtos
cruzados) ou a de Breusch-Pagan (Breusch e Pagan, 1979); a proba LMF de
Autocorrelación (Kiviet, 1986); unha proba de ARCH (Heterocedasticidade
Condicional Autorregresiva; consulta tamén a instrución "arch"); unha
proba da restrición de Factor Común implícita na estimación AR(1); ou
unha proba de Dependencia de sección cruzada en modelos con datos de panel.
Coa excepción das probas de Normalidade, de Factor Común e de Dependencia
de sección cruzada, a meirande parte das opcións destas probas só están
dispoñibles para modelos estimados mediante MCO, pero mira máis abaixo
para obter máis detalles en relación con Mínimos Cadrados en 2 Etapas.
O argumento nivel (opcional) é importante só no caso de que escollas as
opcións --autocorr ou --arch. Por defecto, estas probas execútanse
utilizando un nivel de retardos igual á periodicidade dos datos, pero podes
axustar isto indicando un nivel de retardos específico.
A opción --robust aplícase unicamente cando seleccionas a proba de
Breusch-Pagan; o seu efecto consiste en que se utiliza o estimador robusto
da varianza proposto por Koenker (1981), facendo a proba menos sensible ao
suposto de Normalidade.
A opción --panel está dispoñible só cando o modelo se estima con datos
de panel; e neste caso, realízase unha proba de heterocedasticidade por
grupos (é dicir, de varianzas das perturbacións diferentes entre as
unidades de sección cruzada).
A opción --comfac está dispoñible só cando o modelo se estima mediante
un método AR(1) tal como o de Hildreth-Lu. A regresión auxiliar toma a
forma dun modelo dinámico relativamente non restrinxido, que se utiliza
para probar a restrición de factor común implícita na especificación
AR(1).
A opción --xdepend está dispoñible só para modelos estimados con datos
de panel. O estatístico de proba é o desenvolvido por Pesaran (2004). A
hipótese nula é que a perturbación distribúese independentemente entre
as unidades atemporais ou os individuos.
Por defecto, o programa presenta a regresión auxiliar na que se basea o
estatístico de proba, se é aplicable. Podes eliminar isto utilizando a
opción --quiet (presentación mínima de resultados) ou a opción --silent
(non presenta ningún resultado). Podes recuperar o estatístico de proba e
a súa probabilidade asociada (valor p) utilizando os accesorios "$test" e
"$pvalue", respectivamente.
Cando un modelo se estima por Mínimos Cadrados en 2 Etapas (consulta
"tsls"), ráchase o principio de Máxima Verosimilitude e GRETL ofrece
algúns equivalentes: a opción --autocorr calcula o estatístico de Godfrey
para probar autocorrelación (Godfrey, 1994) mentres que a opción --white
produce o estatístico da proba HET1 de heterocedasticidade (Pesaran e
Taylor, 1999).
Para probas adicionais de diagnóstico sobre os modelos, consulta "chow",
"cusum", "reset" e "qlrtest".
Ruta do menú: Xanela de modelo: Probas
# mpi Programming
Argumento: Mira abaixo
A instrución mpi empeza un bloque de expresións (que deben rematarse con
end mpi) para executarse utilizando o cómputo en paralelo da MPI (Interface
de Paso de Mensaxes). Consulta gretl-mpi.pdf para obter un informe completo
desta prestación.
# mpols Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--simple-print (Non presenta os estatísticos auxiliares)
--quiet (Non presenta os resultados)
Calcula as estimacións de MCO para o modelo especificado, utilizando
aritmética de punto flotante con precisión múltiple, coa axuda da
biblioteca Gnu Multiple Precision (GMP). Por defecto, utilízanse 256 bits
de precisión nos cálculos, pero podes aumentar isto mediante a variable de
contorna GRETL_MP_BITS. Por exemplo, cando utilizas o intérprete Bash se te
podería ocorrer a seguinte instrución para establecer unha precisión de
1024 bits antes de comezar GRETL.
export GRETL_MP_BITS=1024
Dispós dunha opción (máis ben rebuscada) para esta instrución,
principalmente co propósito de facer probas: cando a lista indepvars vai
seguida dun punto e coma, máis dunha lista posterior de números, eses
números tómanse como potencias de x que se engaden á regresión, onde x
é a última variable de indepvars. Estes termos adicionais calcúlanse e
gárdanse con precisión múltiple. No seguinte exemplo, faise a regresión
de y sobre x máis a segunda, terceira e cuarta potencias dese x:
mpols y 0 x ; 2 3 4
Ruta do menú: /Modelar/Outros Modelos Lineais/MCO Lineais de Alta Precisión
# negbin Estimation
Argumentos: depvar indepvars [ ; exposición ]
Opcións: --model1 (Utiliza o modelo NegBin 1)
--robust (Matriz de covarianzas CMV (QML))
--cluster=clustvar (Consulta "logit" para unha explicación)
--opg (Mira abaixo)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
Exemplos: camtriv.inp
Estima un modelo Binomial Negativo. Tómase a variable dependente para
representar un reconto do número de veces que ocorre un suceso dalgún
tipo, e debe de ter só valores enteiros non negativos. Por defecto,
utilízase o modelo NegBin 2 no que a varianza condicionada do reconto ven
determinada por mu(1 + αmu), onde mu denota a media condicionada. Pero se
indicas a opción --model1, a varianza condicionada é mu(1 + α).
A serie de exposición (offset, opcional) funciona do mesmo xeito que para a
instrución "poisson". O modelo de Poisson é unha forma restrinxida da
Binomial Negativa na que α = 0 por construción.
Por defecto, as desviacións padrón calcúlanse utilizando unha
aproximación numérica á matriz Hessiana na converxencia. Pero se indicas
a opción --opg, a matriz de covarianzas baséase no Produto Externo do
vector Gradiente, PEG (OPG), e se indicas a opción --robust, calcúlanse as
desviacións padrón CMV (QML), utilizando un "emparedado" entre a inversa
da matriz Hessiana e o PEG.
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de Reconto
# nls Estimation
Argumentos: función [ derivadas ]
Opcións: --quiet (Non presenta o modelo estimado)
--robust (Desviacións padrón robustas)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--no-gradient-check (Mira abaixo)
Exemplos: wg_nls.inp, ects_nls.inp
Realiza a estimación de Mínimos Cadrados Non Lineais (MCNL ou NLS)
utilizando unha versión modificada do algoritmo de Levenberg-Marquardt.
Debes de indicar a especificación dunha función e de enunciar os
parámetros desta, ademais de darlles uns valores iniciais antes da
estimación. Como opción, podes especificar as derivadas da función de
regresión con respecto a cada un dos parámetros. Se non proporcionas as
derivadas, no seu lugar debes de indicar unha lista dos parámetros que se
van estimar (separados por espazos ou comas), precedida pola palabra chave
params. Neste último caso, calcúlase unha aproximación numérica ao
Xacobiano.
Resulta máis doado amosar o que se require mediante un exemplo. O que segue
é un guión completo para estimar a función non linear de consumo
establecida no libro Econometric Analysis (capítulo 11 da 4a edición ou
capítulo 9 da 5a) de William Greene. Os números á esquerda das liñas son
só para tomar como referencia e non son parte das instrucións. Ten en
conta que calquera indicador de opción, como sería --vcv para presentar a
matriz de covarianzas dos estimadores dos parámetros, deberías de engadilo
á instrución final, end nls.
1 open greene11_3.gdt
2 ols C 0 Y
3 scalar alfa = $coeff(0)
4 scalar beta = $coeff(Y)
5 scalar gamma = 1.0
6 nls C = alfa + beta * Y^gamma
7 deriv alfa = 1
8 deriv beta = Y^gamma
9 deriv gamma = beta * Y^gamma * log(Y)
10 end nls --vcv
Con frecuencia é conveniente iniciar os parámetros cunha referencia a un
modelo linear relacionado; isto lógrase aquí coas liñas da 2 á 5. Os
parámetros alfa, beta e gamma poden establecerse con calquera valor inicial
(non necesariamente baseados nun modelo estimado con MCO), aínda que a
converxencia do procedemento de MCNL non está garantida para calquera punto
de inicio que se te antolle.
As auténticas instrucións de MCNL ocupan as liñas da 6 ata a 10. Na liña
6 indícase a instrución "nls" na que se declara a variable dependente, cun
signo de igualdade a continuación, e seguido este da especificación dunha
función. A sintaxe para o lado dereito da expresión é a mesma que a da
instrución "genr". As seguintes 3 liñas especifican as derivadas da
función de regresión con respecto a cada un dos parámetros, de un en un.
Cada liña comeza coa palabra chave "deriv", establece o nome dun
parámetro, un signo de igualdade e unha expresión pola que pode calcularse
a derivada. En lugar de proporcionar as derivadas analíticas, como
alternativa podes substituír as liñas da 7 á 9, polo seguinte:
params alfa beta gamma
A liña 10, "end nls", completa a instrución e solicita a estimación.
Calquera opción deberás de engadila a esta liña.
Se proporcionas as derivadas analíticas, por defecto GRETL executa unha
verificación numérica da súa credibilidade. Algunhas veces isto pode
producir falsos positivos, por situacións nas que as derivadas correctas
semellan ser incorrectas e a estimación rexéitase. Para ter isto en conta
ou para acadar unha pouca velocidade adicional, podes indicar a opción
--no-gradient-check. Obviamente, debes de facer isto só cando teñas
certeza de que o vector gradiente que especificaches é correcto.
Nomes de parámetros
Ao estimar un modelo non linear, con frecuencia é conveniente nomear os
parámetros de forma sucinta. Agora ben, ao presentar os resultados, pode
que desexes utilizar etiquetas máis informativas. Isto o podes lograr
mediante a palabra chave adicional param_names dentro do bloque de
instrucións. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser unha cadea de texto literal entre comiñas que
conteña k nomes separados por espazos, o nome dunha variable de cadea que
conteña k deses nomes, ou o nome dun arranxo con k cadeas de texto.
Para obter outros detalles sobre a estimación MCNL (NLS), consulta o Manual
de usuario de Gretl (Capítulo 25).
Ruta do menú: /Modelar/Mínimos Cadrados Non Lineais
# normtest Tests
Argumento: serie
Opcións: --dhansen (Proba de Doornik-Hansen, por defecto)
--swilk (Proba de Shapiro-Wilk)
--lillie (Proba de Lilliefors)
--jbera (Proba de Jarque-Bera)
--all (Fai todas as probas)
--quiet (Non presenta os resultados)
Realiza unha proba de Normalidade para a serie indicada. O tipo concreto de
proba contrólase co indicador de opción (e execútase a proba de
Doornik-Hansen cando non indicas ningunha opción). Advertencia: As probas
de Doornik-Hansen e Shapiro-Wilk son máis recomendables que as outras,
tendo en conta as súas mellores propiedades en mostras pequenas.
Mediante os accesorios "$test" e "$pvalue" podes recuperar o estatístico de
proba e a súa probabilidade asociada (valor p), respectivamente. Ten en
conta que cando indicas a opción --all, o resultado gardado é o da proba
de Doornik-Hansen.
Ruta do menú: /Variable/Probas de Normalidade
# nulldata Dataset
Argumento: lonxitude
Opción: --preserve (Retén as variables que non son series)
Exemplo: nulldata 500
Establece un conxunto de datos "en branco" que: inclúe só unha constante
máis unha variable índice, ten periodicidade 1 e contén o número de
observacións especificado no argumento. Podes utilizar isto coa intención
de facer simulacións, pois funcións coma "uniform()" e "normal()" xeran
series artificiais comezando polo principio, para reencher o conxunto de
datos. Esta instrución pode ser moi útil en combinación con "loop".
Consulta tamén a opción "seed" (semente) da instrución "set".
Por defecto, esta instrución libra todos os datos do espazo vixente de
traballo de GRETL, non só as series senón tamén as matrices, os
escalares, as cadeas de texto, etc. Agora ben, cando indicas a opción
--preserve, retense calquera variable que non sexa unha serie e estea
definida nese momento.
Ruta do menú: /Ficheiro/Novo conxunto de datos
# ols Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--jackknife (Mira abaixo)
--simple-print (Non presenta estatísticos auxiliares)
--quiet (Non presenta os resultados)
--anova (Presenta unha táboa ANOVA)
--no-df-corr (Elimina a corrección dos graos de liberdade)
--print-final (Mira abaixo)
Exemplos: ols 1 0 2 4 6 7
ols y 0 x1 x2 x3 --vcv
ols y 0 x1 x2 x3 --quiet
Calcula as estimacións de mínimos cadrados ordinarios (MCO ou OLS) sendo
depvar a variable dependente, e indepvars unha lista de variables
independentes. Podes especificar as variables co nome ou co número; e
utilizar o número cero para indicar o termo constante.
Aparte das estimacións dos coeficientes e das desviacións padrón, o
programa tamén presenta as probabilidades asociadas (valores p) aos
estatísticos t (con dúas colas) e F. Un 'valor p' por debaixo de 0.01
indica significación estatística a un nivel do 1 por cento, e márcase con
***. A marca ** indica niveles de significación entre 1 e 5 por cento, e a
marca * indica niveles entre 5 e 10 por cento. Tamén preséntanse os
estatísticos para elixir modelos (o Criterio de Información de Akaike ou
AIC, e o Criterio de Información Baiesiano de Schwarz). A fórmula
utilizada para o AIC é a proporcionada por Akaike (1974), en concreto,
menos dúas veces o logaritmo da verosimilitude maximizada máis dúas veces
o número de parámetros estimados.
Se indicas a opción --no-df-corr, non se aplica a corrección habitual dos
graos de liberdade ao calcular a varianza estimada da perturbación (e polo
tanto, tampouco as desviacións padrón dos estimadores dos parámetros).
A opción --print-final é aplicable só no contexto dun bucle ("loop"), e
dispón que a regresión se execute silandeiramente en todas as iteracións
do bucle, agás na derradeira. Consulta o Manual de usuario de Gretl
(Capítulo 13) para obter máis detalles.
Podes recuperar varias variables internas despois da estimación. Por
exemplo:
series uh = $uhat
garda os erros da estimación baixo o nome uh. Consulta a sección
"Accesorios" da Guía de funcións de GRETL para obter máis detalles.
Podes axustar a fórmula (versión "HC") específica que se vai utilizar
para xerar as desviacións padrón robustas cando indicas a opción
--robust, mediante a instrución "set". A opción --jackknife ten como
consecuencia a selección dunha hc_version de 3a. A opción --cluster anula
a selección da versión HC, e produce as desviacións padrón robustas
agrupando as observacións segundo os distintos valores de clustvar.
Consulta o Manual de usuario de Gretl (Capítulo 22) para obter máis
detalles.
Ruta do menú: /Modelar/Mínimos Cadrados Ordinarios
Outro acceso: Botón co símbolo beta na barra de ferramentas
# omit Tests
Argumento: listavariables
Opcións: --test-only (Non substitúe o modelo vixente)
--chi-square (Devolve a forma Khi-cadrado da proba de Wald)
--quiet (Presenta só os resultados básicos da proba)
--silent (Non presenta nada)
--vcv (Presenta a matriz de covarianzas do modelo reducido)
--auto[=alfa] (Eliminación secuencial, mira abaixo)
Exemplos: omit 5 7 9
omit seasonals --quiet
omit --auto
omit --auto=0.05
Mira tamén restrict.inp, sw_ch12.inp, sw_ch14.inp
Esta instrución debe de ir despois dunha instrución de estimación. Na
súa forma básica, calcula o estatístico de proba de Wald para a
significación conxunta das variables de listavariables, que debe ser un
subconxunto (aínda que non necesariamente un subconxunto axeitado) das
variables independentes do último modelo estimado. Podes recuperar os
resultados da proba utilizando os accesorios "$test" e "$pvalue".
Agás que a restrición elimine todos os regresores orixinais, por defecto,
estímase o modelo restrinxido e este substitúe ao orixinal como "modelo
vixente" se tes intención, por exemplo, de recuperar os erros con $uhat ou
facer probas posteriores. Podes impedir este comportamento mediante a
opción --test-only.
Por defecto, rexístrase a forma F da proba de Wald; pero podes utilizar a
opción --chi-square para recoller a forma khi-cadrado no seu lugar.
Se tanto estimas como representas o modelo restrinxido, a opción --vcv ten
o efecto de presentar a súa matriz de covarianzas; se non, esta opción
ignórase.
Como alternativa, cando indicas a opción --auto, lévase adiante a
eliminación secuencial por pasos. En cada etapa exclúese a variable ligada
á maior probabilidade asociada (valor p), ata que todas as que queden
estean ligadas a valores p que non sexan maiores ca algún valor de corte.
Por defecto, este é do 10 por cento (con 2 colas) e podes axustalo
engadindo "=", e un valor entre 0 e 1 (sen espazos), como no cuarto exemplo
de arriba. Se indicas listavariables, este proceso limítase só ás
variables da lista; se non, todos os regresores aparte da constante se
tratan como candidatos á exclusión. Cae na conta de que as opcións --auto
e --test-only non podes combinalas.
Ruta do menú: Xanela de modelo: Probas/Excluír variables
# open Dataset
Argumento: nomeficheiro
Opcións: --quiet (Non presenta a lista das series)
--preserve (Retén as variables que non son series)
--select=seleccion (Ler só as series indicadas, mira abaixo)
--frompkg=nomepaquete (Mira abaixo)
--all-cols (Mira abaixo)
--www (Utiliza un banco de datos do servidor de GRETL)
--odbc (Utiliza un banco de datos ODBC)
Mira abaixo para opcións adicionais especiais
Exemplos: open data4-1
open voter.dta
open fedbog.bin --www
open dbnomics
Abre un ficheiro de datos ou un banco de datos (consulta o Manual de usuario
de Gretl (Capítulo 4) para ver unha explicación desta distinción). As
consecuencias son algo diferentes nos dous casos. Cando abres un ficheiro de
datos, léese o seu contido no espazo de traballo de GRETL, substituíndo o
banco de datos vixente (se hai algún). Para engadir datos ao conxunto
vixente, en troques de substituílo, consulta "append" ou (para ter maior
flexibilidade) "join". Cando abres un banco de datos, non se carga
inmediatamente ningún dato; mais ben, establécese a fonte para chamadas
posteriores da instrución "data", que se utiliza para importar series
concretas. Para obter máis detalles en relación aos bancos de datos,
consulta a sección titulada "Abrindo un banco de datos" máis abaixo.
Se non indicas nomeficheiro cunha ruta completa, GRETL procura nalgunhas
rutas destacadas para tratar de atopar o ficheiro, das que o cartafol
vixente ("workdir") é a primeira elección. Se non indicas o sufixo no nome
de ficheiro (como no primeiro exemplo de arriba), GRETL asume que é un
ficheiro de datos propio con sufixo .gdt. Baseándose no nome do ficheiro e
varias regras heurísticas, GRETL tratará de detectar o formato do ficheiro
de datos (propio, texto plano, CSV, MS Excel, Stata, SPSS, etc.).
Cando se utiliza a opción --frompkg, GRETL vai procurar o ficheiro
especificado de datos no subcartafol asociado ao paquete de funcións
especificado por nomepaquete.
Se o argumento nomeficheiro toma a forma dun identificador de recursos
uniforme (URI) que comeza por http:// ou por https://, entón GRETL tratará
de descargar o ficheiro de datos indicado, antes de abrilo.
Por defecto, ao abrir un novo ficheiro de datos líbrase a sesión vixente
de GRETL, o que inclúe a eliminación de todas as variables definidas,
incluíndo matrices, escalares e cadeas de texto. Se queres manter as
variables que teñas definidas nese momento (as que non sexan series, pois
estas elimínanse obrigatoriamente), utiliza a opción --preserve.
Ficheiros de folla de cálculo
Ao abrir un ficheiro de datos con formato de folla de cálculo (Gnumeric,
Open Document ou MS Excel), podes facilitar tres parámetros adicionais
despois do nome do ficheiro. Primeiro, podes escoller unha folla de cálculo
concreta dentro do ficheiro. Isto faise, ben indicando o número de folla
por medio da sintaxe (e.g., --sheet=2), ou ben indicando o nome da folla (se
o sabes) entre comiñas, como en --sheet="MacroData" pois, por defecto,
vaise ler a primeira folla de cálculo do ficheiro. Tamén podes especificar
un desprazamento de columna e/ou de fila dentro da folla de cálculo
mediante, e.g.,
--coloffset=3 --rowoffset=2
o que vai provocar que GRETL ignore as 3 primeiras columnas e as 2 primeiras
filas. Por defecto, hai un desprazamento de 0 en ambas dimensións, é
dicir, comézase a ler na cela de arriba á esquerda.
Ficheiros de texto delimitado
Con ficheiros de texto plano, GRETL habitualmente agarda atopar as columnas
de datos delimitadas dalgún xeito estándar (en xeral mediante coma,
tabulador, espazo, ou punto e coma). Por defecto, GRETL procura na primeira
columna as etiquetas ou as datas das observacións, se o seu encabezamento
ben está baleiro ou ben contén unha cadea de texto suxestiva tal como
"year", "date" ou "obs". Podes evitar que GRETL trate de xeito especial a
primeira columna indicando a opción --all-cols.
Texto de formato fixo
Un ficheiro de datos en texto con "formato fixo" é aquel que non ten
delimitadores de columna, pero no que os datos dispóñense de acordo a un
conxunto coñecido de especificacións como, por exemplo, "a variable k
ocupa 8 columnas comezando na columna 24". Para ler ese tipo de ficheiros,
debes de engadir unha cadea de texto con --fixed-cols=colspec, onde colspec
componse de números enteiros separados por comas. Estes enteiros se
interpretan coma un conxunto de pares. O primeiro elemento de cada par
denota unha columna de comezo, medida en bytes desde o principio da liña,
na que o 1 indica o primeiro byte; e o segundo elemento de cada par indica
cantos bytes se deben de ler para o campo indicado. Así, por exemplo, se
indicas
open fixed.txt --fixed-cols=1,6,20,3
entón GRETL vai ler 6 bytes comezando na columna 1 para a variable 1; e
para a variable 2, vai ler 3 bytes comezando na columna 20. As liñas que
están en branco, ou que comezan con # ignóranse; pero en caso contrario
aplícase o padrón de lectura de columnas, e cando se atopa algo distinto a
un valor numérico válido, amósase un fallo. Cando se len os datos
satisfactoriamente, as variables vanse designar como v1, v2, etc. Está nas
mans do usuario o facilitar nomes con significado e/ou descricións,
utilizando para elo as instrucións "rename" e/ou "setinfo".
Por defecto, cando importas un ficheiro que contén series con valores en
formato de cadea de texto, ábrese unha caixa de texto amosándote o contido
de string_table.txt, un ficheiro que contén a correspondencia entre as
cadeas e a súa codificación numérica. Podes eliminar este proceder
mediante a opción--quiet.
Cargando series seleccionadas
O uso de open cun ficheiro de datos como argumento (ao contrario do caso cun
banco de datos, mira abaixo) xeralmente implica cargar todas as series do
ficheiro indicado. Porén, unicamente no caso de ficheiros orixinais de
GRETL (gdt e gdtb) é posible especificar un subconxunto de series a cargar,
mediante o seu nome. Isto se consegue por medio da opción --select, o que
require un argumento adxunto con algún destes tres formatos: o nome dunha
única serie; unha lista de nomes, separados mediante espazos e contornados
entre comiñas; ou o nome dun arranxo de cadeas de texto. Exemplos:
# Serie única
open somefile.gdt --select=x1
# Máis dunha serie
open somefile.gdt --select="x1 x5 x27"
# Método alternativo
strings Sel = defarray("x1", "x5", "x27")
open somefile.gdt --select=Sel
Abrindo un banco de datos
Como se comentou antes, podes utilizar a instrución open para abrir un
ficheiro cun banco de datos, e a continuación lelo coa instrución "data".
Os tipos de ficheiros que se admiten son os bancos de datos propios de
GRETL, RATS 4.0 e PcGive.
Ademais da lectura destas clases de ficheiros na máquina local, se admiten
outros tres casos máis. Primeiro, cando indicas a opción www, GRETL vai
tratar de acceder a un banco de datos propio de GRETL co nome que
proporciones, no servidor de GRETL (por exemplo, o banco de datos fedbog.bin
cos tipos de interese da Reserva Federal do terceiro exemplo que se indicou
máis arriba). En segundo lugar, podes usar a instrución "open dbnomics"
para establecer que DB.NOMICS sexa a orixe para ler bancos de datos; sobre
isto consulta dbnomics for gretl. En terceiro lugar, se indicas a opción
--odbc, GRETL vai tratar de acceder a un banco de datos ODBC. Esta opción
explícase detalladamente no Manual de usuario de Gretl (Capítulo 42).
Ruta do menú: /Ficheiro/Abrir ficheiro de datos
Outro acceso: Arrastrar un ficheiro de datos ata a xanela principal de GRETL
# orthdev Transformations
Argumento: listavariables
Aplicable só con datos de panel. Obtense unha serie con desviacións
ortogonais adiantadas para cada variable de listavariables e gárdase nunha
nova variable co prefixoo_. Deste xeito "orthdev x y" xera as novas
variables o_x e o_y.
Os valores gárdanse un paso por diante da súa localización temporal
verdadeira (é dicir, o_x na observación t vai conter a desviación que
pertence a t - 1, falando estritamente). Isto é por compatibilidade coas
primeiras diferenzas pois así vaise perder a primeira observación de cada
serie temporal, non a última.
# outfile Printing
Variantes: outfile ficheiro
outfile --buffer=strvar
outfile --tempfile=strvar
Opcións: --append (Engadir a un ficheiro, só a primeira variante)
--quiet (Mira abaixo)
--buffer (Mira abaixo)
--tempfile (Mira abaixo)
A instrución outfile inicia un bloque co que se desvía todo resultado a
presentar, cara a un ficheiro ou buffer (ou, se o desexas, simplemente se
descarta). Dito bloque remátase coa instrución "end outfile", e despois
dela os resultados volven á canle por defecto.
Desvío cara a un ficheiro sinalado
A primeira variante que se amosa abaixo envía os resultados cara ao
ficheiro sinalado polo argumento ficheiro. Por defecto, créase un novo
ficheiro (ou sobrescríbese un xa existente). O ficheiro resultante
gardarase no cartafol "workdir" vixente da configuración, agás que a cadea
de texto ficheiro conteña unha especificación completa da ruta. Mais, se
queres engadir resultados a un ficheiro xa existente, utiliza a opción
--append.
Dispós de algunhas variantes especiais deste tema. Cando indicas a palabra
chave null en vez dun nome real de ficheiro, a consecuencia é que se
eliminan todos os resultados presentados ata que a redirección remate. Se
indicas algunha das palabras chave stdout ou stderr en lugar dun nome
típico de ficheiro, o seu efecto consiste en volver a dirixir o resultado a
un resultado estándar ou a un resultado de erro estándar, respectivamente.
No sinxelo exemplo que segue, os resultados dunha determinada regresión
escríbense no ficheiro sinalado.
open data4-10
outfile regress.txt
ols ENROLL 0 CATHOL INCOME COLLEGE
end outfile
Desvío cara a un buffer de cadea
A opción --buffer utilízase para gardar resultados nunha variable de
cadea. O parámetro que se require para esta opción debe ser o nome dunha
variable de cadea xa existente, cuxo contido vaise sobrescribir. Abaixo
amósase o mesmo exemplo indicado anteriormente, modificado para gardar unha
cadea. Neste caso, ao representar o contido de model_out vanse amosar os
resultados redirixidos.
open data4-10
string model_out = ""
outfile --buffer=model_out
ols ENROLL 0 CATHOL INCOME COLLEGE
end outfile
print model_out
Desvío cara a un ficheiro temporal
A opción --tempfile utilízase para dirixir os resultados cara a un
ficheiro temporal, cun nome xerado automaticamente que se garante que é
único, no directorio "punto" do usuario. Igual que no caso do desvío a un
buffer, o parámetro de opción debe ser o nome dunha variable de cadea:
neste caso, o seu contido sobrescríbese co nome do ficheiro temporal.
Atención: os ficheiros que se gardan no directorio 'punto', vanse depurar
ao saír do programa, polo que non utilices esta modalidade se desexas que
os resultados se conserven despois da túa sesión de GRETL.
Repetimos o sinxelo exemplo de arriba, cun par de liñas extra para ilustrar
a cuestión de que strvar indícache a onde van os resultados, e que podes
recuperalos utilizando a función "readfile".
open data4-10
string meutemp
outfile --tempfile=meutemp
ols ENROLL 0 CATHOL INCOME COLLEGE
end outfile
printf "Os resultados dirixíronse a %s\n", meutemp
printf "Os resultados foron:\n%s\n", readfile(meutemp)
# Limpar cando non se necesita máis o ficheiro
remove(meutemp)
Nalgúns casos, podes querer exercer certo control sobre o nome do ficheiro
temporal. Isto pódelo facer proporcionando unha variable de cadea de texto
que conteña seis X consecutivas, como en
string meutemp = "tmpXXXXXX.csv"
outfile --tempfile=meutemp
...
Neste caso, vaise substituír XXXXXX por unha cadea de caracteres aleatorios
que aseguren que o nome do ficheiro é único, pero vaise preservar o sufixo
".csv". Ao igual que no caso máis simple de arriba, o ficheiro escríbese
automaticamente no directorio "dot" do usuario, e modifícase o contido da
variable de cadea expresada mediante o indicador opcional, para manter a
ruta completa ao ficheiro temporal.
Discreción
Os efectos da opción --quiet son: se desactiva que se volvan presentar as
ordes de instrución, e se presentan as mensaxes auxiliares mentres os
resultados estean redirixidos. É equivalente a facer
set echo off
set messages off
agás que, cando remata a redirección, se restablecen os valores orixinais
das variables echo e messages. Esta opción está dispoñible en todo caso.
Niveis de redirección
En xeral, só podes abrir un ficheiro deste xeito nun momento dado, polo que
as chamadas a esta instrución non poden aniñarse. Porén, a utilización
desta instrución permítese dentro de funcións definidas polo usuario
(sempre que o ficheiro de resultados se peche desde dentro da mesma
función) de forma que podes desviar eses resultados temporalmente, e logo
devolvelos a un ficheiro de resultados orixinal no caso de que outfile estea
en uso nese momento polo solicitante. Por exemplo, o código
function void f (string s)
outfile interno.txt
print s
end outfile
end function
outfile externo.txt --quiet
print "Fóra"
f("Dentro")
print "De novo fóra"
end outfile
producirá un ficheiro chamado "externo.txt" que contén as dúas liñas
Fóra
De novo fóra
e un ficheiro chamado "interno.txt" que contén a liña
Dentro
# panel Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--fixed-effects (Estima con efectos fixos por grupo)
--random-effects (Modelo de efectos aleatorios ou MCX (GLS))
--nerlove (Utiliza a transformación de Nerlove)
--pooled (Estima mediante MCO combinados)
--between (Estima o modelo entre-grupos)
--robust (Desviacións padrón robustas; mira abaixo)
--time-dummies (Inclúe variables ficticias temporais)
--unit-weights (Mínimos Cadrados Ponderados)
--iterate (Estimación iterativa)
--matrix-diff (Calcula a proba de Hausman mediante a matriz-diferenza)
--unbalanced=método (Só efectos aleatorios; mira abaixo)
--quiet (Resultados menos detallados)
--verbose (Resultados máis detallados)
Exemplos: penngrow.inp
Estima un modelo de panel. Por defecto, utilízase o estimador de efectos
fixos; isto ponse en práctica restándolles as medias de grupo ou unidade,
aos datos orixinais.
Cando indicas a opción --random-effects, calcúlanse as estimacións de
efectos aleatorios, utilizando por defecto o método de Swamy e Arora
(1972). Unicamente neste caso, a opción --matrix-diff forza o uso do
método da matriz-diferenza (en contraposición ao método de regresión)
para levar adiante a proba de Hausman sobre a consistencia do estimador de
efectos aleatorios. Tamén é específica do estimador de efectos
aleatorios, a opción --nerlove que escolle o método de Nerlove (1971) en
contraposición ao de Swamy e Arora.
Como alternativa, cando indicas a opción --unit-weights, o modelo estímase
mediante mínimos cadrados ponderados, coas ponderacións baseadas na
varianza residual para as unidades respectivas de sección cruzada da
mostra. Unicamente neste caso, podes engadir a opción --iterate para xerar
estimacións iterativas e, se a iteración converxe, as estimacións
resultantes son Máximo Verosímiles.
Como posterior alternativa, se indicas a opción --between, estímase o
modelo entre-grupos (é dicir, faise unha regresión MCO utilizando as
medias dos grupos).
O procedemento por defecto para calcular desviacións padrón robustas en
modelos con datos de panel, é o estimador HAC de Arellano, pero podes
escoller as "Desviacións Padrón Corrixidas de Panel" de Beck-Katz mediante
a instrución set pcse on. Cando especificas a opción robusta, execútase a
proba conxunta F sobre os efectos fixos utilizando o método robusto de
Welch (1951).
A opción --unbalanced está dispoñible só para modelos con efectos
aleatorios, e podes usala para elixir o método ANOVA que empregar cun panel
desequilibrado. Por defecto, GRETL emprega o método de Swamy-Arora igual
que se fai para os paneis equilibrados, agás que utiliza a media armónica
das longuras das series de tempo individuais en vez da T habitual. Baixo
esta opción podes especificar, ben bc para usar o método de Baltagi e
Chang (1994), ou ben usar stata para emular a opción sa da instrución
xtreg de Stata.
Para obter máis detalles sobre a estimación dun panel, consulta o Manual
de usuario de Gretl (Capítulo 23).
Ruta do menú: /Modelar/Panel
# panplot Graphs
Argumento: vardebuxar
Opcións: --means (Serie temporal coas medias de grupo)
--overlay (Gráfica por grupo, superpostas, N <= 130)
--sequence (Gráfica por grupo, en secuencia, N <= 130)
--grid (Gráfica por grupo, en cuadrícula, N <= 16)
--stack (Gráfica por grupo, amoreadas, N <= 6)
--boxplots (Gráfica de caixa por grupo, en secuencia, N <= 150)
--boxplot (Gráfica única de caixa, todos os grupos)
--output=nomeficheiro (Enviar o resultado a un ficheiro específico)
Exemplos: panplot x --overlay
panplot x --means --output=display
Instrución de debuxo específica para datos de panel: a serie vardebuxar se
debuxa do xeito que se especifica con algunha das opcións.
Ademais das opcións --means e --boxplot, a gráfica representa
explicitamente as variacións nas dúas dimensións, a de serie temporal e a
de sección cruzada. Semellantes gráficas están limitadas no que se refire
ao número de grupos (ou tamén coñecidos como individuos ou unidades) no
rango da mostra vixente do panel. Por exemplo, a opción --overlay, que
presenta unha serie temporal para cada grupo nunha única gráfica, só
está dispoñible se o número de grupos, N, é menor ou igual a 130.
(Doutro xeito, a gráfica chegaría a ser densa de máis para resultar
instrutiva.) Se un panel é longo de máis para permitir a especificación
gráfica desexada, podes escoller provisionalmente un rango reducido de
grupos ou de unidades, como en
smpl 1 100 --unit
panplot x --overlay
smpl full
Podes usar a opción --output=nomeficheiro para controlar a forma e o
destino do resultado; consulta a instrución "gnuplot" para obter máis
detalles.
Outro acceso: Xanela principal: Menú emerxente (selección única)
# panspec Tests
Opcións: --nerlove (Utiliza o método de Nerlove para efectos aleatorios)
--matrix_diff (Utiliza o método da matriz-diferenza para a proba de Hausman)
--quiet (Suprime a presentación de resultados)
Esta instrución está dispoñible unicamente despois de estimar un modelo
con datos de panel utilizando MCO (consulta tamén "setobs"). Comproba a
especificación combinada simple fronte ás principais alternativas, a de
efectos fixos e a de efectos aleatorios.
A especificación de efectos fixos permite que a ordenada na orixe da
regresión varíe dunha unidade de sección cruzada a outra. Preséntase
unha proba F de Wald para a hipótese nula de que as ordenadas na orixe non
difiren. A especificación de efectos aleatorios descompón a varianza de
cada perturbación en dúas partes, unha parte específica da unidade de
sección cruzada e outra parte específica de cada observación concreta.
(Pódese calcular este estimador só cando o número de unidades de sección
cruzada no conxunto de datos supera ao número de parámetros a estimar.) O
estatístico de Multiplicadores de Lagrange de Breusch-Pagan comproba a
hipótese nula de que MCO combinados é axeitado fronte á alternativa de
efectos aleatorios.
MCO combinados poden rexeitarse fronte a ambas as dúas alternativas. En
tanto que a perturbación específica por unidade ou grupo non estea
correlacionada coas variables independentes, o estimador de efectos
aleatorios será máis eficiente que o de efectos fixos; se non, o estimador
de efectos aleatorios será inconsistente e serán preferibles os efectos
fixos. A hipótese nula da proba de Hausman indica que a perturbación
específica de grupo non está así correlacionada (e por iso prefírese o
estimador de efectos aleatorios). Un valor baixo da probabilidade asociada
(valor p) ao estatístico desta proba vai en contra dos efectos aleatorios e
a favor dos efectos fixos.
As dúas primeiras opcións desta instrución corresponden á estimación de
efectos aleatorios. Por defecto, utilízase o método de Swamy e Arora,
mediante o cálculo do estatístico de proba de Hausman, utilizando o
método de regresión. As opcións permiten utilizar o estimador alternativo
da varianza de Nerlove, e /ou a aproximación da matriz-diferenza ao
estatístico de Hausman.
Cando se completa con éxito, os accessorios "$test" e "$pvalue"
proporcionan 3 vectores que conteñen os estatísticos de proba e os valores
p para as tres probas indicadas arriba: combinabilidade (Wald),
combinabilidade (Breusch-Pagan), e Hausman. Se só queres os resultados
desta forma, podes indicar a opción --quiet para saltarte a presentación
de resultados.
Cae na conta de que despois de estimar a especificación de efectos
aleatorios coa instrución "panel", a proba de Hausman execútase
automaticamente e podes recuperar os resultados mediante o accesorio
"$hausman".
Ruta do menú: Xanela de modelo: Probas/Especificacións de panel
# pca Statistics
Argumento: listavariables
Opcións: --covariance (Utiliza a matriz de covarianzas)
--save[=n] (Garda as compoñentes máis importantes)
--save-all (Garda todas as compoñentes)
--quiet (Non presenta os resultados)
Análise de Compoñentes Principais. Agás cando indicas a opción --quiet,
presenta os valores propios da matriz de correlacións (ou da matriz de
covarianzas cando indicas a opción --covariance) para as variables que
forman listavariables, xunto coa proporción da varianza conxunta
representada por cada compoñente. Tamén presenta os correspondentes
autovectores ou "pesos das compoñentes".
Se indicas a opción --save-all, entón gárdanse tódalas compoñentes como
series no conxunto de datos, cos nomes PC1, PC2, etcétera. Estas variables
artificiais fórmanse como a suma dos produtos de (o peso da compoñente)
por (X_i tipificada), onde X_i denota a variable i-ésima de listavariables.
Se indicas a opción --save sen un valor do parámetro, gárdanse as
compoñentes con valores propios maiores ca media (o que significa maiores
ca 1.0 cando a análise se basea na matriz de correlacións) no conxunto de
datos, tal como se describiu arriba. Se indicas un valor para n con esta
opción, entón gárdanse as n compoñentes máis importantes.
Consulta tamén a función "princomp".
Ruta do menú: /Ver/Compoñentes principais
# pergm Statistics
Argumentos: serie [ anchobanda ]
Opcións: --bartlett (Utiliza a xanela de retardo de Bartlett)
--log (Utiliza a escala logarítmica)
--radians (Amosa a frecuencia en radiáns)
--degrees (Amosa a frecuencia en graos)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Calcula e amosa o espectro da serie especificada. Por defecto, indícase o
periodograma da mostra, pero utilízase opcionalmente unha xanela de retardo
de Bartlett ao estimar o espectro, (consulta por exemplo, o libro de Greene
Econometric Analysis para ver unha discusión sobre isto). A largura por
defecto da xanela de Bartlett é de dúas veces a raíz cadrada do tamaño
da mostra, pero podes establecer isto de xeito manual utilizando o
parámetro anchobanda, ata un máximo da metade do tamaño da mostra.
Cando indicas a opción --log, represéntase o espectro nunha escala
logarítmica.
As opcións (mutuamente excluíntes) --radians e --degrees afectan ao
aspecto do eixe de frecuencias cando se debuxa o periodograma. Por defecto,
a frecuencia escálase polo número de períodos da mostra, pero esas dúas
opcións provocan que o eixe se etiquete desde 0 ata pi radiáns ou desde 0
a 180degrees, respectivamente.
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica do periodograma. Podes axustar isto mediante a
opción --plot. Os parámetros admisibles para esta opción son none (para
suprimir a gráfica), display (para representar unha gráfica mesmo en modo
de procesamento por lotes), ou un nome de ficheiro. O efecto de indicar un
nome de ficheiro é como se describe para a opción --output da instrución
"gnuplot".
Ruta do menú: /Variable/Periodograma
Outro acceso: Xanela principal: Menú emerxente (selección única)
# pkg Utilities
Argumentos: acción nomepaquete
Opcións: --local (Instala desde un ficheiro local)
--quiet (Mira abaixo)
--verbose (Mira abaixo)
Exemplos: pkg install armax
pkg install /path/to/myfile.gfn --local
pkg query ghosts
pkg unload armax
Esta instrución proporciona un xeito de instalar, consultar, descargar,
eliminar ou indexar paquetes de funcións de GRETL. O argumento acción debe
de ser algún de entre install, query, unload, remove ou index,
respectivamente.
install: Na súa forma máis elemental, sen ningún indicador de opción e
co argumento nomepaquete expresado como o nome "plano" dun paquete de
funcións de GRETL (como no primeiro exemplo de arriba), o efecto desta
opción consiste en descargar o paquete que se especifica do servidor de
GRETL (agás que nomepaquete comece con http://), e instalalo na máquina
local. Neste caso, non é necesario expresar unha extensión no nome do
ficheiro. Porén, cando indicas a opción --local, o argumento nomepaquete
debe de ser a ruta a un ficheiro de paquete na máquina local, que aínda
non estea instalado, e expresado con unha extensión correcta (.gfn ou
.zip). Neste caso, o efecto consiste en copiar o ficheiro no seu sitio
(gfn), ou descomprimilo no seu sitio (zip), significando "no seu sitio" alí
onde o vai atopar a instrución "include".
query: Por defecto, a consecuencia desta opción é a presentación de
información básica sobre o paquete especificado (autor, versión, etc.).
Pero se engades a opción --quiet, non se presenta nada; en troques,
gárdase a información do paquete en forma dun feixe de GRETL, ao que se
pode acceder mediante "$result". Se non pode atoparse ningunha información,
este feixe estará baleiro.
unload: Debes de indicar o argumento pkgname en modo 'plano', sen ruta nin
extensión, como no derradeiro exemplo de arriba. A consecuencia disto é a
descarga dese paquete en cuestión da memoria de GRETL (se está cargado
nese momento), e tamén eliminalo do menú da Interface Gráfica (GUI) ao
que estea engadido, se o está a algún.
remove: Realiza as accións indicadas para unload e, ademais, elimina do
disco o(s) ficheiro(s) asociado(s) co paquete indicado.
index: É un caso especial no que nomepaquete debe substituírse pola
palabra chave "addons": a consecuencia disto é que se actualiza o índice
dos paquetes estándar que se coñecen como "Engadidos" (ou Complementos).
Esa actualización faise automaticamente de cando en vez, pero nalgúns
casos pode resultar útil unha actualización manual. Neste caso, a opción
--verbose provoca un resultado impreso sobre onde fixo GRETL a procura, e o
que atopou. Sendo claros, aquí tes o xeito de acadar un resultado co
índice completo:
pkg index addons --verbose
Ruta do menú: /Ficheiro/Paquetes de funcións/No servidor
# plot Graphs
Argumento: [ datos ]
Opcións: --with-lines[=varspec] (Utiliza liñas, non puntos)
--with-lp[=varspec] (Utiliza liñas e puntos)
--with-impulses[=varspec] (Utiliza liñas verticais)
--with-steps[=varspec] (Utiliza segmentos de liña horizontais e verticais)
--time-series (Representa fronte ao tempo)
--single-yaxis (Forza o uso dun único eixe de ordenadas)
--ylogscale[=base] (Utiliza a escala logarítmica para o eixe vertical)
--dummy (Mira abaixo)
--fit=espaxuste (Mira abaixo)
--band=espfranxa (Mira abaixo)
--band-style=estilofranxa (Mira abaixo)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Exemplos: nile.inp
O bloque plot proporciona unha alternativa á instrución "gnuplot" que pode
ser máis conveniente cando estás xerando unha gráfica complicada (con
varias opcións e/ou instrucións Gnuplot para que se insiran no ficheiro
gráfico). Ademais da seguinte explicación, por favor, consulta tamén o
Manual de usuario de Gretl (Capítulo 6) para ver outros exemplos.
Un bloque de tipo plot comeza coa palabra de instrución plot. Habitualmente
vai seguida por un argumento de datos que especifica os datos que se van
representar, e que debe de indicar o nome dunha lista, dunha matriz ou dunha
única serie. Se non especificas datos de entrada, o bloque debe de conter
no seu lugar cando menos unha directriz para debuxar unha fórmula; ese tipo
de directivas podes indicalas mediante liñas do tipo literal ou printf
(mira abaixo).
Cando indicas unha lista (ou unha matriz), asúmese que o último termo (ou
a última columna da matriz) é a variable do eixe x e que os(as) outros(as)
son as variables do eixe y, agás cando indicas a opción --time-series, en
cuxo caso todos os datos especificados van no eixe y.
A opción de proporcionar o nome dunha soa serie restrínxese aos datos de
series temporais, en cuxo caso asúmese que queres unha gráfica de series
temporais; se non, amósase un fallo.
A liña de comezo pódese preceder da expresión "savename <-" para que se
garde unha gráfica como icona no programa de Interface Gráfica de Usuario
(GUI). O bloque remata con end plot.
Dentro do bloque tes cero ou máis liñas dos seguintes tipos, identificadas
pola palabra chave inicial:
option: Especifica unha opción simple.
options: Especifica múltiples opcións nunha soa liña, separadas por
espazos.
literal: Unha instrución que se vai pasar literalmente a Gnuplot.
printf: Un enunciado printf cuxo resultado se pasará literalmente a
Gnuplot.
Ten en conta que cando especificas unha opción utilizando as palabras chave
option ou options, non é necesario proporcionar o habitual dobre guión
antes do indicador de opción. Para obter máis detalles sobre os efectos
das distintas opcións, consulta "gnuplot" (pero mira abaixo para algúns
detalles específicos de utilizar a opción --band no contexto plot).
A intención de utilizar o bloque plot ilústrase mellor co exemplo:
string title = "Meu título"
string xname = "Miña variable X"
plot plotmat
options with-lines fit=none
literal set linetype 3 lc rgb "#0000ff"
literal set nokey
printf "set title \"%s\"", title
printf "set xlabel \"%s\"", xname
end plot --output=display
Este exemplo asume que plotmat é o nome dunha matriz que ten 2 columnas
polo menos (ou unha lista que ten 2 elementos polo menos). Cae na conta de
que se considera unha boa praxe colocar (unicamente) a opción --output na
derradeira liña do bloque; outras opcións deberías colocalas dentro do
bloque.
Debuxar unha franxa con datos de matrices
As opcións --band e --band-style funcionan a maioría das veces como se
describe na axuda para "gnuplot", coa seguinte excepción: cando se
proporcionan os datos a representar en forma dunha matriz, o primeiro
parámetro para --band debe de indicarse co nome dunha matriz de 2 columnas
(que conteñan o centro e o largo da franxa, respectivamente). Este
parámetro ocupa o lugar dos dous primeiros valores (nomes de series,
números ID ou columnas de matriz) que require a versión gnuplot desta
opción (o terceiro é un factor multiplicador). A continuación tes un
exemplo:
scalar n = 100
matrix x = seq(1,n)'
matrix y = x + filter(mnormal(n,1), 1, {1.8, -0.9})
matrix B = y ~ muniform(n,1)
plot y
options time-series with-lines
options band=B,10 band-style=fill
end plot --output=display
Debuxar unha gráfica sen datos
O seguinte exemplo amosa un caso sinxelo de como especificar a
representación dunha gráfica sen ter unha fonte de datos.
plot
literal set title 'Utilidade CRRA'
literal set xlabel 'c'
literal set ylabel 'u(c)'
literal set xrange[1:3]
literal set key top left
literal crra(x,s) = (x**(1-s) - 1)/(1-s)
printf "plot crra(x, 0) t 'sigma=0', \\"
printf " log(x) t 'sigma=1', \\"
printf " crra(x,3) t 'sigma=3"
end plot --output=display
# poisson Estimation
Argumentos: depvar indepvars [ ; exposición ]
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
Exemplos: poisson y 0 x1 x2
poisson y 0 x1 x2 ; S
Mira tamén camtriv.inp, greene19_3.inp
Estima unha regresión de Poisson. Cóllese a variable dependente para
representar o acaecemento de sucesos dalgún tipo, e debe de ter só valores
enteiros non negativos.
Se unha variable aleatoria discreta Y segue unha distribución de Poisson,
entón
Pr(Y = y) = exp(-v) * v^y / y!
para y = 0, 1, 2,.... A media e a varianza da distribución son ambas iguais
a v. No modelo de regresión de Poisson, o parámetro v está representado
como unha función dunha ou máis variables independentes. A versión máis
habitual (e a única que admite GRETL) cumpre
v = exp(b0 + b1*x1 + b2*x2 + ...)
ou, noutras palabras, o logaritmo de v é unha función linear das variables
independentes.
Como opción, podes engadir unha variable de exposición ("offset") á
especificación. Esta é unha variable de escala, e o logaritmo dela
engádese á función linear de regresión (implicitamente, cun coeficiente
de 1.0). Isto ten sentido se agardas que o número de ocorrencias do evento
en cuestión é proporcional (manténdose o demais constante) a algún
factor coñecido. Por exemplo, podes supoñer que o número de accidentes de
tráfico é proporcional ao volume de tráfico (manténdose o demais
constante) e, nese caso, o volume de tráfico pode expresarse como unha
variable "de exposición" nun modelo de Poisson do cociente de accidentes. A
variable de exposición debe de ser estritamente positiva.
Por defecto, calcúlanse as desviacións padrón utilizando a inversa
negativa da matriz Hessiana. Se especificas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimada é un "emparedado"
entre a inversa da matriz Hessiana estimada e o produto externo do vector
gradiente.
Consulta tamén "negbin".
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de Reconto
# print Printing
Variantes: print listavariables
print
print nomesobxectos
print cadealiteral
Opcións: --byobs (Por observacións)
--no-dates (Utiliza números de observación simples)
--range=inicio:parada (Mira abaixo)
--midas (Mira abaixo)
--tree (Específico para feixes (bundles); mira abaixo)
Exemplos: print x1 x2 --byobs
print my_matrix
print "Isto é unha cadea"
print my_array --range=3:6
print hflist --midas
Ten en conta que print é máis ben unha instrución "básica" (coa
intención principal de presentar os valores das series). Consulta "printf"
e "eval" para outras alternativas máis avanzadas e menos restritivas.
Na primeira variante amosada arriba (consulta o primeiro exemplo tamén),
listavariables debe de ser unha lista de series (ben unha lista xa definida,
ou ben unha lista especificada mediante os nomes ou números ID das series,
separados por espazos). Neste caso, esta instrución presenta os valores das
series da lista. Por defecto, os datos preséntanse "por variable", pero se
engades a opción --byobs preséntanse por observación. Cando se presentan
por observación, por defecto amósase a data (con datos de series
temporais) ou a cadea de texto do marcador de observación (en caso de que o
haxa) ao comezo de cada liña. Mediante a opción --no-dates elimínase a
presentación das datas ou dos marcadores; no seu lugar amósase un simple
número de observación. Consulta o parágrafo final destes comentarios para
ver o efecto da opción --midas (que se aplica só a unha lista xa definida
de series).
Cando non indicas ningún argumento (a segunda variante amosada arriba)
entón o efecto é similar ao primeiro caso, agás que se van presentar
todas as series do conxunto vixente de datos. As opcións que se admiten son
como se describiron máis arriba.
A terceira variante (co argumento nomesobxectos; mira o segundo exemplo)
agarda unha lista de nomes, separados por espazos, de obxectos básicos de
GRETL que non sexan series (escalares, matrices, cadeas de texto, feixes,
arranxos); e amósase o valor destes obxectos. No caso dos feixes, as súas
compoñentes ordénanse por tipo e alfabeticamente.
Na cuarta forma (terceiro exemplo), cadealiteral debe de ser unha cadea de
texto contornada entre comiñas (e non debe de haber nada máis seguindo á
liña de instrución). Preséntase a cadea de texto en cuestión, seguida
dun carácter de liña nova.
Podes utilizar a opción --range para controlar o volume de información que
se presenta. Os valores (enteiros) dos marcadores de inicio e parada poden
referirse a observacións de series e de listas, a filas de matrices, a
elementos de arranxos, e a liñas de cadeas de texto. En todos os casos, o
valor mínimo de inicio é 1, e o máximo valor de parada é o "tamaño en
forma de filas" do obxecto en cuestión. Os valores negativos destes
marcadores se usan para dispoñer unha conta cara atrás, dende o final.
Podes indicar estes marcadores en formato numérico, ou mediante nomes de
variables escalares previamente definidas. Se omites inicio, se considera
implicitamente igual a 1; e se omites parada, iso significa ir ata o final
de todo. Con series e listas, cae na conta de que os marcadores refírense
ao rango mostral vixente.
A opción --tree é específica para presentar un feixe (bundle) de GRETL. O
efecto diso é que, se o feixe especificado contén outros feixes ou
arranxos deles, se presentan os seus contidos. Se non, só se presentan os
elementos do nivel superior do feixe.
A opción --midas é especial para presentar unha lista de series e, máis
aínda, é específica para conxuntos de datos que conteñen unha ou máis
series de alta frecuencia, cada unha representada por unha "MIDAS list".
Cando indicas unha desas listas como argumento e agregas esta opción, a
serie preséntase por observación da súa frecuencia "orixinal".
Ruta do menú: /Datos/Amosar valores
# printf Printing
Argumentos: formato , elementos
Presenta valores escalares, series, matrices ou cadeas de texto baixo o
control dunha cadea de texto para dar formato (ofrecendo unha parte da
función printf da linguaxe de programación C). Os formatos numéricos
recoñecidos son %e, %E, %f, %g, %G, %d e %x, en cada caso cos diversos
reguladores dispoñibles en C. Exemplos: o formato %.10g presenta un valor
con 10 cifras significativas, e %12.6f presenta un valor cun largo de 12
caracteres dos que 6 son decimais. Porén, ten en conta que en GRETL o
formato %g é unha boa elección por defecto para todos os valores
numéricos, e non tes necesidade de complicarte demasiado. Debes de utilizar
o formato %s para as cadeas de texto.
A propia cadea de formato debe de estar contornada entre comiñas, e os
valores que se van presentar deben de ir despois desa cadea de formato,
separados por comas. Estes valores deben de ter a forma de, ou ben (a) os
nomes das variables, ou ben (b) expresións que xeren algunha clase de
resultado que sexa presentable, ou ben (c) as funcións especiais varname()
ou date(). O seguinte exemplo presenta os valores de dúas variables, máis
o dunha expresión que se calcula:
ols 1 0 2 3
scalar b = $coeff[2]
scalar se_b = $stderr[2]
printf "b = %.8g, Desviación padrón %.8g, t = %.4f\n",
b, se_b, b/se_b
As seguintes liñas ilustran o uso das funcións 'varname' e 'date', que
presentan respectivamente o nome dunha variable (indicado polo seu número
ID) e unha cadea de texto cunha data (dada por un número natural positivo
que indica unha observación).
printf "O nome da variable %d é %s\n", i, varname(i)
printf "A data da observación %d é %s\n", j, date(j)
Cando indicas un argumento matricial asociado a un formato numérico,
preséntase a matriz enteira utilizando o formato especificado para cada
elemento. O mesmo aplícase ás series, agás que o rango de valores
presentados se rexe pola configuración vixente da mostra.
A lonxitude máxima dunha cadea de formato é de 127 caracteres.
Recoñécense as secuencias de escape \n (nova liña), \r (salto de liña),
\t (tabulación), \v (tabulación vertical) e \\ (barra inclinada á
esquerda literal). Para presentar un signo por cento literal, utiliza %%.
Como en C, podes indicar os valores numéricos que forman parte do formato
(o largo e/ou a precisión) directamente como números, como en %10.4f, ou
como variables. Neste último caso, póñense asteriscos na cadea de formato
e proporciónanse os argumentos correspondentes por orde. Por exemplo:
scalar largo = 12
scalar precision = 6
printf "x = %*.*f\n", largo, precision, x
# probit Estimation
Argumentos: depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
--p-values (Amosa os valores p en vez das pendentes)
--estrella (Escolle a variante pseudo-R-cadrado)
--random-effects (Estima un modelo Probit de panel con efectos aleatorios, EA)
--quadpoints=k (Número de puntos de cuadratura para a estimación con EA)
Exemplos: ooballot.inp, oprobit.inp, reprobit.inp
Se a variable dependente é unha variable binaria (todos os seus valores son
0 ou 1), obtéñense estimacións máximo verosímiles dos coeficientes das
variables de indepvars mediante o método de Newton-Raphson. Como o modelo
é non linear, as pendentes están condicionadas polos valores das variables
independentes. Por defecto, calcúlanse as pendentes con respecto a cada
unha das variables independentes (nas medias desas variables) e estas
pendentes substitúen aos valores p habituais no resultado da regresión.
Podes prescindir deste proceder indicando a opción --p-values. O
estatístico khi-cadrado proba a hipótese nula de que todos os coeficientes
son cero, agás o da constante.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Se indicas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimadas é un
"emparedado" entre a inversa da matriz Hessiana estimada e o produto externo
do vector gradiente. Para obter máis detalles, consulta o capítulo 10 do
libro de Davidson e MacKinnon (2004).
Por defecto, vaise amosar o estatístico pseudo-R-cadrado que foi suxerido
por McFadden (1974); mais no caso binario, se indicas a opción --estrella
vaise amosar en troques a variante recomendada por Estrella (1998). Esta
variante previsiblemente imita de xeito máis semellante as propiedades do
R^2 habitual no contexto da estimación de mínimos cadrados.
Se a variable dependente non é binaria senón discreta, entón se obteñen
as estimacións dun Probit Ordenado. (Se a variable elixida como dependente
non é discreta, amósase un fallo.)
Probit para datos de panel
Coa opción --random-effects, asúmese que cada perturbación está composta
por dúas compoñentes Normalmente distribuídas: (a) un termo invariante no
tempo que é específico da unidade de sección cruzada ou "individuo" (e
que se coñece como efecto individual), e (b) un termo que é específico da
observación concreta.
A avaliación da verosimilitude deste modelo implica utilizar a cuadratura
de Gauss-Hermite para aproximar o valor das esperanzas de funcións de
variables Normais. Podes escoller o número de puntos de cuadratura
utilizados mediante a opción --quadpoints (por defecto é de 32).
Utilizando máis puntos mellórase a precisión dos resultados, pero co
custo de máis tempo de cálculo; así, con moitos puntos de cuadratura, a
estimación cun conxunto de datos moi grande pode consumir tempo de máis.
Amais das estimacións habituais dos parámetros (e dos estatísticos
asociados) relacionados cos regresores incluídos, preséntase algunha
información adicional sobre a estimación desta clase de modelo:
lnsigma2: A estimación máximo verosímil do logaritmo da varianza do
efecto individual;
sigma_u: A estimación da desviación padrón do efecto individual; e
rho: A estimación da parte do efecto individual na varianza composta da
perturbación (tamén coñecida como a correlación intra-clase).
A proba de Razón de Verosimilitudes respecto á hipótese nula de que rho
é igual a cero, proporciona un xeito de avaliar se é necesaria a
especificación de efectos aleatorios. Se a hipótese nula non se rexeita,
iso suxire que é axeitada unha simple especificación Probit combinada.
Ruta do menú: /Modelar/Variable Dependente Limitada/Probit
# pvalue Statistics
Argumentos: distribución [ parámetros ] xvalor
Exemplos: pvalue z zscore
pvalue t 25 3.0
pvalue X 3 5.6
pvalue F 4 58 fval
pvalue G shape scale x
pvalue B bprob 10 6
pvalue P lambda x
pvalue W shape scale x
Mira tamén mrw.inp, restrict.inp
Calcula a área que queda á dereita do valor xvalor na distribución
especificada (z para a Normal, t para a t de Student, X para a Khi-cadrado,
F para a F, G para a Gamma, B para a Binomial, P para a Poisson, exp para a
Exponencial, ou W para a Weibull).
Dependendo do tipo de distribución, debes de indicar a seguinte
información antes do valor xvalor: para as distribucións t e khi-cadrado,
os graos de liberdade; para a F, os graos de liberdade de numerador e
denominador; para a Gamma, os parámetros de forma e de escala; para a
distribución Binomial, a probabilidade de "éxito" e o número de intentos;
para a distribución de Poisson, o parámetro lambda (que é tanto a media
como a varianza); para a Exponencial, un parámetro de escala; e para a
distribución de Weibull, os parámetros de forma e de escala. Como se
amosou nos exemplos de arriba, podes indicar os parámetros numéricos en
formato numérico ou como nomes de variables.
Os parámetros para a distribución Gamma indícanse ás veces como media e
varianza en lugar de forma e escala. A media é o produto da forma e a
escala; a varianza é o produto da forma e o cadrado da escala. Deste xeito,
podes calcular a escala dividindo a varianza entre a media, e podes calcular
a forma dividindo a media entre a escala.
Ruta do menú: /Ferramentas/Buscador do valor P
# qlrtest Tests
Opcións: --limit-to=lista (Limita a proba a un subconxunto de regresores)
--plot=modo-ou-nomeficheiro (Mira abaixo)
--quiet (Non presenta os resultados)
Para un modelo estimado con datos de series temporais mediante MCO, realiza
a proba da Razón de Verosimilitudes de Quandt (QLR) para un cambio
estrutural nun punto descoñecido no tempo, cun 15 por cento de recorte ao
comezo e ao final do período da mostra.
Para cada punto potencial de cambio dentro do 70 por cento central das
observacións, realízase unha proba de Chow. Consulta "chow" para obter
máis detalles; pois, de igual xeito que coa proba común de Chow, esta é
unha proba robusta de Wald cando o modelo orixinal se estima coa opción
--robust, e unha proba F noutro caso. Entón o estatístico QLR é o máximo
dos estatísticos de proba particulares.
Obtense unha probabilidade asociada (valor p) asintótica utilizando o
método de Bruce Hansen (1997).
Ademais dos accesorios "$test" e "$pvalue" típicos das probas de
hipóteses, podes utilizar "$qlrbreak" para recuperar o índice da
observación na que o estatístico de proba se maximiza.
Podes utilizar a opción --limit-to para limitar o conxunto de interaccións
coa variable ficticia de corte nas probas de Chow, a un subconxunto dos
regresores orixinais. O parámetro para esta opción debe de ser unha lista
xa definida na que todos os seus elementos se atopen entre os regresores
orixinais, e na que non debes de incluír a constante.
Cando executas de xeito interactivo (unicamente) esta instrución, amósase
por defecto unha gráfica do estatístico de proba de Chow, pero podes
axustar isto mediante a opción --plot. Os parámetros que se admiten nesta
opción son none (para eliminar a gráfica), display (para amosar unha
gráfica mesmo cando non se está en modo interactivo), ou un nome de
ficheiro. O efecto de proporcionar un nome de ficheiro é como o descrito
para a opción --output da instrución "gnuplot".
Ruta do menú: Xanela de modelo: Probas/Proba de RV de Quandt
# qqplot Graphs
Variantes: qqplot y
qqplot y x
Opcións: --z-scores (Mira abaixo)
--raw (Mira abaixo)
--output=nomeficheiro (Envía a gráfica ao ficheiro especificado)
Indicando como argumento unha única serie, amosa unha gráfica dos cuantís
empíricos da serie seleccionada (indicada polo seu nome ou o seu número
ID) fronte aos cuantís da distribución Normal. A serie debe de incluír
cando menos 20 observacións válidas no rango vixente da mostra. Por
defecto, os cuantís empíricos debúxanse fronte aos cuantís dunha
distribución Normal que ten as mesmas media e varianza que os datos da
mostra, pero dispós de dúas alternativas: se indicas a opción --z-scores,
os datos se tipifican; mentres que se indicas a opción --raw, debúxanse os
cuantís empíricos "en bruto" fronte aos cuantís da distribución Normal
estándar.
A opción --output ten como efecto o envío do resultado ao ficheiro
especificado; utiliza "display" para forzar que o resultado se presente na
pantalla. Consulta a instrución "gnuplot" para obter máis detalles sobre
esta opción.
Dadas dúas series como argumentos, y e x, amósase unha gráfica dos
cuantís empíricos de y fronte aos de x. Os valores dos datos non se
tipifican.
Ruta do menú: /Variable/Gráfica Q-Q normal
Ruta do menú: /Ver/Gráfica de variables indicadas/Gráfica Q-Q
# quantreg Estimation
Argumentos: tau depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--intervals[=nivelconf] (Calcula os intervalos de confianza)
--vcv (Presenta a matriz de covarianzas)
--quiet (Non presenta os resultados)
Exemplos: quantreg 0.25 y 0 xlista
quantreg 0.5 y 0 xlista --intervals
quantreg 0.5 y 0 xlista --intervals=.95
quantreg tauvec y 0 xlista --robust
Mira tamén mrw_qr.inp
Regresión de cuantís. O primeiro argumento (tau) é o cuantil condicionado
para o que se quere a estimación. Podes indicalo, ben cun valor numérico,
ou ben co nome dunha variable escalar definida previamente; e o valor debe
de estar no rango de 0.01 a 0.99. (Como alternativa, podes indicar un vector
de valores para tau; mira abaixo para obter máis detalles.) O segundo e
subseguintes argumentos compoñen unha lista de regresión co mesmo padrón
ca "ols".
Sen a opción --intervals, preséntanse as desviacións padrón para as
estimacións dos cuantís. Por defecto, estas calcúlanse de acordo coa
fórmula asintótica indicada por Koenker e Bassett (1978), pero cando
indicas a opción --robust, calcúlanse as desviacións padrón que son
robustas con respecto á heterocedasticidade, utilizando o método de
Koenker e Zhao (1994).
Cando escolles a opción --intervals, preséntanse os intervalos de
confianza para as estimacións dos parámetros en vez das desviacións
padrón. Estes intervalos calcúlanse usando o método da inversión do
rango e, en xeral, son asimétricos a respecto das estimacións puntuais. As
especificidades do cálculo están mediatizadas pola opción --robust: sen
esta, os intervalos calcúlanse baixo o suposto de perturbacións IID
(Koenker, 1994); e con ela se utiliza o estimador robusto desenvolvido por
Koenker e Machado (1999).
Por defecto, xéranse intervalos de confianza do 90 por cento. Podes trocar
isto engadindo un nivel de confianza (expresado como unha fracción decimal)
á opción de intervalos, como en --intervals=0.95.
Vector tau de valores: en troques de proporcionar un escalar, podes indicar
o nome dunha matriz definida previamente. Neste caso, as estimacións
calcúlanse para todos os valores tau indicados, e os resultados
preséntanse nun formato especial, amosando a secuencia das estimacións de
cuantís para cada regresor, de un en un.
Ruta do menú: /Modelar/Estimación Robusta/Regresión de cuantís
# quit Utilities
Sae da modalidade vixente de GRETL.
Cando esta instrución se invoca desde un guión, remátase a execución
de ese guión. No contexto de gretlcli en modo de procesamento por lotes,
o propio gretlcli remata; noutro caso, o programa recúa a modo
interactivo.
Cando se invoca desde a consola do programa de Interface Gráfica de
Usuario (GUI), péchase a xanela da consola.
Cando se invoca desde gretlcli en modo interactivo, este programa remata.
Cae na conta de que esta instrución non pode invocarse desde dentro de
funcións nin de bucles.
A instrución quit en ningún caso provoca que remate o programa de
Interface Gráfica de Usuario (GUI) de GRETL. Isto faise ben mediante a
opción Saír do apartado Ficheiro do menú, ben mediante Ctrl+Q, ou ben
premendo co rato o control de peche na barra do título da xanela principal
de GRETL.
# rename Dataset
Argumentos: serie novonome
Opción: --quiet (Suprime a presentación de resultados)
Cambia o nome de serie (identificada polo seu nome ou seu número ID) a
novonome. O novo nome debe de ter 31 caracteres como máximo, comezar cunha
letra e estar formado só por letras, díxitos e o carácter de barra baixa.
Ademais, non debe de ser o nome dun obxecto de calquera tipo que xa exista.
Ruta do menú: /Variable/Editar atributos
Outro acceso: Xanela principal: Menú emerxente (selección única)
# reset Tests
Opcións: --quiet (Non presenta a regresión auxiliar)
--silent (Non presenta nada)
--squares-only (Calcula a proba usando só os cadrados)
--cubes-only (Calcula a proba usando só os cubos)
Debe de ir despois da estimación dun modelo mediante MCO. Leva a cabo a
proba RESET de Ramsey sobre a especificación (non linear) dun modelo,
engadíndolle á regresión os cadrados e/ou os cubos dos valores axustados,
e calculando o estatístico F para probar a hipótese nula de que os
parámetros dos termos engadidos son cero.
Vanse engadir tanto os cadrados como os cubos, agás que indiques unha das
opcións --squares-only ou --cubes-only.
Podes utilizar a opción --silent se tes intención de facer uso dos
accesorios "$test" e/ou "$pvalue" para gardar os resultados da proba.
Ruta do menú: Xanela de modelo: Probas/Proba RESET de Ramsey
# restrict Tests
Opcións: --quiet (Non presenta as estimacións restrinxidas)
--silent (Non presenta nada)
--wald (Só estimadores de sistema, mira abaixo)
--bootstrap (Cálculo da proba con remostraxe automática, se é posible)
--full (Só MCO e VECMs, mira abaixo)
Exemplos: hamilton.inp, restrict.inp
Impón un conxunto de restricións (habitualmente lineais) sobre: (a) o
último modelo estimado ou (b) un sistema de ecuacións que se definiu e
nomeou previamente. En todos os casos, debes de comezar o conxunto de
restricións coa palabra chave "restrict" e rematalo con "end restrict".
No caso dunha única ecuación, as restricións sempre se aplican
implicitamente ao último modelo, e avalíanse tan pronto como se peche o
bloque restrict.
No caso dun sistema de ecuacións (definido mediante a instrución
"system"), podes poñer o nome do sistema de ecuacións definido
previamente, despois do "restrict" inicial. Cando omites iso e o último
modelo foi un sistema, entón as restricións aplícanse a ese derradeiro
modelo. Por defecto, as restricións avalíanse cando o sistema acaba de
estimarse, usando a instrución "estimate". Pero cando indicas a opción
--wald, a restrición compróbase inmediatamente a través da proba
khi-cadrado de Wald en relación á matriz de covarianzas. Ten en conta que
esta opción vai xerar un fallo se xa definiches un sistema, pero aínda non
o estimaches.
Dependendo do contexto, podes expresar de varios xeitos as restricións que
queiras probar. O máis simple é como se indica deseguido: cada restrición
exprésase como unha ecuación, cunha combinación linear de parámetros á
esquerda do signo de igualdade e un valor escalar á dereita (ben unha
constante numérica, ou ben o nome dunha variable escalar).
No caso dunha única ecuación, podes referirte aos parámetros da mesma co
formato b[i], onde i representa a posición na lista de regresores
(comezando no 1), ou co formato b[nomevar], onde nomevar é o nome do
regresor en cuestión. No caso dun sistema, a referencia aos parámetros
faise utilizando a letra b xunto con dous números colocados entre
corchetes. O primeiro número representa a posición da ecuación dentro do
sistema, e o segundo número indica a posición do regresor dentro da lista
deles. Por exemplo, b[2,1] denota o primeiro parámetro da segunda
ecuación, mentres que b[3,2] denota o segundo parámetro da terceira
ecuación. Podes antepoñer multiplicadores numéricos aos elementos b da
ecuación que representa unha restrición, por exemplo 3.5*b[4].
Aquí tes un exemplo dun conxunto de restricións para un modelo estimado
previamente:
restrict
b[1] = 0
b[2] - b[3] = 0
b[4] + 2*b[5] = 1
end restrict
E aquí tes un exemplo dun conxunto de restricións para aplicar a un
sistema xa definido. (Se o nome do sistema non contén espazos, as comiñas
que o contornan non fan falta.)
restrict "Sistema 1"
b[1,1] = 0
b[1,2] - b[2,2] = 0
b[3,4] + 2*b[3,5] = 1
end restrict
No caso dunha única ecuación, as restricións avalíanse por defecto por
medio da proba de Wald, usando a matriz de covarianzas do modelo en
cuestión. Se estimaches o modelo orixinal con MCO, entón preséntanse as
estimacións dos coeficientes restrinxidos; para eliminar isto, engade a
opción --quiet á instrución restrict inicial. Como alternativa á proba
de Wald, para modelos estimados unicamente mediante MCO ou MCP, podes
indicar a opción --bootstrap para realizar a proba da restrición con
remostraxe automática (bootstrap).
No caso dun sistema, o estatístico de proba depende do estimador elixido:
un estatístico de Razón de Verosimilitudes cando o sistema se estima
utilizando un método de Máxima Verosimilitude, ou un estatístico F
asintótico, noutro caso.
Tes tres alternativas ao método para expresar as restricións descrito
máis arriba. Primeiro, podes escribir de forma compacta un conxunto de g
restricións lineais sobre o vector cos k parámetros (beta), como Rbeta - q
= 0, onde R é unha matriz de dimensión g x k e q é un vector de
dimensión g. Podes expresar unha restrición indicando os nomes de matrices
definidas previamente, cómodas para utilizar como R e q, como en
restrict
R = Rmat
q = qvec
end restrict
En segundo lugar, como variante que te pode ser útil cando uses a función
restrict dentro doutra función, podes elaborar o conxunto de enunciados de
restrición co formato dun arranxo de cadeas de texto. Despois utiliza a
palabra chave inject co nome do arranxo. Este é un exemplo sinxelo:
strings SR = array(2)
RS[1] = "b[1,2] = 0"
RS[2] = "b[2,1] = 0"
restrict
inject RS
end restrict
Co uso actual deste método, posiblemente preferirás utilizar a función
"sprintf" para elaborar as cadeas de texto, en base á entrada para unha
función.
Finalmente, se queres probar unha restrición non linear (o que actualmente
só está dispoñible para modelos dunha única ecuación), debes de indicar
a restrición co nome dunha función, precedida por "rfunc = ", como en
restrict
rfunc = nosafuncion
end restrict
A función de restrición debe de ter un único argumento const matrix, e
isto complétase automaticamente co vector de parámetros. E debera de
devolver un vector que é cero baixo a hipótese nula, e non nulo noutro
caso. A dimensión do vector é igual ao número de restricións. Esta
función utilízase como unha "chamada de volta" da rutina numérica para o
Jacobiano, de GRETL, que calcula o estatístico de proba de Wald mediante o
método delta.
Aquí tes un exemplo sinxelo dunha función apropiada para comprobar unha
restrición non linear, concretamente que dous pares de valores dos
parámetros teñen unha razón común.
function matrix restr (const matrix b)
matrix v = b[1]/b[2] - b[4]/b[5]
return v
end function
Cando se completa con éxito a instrución restrict, os accesorios "$test" e
"$pvalue" proporcionan o estatístico de proba e a súa probabilidade
asociada (valor p), respectivamente.
Cando se proban restricións sobre un modelo dunha única ecuación que foi
estimado mediante MCO ou sobre un Modelo de Vectores de Corrección do Erro
(VECM), podes utilizar a opción --full para dispoñer que as estimacións
restrinxidas sexan o "último modelo", coa intención de facer probas máis
adiante ou de usar accesorios como $coeff e $vcv. Cae na conta de que se
aplican algúns detalles especiais no caso de que probes restricións sobre
un VECM. Consulta o Manual de usuario de Gretl (Capítulo 33) para obter
máis detalles.
Ruta do menú: Xanela de modelo: Probas/Restricións lineais
# rmplot Graphs
Argumento: serie
Opcións: --trim (Mira abaixo)
--quiet (Non presenta os resultados)
--output=nomeficheiro (Mira abaixo)
Gráfica Rango-Media: Esta instrución xera unha gráfica sinxela para
axudar a decidir se unha serie temporal, y(t), ten unha varianza constante
ou non. Cóllese a mostra completa (t=1,...,T) e divídese en pequenas
submostras de tamaño arbitrario k. A primeira submostra está composta por
y(1),...,y(k), a segunda por y(k+1), ..., y(2k), etcétera. Para cada
submostra, calcúlase a media da serie na mostra e o rango (= máximo menos
mínimo), e constrúese unha gráfica coas medias no eixe horizontal e os
rangos no vertical. Así cada submostra se representa mediante un punto
neste plano. Se a varianza da serie é constante, agardaríase que o rango
da submostra sexa independente da media da submostra. Por iso, se observamos
que os puntos se aproximan a unha liña con pendente positiva, isto suxire
que a varianza das series aumenta a medida que o fai a media; e se os puntos
se aproximan a unha liña con pendente negativa, isto suxire que a varianza
decrece ao aumentar a media.
Ademais da gráfica, GRETL amosa as medias e rangos para cada submostra,
xunto co coeficiente da pendente dunha regresión MCO do rango sobre a
media, e coa probabilidade asociada ao estatístico para probar a hipótese
nula de que esta pendente é cero. Se o coeficiente da pendente é
significativo cun nivel de significación do 10 por cento, entón amósase
na gráfica a liña axustada da regresión do rango sobre a media. Se
rexistran tanto o estatístico t para probar a hipótese nula como a
probabilidade asociada correspondente, e podes recuperalos usando os
accesorios "$test" e "$pvalue", respectivamente.
Cando indicas a opción --trim, descártanse os valores mínimo e máximo de
cada submostra antes de calcular a media e o rango. Isto fai que sexa menos
probable que os valores atípicos provoquen unha distorsión na análise.
Cando indicas a opción --quiet, non se amosa a gráfica nin se presenta o
resultado; só se indican o estatístico t e a súa probabilidade asociada
(valor p). Por outra banda, podes controlar o formato da gráfica mediante a
opción --output; e isto funciona como se describe en conexión coa
instrución "gnuplot".
Ruta do menú: /Variable/Gráfica Rango-Media
# run Programming
Argumento: nomeficheiro
Executa as instrucións de nomeficheiro e logo devolve o control ao
indicador interactivo. Esta instrución está pensada para que a utilices co
programa de liñas de instrución gretlcli ou coa "consola de GRETL" no
programa de Interface Gráfica de Usuario (GUI).
Consulta tamén "include".
Ruta do menú: Icona 'Executar' na xanela do editor de guións
# runs Tests
Argumento: serie
Opcións: --difference (Utiliza as primeiras diferenzas da variable)
--equal (Os valores positivos e negativos son equiprobables)
Realiza a proba non paramétrica "de ringleiras" para comprobar o carácter
aleatorio da serie indicada, onde as ringleiras defínense como secuencias
de valores consecutivos positivos ou negativos. Se queres probar o carácter
aleatorio das desviacións respecto á mediana, para unha variable chamada
x1 que ten unha mediana non nula, podes facer o seguinte:
series signx1 = x1 - median(x1)
runs signx1
Cando indicas a opción --difference, vanse calcular as primeiras diferenzas
da serie antes da análise, polo que as ringleiras se interpretarían como
secuencias de aumentos ou de diminucións consecutivas do valor da variable.
Cando indicas a opción --equal, a hipótese nula tamén incorpora o suposto
de que os valores positivos e negativos son igual de probables; se non, o
estatístico de proba resulta invariante con respecto á "neutralidade" do
proceso que xerou a secuencia de valores, e a proba céntrase unicamente na
independencia.
Ruta do menú: /Ferramentas/Probas non paramétricas
# scatters Graphs
Argumentos: yvar ; xvars ou yvars ; xvar
Opcións: --with-lines (Xera gráficas de liñas)
--matrix=nomematriz (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Exemplos: scatters 1 ; 2 3 4 5
scatters 1 2 3 4 5 6 ; 7
scatters y1 y2 y3 ; x --with-lines
Xera gráficas de dúas variables, ben de yvar fronte a todas as variables
de xvars, ou ben de todas as variables de yvars fronte a xvar. No primeiro
exemplo de arriba, se coloca a variable 1 no eixe y e se debuxan 4
gráficas: a primeira ten a variable 2 no eixe x, a segunda coa variable 3
no eixe x, etcétera. O segundo exemplo representa cada unha das variables
da 1 á 6, fronte á variable 7 no eixe x. Repasar un conxunto desas
gráficas pode ser un paso conveniente na análise exploratoria de datos. O
número máximo de gráficas é de 16, polo que vaise ignorar calquera
variable adicional na lista.
Por defecto, as gráficas son de dispersión, pero se indicas a opción
--with-lines serán gráficas de liñas.
Para obter máis detalles sobre o uso da opción --output, consulta a
instrución "gnuplot".
Se especificas unha matriz xa definida como orixe dos datos, debes de
expresar as listas x e y con números naturais positivos que indiquen a
columna; ou, en caso contrario, se non indicas eses números, represéntanse
todas as columnas fronte ao tempo ou a unha variable índice.
Cando o conxunto de datos é de series temporais, entón podes omitir a
segunda lista, pois nese caso vaise tomar implicitamente ao 'tempo' como
tal, polo que podes debuxar varias series temporais en gráficas separadas.
Ruta do menú: /Ver/Gráficas múltiples
# sdiff Transformations
Argumento: listavariables
Obtense a diferenza estacional de cada unha das variables de listavariables,
e gárdase o resultado nunha nova variable co prefixo sd_. Esta instrución
está dispoñible só para series de tempo estacionais.
Ruta do menú: /Engadir/Diferenzas estacionais das variables seleccionadas
# set Programming
Variantes: set variable valor
set --to-file=nomeficheiro
set --from-file=nomeficheiro
set stopwatch
set
Exemplos: set svd on
set csv_delim tab
set horizon 10
set --to-file=mysettings.inp
O uso máis común desta instrución é a primeira variante amosada arriba,
na que se utiliza para establecer o valor dun parámetro escollido do
programa (isto discútese con detalle máis abaixo). Os outros usos son: con
--to-file para escribir un ficheiro de guión que conteña todas as
configuracións actuais dos parámetros; con --from-file para ler un
ficheiro de guión que conteña as configuracións dos parámetros e para
aplicalas á sesión vixente; con stopwatch para poñer a cero o
"cronómetro" de GRETL que podes usar para medir o tempo de CPU (consulta os
comentarios para o accesorio "$stopwatch"); ou para presentar as
configuracións actuais, cando indicas só a palabra set.
Os valores establecidos mediante esta instrución seguen vixentes durante a
duración da sesión de GRETL, agás que os troques por medio dunha chamada
posterior a "set". Os parámetros que podes establecer deste xeito
enuméranse máis abaixo. Ten en conta que se utilizan as configuracións de
hc_version, hac_lag e hac_kernel cando indicas a opción --robust nunha
instrución de estimación.
As configuracións dispoñibles agrúpanse baixo as seguintes categorías:
interacción e comportamento do programa, métodos numéricos, xeración de
números aleatorios, estimación robusta, filtrado, estimación de series
temporais e interacción con GNU R.
Interacción e comportamento do programa
Estas configuracións utilízanse para controlar diversos aspectos do xeito
no que GRETL interactúa co usuario.
workdir: path. Establece o cartafol por defecto para escribir e ler
ficheiros nos casos nos que non se especifican as rutas completas.
use_cwd: on ou off (por defecto). Manexa a configuración do cartafol de
traballo (workdir) inicial: se está en on, hérdase o cartafol de
traballo desde o intérprete; se non, establécese onde queira que se
seleccionou na sesión previa de GRETL.
echo: off ou on (por defecto). Elimina (ou acurta) a resonancia dos textos
das instrucións nos resultados de GRETL.
messages: off ou on (por defecto). Elimina (ou acurta) a presentación de
mensaxes sen fallo asociados a diversas instrucións, por exemplo cando se
xera unha nova variable ou cando se cambia o rango da mostra.
verbose: off, on (por defecto) ou comments. Funciona como un "interruptor
mestre" para echo e messages (mira máis abaixo), apagando ou acendendo os
dous simultaneamente. O argumento comments apaga a resonancia e a
aparición de mensaxes, pero mantén a presentación de comentarios dun
guión.
warnings: off ou on (por defecto). Elimina (ou acurta) a presentación de
mensaxes de advertencia que xorden cando as operacións aritméticas
producen valores non finitos.
csv_delim: comma (coma, por defecto), space (espazo), tab (tabulación) ou
semicolon (punto e coma). Establece o delimitador de columnas que se usa
cando se gardan datos nun ficheiro con formato CSV.
csv_write_na: A cadea de texto que se utiliza para representar os valores
ausentes cando se escriben datos nun ficheiro con formato CSV. Máximo = 7
caracteres; por defecto é NA.
csv_read_na: A cadea de texto que se colle para representar valores
ausentes (NAs) cando se len datos co formato CSV (máximo 7 caracteres). A
cadea por defecto depende de que se atope unha columna de datos que
conteña datos numéricos (a maioría das veces) ou valores de cadea. Para
datos numéricos, considérase que o seguinte indica NAs: unha cela
baldeira ou calquera das cadeas NA, N.A., na, n.a., N/A, #N/A, NaN, .NaN,
., .., -999, e -9999. Para datos con forma de cadeas de texto con valores,
tan só se conta como NA unha cela en branco ou unha cela que conteña
unha cadea baldeira. Podes volver a impoñer eses valores por defecto
indicando default como o valor de csv_read_na. Para especificar que tan
só se len as celas baldeiras como NAs, indica o valor "". Ten en conta
que as celas baldeiras sempre se len como NAs con independencia de como
estea configurada esta variable.
csv_digits: Un enteiro positivo que especifica o número de díxitos
significativos a usar cando se escriben datos en formato CSV. Por defecto,
utilízanse ata 15 díxitos dependendo da precisión dos datos orixinais.
Ten en conta que o resultado CSV emprega a función fprintf da librería
de C coa conversión "%g" , o que significa que se prescinde dos ceros que
quedan atrás.
display_digits: Un enteiro de 3 a 6 que especifica o número de díxitos
significativos a usar cando se amosan os coeficientes da regresión e as
desviacións padrón (sendo 6 por defecto). Tamén podes utilizar esta
configuración para limitar o número de díxitos que se amosan coa
instrución "summary"; sendo neste caso 5 por defecto (e tamén como
máximo) ou 4 cando indicas a opción --simple.
mwrite_g: on ou off (por defecto). Cando se escribe unha matriz como texto
nun ficheiro, GRETL por defecto utiliza notación científica con 18
díxitos de precisión, asegurando deste xeito que os valores gardados son
unha representación fiable dos números en memoria. Cando se escriben
datos básicos con non máis ca 6 díxitos de precisión, podes preferir
utilizar o formato %g para ter un ficheiro máis compacto e doado de ler;
podes facer este cambio mediante set mwrite_g on.
force_decpoint: on ou off (por defecto). Forza a GRETL a utilizar o
carácter de punto decimal, nun escenario onde outro carácter
(probablemente a coma) é o separador decimal estándar.
loop_maxiter: Un valor enteiro non negativo (por defecto é 100000).
Establece o número máximo de iteracións que se lle permite a un bucle
while, antes de parar (consulta "loop"). Cae na conta de que esta
configuración só afecta á variante while; a súa intención é
protexerse ante infinitos bucles que xurdan de forma inadvertida.
Establecer que este valor sexa 0 ten o efecto de inhabilitar o límite
(utilízao con precaución).
max_verbose: off (por defecto), on ou full. Controla a verborrea das
instrucións e das funcións que utilizan métodos de optimización
numérica. A opción on só se aplica a funcións (tales como "BFGSmax" e
"NRmax") que funcionan por defecto con discreción; o seu efecto consiste
en que se amosa información básica sobre as iteracións. Podes usar a
opción full para provocar un resultado máis detallado, que inclúe os
valores dos parámetros e o seu respectivo gradiente da función
obxectivo, en cada iteración. Esta opción aplícase tanto ás funcións
do tipo mencionado antes, como ás instrucións que se basean en
optimización numérica como "arima", "probit" e "mle". No caso das
instrucións, o seu efecto consiste en facer que a súa opción --verbose
proporcione un maior detalle. Consulta tamén o Manual de usuario de Gretl
(Capítulo 37).
debug: 1, 2 ou 0 (por defecto). Isto utilízase coas funcións definidas
polo usuario. Establecer debug igual a 1 equivale a activar messages
dentro de todas esas funcións, e establecer esta variable igual a 2 ten o
efecto adicional de activar max_verbose dentro de todas as funcións.
shell_ok: on ou off (por defecto). Permite executar programas externos
desde GRETL mediante o intérprete de sistema. Isto non está habilitado
por defecto por razóns de seguridade, e só podes habilitalo mediante a
Interface Gráfica de Usuario (Ferramentas/Preferencias/Xeral). Porén,
unha vez activada, esta configuración permanecerá activa para sesións
futuras ata que se desactive explicitamente.
bfgs_verbskip: Un enteiro. Esta configuración afecta ao comportamento da
opción --verbose naquelas instrucións que utilizan BFGS como algoritmo
de optimización, e se usa para compactar o resultado. Se bfgs_verbskip se
establece en 3, por exemplo, entón a opción --verbose vai provocar que
se presenten as iteracións 3, 6, 9, etcétera.
skip_missing: on (por defecto) ou off. Controla o comportamento de GRETL
cando se constrúe unha matriz a partir de series de datos: por defecto
sáltanse as filas de datos que conteñen un ou máis valores ausentes,
pero cando se pon skip_missing en off, os valores ausentes convértense en
NaNs.
matrix_mask: O nome dunha serie ou a palabra chave null. Ofrece un maior
control ca skip_missing cando se constrúen matrices a partir de series:
as filas de datos seleccionadas para as matrices son aquelas con valores
non nulos (e non ausentes) das series especificadas. A careta escollida
permanece en vigor ata que se substitúe, ou se elimina mediante a palabra
chave null.
quantile_type: Debes escoller entre Q6 (por defecto), Q7 ou Q8. Selecciona
o método concreto que utiliza a función "quantile". Para obter máis
detalles, consulta Hyndman e Fan (1996) ou a entrada da Wikipedia
dispoñible en https://en.wikipedia.org/wiki/Quantile.
huge: Un número positivo moi grande (por defecto, 1.0E100). Esta
configuración controla o valor que devolve o accesorio "$huge".
assert: off (por defecto), warn ou stop. Controla as consecuencias dun
fallo (que o valor que se devolva sexa igual a 0) da función "assert".
datacols: Un número enteiro entre 1 e 15, cuxo valor por defecto é 5.
Establece o número máximo de series que se presentan conxuntamente cando
os datos se representan por observación.
plot_collection: on, auto ou off. Esta configuración afecta ao xeito no
que se amosan as gráficas durante o uso interactivo. Se está en on, as
gráficas do mesmo tamaño en pixels reúnense nunha "colección de
gráficas", é dicir, nunha única xanela de saída de resultados na que
podes navegar entre as diversas gráficas indo cara adiante e cara atrás.
Co axuste en off, pola contra vaise xerar unha xanela distinta para cada
gráfica, como nas versións anteriores de GRETL. Finalmente, o axuste en
auto ten como efecto que permite o modo de colección de gráficas só
para as gráficas que se xeran antes de que pasen 1.25 segundos despois de
outra (por exemplo, como resultado da execución de instrucións de
representación gráfica dentro dun bucle).
Métodos numéricos
Estas configuracións utilízanse para controlar os algoritmos numéricos
que utiliza GRETL para a estimación.
optimizer: ou auto (por defecto), ou BFGS, ou ben newton. Establece o
algoritmo de optimización que se utiliza para varios estimadores Máximo
Verosímiles, nos casos onde o BFGS e o de Newton-Raphson se poden aplicar
ambos. Por defecto, utilízase o de Newton-Raphson cando se dispoña dunha
matriz Hessiana analítica; se non, BFGS.
bhhh_maxiter: Un enteiro, o número máximo de iteracións para a rutina
interna BHHH de GRETL, que se utiliza na instrución "arma" para a
estimación MV condicional. Se a converxencia non se acada logo de
bhhh_maxiter, o programa devolve un fallo. Por defecto, establécese en
500.
bhhh_toler: Un valor de punto flotante ou a cadea default. Isto utilízase
na rutina interna BHHH de GRETL para verificar se a converxencia se
acadou. O algoritmo remata de repetirse tan pronto como o incremento no
logaritmo da verosimilitude entre iteracións sexa menor ca bhhh_toler. O
valor por defecto é 1.0E-06, e podes restablecer este valor tecleando
default en troques dun valor numérico.
bfgs_maxiter: Un enteiro, o número máximo de iteracións para a rutina
BFGS de GRETL, que se utiliza para "mle" (EMV), "gmm" (MGM) e varios
estimadores específicos. Se non se acada a converxencia no número
indicado de iteracións, o programa devolve un fallo. O valor por defecto
depende do contexto, pero habitualmente é da orde de 500.
bfgs_toler: Un valor de punto flotante ou a cadea default. Isto utilízase
na rutina interna BFGS de GRETL para verificar se a converxencia se
acadou. O algoritmo remata de repetirse tan pronto como a melloría
relativa na función obxectivo entre iteracións sexa menor ca bfgs_toler.
O valor por defecto é igual á precisión de máquina elevada a 3/4, e
podes restablecer este valor tecleando default en lugar dun valor
numérico.
bfgs_maxgrad: Un valor de punto flotante. Isto utilízase na rutina
interna BFGS de GRETL, para verificar se a norma do vector gradiente está
razoablemente preto de cero cando se acada o criterio bfgs_toler. Vaise
presentar unha advertencia cando a norma do vector gradiente exceda de 1;
e amósase un fallo se a norma excede bfgs_maxgrad. Actualmente, por
defecto o valor de tolerancia é de 5.0.
bfgs_richardson: on ou off (por defecto). Utiliza a extrapolación de
Richardson cando calcules as derivadas numéricas no contexto da
maximización BFGS.
initvals: O nome dunha matriz que fose definida previamente. Permite
establecer manualmente o vector inicial de parámetros en determinadas
instrucións de estimación que implican realizar optimización numérica
como arma, garch, logit, probit, tobit, intreg, biprobit, duration; e
tamén cando se impoñen certos tipos de restricións que están
vencelladas a modelos VEC. A diferenza doutras configuracións, initvals
non é persistente, pois se restablece o seu valor ao de inicio por
defecto, despois da súa primeira utilización. Para obter detalles en
relación coa estimación ARMA consulta Manual de usuario de Gretl
(Capítulo 31).
lbfgs: on ou off (por defecto). Utiliza a versión de memoria limitada de
BFGS (L-BFGS-B) en troques do algoritmo habitual. Isto pode ser vantaxoso
cando a función que se maximiza non é globalmente cóncava.
lbfgs_mem: Un valor enteiro no rango de 3 a 20 (cun valor por defecto de
8). Isto determina o número de correccións que se utilizan na matriz de
memoria limitada cando se emprega L-BFGS-B.
nls_toler: Un valor de punto flotante. Establece a tolerancia que se
utiliza ao xulgar se a converxencia se acada ou non, nunha estimación de
mínimos cadrados non lineais utilizando a instrución "nls". O valor por
defecto é igual á precisión de máquina elevada a 3/4, e podes
restablecer este valor tecleando default en lugar dun valor numérico.
svd: on ou off (por defecto). Utiliza a Descompisición en Valores
Singulares (SVD) en troques das descomposicións de Cholesky ou a QR, nos
cálculos de mínimos cadrados. Esta opción aplícase á función mols
así como a varios cálculos internos, pero non á instrución "ols"
habitual.
force_qr: on ou off (por defecto). Isto aplícase á instrución "ols".
Por defecto, esta instrución calcula as estimacións de MCO utilizando a
descomposición de Cholesky (o método máis rápido), con QR como último
recurso se os datos semellan demasiado mal condicionados. Podes utilizar
force_qr para saltarte o paso de Cholesky, pois nos casos "dubidosos" isto
pode asegurar unha maior precisión.
fcp: on ou off (por defecto). Utiliza o algoritmo de Fiorentini, Calzolari
e Panattoni en vez do código propio de GRETL, cando se calculan as
estimacións GARCH.
gmm_maxiter: Un enteiro, o número máximo de iteracións da instrución
"gmm" de GRETL cando se está en modo iterativo (en contraposición ao dun
paso ou ao de dous pasos). O valor por defecto é 250.
nadarwat_trim: Un enteiro, o parámetro de recorte utilizado na función
"nadarwat".
fdjac_quality: Un enteiro (0, 1 ou 2) que indica o algoritmo utilizado
pola función "fdjac"; por defecto é 0.
gmp_bits: Un enteiro, que debe ser unha potencia de 2 con expoñente
enteiro (o valor predeterminado e mínimo é 256, e o máximo é 8192).
Isto controla o número de bits que se utilizan para representar un
número de punto flotante cando se invoca a GMP (a Biblioteca da
Aritmética de Precisión Múltiple de GNU), principalmente por medio da
instrución mpols. Os valores máis grandes dese enteiro proporcionan
maior precisión ao custo dun maior tempo de cálculo. Esta configuración
tamén se pode controlar mediante a variable de entorno GRETL_MP_BITS.
Xénese de números aleatorios
seed: Un número natural positivo ou a palabra chave auto. Establece a
semente para o xerador de números pseudoaleatorios. Por defecto, isto
establécese a partir do tempo do sistema; pero se queres xerar secuencias
repetibles de números aleatorios debes de establecer a semente
manualmente. Para restablecer a semente a un valor automático baseado no
tempo, usa auto.
Estimación robusta
bootrep: Un enteiro. Establece o número de repeticións da instrución
"restrict" coa opción --bootstrap.
garch_vcv: unset, hessian, im (matriz de información), op (matriz de
produto externo), qml (estimador CMV ou QML), ou bw
(Bollerslev-Wooldridge). Especifica a variante que se vai utilizar para
estimar a matriz de covarianzas dos coeficientes para modelos GARCH. Cando
indicas unset (caso por defecto) entón utilízase a matriz Hessiana,
agás que se indique a opción "robust" para a instrución garch, en cuxo
caso utilízase CMV (QML).
arma_vcv: hessian (caso por defecto) ou op (matriz de produto externo).
Especifica a variante que se vai utilizar cando se calcula a matriz de
covarianzas para modelos ARIMA.
force_hc: off (por defecto) ou on. Por defecto, con datos de series
temporais e cando indicas a opción--robust con ols (MCO), utilízase o
estimador HAC. Se pos force_hc en "on", isto forza o cálculo da Matriz de
Covarianzas Consistente ante Heterocedasticidade (HCCM) habitual, que non
ten en conta a autocorrelación. Cae na conta de que os VARs trátanse
como un caso especial, pois cando indicas a opción --robust o método por
defecto é o da HCCM habitual, pero podes utilizar a opción --robust-hac
para forzar que se empregue un estimador HAC.
robust_z: off (por defecto) ou on. Isto controla a distribución que se
utiliza cando se calculan as probabilidades asociadas (valores p) baseadas
nas desviacións padrón robustas, no contexto dos estimadores de mínimos
cadrados. Por defecto, GRETL utiliza a distribución t de Student pero se
activas robust_z, utilízase unha distribución Normal.
hac_lag: nw1 (por defecto), nw2, nw3 ou un enteiro. Establece o valor do
retardo máximo ou largo de banda (p) utilizado cando se calculan as
desviacións padrón HAC (Consistentes ante Heterocedasticidade e
Autocorrelación) utilizando o enfoque de Newey-West, para datos de series
temporais. As opcións nw1 e nw2 representan dúas variantes de cálculo
automático baseadas no tamaño da mostra T: para nw1, p = 0.75 * T^(1/3),
e para nw2, p = 4 * (T/100)^(2/9). A nw3 solicita unha elección do largo
de banda que se basea nos datos. Consulta tamén máis abaixo qs_bandwidth
e hac_prewhiten.
hac_kernel: bartlett (por defecto), parzen ou qs (Espectral cadrado).
Establece o 'kernel', ou padrón de ponderacións, que se utiliza cando se
calculan as desviacións padrón HAC.
hac_prewhiten: on ou off (por defecto). Utiliza o 'branqueo' previo e a
'volta a colorear' de Andrews-Monahan cando se calculan as desviacións
padrón HAC. Isto tamén implica utilizar unha elección do largo de banda
que se basea nos datos.
hc_version: 0 (por defecto), 1, 2, 3 ou 3a. Establece a variante que se
utiliza ao calcular as desviacións padrón Consistentes ante
Heterocedasticidade (HC) con datos de sección cruzada. As 4 primeiras
opcións correspóndense a HC0, HC1, HC2 e HC3 discutidas por Davidson e
MacKinnon no capítulo 5 de Econometric Theory and Methods. HC0 produce as
"desviacións padrón de White", como se denominan habitualmente. A
variante 3a é o procedemento da "navalla" de MacKinnon-White.
pcse: off (por defecto) ou on. Por defecto, cando se estima un modelo
utilizando MCO combinados con datos de panel coa opción --robust,
utilízase o estimador de Arellano para a matriz de covarianzas. Cando pos
pcse en "on", isto forza que se utilicen as Desviacións Padrón
Corrixidas de Panel de Beck e Katz (que non teñen en conta a
autocorrelación).
qs_bandwidth: Largo de banda para a estimación HAC no caso de que
selecciones o kernel Espectral Cadrado (QS). (A diferenza dos 'kernels' de
Bartlett e de Parzen, o largo de banda QS non require ser un enteiro.)
Series temporais
horizon: Un enteiro (por defecto baséase na frecuencia dos datos).
Establece o horizonte para as respostas ao impulso e as descomposicións
da varianza de predición no contexto de autorregresións de vectores.
vecm_norm: phillips (por defecto), diag, first ou none. Usada no contexto
da estimación VECM mediante a instrución "vecm" para identificar os
vectores de cointegración. Consulta o Manual de usuario de Gretl
(Capítulo 33) para obter máis detalles.
boot_iters: Un enteiro, B. Establece o número de iteracións 'bootstrap'
que se utilizan cando se calculan funcións de resposta ao impulso con
intervalos de confianza. O valor por defecto é 1999. É recomendable que
B + 1 sexa sempre divisible por 100α/2 de xeito que, por exemplo con α =
0.1, B+1 debería ser múltiplo de 5. O mínimo valor aceptable para B é
499.
Interacción con R
R_lib: on (por defecto) ou off. Cando se envían instrucións para que as
execute R, utiliza a biblioteca compartida de R mellor ca o executable de
R, se a biblioteca está dispoñible.
R_functions: off (por defecto) ou on. Recoñece funcións definidas en R
como se foran funcións propias (para iso requírese o prefixo de
asignación de nomes "R."). Consulta o Manual de usuario de Gretl
(Capítulo 44) para obter máis detalles sobre este elemento e o anterior.
Miscelánea
mpi_use_smt: on ou ben off (por defecto). Este interruptor afecta ao
número de procesos que se inician nun bloque mpi dentro dun guión. Se o
interruptor está en off, a cantidade por defecto destes procesos é igual
ao número de núcleos físicos da máquina local; se está en on, a
cantidade por defecto destes procesos é igual ao número máximo de
subprocesos, que cadrará co dobre do número de núcleos físicos cando
estes podan soportar SMT (Multiproceso Simultáneo, tamén coñecido como
Hiperproceso). Isto se aplica unicamente se o usuario non indica o número
de procesos, ben de xeito directo ou ben de xeito indirecto (mediante a
especificación dun ficheiro hosts para utilizar con MPI).
graph_theme: unha cadea de texto a escoller entre altpoints, classic,
dark2 (a vixente por defecto), ethan, iwanthue ou sober. Isto establece o
"tema" que se utiliza para as gráficas que xera GRETL. A opción classic
supón volver ao sinxelo tema que estaba vixente con antelación á
versión 2020c de GRETL.
# setinfo Dataset
Argumento: serie
Opcións: --description=cadea (Establece a descrición)
--graph-name=cadea (Establece o nome da gráfica)
--discrete (Marca a serie como discreta)
--continuous (Marca a serie como continua)
--coded (Marca como unha codificación)
--numeric (Marca como non codificación)
--midas (Marca como compoñente de datos de alta frecuencia)
Exemplos: setinfo x1 --description="Descrición de x1"
setinfo y --graph-name="Algunha cadea"
setinfo z --discrete
Se activas as opcións --description ou --graph-name, o argumento debe de
ser unha única serie; se non, poderá ser unha lista de series, en cuxo
caso a instrución funciona sobre todos os elementos da lista. Esta
instrución configura 4 atributos como se indica deseguido.
Cando indicas a opción --description seguida dunha cadea de texto entre
comiñas, esa cadea utilízase para establecer a etiqueta descritiva da
variable. Esta etiqueta amósase en resposta á instrución "labels", e
tamén amósase na xanela principal do programa de Interface Gráfica de
Usuario (GUI).
Cando especificas a opción --graph-name seguida dunha cadea de texto entre
comiñas, esa cadea vaise utilizar nas gráficas en lugar do nome da
variable.
Cando indicas un dos dous indicadores de opción --discrete ou --continuous,
o carácter numérico da variable establécese en consonancia con iso. Por
defecto, trátanse todas as series como continuas, entón determinar que
unha serie sexa discreta vai afectar ao xeito no que se manexa a variable en
outras instrucións e funcións, como por exemplo con "freq" ou con
"dummify".
Cando indicas algunha das dúas opcións --coded ou --numeric, o status da
serie indicada establécese dacordo con iso. Por defecto, trátanse todos os
valores numéricos como que teñen sentido coma tales, polo menos na
acepción habitual; pero establecer que unha serie é coded quere dicir que
os valores numéricos son unha codificación arbitraria de características
cualitativas.
A opción --midas establece unha indicación que alude a que unha
determinada serie contén datos dunha frecuencia maior que a frecuencia base
do conxunto de datos; por exemplo, se o conxunto de datos é trimestral, e
as series conteñen valores para o mes 1, 2 ou 3 de cada trimestre. (MIDAS =
Mixed Data Sampling.)
Ruta do menú: /Variable/Editar atributos
Outro acceso: Xanela principal: Menú emerxente
# setmiss Dataset
Argumentos: valor [ listavariables ]
Exemplos: setmiss -1
setmiss 100 x2
Permite que o programa interprete algún valor específico de dato numérico
(o primeiro parámetro da instrución) como un código para "ausente", no
caso de importar datos. Cando este valor é o único parámetro (como no
primeiro exemplo de arriba), esa interpretación vaise aplicar a todas as
series do conxunto de datos. Cando "valor" vai seguido dunha lista de
variables (indicadas por nome ou número), a interpretación limítase á(s)
variable(s) especificada(s). Así, no segundo exemplo, o valor 100 dos datos
interprétase como un código para "ausente", pero só para a variable x2.
Ruta do menú: /Datos/Establecer código de valor ausente
# setobs Dataset
Variantes: setobs periodicidade obsinicio
setobs varunidades vartempo --panel-vars
Opcións: --cross-section (Interpreta como de sección cruzada)
--time-series (Interpreta como serie temporal)
--special-time-series (Mira abaixo)
--stacked-cross-section (Interpreta como datos de panel)
--stacked-time-series (Interpreta como datos de panel)
--panel-vars (Utiliza variables índice, mira abaixo)
--panel-time (Mira abaixo)
--panel-groups (Mira abaixo)
Exemplos: setobs 4 1990:1 --time-series
setobs 12 1978:03
setobs 1 1 --cross-section
setobs 20 1:1 --stacked-time-series
setobs unit year --panel-vars
Esta instrución forza ao programa a interpretar que o conxunto de datos ten
unha estrutura específica.
Na primeira forma da instrución, debes de indicar a periodicidade mediante
un enteiro que represente a frecuencia no caso de que os datos sexan series
temporais (1 = anuais; 4 = trimestrais; 12 = mensuais; 52 = semanais; 5, 6,
ou 7 = diarios; 24 = horarios). No caso de datos de panel, a periodicidade
indica o número de liñas por bloque de datos; polo tanto, isto expresa ou
ben o número de unidades consecutivas cando indicas que son 'seccións
cruzadas amontoadas', ou ben o número de períodos de tempo consecutivos
cando indicas 'series de tempo amontoadas'. No caso de datos simples de
sección cruzada, a periodicidade debe de establecerse en 1.
A observación de inicio representa a data inicial, no caso de tratarse de
datos de series temporais. Podes indicar os anos mediante 2 ou 4 díxitos; e
debes de separar os subperíodos (por exemplo, trimestres ou meses) do ano
mediante dous puntos. No caso de datos de panel, debes de indicar a
observación inicial como 1:1, e no caso de datos de sección cruzada, como
1. Debes de indicar as observacións iniciais para datos diarios ou semanais
co formato YYYY-MM-DD (ou simplemente como 1 para datos sen datar).
Algunhas periodicidades de series temporais teñen interpretacións
estándar (por exemplo, 12 = mensuais e 4 = trimestrais). Pero se tes datos
de series temporais pouco habituais para as que non se aplica a
interpretación estándar, podes sinalar isto indicando a opción
--special-time-series. Nese caso, GRETL non vai advertir de que os teus
datos de (por exemplo) frecuencia igual a 12, sexan mensuais.
Cando non seleccionas un indicador de opción explícito para determinar a
estrutura dos datos, o programa vai tratar de adiviñar a estrutura a partir
da información proporcionada.
A segunda forma da instrución (que require que indiques a opción
--panel-vars) pode utilizarse para impoñer unha interpretación de panel,
cando o conxunto de datos contén variables que identifican de forma
inequívoca as unidades de sección cruzada e os períodos de tempo. O
conxunto de datos vaise ordenar como series de tempo amontoadas, en función
dos valores ascendentes da variable de unidades (varunidades).
Opcións específicas de Panel
Podes usar opcións --panel-time e --panel-groups unicamente cun conxunto de
datos que xa foi definido previamente como un panel.
A intención da opción --panel-time é determinar información adicional
relacionada coa dimensión temporal do panel. Debes de indicar esta seguindo
o padrón do primeiro formato de setobs apuntado máis arriba. Por exemplo,
podes utilizar a seguinte forma de indicar que a dimensión temporal dun
panel é trimestral, comezando no primeiro trimestre de 1990:
setobs 4 1990:1 --panel-time
A intención da opción --panel-groups é crear unha serie con valores en
cadeas de texto, que conteña os nomes dos grupos (individuos, unidades
atemporais) do panel. (Isto vaise utilizar cando sexa adecuado en gráficas
de panel.) Con esta opción indicas un ou dous argumentos, como se indica
deseguido.
Primeiro caso: Un único argumento é o nome dunha serie con valores en
cadeas de texto. Se o número de valores diferentes é igual ao número de
grupos do panel, esa serie utilízase para definir os nomes dos grupos. Se
resulta necesario, o contido numérico da serie vaise axustar de forma que
os valores sexan todos 1 para o primeiro grupo, todos 2 para o segundo
grupo, etcétera. Cando o número de valores diferentes en cadeas de texto
non coincide co número de grupos, amósase un fallo.
Segundo caso: O primeiro argumento é o nome dunha serie, e o segundo é
unha cadea de texto literal ou unha variable de cadea que contén un nome
para cada grupo. As series vanse xerar se non existen xa. Cando o segundo
argumento é unha cadea de texto literal ou unha variable de cadea, os nomes
dos grupos deben de estar separados por espazos; pero se un nome inclúe
espazos, debe de contornarse con comiñas precedidas (cada unha) de barra
inversa. Alternativamente, o segundo argumento pode ser un arranxo de cadeas
de texto.
Por exemplo, o seguinte código xera unha serie que se vai chamar Estado na
que os nomes da cadea cstrs repítense cada un T veces, e sendo T a longura
das series de tempo do panel.
string cstrs = sprintf("Francia Alemaña Italia \"Reino Unido\"")
setobs Estado cstrs --panel-groups
Ruta do menú: /Datos/Estrutura do conxunto de datos
# setopt Programming
Argumentos: instrución [ acción ] opcións
Exemplos: setopt mle --hessian
setopt ols persist --quiet
setopt ols clear
Mira tamén gdp_midas.inp
Esta instrución permite a configuración previa de opcións para unha
instrución concreta. Normalmente isto non fai falta, pero pode ser útil
para os autores de funcións en HANSL, cando queren facer que algunhas
opcións das instrucións estean condicionadas ao valor dun argumento que
proporcione quen as solicita.
Por exemplo, supón que unha función ofrece un interruptor booleano
"quiet", cuxa intención é que se suprima a presentación de resultados
dunha determinada regresión que se executa dentro da propia función. Nese
caso, poderíase escribir:
if quiet
setopt ols --quiet
endif
ols ...
Entón, a opción --quiet vaise aplicar á vindeira instrución ols
unicamente se a variable quiet ten un valor non nulo.
Por defecto, as opcións que se establecen deste xeito só se aplican á
seguinte petición da instrución; polo que non son persistentes. Porén, se
indicas persist como valor para acción, as opcións se continuarán
aplicando á instrución indicada ata novo aviso. O 'antídoto' á acción
persist é clear, pois este elimina calquera configuración gardada para a
instrución especificada.
Debes de ter en conta que as opcións establecidas mediante setopt
combínanse con calquera opción agregada directamente á instrución
apuntada. Así, por exemplo, pódese engadir a opción --hessian a unha
instrución mle de forma incondicional, pero utilizar setopt para engadir
--quiet de forma condicional.
# shell Utilities
Argumento: instrucshell
Exemplos: ! ls -al
! dir c:\users
launch notepad
launch emacs myfile.txt
A prestación que se describe aquí non está activada por defecto. Mira
máis abaixo para os detalles.
Un signo de exclamación ("!") ao comezo dunha liña de instrución se
interpreta como unha escapada do intérprete de usuario. Así podes executar
instrucións do intérprete ao teu antollo desde dentro de GRETL. O
argumento instrucshell pásase a /bin/sh en sistemas de tipo Unix como Linux
e macOS, ou a cmd.exe en MS Windows. Execútase de forma síncrona; é
dicir, GRETL vai agardar a que se complete a instrución antes de proseguir.
Se a instrución dá como resultado algún texto, este se presenta na
consola ou na xanela de resultados de guións.
Unha variante do acceso síncrono co intérprete, permite ao usuario
"capturar" o resultado dunha instrución nunha variable de cadea de texto.
Isto pódese acadar envolvendo a instrución entre parénteses, precedidos
por un signo dólar, como en
string s = $(ls -l $HOME)
Por outra banda, a clave "launch", executa un programa externo de xeito
asíncrono (sen agardar a que se complete), como no terceiro e no cuarto
exemplos de arriba. Isto está pensado para abrir unha aplicación en modo
interactivo. A RUTA do usuario vaise procurar para o executable
especificado. En MS Windows, a instrución vaise executar directamente, sen
pasala a cmd.exe (dese xeito as variables de contorna non se van expandir de
forma automática).
Activación
Por razóns de seguridade, a prestación de acceso co intérprete non se
permite por defecto. Para activala, marca o cadriño "Permitir instrucións
do intérprete" baixo o menú Ferramentas/Preferencias/Xeral no programa de
Interface Gráfica de Usuario (GUI). Isto tamén fai que estean dispoñibles
as instrucións do intérprete no programa de instrucións en liñas (e
resulta o único xeito de facelo).
# smpl Dataset
Variantes: smpl obsinicio obsfin
smpl +i -j
smpl varficticia --dummy
smpl condición --restrict
smpl --no-missing [ listavariables ]
smpl --no-all-missing [ listavariables ]
smpl --contiguous [ listavariables ]
smpl n --random
smpl full
Opcións: --dummy (O argumento é unha variable ficticia)
--restrict (Aplica unha restrición booleana)
--replace (Substitúe calquera restrición booleana existente)
--no-missing (Limitarse a observacións válidas)
--no-all-missing (Omite observacións baleiras (mira abaixo))
--contiguous (Mira abaixo)
--random (Xera unha submostra aleatoria)
--permanent (Mira abaixo)
--preserve-panel (Datos de panel: mira abaixo)
--unit (Datos de panel: mostra na dimensión atemporal)
--time (Datos de panel: mostra na dimensión temporal)
--dates (Interpreta os números de observación como datas)
--quiet (Non amosa o rango mostral)
Exemplos: smpl 3 10
smpl 1960:2 1982:4
smpl +1 -1
smpl x > 3000 --restrict
smpl y > 3000 --restrict --replace
smpl 100 --random
Restablece o rango da mostra. Podes definir o novo rango de varios xeitos.
Na primeira alternativa (e nos dous primeiros exemplos) de arriba, obsinicio
e obsfin deben de ser consistentes coa periodicidade dos datos. Podes
substituír calquera dos dous mediante un punto e coma para deixar ese valor
sen cambiar. (Para máis detalles sobre obsinicio e obsfin, consulta a
sección titulada "Datas versus Índices secuenciais" máis abaixo.) Na
segunda forma, os números enteiros i e j (poden ser positivos ou negativos,
e deben de ter o seu signo) considéranse como variacións en relación ao
rango da mostra existente. Na terceira forma, varficticia debe de ser unha
variable de sinalización con valores 0 ou 1 en cada observación; así a
mostra vaise restrinxir ás observacións nas que o valor é 1. A cuarta
forma, que utiliza --restrict, restrinxe a mostra ás observacións que
cumpren a condición booleana que se indica.
Podes empregar as opcións --no-missing e --no-all-missing para excluír da
mostra aquelas observacións para as que hai ausencia de datos. A primeira
variante exclúe aquelas filas do conxunto de datos para as que, polo menos
unha variable, ten un valor ausente; mentres que a segunda variante exclúe
unicamente aquelas filas nas que todas as variables teñen valores ausentes.
En cada caso, a comprobación limítase ás variables de listavariables
cando indicas este argumento; se non, aplícase a todas as series (coa
reserva de que, no caso de non ter listavariables e indicar
--no-all-missing, as variables xenéricas index e time ignóranse).
A opción --contiguous de smpl está pensada para usar con datos de series
temporais. O seu efecto consiste en recortar calquera observación ao comezo
e ao final do rango da mostra vixente que conteña valores ausentes (ben
para as variables de listavariables, ou ben para todas as series de datos se
non indicas listavariables). Entón realízase unha verificación para
comprobar se hai algún valor ausente no rango que queda; e se é así,
amósase un fallo.
Coa opción --random, o número de casos especificado escóllese
aleatoriamente do conxunto vixente de datos (sen substitución). Se queres
ser capaz de replicar esa selección, debes de establecer primeiro a semente
para o xerador de números aleatorios (consulta a instrución "set").
A forma final (smpl full) restablece o rango completo de datos.
Ten en conta que as restricións mostrais son, por defecto, acumulativas; é
dicir, o punto de partida de calquera instrución smpl é a mostra vixente.
Se queres que a instrución actúe substituíndo calquera restrición xa
existente, podes engadir o indicador de opción --replace ao final da
instrución. (Pero esta opción non é compatible coa opción --contiguous.)
Podes utilizar a variable interna obs xunto coa opción --restrict de smpl
para excluír observacións concretas da mostra. Por exemplo
smpl obs!=4 --restrict
vai prescindir unicamente da cuarta observación. Se os casos dos datos se
identifican mediante etiquetas,
smpl obs!="USA" --restrict
vai prescindir da observación coa etiqueta "USA".
Debe de apuntarse unha cuestión en relación ás opcións --dummy,
--restrict e --no-missing da instrución smpl: a información "estrutural"
do ficheiro de datos (relacionada coa natureza de series de tempo ou de
panel, dos datos) probablemente vaise perder cando se execute esta
instrución; pero podes volver impoñer a estrutura coa instrución "setobs"
(consulta tamén a opción --preserve-panel máis abaixo).
Datas versus Índices secuenciais
Podes utilizar a opción --dates para solucionar algunha posible
ambigüidade ao interpretar obsinicio e obsfin no caso de usar datos de
series de tempo anuais. Por exemplo, debería considerarse que 2010 se
refire ao ano 2010, ou á dous mil décima observación? Na maioría dos
casos, isto debera saír ben automaticamente, pero podes forzar a
interpretación en forma de data se o precisas. Esta opción tamén se pode
utilizar con datos que estean datados diariamente para lograr que smpl
interprete, por exemplo, 20100301 como o primeiro de marzo de 2010 en
troques dun índice secuencial corrente. Cae na conta de que esta
ambigüidade non xurde coas frecuencias de series de tempo que sexan
distintas á anual e á diaria; datas como 1980:3 (terceiro trimestre de
1980) e 2020:03 (marzo de 2020) non poden confundirse con índices
correntes.
Opcións específicas para datos de panel
As opcións --unit e --time son específicas para datos de panel. Te
permiten indicar, respectivamente, un rango de "unidades" ou de períodos de
tempo. Por exemplo:
# Limita a mostra ás primeiras 50 unidades
smpl 1 50 --unit
# Limita a mostra aos períodos de tempo de 2 a 20
smpl 2 20 --time
Cando se especifica a dimensión temporal dun conxunto de datos de panel
mediante a instrución "setobs" coa opción --panel-time, a instrución smpl
coa opción --time pode expresarse en termos de datas en troques de números
de observación planos. Este é un exemplo:
# Especificar o tempo dun panel como trimestral, comezando no primeiro de 1990
setobs 4 1990:1 --panel-time
# Limitar a mostra desde 2000:1 ata 2007:1
smpl 2000:1 2007:1 --time
En GRETL, un conxunto de datos de panel debe estar sempre "teoricamente
equilibrado " -- é dicir, cada unidade debe ter o mesmo número de filas de
datos, aínda que algunhas filas non conteñan máis que NAs. Extraer unha
submostra mediante as opcións --restrict ou --dummy pode rachar esta
estrutura. Nese caso, podes engadir a opción --preserve-panel para
solicitar que se reconstitúa un panel teoricamente equilibrado, por medio
da inserción das "filas ausentes" que fagan falta.
Establecer a mostra como permanente ou provisional
Por defecto, podes desfacer as limitacións que establezas sobre o rango da
mostra vixente, pois executando smpl full podes restaurar o conxunto de
datos completo. Porén, podes utilizar a opción --permanent para
substituír o conxunto de datos restrinxido en lugar do orixinal. O efecto
de indicar a opción --permanent sen outros argumentos nin opcións, é o de
reducir o banco de datos ao rango da mostra vixente.
Consulta o Manual de usuario de Gretl (Capítulo 5) para obter outros
detalles.
Ruta do menú: /Mostra
# spearman Statistics
Argumentos: serie1 serie2
Opción: --verbose (Presenta os datos por rangos)
Presenta o coeficiente da correlación por rangos de Spearman para as series
serie1 e serie2. Non tes que xerarquizar manualmente as variables por
adiantado, pois a función xa ten conta diso.
A forma automática de xerarquizar é de maior a menor (i.e. o valor máis
grande dos datos acada o rango 1). Se necesitas inverter esta forma de
xerarquizar, xera unha nova variable que sexa a negativa da orixinal. Por
exemplo:
series altx = -x
spearman altx y
Ruta do menú: /Ferramentas/Probas non paramétricas/Correlación
# sprintf Printing
Instrución obsoleta: utiliza no seu lugar a función co mesmo nome,
"sprintf".
# square Transformations
Argumento: listavariables
Opción: --cross (Xera os produtos cruzados así como os cadrados)
Xera novas series que son os cadrados das series de listavariables (ademais
das variables cos produtos cruzados entre cada dúas, cando indicas a
opción --cross). Por exemplo, "square x y" vai xerar as variables sq_x = x
ao cadrado, sq_y = y ao cadrado e (opcionalmente con 'cross') x_y = x por y.
Cando unha determinada variable é unha variable ficticia, non se calcula o
seu cadrado pois obteríamos a mesma variable.
Ruta do menú: /Engadir/Cadrados das variables seleccionadas
# stdize Transformations
Argumento: listavar
Opcións: --no-df-corr (Sen corrección de graos de liberdade)
--center-only (Sen dividir por desviación padrón)
Por defecto, obtense unha versión tipificada de cada unha das variables de
listavar, e cada resultado gárdase nunha nova serie co prefixo s_. Así,
por exemplo, a expresión "stdize x y" crea as novas series s_x e s_y, cada
unha como resultado de centrar e dividir a orixinal pola súa desviación
padrón mostral (coa corrección de 1, nos graos de liberdade).
Cando indicas a opción --no-df-corr, non se vai aplicar ningunha
corrección dos graos de liberdade na desviación padrón que se utiliza;
será o estimador máximo-verosímil. Se indicas a opción --center-only, as
series resultan de unicamente restar a media e, nese caso, os nomes das
resultantes van ter o prefixo c_ en troques de s_.
A funcionalidade desta instrución está dispoñible de xeito en certo modo
máis flexible, por medio da función "stdize".
Ruta do menú: /Engadir/Tipificar as variables seleccionadas
# store Dataset
Argumentos: nomeficheiro [ listavariables ]
Opcións: --omit-obs (Mira abaixo, sobre o formato CSV)
--no-header (Mira abaixo, sobre o formato CSV)
--gnu-octave (Utiliza o formato GNU Octave)
--gnu-R (Formato tratable con read.table)
--gzipped[=nivel] (Aplica a compresión gzip)
--jmulti (Utiliza o formato ASCII JMulti)
--dat (Utiliza o formato ASCII PcGive)
--decimal-comma (Utiliza a coma como carácter decimal)
--database (Utiliza o formato de banco de datos de GRETL)
--overwrite (Mira abaixo, sobre o formato de banco de datos)
--comment=cadea (Mira abaixo)
--matrix=nomematriz (Mira abaixo)
Garda os datos en nomeficheiro. Por defecto, gárdanse todas as series xa
definidas nese momento, pero podes utilizar o argumento listavariables
(opcional) para escoller un subconxunto de series. Se o conxunto de datos é
unha submostra, só se gardan as observacións do rango vixente da mostra.
O ficheiro resultante vai escribirse no cartafol ("workdir") establecido
nese momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Cae na conta de que a instrución store compórtase de xeito especial no
contexto dun "bucle progresivo"; consulta o Manual de usuario de Gretl
(Capítulo 13) para obter máis detalles.
Formatos propios
Se nomeficheiro ten extensión .gdt ou .gtdb, isto implica que se garden os
datos nun dos formatos propios de GRETL. Amais, se non indicas unha
extensión, considérase implicitamente a .gdt e este sufixo engádese de
xeito automático. O formato gdt é de tipo XML, opcionalmente comprimido en
gzip; mentres que o formato gdtb é binario. O primeiro recoméndase para
conxuntos de datos de tamaño moderado (digamos que ata varios centos de
quilobytes de datos); co formato binario é moito maior a velocidade con
conxuntos de datos moi grandes.
Cando gardas os datos en formato gdt, podes utilizar a opción --gzipped
para comprimilos. O parámetro (optativo) desta opción controla o nivel de
compresión (de 0 a 9): os valores maiores xeran un ficheiro máis pequeno,
pero a compresión leva máis tempo. O nivel por defecto é o 1; e un nivel
de 0 significa que non se aplica ningunha compresión.
Admítese un tipo especial de gardado "propio" no programa de interface GUI:
se nomeficheiro ten extensión .gretl e omites o argumento listavariables,
entón grávase un ficheiro de sesión de GRETL. Este tipo de ficheiros
inclúen o conxunto de datos vixente xunto con calquera obxecto que teña un
nome, como modelos, gráficas e matrices.
Outros formatos
Ata certo punto, podes controlar o formato no que se escriben os datos
mediante a extensión ou sufixo de nomeficheiro, como se indica deseguido:
.csv: Valores Separados por Comas (CSV).
.txt ou .asc: valores separados por espazos.
.m: Formato matricial GNU Octave.
.dta: Formato dta de Stata (versión 113).
Podes usar os indicadores de opción relacionados co formato amosados arriba
para forzar a elección do formato, con independencia do nome do ficheiro
(ou para lograr que GRETL escriba nos formatos de PcGive ou JMulTi).
Opcións CSV
Os indicadores de opción --omit-obs e --no-header son específicos para
gardar datos no formato CSV. Por defecto, se os datos son series temporais
ou de panel, ou se o conxunto de datos inclúe marcadores específicos de
observación, o ficheiro resultante inclúe unha primeira columna que
identifica as observacións (e.g. por data). Cando indicas a opción
--omit-obs, esta columna omítese. A opción --no-header elimina a habitual
representación dos nomes das variables no encabezamento das columnas.
O indicador de opción --decimal-comma está tamén limitado a CSV. O seu
efecto consiste en substituír o punto decimal coa coma decimal; e, por
engadido, fórzase a que o separador de columnas sexa o punto e coma, en
troques da coma.
Gardar nun banco de datos
A posibilidade de gardar no formato de banco de datos de GRETL está pensada
para axudar a construír longos conxuntos de series, con mesturas de
frecuencias e rangos de observacións. Neste momento, esta opción só está
dispoñible para datos de series temporais de tipo anual, trimestral ou
mensual. Se fas o gardado nun ficheiro que xa existe, o efecto por defecto
consiste en engadir as series recentemente gardadas ao contido existente no
banco de datos. Neste contexto, é un fallo que unha (ou máis) das
variables que se van gardar teña o mesmo nome ca unha variable que xa está
presente no banco de datos. A opción --overwrite ten como consecuencia que,
se hai nomes de variables en común, a variable recentemente gardada
substitúe á variable do mesmo nome no conxunto de datos orixinal.
A opción --comment está dispoñible cando se gardan datos como banco de
datos ou como CSV. O parámetro que se require é unha cadea nunha liña,
entre comiñas, ligada ao indicador de opción mediante un signo de
igualdade. A cadea de texto insírese como comentario no ficheiro índice do
banco de datos ou no encabezamento do CSV.
Escribir unha matriz como conxunto de datos
A opción --matriz precisa dun parámetro: o nome dunha matriz (que non
estea baleira). Entón a consecuencia da instrución store é efectivamente
converter a matriz nun conxunto de datos "en segundo plano", e escribilo
como tal nun ficheiro. As columnas da matriz pasan a ser series cuxos nomes
se toman ben dos nomes adxuntos ás columnas da matriz (no caso de habelos),
ou ben se asignan por defecto como v1, v2, etc. Se a matriz ten nomes
adxuntos ás filas, estes utilízanse no conxunto de datos como "marcadores
das observacións".
Cae na conta de que podes escribir as matrices como tales en ficheiros,
consulta para elo a función "mwrite". Pero ás veces pode resultarche útil
escribilas en forma de conxuntos de datos.
Ruta do menú: /Ficheiro/Gardar datos; /Ficheiro/Exportar datos
# summary Statistics
Variantes: summary [ listavariables ]
summary --matrix=nomematriz
Opcións: --simple (Só estatísticos básicos)
--weight=wvar (Variable de ponderación)
--by=byvar (Mira abaixo)
Exemplos: frontier.inp
Na súa primeira forma, esta instrución presenta un resumo estatístico das
variables de listavariables, ou de todas as variables do conxunto de datos
cando omites listavariables. Por defecto, o resultado consiste na media,
desviación padrón (sd), coeficiente de variación (= sd/media), mediana,
mínimo, máximo, coeficiente de asimetría e exceso de curtose. Cando
indicas a opción --simple, o resultado limítase á media, o mínimo, o
máximo e a desviación padrón.
Cando indicas a opción --by (en cuxo caso o parámetro byvar debe de ser o
nome dunha variable discreta), entón preséntanse os estatísticos para as
submostras que se corresponden cos diferentes valores que toma byvar. Por
exemplo, cando byvar é unha variable ficticia (binaria), preséntanse os
estatísticos para os casos nos que byvar = 0 e byvar = 1. Advertencia:
Neste momento, esta opción é incompatible coa opción --weight.
Cando indicas a forma alternativa, utilizando unha matriz xa definida,
entón preséntase o resumo estatístico para cada columna da matriz. Neste
caso, a opción --by non está dispoñible.
Podes obter, en forma de matriz, a táboa de estatísticos xerada pola
instrución summary, mediante o accesorio "$result".
Ruta do menú: /Ver/Estatísticos principais
Outro acceso: Xanela principal: Menú emerxente
# system Estimation
Variantes: system method=estimador
sysname <- system
Exemplos: "Klein Model 1" <- system
system method=sur
system method=3sls
Mira tamén klein.inp, kmenta.inp, greene14_2.inp
Comeza un sistema de ecuacións. Podes indicar unha das dúas formas da
instrución, dependendo de se queres gardar o sistema para estimalo de
varias formas, ou só estimar o sistema unha vez.
Para gardar o sistema debes de asignarlle un nome como no primeiro exemplo
(se o nome contén espazos, debes de contornalo entre comiñas). Neste caso,
estímase o sistema utilizando a instrución "estimate". Cun sistema de
ecuacións xa gardado, podes impoñer restricións (incluídas restricións
entre ecuacións) utilizando a instrución "restrict".
Como alternativa, podes especificar un estimador para o sistema utilizando
method= seguido dunha cadea que identifique un dos estimadores admitidos:
"ols" (Mínimos Cadrados Ordinarios), "tsls" (Mínimos Cadrados en 2 Etapas)
"sur" (Regresións Aparentemente Non Relacionadas), "3sls" (Mínimos
Cadrados en 3 Etapas), "fiml" (Máxima Verosimilitude con Información
Total) ou "liml" (Máxima Verosimilitude con Información Limitada). Neste
caso, o sistema estímase unha vez que estea completa a súa definición.
Un sistema de ecuacións remátase coa liña "end system". Dentro do sistema
poden indicarse 4 tipos de enunciado, como os seguintes.
"equation": Especifica unha ecuación do sistema.
"instr": Para estimar un sistema mediante Mínimos Cadrados en 3 etapas,
indícase unha lista de instrumentos (mediante o nome da variable ou o seu
número). Alternativamente, podes poñer esta información na liña
"equation" usando a mesma sintaxe que na instrución "tsls".
"endog": Para un sistema de ecuacións simultáneas, indícase unha lista
de variables endóxenas. En principio, isto está pensado para utilizar
coa estimación FIML, pero podes utilizar este enfoque con Mínimos
Cadrados en 3 Etapas en troques de indicar unha lista "instr"; e entón
todas as variables que non se identifiquen como endóxenas, vanse utilizar
como instrumentos.
"identity": Para utilizar con Máxima Verosimilitude con Información
Completa (MVIC, FIML), indícase unha identidade que enlaza dúas ou máis
variables do sistema. Este tipo de enunciado se ignora cando se utiliza un
estimador diferente ao de MVIC.
Logo de facer a estimación utilizando as instrucións "system" ou
"estimate", podes usar os seguintes accesorios para recoller información
adicional:
$uhat: Matriz cos erros de estimación, cunha columna por ecuación.
$yhat: Matriz cos valores axustados, cunha columna por ecuación.
$coeff: Vector columna cos coeficientes das ecuacións (todos os
coeficientes da primeira ecuación, seguidos polos da segunda ecuación,
etcétera).
$vcv: Matriz coas covarianzas entre os coeficientes. Cando hai k elementos
no vector $coeff, esta matriz ten unha dimensión de k por k.
$sigma: Matriz coas covarianzas entre os erros de estimación das
ecuacións cruzadas.
$sysGamma, $sysA e $sysB: Matrices cos coeficientes na forma estrutural
(mira abaixo).
Se queres recuperar os erros de estimación ou os valores axustados para
unha ecuación en concreto, en forma de serie de datos, escolle unha columna
da matriz $uhat ou $yhat, e asígnalle a serie como en
series uh1 = $uhat[,1]
As matrices na forma estrutural correspóndense coa seguinte representación
dun modelo de ecuacións simultáneas:
Gamma y(t) = A y(t-1) + B x(t) + e(t)
Se hai n variables endóxenas e k variables esóxenas, Gamma é unha matriz
de dimensión n x n e B é n x k. Cando o sistema non contén ningún
retardo das variables endóxenas, entón a matriz A non está presente. Se o
retardo máximo dun regresor endóxeno é p, a matriz A é de dimensión n x
np.
Ruta do menú: /Modelar/Ecuacións Simultáneas
# tabprint Printing
Opcións: --output=nomeficheiro (Envía o resultado ao ficheiro especificado)
--format="f1|f2|f3|f4" (Especifica o formato TeX personalizado)
--complete (Relacionado con TeX, mira abaixo)
Debe de ir despois da estimación dun modelo e presenta ese modelo en
formato de táboa. O formato réxese pola extensión do nomeficheiro
especificado: ".tex" para LaTeX, ".rtf" para RTF (Microsoft's Rich Text
Format) ou ".csv" para o formato con separación mediante comas. O ficheiro
resultante vai escribirse no cartafol vixente ("workdir"), agás que a cadea
nomeficheiro conteña unha especificación completa da ruta.
Cando seleccionas o formato CSV, os valores sepáranse con comas agás que a
coma decimal estea vixente, en cuxo caso o separador é o punto e coma.
Opcións específicas de resultados en LaTeX
Cando indicas a opción --complete, o ficheiro LaTeX é un documento
completo, listo para procesar; se non, debe de incluírse nun documento.
Se queres modificar a aparencia do resultado tabular, podes especificar un
formato personalizado en filas utilizando a opción --format. A cadea de
formato debe de estar contornada entre comiñas e debe de estar ligada á
opción cun signo de igualdade. O padrón para as cadeas de formato é o
seguinte. Existen 4 campos que representan: o coeficiente, a desviación
padrón, a razón t e a probabilidade asociada, respectivamente. Debes de
separar estes campos mediante barras verticais; e, ou ben poden ter unha
especificación de tipo printf para o formato do valor numérico en
cuestión, ou ben poden deixarse en branco para eliminar a presentación
desa columna (suxeito isto á condición de que non podes deixar todas as
columnas en branco). Aquí tes uns poucos exemplos:
--format="%.4f|%.4f|%.4f|%.4f"
--format="%.4f|%.4f|%.3f|"
--format="%.5f|%.4f||%.4f"
--format="%.8g|%.8g||%.4f"
A primeira destas especificacións presenta os valores de todas as columnas
usando 4 díxitos decimais. A segunda elimina a probabilidade asociada e
presenta as razóns t con 3 díxitos decimais. A terceira omite a razón t.
A derradeira tamén omite a t, e presenta tanto o coeficiente como a
desviación padrón con 8 cifras significativas.
Unha vez que estableces un formato personalizado deste xeito, este lémbrase
e utilízase ao longo do que dure a sesión de GRETL. Para reverter isto ao
formato por defecto, podes utilizar a variante especial --format=default.
Ruta do menú: Xanela de modelo: LaTeX
# textplot Graphs
Argumento: listavariables
Opcións: --time-series (Gráfica por observación)
--one-scale (Forza unha escala única)
--tall (Usa 40 filas)
Gráficas ASCII rápidas e sinxelas. Sen a opción --time-series,
listavariables debe de conter cando menos 2 series, a última delas tómase
como a variable para o eixe x, e xérase unha gráfica de dispersión. Neste
caso, podes utilizar a opción --tall para xerar unha gráfica na que o eixe
y se representa mediante 40 filas de caracteres (por defecto son 20 filas).
Coa opción --time-series, xérase unha gráfica por observación. Neste
caso, podes utilizar a opción --one-scale para forzar o uso dunha escala
única; se non, se listavariables contén máis dunha serie, os datos poden
escalarse. Cada liña representa unha observación, cos valores dos datos
debuxados horizontalmente.
Consulta tamén "gnuplot".
# tobit Estimation
Argumentos: depvar indepvars
Opcións: --llimit=cotaesq (Especifica a cota da esquerda)
--rlimit=cotader (Especifica a cota da dereita)
--vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--opg (Mira máis abaixo)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--verbose (Presenta os detalles das iteracións)
--quiet (Non presenta os resultados)
Estima un modelo Tobit, que pode ser o adecuado cando a variable dependente
está "censurada". Por exemplo, cando se observan valores positivos e nulos
na adquisición de bens duradeiros por parte dos fogares, e ningún valor
negativo, mesmo pode pensarse que as decisións sobre esas compras son o
resultado dunha disposición subxacente e inobservada a comprar, que pode
ser negativa nalgúns casos.
Por defecto, asúmese que a variable dependente está 'censurada' no cero
pola esquerda, e que non está 'censurada' pola dereita. Porén, podes usar
as opcións --llimit e --rlimit para especificar un padrón diferente para
facer a 'censura'. Ten en conta que se especificas unicamente unha cota pola
dereita, entón o que se supón é que a variable dependente non está
'censurada' pola esquerda.
O modelo Tobit é un caso especial da regresión por intervalos. Consulta a
instrución "intreg" para obter detalles adicionais, incluída unha
explicación das opcións --robust e --opg.
Ruta do menú: /Modelar/Variable Dependente Limitada/Tobit
# tsls Estimation
Argumentos: depvar indepvars ; instrumentos
Opcións: --no-tests (Non fai probas de diagnose)
--vcv (Presenta a matriz de covarianzas)
--quiet (Non presenta os resultados)
--no-df-corr (Sen corrección dos graos de liberdade)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--liml (Utiliza Máxima Verosimilitude con Información Limitada)
--gmm (Utiliza o Método Xeneralizado dos Momentos)
Exemplos: tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6
Mira tamén penngrow.inp
Calcula as estimacións de Variables Instrumentais (VI), utilizando por
defecto Mínimos Cadrados en 2 Etapas (TSLS), pero mira máis abaixo para
outras opcións. A variable dependente é depvar, mentres que indepvars
expresa unha lista de regresores (presuponse que inclúe cando menos unha
variable endóxena), e instrumentos indica unha lista de instrumentos
(variables esóxenas e/ou predeterminadas). Se a lista instrumentos non é
cando menos tan longa como indepvars, o modelo non está identificado.
No exemplo de arriba, as ys son as variables endóxenas e as xs son as
variables esóxenas. Cae na conta de que os regresores esóxenos deben de
aparecer en ambas listas.
O resultado das estimacións de Mínimos Cadrados en 2 Etapas inclúen a
proba de Hausman e (se o modelo está sobreidentificado) a proba de
sobreidentificación de Sargan. Na proba de Hausman, a hipótese nula é que
as estimacións MCO son consistentes ou, noutras palabras, que a estimación
por medio de variables instrumentais en realidade non se necesita. Un modelo
desta clase está sobreidentificado se hai máis instrumentos dos que
estritamente se requiren. A proba de Sargan se basea nunha regresión
auxiliar dos erros da estimación do modelo por Mínimos Cadrados en 2
Etapas sobre a lista completa de instrumentos. A hipótese nula é que todos
os instrumentos son válidos, e sospéitase da validez desta hipótese se a
regresión auxiliar ten un grao de poder explicativo que é significativo.
Para unha boa explicación das dúas probas, consulta o capítulo 8 de
Davidson e MacKinnon (2004).
Tanto para MC2E (TSLS) como para a estimación MVIL (LIML), amósase o
resultado dunha proba adicional, posto que o modelo estímase baixo o
suposto de perturbacións IID (é dicir, non se escolle a opción --robust).
Esta é unha proba da debilidade dos instrumentos, pois instrumentos
débiles poden levar a serios problemas na regresión de VI: estimacións
nesgadas e/ou tamaño incorrecto das probas de hipóteses baseadas na matriz
de covarianzas, con taxas de rexeite que superan moito o nivel de
significación nominal (Stock, Wright e Yogo, 2002). O estatístico é o da
proba F da primeira etapa se o modelo ten tan só un regresor endóxeno; se
non, é o valor propio máis pequeno da matriz de contrapartida do F da
primeira etapa. Amósanse os puntos críticos baseados na análise Monte
Carlo de Stock e Yogo (2003), cando estean dispoñibles.
O valor de R-cadrado que se presenta para modelos estimados mediante
Mínimos Cadrados en 2 Etapas é o cadrado da correlación entre a variable
dependente e a variable cos valores axustados.
Para obter máis detalles en relación aos efectos das opcións --robust e
--cluster, consulta a axuda para "ols".
Como alternativas a MC2E, o modelo pode estimarse mediante Máxima
Verosimilitude con Información Limitada (opción --liml) ou mediante o
Método Xeneralizado dos Momentos (opción --gmm). Cae na conta de que, se o
modelo está simplemente identificado, estes métodos deberían xerar os
mesmos resultados que MC2E; pero se está sobreidentificado, os resultados
en xeral van diferir.
Cando se escolle a estimación MXM (GMM), as seguintes opcións adicionais
pasan a estar dispoñibles:
--two-step: Realiza MXM en 2 etapas en troques de facelo en 1 etapa (por
defecto).
--iterate: Reitera MXM ata a converxencia.
--weights=Wmat: Especifica unha matriz cadrada de ponderacións para
utilizar cando se calcula a función do criterio MXM. A dimensión desta
matriz debe de ser igual ao número de instrumentos. Por defecto, é unha
matriz identidade de dimensión axeitada.
Ruta do menú: /Modelar/Variables Instrumentais
# var Estimation
Argumentos: nivel ylista [ ; xlista ]
Opcións: --nc (Sen constante)
--trend (Con tendencia linear)
--seasonals (Con variables ficticias estacionais)
--robust (Desviacións padrón robustas)
--robust-hac (Desviacións padrón HAC)
--quiet (Non amosa os resultados das ecuacións individuais)
--silent (Non presenta nada)
--impulse-responses (Presenta as respostas ao impulso)
--variance-decomp (Presenta as descomposicións da varianza)
--lagselect (Amosa os criterios de selección de retardos)
--minlag=retardo mínimo (Só selección de retardo, mira abaixo)
Exemplos: var 4 x1 x2 x3 ; time mydum
var 4 x1 x2 x3 --seasonals
var 12 x1 x2 x3 --lagselect
Mira tamén sw_ch14.inp
Establece e estima (utilizando MCO) unha autorregresión de vectores (VAR).
O primeiro argumento especifica o nivel de retardos (ou o nivel máximo de
retardos, no caso de que indiques a opción --lagselect, mira máis abaixo).
O nivel podes indicalo numericamente ou co nome dunha variable escalar
preexistente. A continuación segue a configuración da primeira ecuación.
Non inclúas retardos entre os elementos de ylista pois vanse engadir
automaticamente. O punto e coma vai separar as variables estocásticas (para
as que se vai incluír un nivel de retardos) de calquera variable esóxena
de xlista. Ten en conta que: (a) inclúese unha constante automaticamente
(agás que indiques a opción --nc), (b) podes engadir unha tendencia coa
opción --trend, e (c) podes engadir variables ficticias estacionais
utilizando a opción --seasonals.
Mentres que unha especificación VAR habitualmente inclúe tódolos retardos
desde 1 ata o máximo que indiques, tamén podes escoller un grupo de
retardos. Para facer isto, substitúe o argumento rutineiro nivel (escalar),
ben co nome dun vector xa definido previamente, ou ben cunha lista de
retardos separados con comas e contornada entre chaves. Debaixo amósanse
dous xeitos de especificar que un VAR debe de incluír os retardos 1, 2 e 4
(pero non o 3):
var {1,2,4} ylista
matrix p = {1,2,4}
var p ylista
Devólvese unha regresión por separado para cada unha das variables de
ylista. Os resultados para cada ecuación inclúen as probas F para
restricións cero en todos os retardos de cada unha das variables, unha
proba F sobre a significación do retardo máximo e, cando especificas a
opción --impulse-responses, as descomposicións da varianza da predición e
as respostas ao impulso.
As descomposicións da varianza da predición e as respostas ao impulso
baséanse na descomposición de Cholesky da matriz de covarianzas
contemporánea e, neste contexto, ten importancia a orde na que indicas as
variables (estocásticas). Así, a primeira variable da lista asúmese que
é a "máis esóxena" dentro do período. Podes establecer o horizonte para
as descomposicións da varianza e as respostas ao impulso, utilizando a
instrución "set". Para recuperar unha función concreta de resposta ao
impulso en forma matricial, consulta a función "irf".
Cando indicas a opción --robust, as desviacións padrón corríxense do
efecto da heterocedasticidade. Como alternativa, podes indicar a opción
--robust-hac para dar lugar a desviacións padrón que sexan robustas con
respecto tanto á heterocedasticidade como á autocorrelación (HAC). En
xeral, esta última corrección non debera de ser necesaria se o VAR inclúe
un número suficiente de retardos.
Cando indicas a opción --lagselect, tómase o primeiro parámetro da
instrución var como o nivel máximo de retardos. O resultado consiste nunha
táboa que amosa os valores dos criterios de información de Akaike (AIC),
Schwarz (BIC) e Hannan-Quinn (HQC), calculados por defecto con VARs de
niveis desde 1 ata o máximo indicado. Isto trata de axudar na selección do
nivel óptimo de retardos. O resultado habitual do VAR non se presenta.
Podes recuperar a táboa cos criterios de información en forma de matriz
mediante o accesorio "$test". Neste contexto (unicamente), podes usar a
opción --minlag para axustar o nivel mínimo de retardos. Fai que sexa 0
para permitir a posibilidade de que o nivel óptimo de retardos sexa cero,
querendo isto dicir realmente que non se require un VAR para nada. Pola
contra, poderías facer que --minlag=4 se cres que necesitas cando menos 4
retardos, de xeito que se aforre un pouco de tempo de cálculo.
Ruta do menú: /Modelar/Series temporais multivariantes
# varlist Dataset
Opción: --type=nometipo (Eido da listaxe)
Por defecto, presenta unha listaxe das series do conxunto vixente de datos
(se hai algunha); e podes utilizar "ls" como alcume.
Cando indicas a opción --type, debe de ir seguida (despois dun signo de
igualdade) por un dos seguintes tipos: series, scalar, matrix, list, string,
bundle, array ou accessor. O seu efecto consiste en presentar os nomes de
tódolos obxectos do tipo indicado que estean definidos nese momento.
Como caso especial, se o tipo é accessor, os nomes que se presentan son
aqueles das variables internas dispoñibles nese momento como "accesorios",
como poden ser "$nobs" e "$uhat" (sexan os que sexan os seus tipos
concretos).
# vartest Tests
Argumentos: serie1 serie2
Calcula o estatístico F para probar a hipótese nula de que as varianzas
poboacionais das variables serie1 e serie2 son iguais, e amosa a súa
probabilidade asociada (valor p). Podes obter as estatísticas da proba e a
probabilidade asociada mediante os accesorios "$test" e "$pvalue",
respectivamente. O seguinte código
open AWM18.gdt
vartest EEN EXR
eval $test
eval $pvalue
calcula a proba, e amosa como recuperar máis tarde o estatístico de proba
e a probabilidade asociada correspondente:
Proba de igualdade de varianzas
EEN: Número de observacións = 192
EXR: Número de observacións = 188
Cociente entre varianzas mostrais = 3.70707
Hipótese nula: As dúas varianzas das poboacións son iguais
Estatístico de proba: F(191,187) = 3.70707
valor p (con dúas colas) = 1.94866e-18
3.7070716
1.9486605e-18
Ruta do menú: /Ferramentas/Calculadora de probas
# vecm Estimation
Argumentos: nivel rango ylista [ ; xlista ] [ ; rxlista ]
Opcións: --nc (Sen constante)
--rc (Constante restrinxida)
--uc (Constante non restrinxida)
--crt (Constante e tendencia restrinxida)
--ct (Constante e tendencia non restrinxida)
--seasonals (Inclúe variables ficticias estacionais centradas)
--quiet (Non amosa os resultados das ecuacións individuais)
--silent (Non presenta nada)
--impulse-responses (Presenta as respostas ao impulso)
--variance-decomp (Presenta as descomposicións da varianza)
Exemplos: vecm 4 1 Y1 Y2 Y3
vecm 3 2 Y1 Y2 Y3 --rc
vecm 3 2 Y1 Y2 Y3 ; X1 --rc
Mira tamén denmark.inp, hamilton.inp
Un VECM é unha forma de autorregresión de vectores ou VAR (consulta
"var"), aplicable cando as variables do modelo son individualmente
integradas de orde 1 (polo tanto son paseos aleatorios, con ou sen deriva)
pero presentan cointegración. Esta instrución está intimamente
relacionada coa proba de cointegración de Johansen (consulta "johansen").
O parámetro nivel desta instrución representa o nivel de retardos do
sistema VAR. O número de retardos no propio VECM (onde a variable
dependente se indica como unha primeira diferenza) é de un menos ca nivel.
O parámetro rango representa o rango de cointegración ou, noutras
palabras, o número de vectores cointegrantes. Este debe de ser maior ca
cero, e menor ou igual (xeralmente menor) que o número de variables
endóxenas indicadas en ylista.
O argumento ylista proporciona a lista de variables endóxenas, expresadas
en niveis. A inclusión de termos de tipo determinístico no modelo,
contrólase cos indicadores de opción. Por defecto, cando non indicas
ningunha opción, inclúese unha "Constante non restrinxida", o que permite
que haxa unha ordenada na orixe non nula nas relacións de cointegración,
así como unha tendencia nos niveis das variables endóxenas. A literatura
derivada do traballo de Johansen (por exemplo, podes consultar o seu libro
de 1995) habitualmente refírese a isto como o "caso 3". As primeiras 4
opcións indicadas arriba (mutuamente excluíntes) xeran os casos 1, 2, 4 e
5, respectivamente. Os significados destes casos e os criterios que se usan
para escoller un caso, explícanse no Manual de usuario de Gretl (Capítulo
33).
As listas (opcionais) xlista e rxlista te permiten especificar conxuntos de
variables esóxenas que forman parte do modelo, ben sen restricións
(xlista) ou ben restrinxidas ao espazo de cointegración (rxlista). Estas
listas sepáranse de ylista e unhas das outras, mediante punto e coma.
A opción --seasonals, que podes combinar con calquera das outras opcións,
especifica a inclusión dun conxunto de variables ficticias estacionais
centradas. Esta opción unicamente está dispoñible para datos trimestrais
ou mensuais.
O primeiro exemplo de arriba especifica un VECM, cun nivel de retardos de 4
e un único vector de cointegración. As variables endóxenas son Y1, Y2 e
Y3. O segundo exemplo usa as mesmas variables pero especifica un nivel de
retardos de 3, e dous vectores de cointegración; tamén especifica unha
"Constante restrinxida", que é adecuada cando os vectores de cointegración
poden ter ordenada na orixe non nula pero as variables Y non teñen
tendencia.
A continuación da estimación dun VECM, tes dispoñibles algúns accesorios
especiais: $jalpha, $jbeta e $jvbeta recuperan as matrices α e beta, e a
varianza estimada de beta, respectivamente. Para recuperar a función de
resposta ante un impulso determinado, en forma de matriz, consulta a
función "irf".
Ruta do menú: /Modelar/Series temporais multivariante
# vif Tests
Opción: --quiet (Non presenta nada)
Exemplos: longley.inp
Debe de ir despois da estimación dun modelo que inclúa cando menos 2
variables independentes. Calcula e amosa información de diagnóstico
relacionada coa multicolinearidade.
O Factor de Inflación da Varianza (FIV) do regresor j defínese como
1/(1 - Rj^2)
onde R_j é o coeficiente de correlación múltiple entre ese regresor j e
os demais regresores. O factor ten un valor mínimo de 1.0 cando a variable
en cuestión é ortogonal con respecto ás outras variables independentes.
Neter, Wasserman e Kutner (1990) suxiren revisar o valor máis grande dos
FIV, para diagnosticar un alto grao de multicolinearidade; así, un valor
maior ca 10 considérase ás veces indicativo dun grao de multicolinearidade
problemático.
Despois de utilizar esta instrución, podes usar o accesorio "$result" para
obter un vector columna que inclúa os FIV. Para ter un enfoque máis
sofisticado para diagnosticar a multicolinearidade, consulta a instrución
"bkw".
Ruta do menú: Xanela de modelo: Análise/Multicolinearidade
# wls Estimation
Argumentos: varponder depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--quiet (Non presenta os resultados)
--allow-zeros (Mira abaixo)
Calcula as estimacións de mínimos cadrados ponderados (MCP, WLS)
utilizando varponder como ponderación, depvar como variable dependente e
indepvars como lista de variables independentes. Sexa w a raíz cadrada
positiva de varponder, entón MCP é basicamente equivalente á regresión
MCO de w * depvar sobre w * indepvars. Porén, o R-cadrado calcúlase de
xeito especial, concretamente como
R^2 = 1 - ESS / WTSS
onde ESS é a suma de erros cadrados da regresión ponderada, e WTSS denota
a "Suma de cadrados totais ponderados", que é igual á suma de erros
cadrados da regresión da variable dependente ponderada sobre unicamente a
constante ponderada.
Como caso especial, se varponder é unha variable ficticia 0/1, a
estimación MCP (WLS) é equivalente a MCO (OLS) nunha mostra na que se
exclúen todas as observacións que teñen un valor de cero para varponder.
Pola contra, a inclusión de ponderacións iguais a cero se considera un
fallo, pero se realmente desexas mesturar ponderacións iguais a cero con
ponderacións positivas, podes engadir a opción --allow-zeros.
Para aplicar a estimación de Mínimos Cadrados Ponderados a datos de panel,
baseada nas varianzas do erro específico de cada unidade, consulta a
instrución "panel" xunto coa opción --unit-weights.
Ruta do menú: /Modelar/Outros Modelos Lineais/Mínimos Cadrados Ponderados
# xcorrgm Statistics
Argumentos: serie1 serie2 [ nivel ]
Opcións: --plot=modo-ou-nomeficheiro (Mira abaixo)
--quiet (Non presenta a gráfica)
Exemplo: xcorrgm x y 12
Presenta e debuxa o correlograma cruzado de serie1 con serie2, as que podes
especificar mediante os seus nomes ou os seus números. Os valores son os
coeficientes de correlación na mostra entre o valor vixente de serie1 e os
sucesivos adiantos e retardos de serie2.
Se especificas un valor para nivel, a longura do correlograma cruzado
limítase a ese número de adiantos e retardos (cando menos); se non, a
longura determínase de forma automática en función da frecuencia dos
datos e do número de observacións.
Por defecto, xérase unha gráfica do correlograma cruzado: unha gráfica
Gnuplot en modo interactivo ou unha gráfica ASCII en modo de procesamento
por lotes. Podes axustar isto mediante a opción --plot. Os parámetros
admisibles para esta opción son none (para omitir a gráfica), ascii (para
xerar unha gráfica de texto aínda que sexa en modo interactivo), display
(para xerar unha gráfica Gnuplot aínda que sexa en modo de procesamento
por lotes), ou un nome de ficheiro. O efecto de proporcionar un nome de
ficheiro é como se describiu para a opción --output da instrución
"gnuplot".
Ruta do menú: /Ver/Correlograma cruzado
Outro acceso: Xanela principal: Menú emerxente (tras selección múltiple)
# xtab Statistics
Argumentos: listay [ ; listax ]
Opcións: --row (Amosa as porcentaxes de fila)
--column (Amosa as porcentaxes de columna)
--zeros (Amosa un cero nas entradas nulas)
--no-totals (Elimina a presentación dos recontos marxinais)
--matrix=nomematr (Usa as frecuencias da matriz indicada)
--quiet (Suprime a presentación de resultados)
--tex[=nomeficheiro] (Saída como LaTeX)
--equal (Consulta o caso LaTeX debaixo)
Exemplos: xtab 1 2
xtab 1 ; 2 3 4
xtab --matrix=A
xtab 1 2 --tex="xtab.tex"
Mira tamén ooballot.inp
Indicando unicamente o argumento listay, calcula (e presenta por defecto)
unha táboa de continxencia ou unha tabulación cruzada para cada
combinación das variables incluídas nesa lista. Cando indicas unha segunda
lista (listax), cada variable de listay crúzase nunha táboa por fila
fronte a cada variable de listax (por columna). Podes referirte ás
variables destas listas mediante os seus nomes ou os seus números. Ten en
conta que todas as variables teñen que estar marcadas como discretas. Como
alternativa, cando indicas a opción --matrix, se trata a matriz indicada
como un conxunto calculado previamente de frecuencias a presentar como
tabulación cruzada (consulta tamén a función "mxtab"). Neste caso
deberás de omitir o argumento list.
Por defecto, a anotación de cada cela indica o reconto da frecuencia de
casos. As opcións --row e --column (que se exclúen mutuamente) substitúen
os recontos coas porcentaxes para cada fila ou columna, respectivamente. Por
defecto, as celas cun reconto de cero casos déixanse en branco, mais a
opción --zeros ten como efecto a presentación explícita dos ceros, o que
pode serche útil para importar a táboa con un outro programa tal como unha
folla de cálculo.
A proba de independencia khi-cadrado de Pearson amósase se a frecuencia
agardada baixo independencia é cando menos de 1.0e-7 para todas as celas.
Unha regra xeral habitual da validez deste estatístico é que, polo menos o
80 por cento das celas deben de ter frecuencias agardadas iguais a 5 ou
máis; e se este criterio non se cumpre, preséntase unha advertencia.
Se unha táboa de continxencia é 2 por 2, amósase a Proba Exacta de
independencia de Fisher. Cae na conta de que esta proba baséase no suposto
de que os totais por fila e por columna son fixos, o que pode ser ou non ser
adecuado dependendo de como se xeraron os datos. Debes de utilizar a
probabilidade asociada (valor p) da esquerda cando a hipótese alternativa
á de independencia é a asociación negativa (os valores tenden a agruparse
nas celas de abaixo á esquerda, e de arriba á dereita); e debes de
utilizar o valor p da dereita se a alternativa é a asociación positiva. O
valor p de dúas colas para esta proba calcúlase mediante o método (b) da
sección 2.1 de Agresti (1992): isto é a suma das probabilidades de todas
as táboas posibles que teñan os totais de filas e columnas indicados, e
que teñan unha probabilidade non maior á da táboa observada.
O caso bivariante
No caso dunha tabulación cruzada bivariante (cando se indica tan só unha
lista que ten dous elementos) gárdanse algúns resultados. Podes recuperar
a táboa de continxencia en forma de matriz mediante o accesorio "$result".
Amais, se se cumpre a condición do valor agardado, podes recuperar o
estatístico da proba khi-cadrado de Pearson e a súa probabilidade asociada
(valor p) mediante os accesorios "$test" e "$pvalue". Se estes son os
resultados que te interesan, podes utilizar a opción --quiet para eliminar
a presentación habitual de resultados.
Saída LaTeX
Cando indicas a opción --tex, a tabulación cruzada se presenta co formato
dun contorno tabular LaTeX en liña (de onde podería copiarse e pegarse)
ou, cando se engade o parámetro nomeficheiro, envíase ao ficheiro aí
indicado. (Se en nomeficheiro non se especifica unha ruta completa, o
ficheiro escríbese no directorio vixente establecido, "workdir".) Non se
calcula ningún estatístico de proba. Podes utilizar --equal como opción
adicional para sinalar (mostrado en letra grosa) o reconto ou porcentaxe de
celas nas que as variables da fila e columna teñen o mesmo valor numérico.
Esta opción ignórase agás que indiques a opción --tex; e tamén cando
unha ou as dúas variables da tabulación cruzada teña valores de cadea de
texto.
|