Distinción entre dos términos estadísticos: Regresión Logística Multivariable y Multivariable
Estimado editor,
Dos términos estadísticos, multivariable y multivariable, se utilizan repetida e indistintamente en la literatura, cuando en realidad representan dos enfoques metodológicos distintos.1 Mientras que el modelo multivariable se utiliza para el análisis con un resultado (dependiente) y múltiples variables independientes (a.k.a., Mientras que el modelo multivariable se utiliza para el análisis con más de un resultado (dependiente) y múltiples variables independientes (también conocidas como predictoras o explicativas),2,3 el multivariable se utiliza para el análisis con más de un resultado (por ejemplo, medidas repetidas) y múltiples variables independientes.1 Sin embargo, los términos se utilizan a veces indistintamente en la literatura ya que no muchos investigadores están atentos a la distinción. La diferencia entre estos dos términos fue señalada por Hidalgo y Goodman en 2013.1 Sin embargo, algunos investigadores siguen informando de estos términos indistintamente. Por ejemplo, en un artículo reciente publicado en Nicotine and Tobacco Research,4 aunque se detallaba el enfoque del análisis de datos, utilizaban el término modelos de «regresión logística multivariable» mientras que su análisis se basaba en «regresión logística multivariable»; esto se enfatizaba en la leyenda de la tabla 2 del mismo artículo. Esto también ha ocurrido en otros artículos publicados en Nicotine and Tobacco Research5,6 y en otros lugares.7-9 Por lo tanto, aprovechamos esta oportunidad para destacar una clara distinción e identificar los matices que hacen que estos tipos de análisis sean diferentes entre sí.
El análisis de regresión es un método de modelado que investiga la relación entre un resultado y una(s) variable(s) independiente(s).3 La mayoría de los modelos de regresión se caracterizan en términos de la forma en que se modela la variable de resultado. Por ejemplo, en la regresión logística, el resultado es dicotómico (p. ej., éxito/fracaso), en la regresión lineal es continuo, y en el análisis de supervivencia se considera como un evento temporal.1,3,10
Mientras que un modelo de regresión logística simple tiene un resultado binario y un predictor, un modelo de regresión logística múltiple o multivariable encuentra la ecuación que mejor predice el valor de éxito de la variable de respuesta binaria Y π(x)=P(Y=1|X=x) para los valores de varias variables X (predictores). Como se muestra en la ecuación 1, el coeficiente β representa la cantidad de cambio en el logit (log-odds) por un cambio de una unidad en X (predictor) para un modelo de regresión logística simple.
En cambio, un modelo de regresión logística multivariable o múltiple tendría la forma
donde π(x)=P(Y=1|X=x) es una variable independiente binaria Y con dos categorías, X es un único predictor en el modelo de regresión simple, y X1, X2,…,Xn son los predictores en el modelo multivariable. Además, hay situaciones en las que la variable de resultado categórica tiene más de dos niveles (es decir, una variable politómica con más de dos categorías que pueden ser ordinales o nominales).3 Como ya comentaron Hidalgo y Goodman,1 los modelos de regresión lineal y de riesgos proporcionales pueden ser simples o multivariables. Cada una de estas estructuras de modelo tiene una única variable de resultado y una o más variables independientes o predictoras.
En muchos análisis estadísticos, los datos de resultado son multivariables o correlacionados porque a menudo se derivan de estudios longitudinales (es decir, observaciones repetidas sobre el mismo sujeto de estudio), y es atractivo tener un modelo que mantenga una interpretación logística marginal para los resultados individuales al tiempo que da cuenta adecuadamente de la estructura de dependencia.10
Un modelo de regresión logística multivariante tendría la forma
donde se examinan las relaciones entre múltiples variables dependientes -medidas de múltiples observaciones repetidas j dentro del grupo i- y un conjunto de variables predictoras (es decir, Xs). Para esta ecuación, se suele suponer que un efecto aleatorio, α i, sigue una distribución normal con media cero y varianza constante (es decir, αi∼N(0,σα2)).10
Al comprender la distinción entre los modelos de regresión multivariable y multivariable, el público de los artículos puede valorar mejor los objetivos y los resultados del estudio. Además, se trata de una discrepancia notable no sólo para evitar la confusión entre la audiencia de los artículos científicos, sino para informar con mayor precisión a los investigadores noveles que buscan publicar sus manuscritos en revistas de alto rango revisadas por pares.
Material complementario
Un formulario de contribución que detalla la participación específica de cada autor en este contenido, así como cualquier dato complementario, están disponibles en línea en https://academic.oup.com/ntr.
Agradecimientos
Agradecemos al profesor David W. Hosmer sus valiosos comentarios sobre esta carta.
Financiación
No se ha declarado ninguna.
Declaración de intereses
Ninguno declarado.
,
.
;
(
):
–
.
.
.
;
(
):
–
.
,
,
,
. 2nd ed.
:
;
.
,
,
, et al.
.
;
(
):
–
.
,
,
.
.
;
(
):
–
.
,
,
, et al.
.
;
(
):
–
.
,
,
, et al.
.
;
(
):
–
.
,
,
,
.
.
;
(
):
–
.
,
,
,
,
.
.
;
(
):
–
.
Jr
,
,
.
:
;
.
.