Articles

Distinción entre dos términos estadísticos: Regresión Logística Multivariable y Multivariable

Estimado editor,

Dos términos estadísticos, multivariable y multivariable, se utilizan repetida e indistintamente en la literatura, cuando en realidad representan dos enfoques metodológicos distintos.1 Mientras que el modelo multivariable se utiliza para el análisis con un resultado (dependiente) y múltiples variables independientes (a.k.a., Mientras que el modelo multivariable se utiliza para el análisis con más de un resultado (dependiente) y múltiples variables independientes (también conocidas como predictoras o explicativas),2,3 el multivariable se utiliza para el análisis con más de un resultado (por ejemplo, medidas repetidas) y múltiples variables independientes.1 Sin embargo, los términos se utilizan a veces indistintamente en la literatura ya que no muchos investigadores están atentos a la distinción. La diferencia entre estos dos términos fue señalada por Hidalgo y Goodman en 2013.1 Sin embargo, algunos investigadores siguen informando de estos términos indistintamente. Por ejemplo, en un artículo reciente publicado en Nicotine and Tobacco Research,4 aunque se detallaba el enfoque del análisis de datos, utilizaban el término modelos de «regresión logística multivariable» mientras que su análisis se basaba en «regresión logística multivariable»; esto se enfatizaba en la leyenda de la tabla 2 del mismo artículo. Esto también ha ocurrido en otros artículos publicados en Nicotine and Tobacco Research5,6 y en otros lugares.7-9 Por lo tanto, aprovechamos esta oportunidad para destacar una clara distinción e identificar los matices que hacen que estos tipos de análisis sean diferentes entre sí.

El análisis de regresión es un método de modelado que investiga la relación entre un resultado y una(s) variable(s) independiente(s).3 La mayoría de los modelos de regresión se caracterizan en términos de la forma en que se modela la variable de resultado. Por ejemplo, en la regresión logística, el resultado es dicotómico (p. ej., éxito/fracaso), en la regresión lineal es continuo, y en el análisis de supervivencia se considera como un evento temporal.1,3,10

Mientras que un modelo de regresión logística simple tiene un resultado binario y un predictor, un modelo de regresión logística múltiple o multivariable encuentra la ecuación que mejor predice el valor de éxito de la variable de respuesta binaria Y π(x)=P(Y=1|X=x) para los valores de varias variables X (predictores). Como se muestra en la ecuación 1, el coeficiente β representa la cantidad de cambio en el logit (log-odds) por un cambio de una unidad en X (predictor) para un modelo de regresión logística simple.

Logit=log(π(x)1-π(x))=β0+β1x
(1)

En cambio, un modelo de regresión logística multivariable o múltiple tendría la forma

log(πi1-πi)=β0+β1X1+β2X2+…+βnXn
(2)

donde π(x)=P(Y=1|X=x) es una variable independiente binaria Y con dos categorías, X es un único predictor en el modelo de regresión simple, y X1, X2,…,Xn son los predictores en el modelo multivariable. Además, hay situaciones en las que la variable de resultado categórica tiene más de dos niveles (es decir, una variable politómica con más de dos categorías que pueden ser ordinales o nominales).3 Como ya comentaron Hidalgo y Goodman,1 los modelos de regresión lineal y de riesgos proporcionales pueden ser simples o multivariables. Cada una de estas estructuras de modelo tiene una única variable de resultado y una o más variables independientes o predictoras.

En muchos análisis estadísticos, los datos de resultado son multivariables o correlacionados porque a menudo se derivan de estudios longitudinales (es decir, observaciones repetidas sobre el mismo sujeto de estudio), y es atractivo tener un modelo que mantenga una interpretación logística marginal para los resultados individuales al tiempo que da cuenta adecuadamente de la estructura de dependencia.10

Un modelo de regresión logística multivariante tendría la forma

log(πij1-πij)=β0+β1X1+β2X2+…+βnXn+αi
(3)

donde se examinan las relaciones entre múltiples variables dependientes -medidas de múltiples observaciones repetidas j dentro del grupo i- y un conjunto de variables predictoras (es decir, Xs). Para esta ecuación, se suele suponer que un efecto aleatorio, α i, sigue una distribución normal con media cero y varianza constante (es decir, αi∼N(0,σα2)).10

Al comprender la distinción entre los modelos de regresión multivariable y multivariable, el público de los artículos puede valorar mejor los objetivos y los resultados del estudio. Además, se trata de una discrepancia notable no sólo para evitar la confusión entre la audiencia de los artículos científicos, sino para informar con mayor precisión a los investigadores noveles que buscan publicar sus manuscritos en revistas de alto rango revisadas por pares.

Material complementario

Un formulario de contribución que detalla la participación específica de cada autor en este contenido, así como cualquier dato complementario, están disponibles en línea en https://academic.oup.com/ntr.

Agradecimientos

Agradecemos al profesor David W. Hosmer sus valiosos comentarios sobre esta carta.

Financiación

No se ha declarado ninguna.

Declaración de intereses

Ninguno declarado.

Hidalgo
B

,

Goodman
M

.

¿Regresión multivariable o multivariable?
Am J Public Health.
2013

;

103

(

1

):

39

40

.

Katz
MH

.

Análisis multivariable: un manual para los lectores de investigación médica

.

Ann Intern Med.
2003

;

138

(

8

):

644

650

.

Van Belle
G

,

Fisher
LD

,

Heagerty
PJ

,

Lumley
T.
Bioestadística: Una metodología para las ciencias de la salud

. 2nd ed.

Hoboken, NJ

:

John Wiley & Sons

;

2004

.

Jiang
N

,

Siman
N

,

Cleland
CM

, et al.

Eficacia del asesoramiento para dejar de fumar impartido por trabajadores sanitarios de las aldeas en Vietnam

.

Nicotine Tob Res.
2019

;

21

(

11

):

1524

1530

.

McCabe
SE

,

Oeste
BT

,

McCabe
V

.

Asociaciones entre el inicio temprano del uso de cigarrillos electrónicos y el consumo de cigarrillos y otras sustancias entre los adolescentes estadounidenses: un estudio nacional

.

Nicotine Tob Res.
2018

;

20

(

8

):

923

930

.

Coleman
BN

,

Apelberg
BJ

,

Ambrose
BK

, et al.

Asociación entre el uso de cigarrillos electrónicos y la apertura a fumar cigarrillos entre los adultos jóvenes estadounidenses

.

Nicotine Tob Res.
2015

;

17

(

2

):

212

218

.

Rendle
KA

,

Sarma
EA

,

Quaife
SL

, et al.

Reconocimiento de los síntomas del cáncer y retrasos anticipados en la búsqueda de atención entre los adultos estadounidenses

.

Am J Prev Med.
2019

;

57

(

1

):

e1

e9

.

Mazurek
JM

,

White
GE

,

Moorman
JE

,

Storey
E

.

Vacunación contra la gripe entre personas con asma relacionada con el trabajo

.

Am J Prev Med.
2014

;

47

(

2

):

203

211

.

Byron
MJ

,

Jeong

,

M

,

Abrams
D

,

Brewer
NT

.

Percepción pública errónea de que los cigarrillos de muy baja nicotina son menos cancerígenos

.

Tob Control.
2018

;

27

(

6

):

712

714

.

Hosmer

Jr

DW

,

Lemeshow
S

,

Sturdivant
RX.
Regresión Logística Aplicada

.

Hoboken, NJ

:

John Wiley & Sons

;

2013

.

© The Author(s) 2020. Publicado por Oxford University Press en nombre de la Society for Research on Nicotine and Tobacco. Todos los derechos reservados.Para obtener permisos, envíe un correo electrónico a: [email protected].
Este artículo se publica y distribuye bajo los términos de Oxford University Press, Standard Journals Publication Model (https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)

.

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *