Variables explicativas que no pueden controlarse ni fijarse: ¿Funciona la regresión?

  • Teresa Boca Facultad de Agronomía, Universidad de Buenos Aires. Instituto Nacional de Tecnología Agropecuaria.
  • Adriana Pérez Facultad de Agronomía, Universidad de Buenos Aires. Grupo de Bioestadística Aplicada, Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires.
  • Susana Perelman Facultad de Agronomía, Universidad de Buenos Aires. IFEVA, FAUBA-CONICET.
Palabras clave: variables independientes con error, simulaciones, sesgo

Resumen

El análisis de regresión lineal es una de las técnicas estadísticas que más se usan en los experimentos planificados para estudiar el funcionamiento de los sistemas naturales, en especial en estudios mensurativos. Muchas veces, el investigador no tiene capacidad de controlar la porción explicativa del modelo de regresión, por lo que las variables explicativas pueden resultar tan aleatorias o más que la variable respuesta. Esto podría generar sesgos en las estimaciones de las pendientes asociadas y conducir a conclusiones equivocadas. Una alternativa al método de regresión clásico es la regresión tipo II, diseñada para cuando no se pueden fijar los valores de la variable explicativa. En este trabajo se presentan distintas situaciones basadas en investigaciones publicadas en ecología y agronomía con diferentes objetivos: predicción, estimación de la pendiente y comparación de pendientes entre dos grupos, en las que el problema de variación aleatoria en las variables explicativas está presente con distinto grado de relevancia. En cada caso se identifica cuál es el camino más adecuado para el análisis. También se realizó una simulación que consideró distintas combinaciones para los errores aleatorios en las variables regresora y respuesta con el objetivo de visualizar el sesgo de los estimadores en cada situación para los diferentes métodos de regresión. De lo presentado se desprende que se debe poner énfasis en dos cuestiones muy importantes para poder decidir el método de regresión tipo II más adecuado: tener en claro cuál es el objetivo del trabajo y si se cumplen las condiciones de aplicación requeridos por cada método. Esta revisión pretende ser una sencilla guía de cuándo y qué método aplicar en cada situación.

Biografía del autor/a

Teresa Boca, Facultad de Agronomía, Universidad de Buenos Aires. Instituto Nacional de Tecnología Agropecuaria.

Jefe de Trabajos Prácticos. Cátedra de Métodos Cuantitativos Aplicados. FAUBA.

Ingeniera Agrónoma. Facultad de Agronomía, Universidad de Buenos Aires, Orientación Fitotecnia
Magister Scientiae. Programa Biometría y Mejoramiento. Escuela para Graduados Alberto Soriano – FAUBA.
Doctora de la Universidad de Buenos Aires. Escuela para Graduados Alberto Soriano – FAUBA. 2016

Adriana Pérez, Facultad de Agronomía, Universidad de Buenos Aires. Grupo de Bioestadística Aplicada, Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires.

Profesora Adjunta Regular. Cátedra de Biometría. Departamento de Ecología, Genética y Evolución, Facultad de Ciencias Exactas y Naturales, UBA.  Profesora Adjunta Regular. Cátedra de Métodos Cuantitativos, Facultad de Agronomía, UBA.
Profesora Adjunta. Instituto de Investigaciones Biotecnológicas. Universidad Nacional de San Martín

Magister en Generación y Análisis de Información Estadística.  Universidad de Tres de Febrero. 2012

Licenciada en Ciencias Biológicas. FCEN, UBA. 1989.

Susana Perelman, Facultad de Agronomía, Universidad de Buenos Aires. IFEVA, FAUBA-CONICET.

Profesor Titular Regular, Directora de Departamento Departamento de Métodos Cuantitativos y Sistemas de Información

Ingeniera Agrónoma – Orientacion Fitotecnia. 1980. Facultad de Agronomia. Universidad de Buenos Aires
Magister Scientiae área Biometría; Escuela de Postgrado Facultad de Agronomía. Universidad de Buenos Aires, 1996.

Citas

Bland, J. M., and D. G. Altman. 1999. Measuring agreement in method comparison studies. Statistical Methods in Medical Research 8(2):135-160. https://doi.org/10.1177/096228029900800204.

Ciancio, N., M. Parco, S. J. P. Incognito, and G. A. Maddonni. 2016. Kernel setting at the apical and sub-apical ear of older and newer Argentinean maize hybrids. Field Crops Research 191:101-110. https://doi.org/10.1016/j.fcr.2016.02.021.

Correndo, A. A., F. Salvagiotti, F. O. García, and F. H. Gutiérrez-Boem. 2017. A modification of the arcsine-log calibration curve for analysing soil test value–relative yield relationships. Crop and Pasture Science 68(3):297-304. https://doi.org/10.1071/CP16444.

Draper, N. R., and H. Smith. 2014. Applied regression analysis (Vol. 326). John Wiley and Sons.

Faraway, J. J. 2016. Extending the linear model with R: generalized linear, mixed effects and nonparametric regression models. Vol. 124. CRC press. https://doi.org/10.1201/9781315382722.

Fassola, H. E., F. A Moscovich, P. Ferrere, and F. Rodríguez. 2002. Evolución de las principales variables de árboles de Pinus taeda L. sometidos a diferentes tratamientos silviculturales en el nordeste de la provincia de Corrientes, Argentina. Ciência Florestal 12(2). https://doi.org/10.5902/198050981680.

Francq, B. G., and B. B. Govaerts. 2014. Measurement methods comparison with errors-in-variables regressions. From horizontal to vertical OLS regression, review and new perspectives. Chemometrics and Intelligent Laboratory Systems 134:123-139. https://doi.org/10.1016/j.chemolab.2014.03.006.

Gillard, J. W. 2006. An historical overview of linear regression with errors in both variables. Math. School, Cardiff Univ., Wales, UK, Tech. Rep.

Harper, J. L. 1977. Population biology of plants. Academic Press, New York.

Hurlbert, S. H. 1984. Pseudoreplication and the design of ecological field experiments. Ecological Monographs 54(2):187-211. https://doi.org/10.2307/1942661.

Jolicoeur, P. 1990. Bivariate allometry: interval estimation of the slopes of the ordinary and standardized normal major axes and structural relationship. Journal of Theoretical Biology 144(2):275-285. https://doi.org/10.1016/S0022-5193(05)80326-1.

Legendre, P., and L. F. Legendre. 2012. Numerical ecology. Vol. 24. Elsevier.

Legendre, P. 1998. Model II regression user’s guide, R edition. R Vignette, 14.

Legendre, P. 2015. lmodel2: Model II Regression. R package version 1.7-2.

Ludbrook, J. 2012. A primer for biomedical scientists on how to execute model II linear regression analysis. Clinical and Experimental Pharmacology and Physiology 39(4):329-335. https://doi.org/10.1111/j.1440-1681.2011.05643.x.

Marti, J., and G. A. Slafer. 2014. Bread and durum wheat yields under a wide range of environmental conditions. Field Crops Research 156:258-271. https://doi.org/10.1016/j.fcr.2013.10.008.

R Core Team. 2019. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria.

Smith, R. J. 2009. Use and misuse of the reduced major axis for line‐fitting. American Journal of Physical Anthropology: The Official Publication of the American Association of Physical Anthropologists 140(3):476-486. https://doi.org/10.1002/ajpa.21090.

Sokal, R. R., and F. J. Rohlf. 1995. Biometry. Freeman. New York. US.

Taskinena, S., and D. I. Wartona. 2013. Robust tests for one or more allometric lines. Journal of Theoretical Biology 333(21):38-46. https://doi.org/10.1016/j.jtbi.2013.05.010.

Warton, D. I., I. J. Wright, D. S. Falster, and M. Westoby. (2006). Bivariate line-fitting methods for allometry. Biological Reviews 81(2):259-291. https://doi.org/10.1017/S1464793106007007.

Warton, D. I., R. A. Duursma, D. S. Falster, and S. Taskinen. 2012. smatr 3-an R package for estimation and inference about allometric lines. Methods in Ecology and Evolution 3(2):257-259. https://doi.org/10.1111/j.2041-210X.2011.00153.x.

Yoda, K. 1963. Self-thinning in overcrowded pure stands under cultivated and natural conditions (Intraspecific competition among higher plants. XI). J. Inst. Polytech. Osaka City Univ Ser D 14:107-129.

Variables explicativas que no pueden controlarse ni fijarse: ¿Funciona la regresión?
Publicado
2020-09-02
Sección
Artículos