Descubren que una de cada cinco investigaciones sobre genética tienen errores por culpa del autoformato de Microsoft Excel
En el trabajo cotidiano con las planillas de cálculo muchas veces hay que prestar atención en algunos ingresos que se realizan en las celdas, porque en algunas ocasiones el software puede alterar el valor al interpretar un dato como un valor númerico o una fecha.
A partir de ahora, esta será una observación obligatoria para los investigadores académicos tras un reporte publicado por la revista Genome Biology, que detectó errores en el ingreso de los datos analizados: Excel, el programa de referencia en este segmento, modificada de forma automática los nombres de algunos genes al interpretarlos como fechas.
El informe, citado por The Washington Post, indica que un grupo de investigadores australianos analizaron 3600 estudios realizados por diversas revistas como Nature, Science y PLoS One, y detectaron que uno de cada cinco papers incluyen errores provocados por el autoformato que ejecuta Excel.
Una identificación de un gen, que de forma habitual suelen ser catalogados con un nombre corto, suelen ser interpretados como fechas. Es el caso del gen Septin 2, que suele ser abreviado como SEPT2, mientras que Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase, se identifica como MARCH1.
"En Excel, el programa identifica estos registros como fechas. SEPT2 se transforma en 2 de septiembre y queda almacenado como 9/2/2016", señalan los investigadores. Para evitar este problema, al trabajar en Excel los investigadores tienen que recordar cambiar de forma manual el formato a texto antes de ingresar cualquier dato.
Debido a este error, un 20 por ciento de los papers relacionados con el estudio genético tienen errores provocados por la modificación automática que realiza Excel.
Los autores del informe Genome Biology señalan que este problema no es exclusivo de Microsoft Excel, ya que el cambio de formato forzado también se produce al trabajar con Calc de LibreOffice o Calc de OpenOffice. Google Docs, por su parte, no modifica de forma automática los datos ingresados.
Sin embargo, la mejor recomendación para este tipo de casos es que los investigadores utilicen herramientas especiales de estadística, como R y Python, y dejen de utilizar las planillas de cálculo, a menos que sean cuidadosos en el formato de los datos.