Cuando Galileo descubrió en el siglo XVII que Júpiter poseía cuatro lunas, el gran matemático y físico Christian Huygens aplicó su poder de razonamiento a la pregunta de "¿Por qué cuatro en lugar de uno?" Se preguntó: "¿Cuál es el propósito de una luna?" Bueno, el "propósito" de la luna terrestre era ayudar a los marineros a navegar. Si un planeta tiene cuatro lunas, debe tener muchos marineros. Que hayan marineros implica que hay barcos. Que haya barcos implica que hay velas. Y que hayan velas implica que hay cuerdas. Las cuerdas están hechas de cáñamo. Por lo tanto, es obvio que Júpiter debe tener muchas plantas de cáñamo.

En cuanto a la nuez moscada, su superficie enrevesada se asemeja a la superficie del cerebro. De acuerdo con un principio alguna vez respetado de la terapia con medicamentos llamado “la doctrina de las firmas”, un Creador reflexivo había proporcionado pistas para ayudar a tratar la enfermedad. Por ejemplo, dado que las hojas de la planta de ciclamen se parecen más o menos al oído humano, deben usarse para las aflicciones del oído. Del mismo modo, la nuez moscada, dada su forma cerebral, era la droga preferida para los trastornos cerebrales.

Cuando los satélites Voyager 1 y 2 pasaron junto a Júpiter en 1979, la cantidad de lunas detectadas alrededor de ese planeta había aumentado a 14, pero nadie hablaba del cáñamo. Y hoy sabemos que la nuez moscada no tiene valor terapéutico (aunque si se consume en grandes cantidades puede dañar gravemente el hígado).

Las conclusiones una vez aceptadas sobre la nuez moscada y el cerebro y el cáñamo en Júpiter tienen algo en común. Se derivaron de un proceso de razonamiento que implicaba "ver a través del intelecto" para discernir "para qué" es algo, o para qué "debería ser", en lugar de "ver a través de los ojos" para determinar lo que es algo en realidad. Este proceso de descubrir qué es algo en realidad lo llamamos método científico. De hecho, la ciencia en sí misma es, simplemente, una forma de descubrir evidencia, una forma que incluye un método de análisis objetivo, lógico y sistemático.

Pero incluso los mejores métodos pueden utilizarse incorrectamente. Uno de los mejores ejemplos del uso adecuado e inadecuado del método científico involucró un intento de resolver, de una vez por todas, la cuestión de si los seres vivos podrían surgir de la materia inanimada: la generación espontánea. La creencia en la generación espontánea se basaba en la observación inexacta. La gente vio que ciertas formas inferiores de vida aparecían en el agua, el suelo y sustancias orgánicas en descomposición de muchos tipos. Pronto se aceptó como verdad que los gusanos y las orugas provenían del rocío de las hojas de repollo, las moscas domésticas de la madera húmeda, las polillas de las prendas de lana, las anchoas de la espuma del mar y los ratones del lodo del río. Ciertas sustancias parecían ser potentes productoras de vida, como la madera podrida, el pelo de los animales, el agua estancada, el papel y los cadáveres de animales.

En el siglo XIX, el escepticismo con respecto a la generación espontánea estaba creciendo entre unos cuantos científicos, particularmente desde que la invención del microscopio había revelado la existencia de bacterias. A mediados del siglo XIX, algunos biólogos concluyeron que la generación espontánea era una tontería y estaban dispuestos a probarlo.

Uno de los mayores escépticos fue Louis Pasteur. Fue desafiado por otro científico eminente, FA Pouchet. Tanto Pasteur como Pouchet realizaron experimentos. Ambos utilizaron métodos científicos y aparatos científicos. Las pruebas de Pouchet con diversas sustancias “demostraron” que la vida surgió espontáneamente; Pasteur demostró lo contrario. ¿Sería posible? Bueno, Pouchet no lo hizo. El aparato experimental de Pouchet no pudo evitar que los microorganismos y las partículas de polvo en el aire llegaran a la sustancia experimental, mientras que Pasteur logró diseñar un aparato que excluía el aire. El caso es que ambos estaban usando el método científico de experimentación, observación y lógica, pero uno lo usó correctamente y el otro no. Pasteur presentó pruebas; Pouchet produjo tonterías disfrazadas de evidencia.

Usar el método científico correctamente, de modo que arroje evidencia y no tonterías, siempre representa un desafío para los investigadores que realizan una investigación, particularmente cuando se están estudiando formas de vida superiores. A veces, incluso los científicos modernos fracasan en el desafío. Hoy, como en los días de Pasteur, se requiere una vigilancia constante y un esfuerzo extraordinario para producir un resultado científicamente válido de un experimento. Por ejemplo, cuando el Centro Nacional de Investigación Toxicológica de la FDA lleva a cabo un experimento para ver si una determinada sustancia química causa cáncer en ratones, se realizan esfuerzos extraordinarios para asegurarse de que los efectos nocivos que exhiban los ratones sean el resultado de una sola cosa: la sustancia química específica que se está probando, y nada más, como la predisposición genética de los animales de prueba, o los contaminantes en el aire, o el contacto con los cuidadores de animales. Para eliminar estas variables, tanto los ratones que reciben la sustancia química (el grupo experimental) como los que no (el grupo de control) son genéticamente similares; el entorno de ambos grupos se controla cuidadosamente: el aire entrante se filtra, la temperatura y la humedad se controlan constantemente, las luces de ambos grupos se encienden y apagan a la misma hora todos los días. El equipo, la ropa de cama y el agua no contaminados son los mismos para ambos grupos. Incluso se analiza el "ambiente interior" de los animales, con pruebas para 33 parásitos, 20 tipos de bacterias, 13 hongos y 13 virus. Si se encuentra alguno de estos intrusos, los ratones afectados se eliminan del estudio. Los científicos que trabajan con los ratones se someten a un examen físico completo, usan ropa esterilizada y realizan el equivalente a un lavado quirúrgico antes del contacto con los animales. El esfuerzo por encontrar solo una cosa, al excluir cualquier otra variable, también incluye la sustancia química que se está probando. Se tomará sumo cuidado para que el forraje y la sustancia problema mezclados con él sean puros y uniformes. Finalmente, los animales se sacrifican a intervalos específicos, durante los cuales se realizan observaciones de un total de 48 muestras de órganos y tejidos.

Es obvio que encontrar pruebas en lugar de tonterías es extraordinariamente difícil y costoso, incluso cuando el estudio solo involucra pequeños animales de laboratorio. Cuando el estudio involucra a seres humanos, la dificultad se multiplica por mil.

Primero, mientras que los seres humanos están involucrados en varios experimentos, como en las fases finales de prueba de nuevos medicamentos, existen —y deben haber— límites estrictos sobre los tipos de experimentos y las condiciones bajo las cuales pueden llevarse a cabo. Estas condiciones se expresan en códigos internacionales, específicamente los de la 18ª Declaración de Helsinki de la Asociación Médica Mundial (1964), que fueron revisados y ampliados en 1975 por la 29ª Declaración Mundial de Tokio. Para cumplir con estos estándares, las instituciones médicas que reciben fondos federales de investigación deben establecer comités especiales de científicos y legos para aprobar cualquier experimento en humanos. Y, en los Estados Unidos, los experimentos propuestos que involucran un nuevo medicamento o un dispositivo médico con un riesgo significativo primero deben obtener la aprobación de la Administración de Alimentos y Medicamentos. Tales salvaguardias protegen a los sujetos de los experimentos, pero a menudo dificultan la realización de la investigación.

En segundo lugar, es imposible diseñar experimentos humanos con las mismas restricciones empleadas para los experimentos con animales. Por ejemplo, no podemos obtener el tipo de conocimiento detallado sobre la historia genética humana que está disponible rutinariamente para varios animales de laboratorio, por lo que la variación genética es en gran parte desconocida. Además, no podemos aislar a los humanos en un laboratorio controlado durante períodos prolongados para eliminar las variables ambientales. Esto no significa que la búsqueda de evidencias sea imposible con humanos, solo que es extremadamente difícil.

Para superar estos obstáculos al tiempo que se adhiere al método científico, se han desarrollado varias técnicas, algunas de las cuales brindan evidencia más convincente que otras de que la variable particular —lo único que se busca o prueba— realmente causó el efecto observado. La evidencia de mayor calidad proviene de un ensayo clínico realizado correctamente. Al igual que con los ratones en el estudio del cáncer, esta forma de experimento involucró a dos grupos: el grupo de prueba o experimental, que recibe el nuevo fármaco o lo que sea que se esté probando, y el grupo de control, que no lo recibe. Para garantizar la máxima similitud, los miembros de ambos grupos se eligen al azar del mismo grupo de candidatos. Dado que, a diferencia de los animales de laboratorio, el comportamiento de los sujetos humanos puede verse afectado por el conocimiento sobre la naturaleza del experimento, es necesario dar al grupo de control un placebo, una sustancia que no se sabe que sea eficaz para tratar la afección que se observa de manera superficial similar en todos los sentidos al que se le dio al grupo experimental. (Hay una excepción: probar un nuevo fármaco en pacientes que ya están gravemente enfermos. En tales casos, es éticamente inadmisible utilizar un placebo que no tenga acción terapéutica. En tales casos, se usa un medicamento de "control", uno que no es experimental y cuyos efectos se conocen y se pueden medir, en lugar de un placebo). Además de usar un placebo, también es necesario que no solo los participantes sino también los que miden el efecto de la prueba no sepan (sean ciegos) quién está en el grupo experimental y quiénes son los controles. Este es el llamado ensayo clínico "doble ciego".

Un ejemplo del uso adecuado de un ensayo clínico para establecer el efecto de una sola variable fue un estudio para ver si la reducción de la ingesta de colesterol reducía el riesgo de enfermedad coronaria en hombres de entre 35 y 59 años que ya tenían niveles altos de colesterol. Unos 480.000 hombres se ofrecieron como voluntarios para el programa, de los cuales se eligieron 3.810. Para asegurar que solo una variable estuviera involucrada, no se permitió participar a todos los voluntarios que tuvieran otros problemas de salud, como antecedentes de angina de pecho o electrocardiogramas anormales. Los individuos fueron asignados aleatoriamente a los grupos experimental y de control. Durante un promedio de 7.4 años, el grupo experimental recibió un medicamento para reducir el colesterol (colestiramina), mientras que el grupo de control recibió un placebo dispensado en un paquete idéntico. Ambos grupos siguieron una dieta moderadamente baja en colesterol. Los participantes visitaron las clínicas cada dos meses para recibir nuevos suministros del medicamento (o placebo) y para realizar varias pruebas. Al final del estudio, los que recibieron el medicamento tenían niveles de colesterol significativamente más bajos y sufrieron un 24 por ciento menos de muertes por enfermedad coronaria y un 19 por ciento menos de ataques cardíacos no mortales en comparación con el grupo de control.

¿Qué es lo único que se encuentra en este cuidadoso y extenso ensayo clínico? ¿Que reducir el colesterol reduce el riesgo de enfermedad coronaria? No. La prueba incluyó solo a hombres de mediana edad. ¿Que una dieta baja en colesterol reduce el riesgo de enfermedad coronaria en hombres de mediana edad? No. Solo que el medicamento y la dieta juntos redujeron la tasa de enfermedad coronaria. Para averiguar el efecto de la dieta sola en hombres de mediana edad, se tendría que realizar otro estudio en el que el grupo experimental siguiera una dieta baja en colesterol y el grupo de control no. (Esto no solo sería muy difícil de hacer, sino que también plantearía serias cuestiones éticas).

Cuando los ensayos clínicos no son prácticos, existen otras formas de emplear el método científico, como el estudio de cohortes, la encuesta transversal y el estudio de casos y controles. En los estudios de cohorte, que miran hacia adelante en el tiempo, se observa a un grupo de personas durante un período prolongado, quizás muchos años, para ver qué hábitos o características afectan su salud. Se han utilizado estudios de cohortes, por ejemplo, para estudiar la relación entre el tabaquismo y el cáncer de pulmón.

La encuesta transversal, que, como una instantánea, "congela" un momento específico en el tiempo, tiene como objetivo encontrar el mismo tipo de relaciones que podría mostrar la "imagen en movimiento" del estudio de cohorte, pero a un costo mucho menor. En una encuesta transversal, se observa a un grupo específico para ver si una sustancia o actividad, como fumar, está relacionada con el efecto sobre la salud que se investiga, por ejemplo, el cáncer de pulmón. Si un número significativamente mayor de fumadores ya tiene cáncer de pulmón que aquellos que no fuman, esto respaldaría la hipótesis de que el cáncer de pulmón es causado por fumar.

Mientras que el estudio de cohorte mira hacia adelante y la encuesta transversal mira el presente, el estudio de casos y controles mira hacia atrás, comparando las características de un grupo (como los que tienen cáncer de pulmón) con otro grupo (los que no tienen cáncer de pulmón) para ver si hay diferencias (como el hábito de fumar).

Dado que es imposible decir con total certeza que solo se ha descubierto una cosa, la evidencia encontrada en este tipo de estudios es generalmente menos sólida que la de experimentos más bien controlados, como los ensayos clínicos. No es posible decir que la evidencia es una prueba absoluta de que una sustancia o actividad causa un efecto determinado. Solo es posible decir que ciertos efectos sobre la salud están asociados con la sustancia o actividad en estudio. A veces, esta asociación es tan fuerte que la hipótesis se considera probada.

Al igual que con los experimentos de Pasteur y Pouchet sobre la generación espontánea, todos estos tipos de estudios se pueden hacer bien (y por lo tanto producir alguna forma de evidencia científica) o mal, en cuyo caso tenemos tonterías en lugar de evidencia. Con demasiada frecuencia, lo que se aclama en la prensa o en los informes de televisión como el último "hecho científico" resulta no ser un hecho en absoluto, sino el resultado de un error en la aplicación del método científico.

Un ejemplo reciente se refiere a un estudio realizado en la Universidad de Ciencias de la Salud de Oregon por el Dr. David McCarren y otros y publicado el año pasado en la revista Science. El estudio concluyó que la ingesta baja de calcio estaba asociada con la presión arterial alta y que, contrariamente a lo que se creía comúnmente, la ingesta alta de sodio no se asociaba con la presión arterial alta sino con una presión arterial más baja.

Muchos de los mayores avances científicos han dado como resultado la anulación de lo que se había aceptado como un hecho, por ejemplo, que la vida no surge espontáneamente de los montones de estiércol y que la tierra no es el centro del universo. De modo que el hecho de que esta prueba científica anulara una visión comúnmente aceptada podría haber estado en la gran tradición de la ciencia en la que no hay hechos finales, solo tentativos siempre abiertos al desafío y revisión a medida que surgen nuevos conocimientos. Sin embargo, una pregunta importante fue: ¿Cómo se realizó la prueba? ¿De hecho encontró, o estuvo cerca de encontrar, solo una cosa: que las personas con presión arterial alta consumían menos sodio que las que tenían presión arterial más baja?

La evidencia que apoya la conclusión de alto contenido de sodio / presión arterial más baja se derivó de un tipo de estudio de cohorte. Implicaba medir los niveles de 17 nutrientes (incluidos calcio y sodio) en las dietas de unas 10.000 personas sin antecedentes de hipertensión arterial. Pero el examen posterior de cómo se llevó a cabo el estudio planteó serias dudas sobre la calidad de la evidencia, o incluso si era evidencia en absoluto. La FDA, el Centro Nacional de Estadísticas de Salud (la fuente de datos utilizada en el estudio) y el Instituto Nacional del Corazón, los Pulmones y la Sangre evaluaron el uso de las estadísticas y encontraron "importantes problemas conceptuales y estadísticos en el enfoque del autor". Estos problemas, encontraron las agencias, produjeron "conclusiones inapropiadas". Específicamente, se encontró que el estudio contenía tres errores que dificultaban decir qué se había encontrado, si es que se había encontrado, con respecto a la relación entre la presión arterial y el sodio.

El primer error involucró el CÓMO de la medición: las lecturas de la presión arterial. Una lectura de la presión arterial suele ser una medida de la presión sistólica (cuando el corazón bombea sangre de forma activa hacia las arterias) y la presión diastólica (cuando el corazón relajado recibe sangre de las venas). Sin embargo, este estudio consideró solo la presión sistólica, aunque los médicos consideran que ambos números son clínicamente importantes.

El segundo error involucró el QUÉ de la medición: la cantidad de sodio en los alimentos consumidos. El estudio se limitó a la cantidad de sodio en los alimentos antes de su preparación, no a las cantidades a menudo considerables que podrían agregarse durante la cocción o en la mesa. El estudio también ignoró los niveles variables de sodio en el agua potable e incluso en algunos medicamentos que los participantes pueden haber estado tomando.

El tercer error involucró al QUIÉN de la medición: no controlar de manera consistente o no tener en cuenta variables entre los participantes como la edad, la raza, el sexo y el peso. Por ejemplo, cuando se consideró la edad, los hallazgos mostraron que, de hecho, el sodio está directamente asociado con la presión arterial alta, contrariamente a la conclusión a la que llegaron los científicos que realizaron el estudio.

Una de las razones por las que los científicos consideran que un experimento controlado es una forma eficaz de llegar a un hecho es que otros científicos pueden repetirlo para ver si los resultados pueden duplicarse. Si se supera ese desafío, y el mismo experimento realizado por diferentes y quizás muy escépticos científicos  arroja los mismos hallazgos, entonces se aceptan los resultados.

Por otro lado, los resultados de métodos no experimentales, como los estudios de casos y controles o de cohortes, generalmente se validan verificando de cerca factores como la forma en que se recopilaron y analizaron los datos y si los datos fueron suficientes para respaldar la conclusión. En el estudio que concluyó que bajar los niveles de colesterol reduciría el riesgo de enfermedades cardíacas, los datos, el método y, por ende, la conclusión pasaron esta prueba. Pero el estudio de sodio / presión arterial alta no pasó el escrutinio de otros científicos; por lo que la conclusión de otros estudios, que la presión arterial alta está directamente relacionada con la ingesta de sodio, sigue en pie.

El avance del conocimiento científico se basa en emplear el método científico y analizar lógicamente los resultados. No todos estos estudios resistirán el escrutinio de otros científicos; Algunos nuevos descubrimientos sorprendentes seguirán el camino de la generación espontánea y la terapia con nuez moscada para las enfermedades cerebrales. Pero sin tales estudios, y sin el escrutinio de sus hallazgos en la comunidad científica, el conocimiento aumentaría muy poco, y aún podríamos estar tratando de estimar el tamaño de la cosecha de cáñamo de este año en Júpiter.

Este artículo se reimprimió de la edición de junio de 1985 de FDA Consumer. En el momento en que se escribió, el Sr. Larkin era un reportero independiente y ex empleado de la FDA que trabajaba en Easton, Maryland.

Por Tim Larkin 11 de febrero de 2005 , publicado originalmente en Quackwatch;
Evidence vs. Nonsense: A Guide to the Scientific Method


Traducción : Jorge Juarez
Revisión: Javier Delgado