Busto de piedra agrietado con términos de crisis científica como P-hacking y sesgo de publicación, junto a un informe con el sello FAILED

Cómo 865 científicos están reescribiendo todo lo que creíamos saber sobre la mente humana

Actualidad Internacional

865 expertos confirman que la mitad de los estudios psicológicos no se replican. Es el fin de los mitos de la mente.

Busto de piedra agrietado con términos de crisis científica como P-hacking y sesgo de publicación, junto a un informe con el sello FAILED

En abril de 2026, un equipo global de 865 investigadores publicó en la revista Nature un exhaustivo análisis del Proyecto SCORE que demuestra que el 51% de los hallazgos en ciencias sociales no pueden replicarse. Mediante la revisión de miles de artículos publicados entre 2009 y 2018, los expertos revelaron cómo los incentivos del sistema académico priorizaron el espectáculo sobre el rigor, forzando ahora una reescritura total de los libros de texto para salvar la credibilidad de la psicología moderna.


Cuando la ciencia se desvanece: La revolución silenciosa que está reescribiendo todo lo que creíamos saber sobre la mente humana

Una investigación sobre cómo la mitad de los descubrimientos psicológicos que dieron forma al siglo XXI resultaron ser historias demasiado buenas para ser verdad —y por qué esto es una buena noticia

📍 Abril de 2026. Mientras el mundo miraba elecciones, guerras y mercados, 865 científicos publicaban en silencio uno de los diagnósticos más incómodos del siglo XXI. En las páginas de Nature, lejos de los titulares ruidosos, revelaban una verdad que la academia susurraba desde 2011: la mitad de lo que creíamos saber sobre la mente humana se desvanece cuando alguien intenta repetirlo. No por fraude. No por incompetencia. Porque durante décadas, el sistema estuvo optimizado para producir descubrimientos espectaculares, no para comprobar si eran ciertos.


La pose perfecta

Imagina que mañana entras a una sala de juntas. Te plantas con las manos en las caderas, pecho hacia afuera, ocupando espacio físico como si el mundo te perteneciera. Según Amy Cuddy, psicóloga de Harvard y oradora de uno de los TED Talks más vistos de la historia (46 millones de reproducciones), durante los dos minutos siguientes tu cuerpo experimentará un cambio químico real: subirá tu testosterona, bajará tu cortisol y te sentirás más poderoso, más capaz, más dueño de tu destino.

La llamaron power posing. La enseñaron en escuelas de negocios, la aplicaron en terapias de liderazgo femenino, la citaron presidentes de empresas. Durante seis años, fue una verdad científica incontrovertida. Una historia demasiado buena para ser verdad. Y como suele suceder con esas historias, lo era.

«No creo que los efectos de las posturas de poder sean reales… la evidencia en contra es innegable.»
Dana Carney, coautora del estudio original, 2016

Lo que sucedió con el power posing no fue un error aislado. Fue el síntoma más visible de una enfermedad sistémica que ha consumido a las ciencias sociales durante décadas: la crisis de replicación. Un fenómeno tan vasto que requiere que replanteemos no solo cómo hacemos ciencia, sino cómo consumimos conocimiento en una era sedienta de respuestas simples.


El iceberg que hundió la certeza

En abril de 2026, mientras los algoritmos de noticias priorizaban conflictos geopolíticos, la revista Nature publicó tres artículos que pasaron relativamente desapercibidos para el público general, pero que representan un terremoto intelectual. El Proyecto SCORE (Systematizing Confidence in Open Research and Evidence), financiado por la agencia de investigación militar DARPA, analizó 3.900 artículos científicos publicados entre 2009 y 2018 en 62 revistas especializadas. La conclusión fue fría, matemática y devastadora:

🔬 Solo el 49% de los estudios replicados mostraron resultados consistentes con sus originales.

Para entender la magnitud de este número, imagina que entras a una biblioteca médica y descubres que la mitad de los tratamientos descritos allí no funcionan cuando otros médicos intentan reproducirlos. No porque sean fraudulentos, no porque los científicos sean incompetentes, sino porque el sistema estaba diseñado para fabricar hallazgos, no para validar verdades.

📊 Los tres niveles de la verdad científicaReproducibilidad: ¿Obtienes los mismos números si analizas los mismos datos? (Solo 53% de los estudios lo lograron) • Robustez: ¿Llegas a la misma conclusión si analizas los datos de otra manera razonable? (75% de éxito) • Replicabilidad: ¿Obtienes resultados similares si repites el experimento desde cero? (49% de éxito)

«La innovación sin verificación no nos lleva a ninguna parte.»
Brian Nosek, director del Center for Open Science


Los íconos que no sobrevivieron a la evidencia

La historia de la psicología social del siglo XXI puede leerse como un panteón de dioses que fueron derrocados uno por uno. No mediante debates filosóficos, sino mediante el método científico aplicado a sí mismo: la repetición. La corrección nunca es viral. Pero es necesaria.

🎭 El Experimento de Stanford: Teatro documentado

En 1971, Philip Zimbardo reclutó a 24 estudiantes, los dividió en «guardias» y «prisioneros» en un sótano simulado, y detuvo la investigación seis días después porque los «guardias» se habían vuelto sádicos. Durante cuarenta años, este estudio fundó la teoría de que las situaciones corruptan a las personas normales. Apareció en cada libro de texto, inspiró películas, explicó el abuso de Abu Ghraib.

Solo que nunca sucedió como lo contaron.

Archivos desclasificados de Thibault Le Texier (2019) revelaron que: • Zimbardo instruyó personalmente a los «guardias» sobre cómo ser crueles • El «colapso nervioso» del prisionero más famoso fue fingido para poder irse a estudiar • Los estudiantes actuaron según un guion, no por transformación psicológica espontánea

«Fue una demostración de obediencia a la autoridad investigadora, no de la maldad intrínseca de las prisiones.»
Análisis actual de la comunidad científica

🧠 El Efecto Dunning-Kruger: La arrogancia matemática

¿Conoces a alguien incompetente que cree ser experto? Todos conocemos al típico personaje que habla de economía sin haber leído un libro o critica la medicina desde su sofá. El efecto Dunning-Kruger, descrito en 1999, parecía explicar por qué: los incompetentes carecen de la habilidad metacognitiva para reconocer su incompetencia.

El gráfico mostraba a los menos hábiles evaluándose en el percentil 75. Era perfecto, visual, intuitivo. Se convirtió en meme, en argumento de Twitter, en justificación para despreciar al prójimo. Todos conocemos a alguien así… o tememos serlo.

Pero aquí está el problema: el efecto Dunning-Kruger aparece incluso cuando analizas datos aleatorios generados por computadora.

Investigadores demostraron que el patrón es principalmente un artefacto estadístico: la regresión a la media combinada con el sesgo de «mejor-que-el-promedio». Cuando eres muy malo en algo, tus errores solo pueden ir en una dirección: hacia arriba. No es psicología; es geometría estadística.

• Lo que queda: Sí, a veces no sabemos lo que no sabemos • Lo que se va: La curva perfecta que convierte la estupidez en una ley lineal

🔋 El Agotamiento del Ego: La batería que nunca existió

Roy Baumeister propuso que la fuerza de voluntad es un recurso finito, como un músculo que se fatiga. Este concepto explicaba por qué después de un día difícil caemos en tentaciones, por qué los jueces dan menos libertades condicionales antes del almuerzo.

En 2016, 23 laboratorios independientes intentaron replicar los hallazgos con más de 2.000 participantes.

Encontraron efectos inconsistentes o nulos en la mayoría de los casos.

El «modelo de glucosa» colapsó: resultó que enjuagarse la boca con agua azucarada (sin tragar) producía el mismo efecto que beber el jugo, sugiriendo motivación, no bioquímica. Michael Inzlicht, investigador original de la teoría, declaró: «El agotamiento del ego se ha colapsado.»

La voluntud no es una batería. Es algo más complejo, contextual, menos predecible y, curiosamente, más humano.

🚶‍♂️ El experimento que hacía caminar lento

En 1996, John Bargh publicó un estudio que parecía ciencia ficción: si leías palabras relacionadas con la vejez (como «bastón» o «caminar»), salías del laboratorio caminando más lento sin darte cuenta. El priming social había nacido: la idea de que estímulos sutiles programan nuestra conducta inconscientemente.

El estudio se convirtió en clásico instantáneo. Hasta que en 2012, Stéphane Doyen lo replicó usando cronometraje automático por infrarrojos en lugar de cronómetros manuales.

El efecto desapareció por completo.

Se descubrió que los experimentadores originales, conscientes de la hipótesis, inconscientemente influían en los participantes mediante instrucciones más lentas o pulsaciones retardadas del cronómetro. Lo que parecía control mental era sesgo del observador.

Este fue el caso que detonó la famosa carta de Daniel Kahneman en 2012, donde el premio Nobel advirtió a la comunidad científica: «La psicología social está en situación de desastre inminente.»

Hoy se distingue entre el priming semántico (real) y el priming conductual (falso). El cerebro no es tan programable como creíamos.

🌱 La Mentalidad de Crecimiento: Cuando el esfuerzo vacío no alcanza

Carol Dweck descubrió que los niños que creen que la inteligencia es maleable superan a quienes creen que es fija. Fue el santo grial de la educación: si solo cambiamos las creencias, mejoramos el rendimiento. Bill Gates la promovió. Las escuelas la implementaron masivamente.

Un meta-análisis de 273 estudios (2018) encontró que el tamaño del efecto real es de 0.08 —prácticamente cero. Para contexto: dormir bien tiene un efecto de 0.30 en rendimiento académico.

Lo que descubrieron investigadores fue que las intervenciones cambian lo que los niños dicen creer, pero no cómo actúan ante el fracaso. Dweck misma tuvo que salir a aclarar que estaba horrorizada por la «falsa mentalidad de crecimiento»: escuelas premiando el esfuerzo sin estrategia, convirtiendo una idea compleja en un eslogan motivacional vacío.


La fábrica de espejismos

Si tantos estudios fallaron, ¿por qué fueron publicados? ¿Por qué los libros de texto los incluyeron? ¿Por qué TED los convirtió en virales?

El problema no es que la ciencia se equivoque. Es que estaba optimizada para producir descubrimientos, no para comprobarlos.

El sistema académico creó un caldo de cultivo perfecto para las historias demasiado buenas para ser verdad:

🎰 El P-hacking y el HARKingP-hacking: Seguir analizando datos de formas diferentes hasta que el valor p baje de 0.05 • HARKing (Hipotesizar Después de los Resultados Conocidos): Encontrar un patrón por azar y escribir la hipótesis como si siempre la hubieras tenido

📉 La tiranía de la muestra pequeña El estudio de power posing utilizó 42 personas. El de priming social utilizó menos de 30. Con muestras tan pequeñas, solo detectas efectos enormes —raros en psicología— o ruido estadístico disfrazado de descubrimiento.

📰 La asimetría de la atención Un estudio que dice «tu postura cambia tus hormonas» genera portadas y consultorías. Un estudio que dice «intentamos replicarlo con 500 personas y no pasó nada» es aburrido, no vende. La corrección nunca alcanza la misma audiencia que el error.

«Las ideas no mueren cuando se equivocan. Mueren cuando dejan de ser útiles.»

🧟 Las ideas zombis En consultoría empresarial, estas teorías son rentables. Es más fácil vender un taller de «Posturas de Poder» que proponer reestructuraciones salariales reales. Culpabilizan al individuo («tú no tienes confianza») en lugar de al sistema («tu empresa paga mal»). Así sobreviven a su muerte científica, convertidas en zombis que caminan por los congresos corporativos.


La revolución de la credibilidad

Si la crisis de replicación es el problema, ¿cuál es la solución? Sorprendentemente, la ciencia está respondiendo con lo que podría ser su mayor reforma metodológica en siglos.

🔬 El Preregistro Antes de recolectar datos, los investigadores registran públicamente sus hipótesis, diseño y análisis planeados. Esto elimina el p-hacking y el HARKing. Ya no puedes «dibujar la diana alrededor de la flecha» si dibujaste la diana antes de lanzar.

📂 La Ciencia Abierta Compartir datos brutos, materiales y código. El Open Science Framework aloja miles de estudios completos para que cualquiera pueda verificarlos. La transparencia se convierte en el nuevo estándar de calidad.

🌍 Many Labs y el Acelerador El proyecto Many Labs (2012-2022) demostró que la colaboración masiva funciona: 36 sitios, miles de participantes, replicaciones robustas. Su sucesor, el Psychological Science Accelerator, es como el CERN de la psicología: 500 laboratorios en 72 países realizando estudios con muestras diversas, no solo estudiantes universitarios occidentales (WEIRD).

🤖 Predicción algorítmica El proyecto SCORE desarrolló IA y mercados de predicción donde expertos evalúan la probabilidad de replicación antes de que ocurra. Aciertan el 71% de las veces, sugiriendo que la calidad científica es detectable a priori si miramos los métodos, no solo los resultados.


La humildad de Kahneman

Quizás el momento más humano de esta historia involucra a Daniel Kahneman, premio Nobel de Economía y autor de Pensar rápido, pensar despacio. Su libro, leído por millones, citaba extensamente los estudios de priming social de Bargh.

Cuando esos estudios comenzaron a fracasar en replicaciones, Kahneman hizo algo raro en el mundo académico: admitió su error públicamente.

«Fui demasiado confiado… puse demasiada fe en estudios con muestras pequeñas. Las pruebas ahora son abrumadoramente negativas. Me equivoqué.»
Daniel Kahneman, 2017

Esta admisión encapsula la esencia de la ciencia funcionando correctamente. No es un acervo de verdades inmutables grabadas en mármol, sino un proceso de error y corrección continua. La crisis no es el fin de la ciencia social; es su adolescencia dolorosa pero necesaria.

«La ciencia no falló. Sus incentivos sí.»


Más allá de la psicología

Esto no es solo un problema de psicología. Es un recordatorio de cómo construimos verdad en la era de los datos.

En un mundo donde los algoritmos nos sirven verdades a medida que confirman nuestros sesgos, donde la información abunda pero la comprensión escasea, la lentitud del método científico corregido —con su énfasis en la verificación sobre la virality— es un acto de resistencia epistemológica.

La crisis de replicación nos enseña que cualquier conocimiento que parezca demasiado simple, demasiado elegante, demasiado confirmatorio de nuestras intuiciones, debe ser examinado con sospecha. No cinismo, pero sí escrutinio. No porque los científicos sean malos, sino porque la realidad es compleja, y las historias simples sobre la mente humana suelen ser justo eso: historias.


El valor de lo frágil

Volvamos a la sala de juntas. Quizás pararte como Superman durante dos minutos no cambie tu testosterona. Quizás la fuerza de voluntad no sea una batería que se agota. Quizás el incompetente de tu oficina no sea víctima de una ceguera psicológica universal, sino simplemente… una persona compleja.

Pero esto no significa que la mente sea inescrutable. Significa que es más compleja de lo que cómodos mitos psicológicos sugieren. Que no podemos reducir la condición humana a gráficos simples o charlas TED de quince minutos.

«Conocer es difícil. Requiere duda, repetición, muestras masivas, y la humildad de admitir que nuestras intuiciones más seductoras pueden ser —y a menudo son— incorrectas.»

La crisis de replicación nos devuelve una verdad incómoda pero liberadora: la certeza es el enemigo del conocimiento. En una era de información instantánea, donde los titulares prometen respuestas definitivas, el método científico lento, metódico, dispuesto a equivocarse y corregirse, es un acto de rebeldía intelectual.

Es decir: no sé, averigüémoslo, y si me equivoco, lo corrijo.

Eso es más valioso que cualquier pose de poder. Es poder real.


La Revolución de la Credibilidad: Una Investigación sobre la Crisis de Replicación en las Ciencias Sociales

Durante más de una década, las ciencias sociales han atravesado una convulsión existencial conocida como la «crisis de replicación». El reciente proyecto SCORE (Systematizing Confidence in Open Research and Evidence), publicado en abril de 2026 en Nature, confirmó lo que investigadores sospechaban desde 2011: apenas la mitad de los estudios en ciencias sociales resisten el escrutinio riguroso cuando se someten a replicación independiente. Este hallazgo, lejos de ser un mero problema metodológico, representa un punto de inflexión epistemológico que cuestiona cómo se produce, valida y difunde el conocimiento científico. El presente análisis examina los casos más emblemáticos de esta crisis —desde el colapso del efecto Dunning-Kruger hasta el escándalo del Experimento de la Cárcel de Stanford—, explorando las causas estructurales que permitieron que teorías defectuosas dominaran libros de texto y políticas públicas durante décadas.


1. El diagnóstico: Cuando la mitad de la ciencia no es ciencia

El 1 de abril de 2026, la revista Nature publicó los resultados finales del proyecto SCORE, una iniciativa financiada por la Defense Advanced Research Projects Agency (DARPA) que involucró a 865 investigadores examinando 3.900 artículos académicos publicados entre 2009 y 2018 en 62 revistas especializadas. Los hallazgos fueron contundentes: únicamente el 49% de los estudios replicados alcanzaron resultados estadísticamente significativos comparables con sus originales.

El proyecto SCORE no fue el primero en documentar esta crisis, pero sí el más ambicioso. Precedido por los proyectos «Many Labs» —que concluyeron formalmente en 2022 tras una década de operaciones—, el esfuerzo sistematizó tres dimensiones distintas de la credibilidad científica: la reproducibilidad (obtener los mismos resultados analizando los mismos datos), la robustez (obtener conclusiones similares mediante análisis alternativos de los mismos datos) y la replicabilidad (obtener resultados consistentes mediante nuevos experimentos).

Brian Nosek, profesor de psicología en la Universidad de Virginia y director ejecutivo del Center for Open Science, quien coordinó tanto los proyectos Many Labs como SCORE, ha señalado que estos resultados no implican necesariamente mala praxis científica, sino que revelan deficiencias sistémicas en los incentivos académicos. Muchos artículos simplemente no proporcionaron suficiente información metodológica o datos brutos para permitir verificaciones independientes.

La cronología de esta crisis comenzó formalmente en 2011, cuando el proyecto Many Labs 1 intentó replicar 13 estudios clásicos y contemporáneos de psicología social. Aunque 10 de ellos se replicaron con éxito, tres fracasaron estrepitosamente, incluyendo estudios sobre «priming» (el efecto de estímulos subliminales en el comportamiento) y reducción de prejuicios mediante contacto imaginario. Lo que siguió fue una avalancha de replicaciones fallidas que sacudió los cimientos de la disciplina. El Reproducibility Project: Psychology, coordinado también por Nosek con 269 colaboradores, logró replicar menos de 50 de 100 estudios publicados en 2008 en tres revistas prestigiosas —una tasa de éxito inferior al azar de una moneda al aire.


2. El colapso de los íconos: Casos emblemáticos de la crisis

2.1 El Efecto Dunning-Kruger: Cuando las matemáticas engañan

Uno de los fenómenos más citados en la cultura popular —el efecto Dunning-Kruger, que postula que las personas incompetentes son demasiado incompetentes para reconocer su incompetencia— ha sido sometido a un escrutinio devastador. Publicado originalmente por Justin Kruger y David Dunning en 1999, el estudio se convirtió en un meme cultural y un referente obligado en discusiones sobre sesgos cognitivos.

Sin embargo, investigaciones recientes han demostrado que el efecto podría ser principalmente un artefacto estadístico. Gignac y Zajenkowski (2020) publicaron un análisis en la revista Intelligence titulado The Dunning-Kruger effect is mostly a statistical artefact, donde utilizaron datos simulados y reales de cociente intelectual para demostrar que el patrón característico —incompetentes sobreestimándose y expertos subestimándose— emerge inevitablemente de la regresión a la media y el sesgo de mejor-que-el-promedio, sin necesidad de recurrir a explicaciones psicológicas sobre metacognición deficiente.

La crítica se centra en el «doble uso» de las medidas: cuando los investigadores clasifican a los participantes según su rendimiento en una tarea y luego comparan esa clasificación con la autoevaluación sobre la misma tarea, introducen inevitabilmente artefactos estadísticos. Aunque Kruger y Dunning han defendido su trabajo argumentando que el efecto persiste incluso controlando la confiabilidad de las mediciones, la comunidad científica ha adoptado una postura más cautelosa. Como señala McIntosh y Della Sala, el efecto podría no ser una característica del cerebro humano sino una propiedad matemática de cómo se diseñaron los estudios.

2.2 Power Posing: El espectáculo del TED Talk contra la ciencia

El caso de las «posturas de poder» (power posing) representa quizás el ejemplo más dramático de cómo una charla TED puede eclipsar décadas de rigor científico. En 2010, Dana Carney, Amy Cuddy y Andy Yap publicaron en Psychological Science un estudio con 42 participantes que afirmaba que adoptar posturas expansivas durante dos minutos aumentaba los niveles de testosterona, reducía el cortisol y aumentaba la tolerancia al riesgo.

El estudio capturó la imaginación pública cuando Cuddy presentó sus hallazgos en una charla TED que acumuló más de 46 millones de vistas. Su mensaje —»puedes fingirlo hasta lograrlo» (fake it till you make it)— resonó en corporaciones, escuelas de negocios y políticas públicas. Sin embargo, la evidencia contradictoria no tardó en acumularse.

En 2015, Ranehill y colaboradores publicaron una replicación con más de 200 participantes en la misma revista, encontrando que si bien los participantes se sentían más poderosos, no había cambios hormonales ni efectos conductuales. Ese mismo año, once nuevos estudios coordinados por Joseph Cesario de la Universidad Estatal de Michigan fracasaron en replicar cualquier efecto conductual o cognitivo.

El punto de inflexión llegó en 2016, cuando Dana Carney —autora principal del estudio original— publicó una declaración en su sitio web de la Universidad de California, Berkeley, donde afirmaba: «No creo que los efectos de las posturas de poder sean reales… la evidencia en contra es innegable». Carney detalló específicamente que el estudio original utilizaba muestras demasiado pequeñas (N=42) y técnicas estadísticas que hoy se consideran inadecuadas.

A pesar de esto, Amy Cuddy ha continuado defendiendo una versión atenuada de la teoría, argumentando que aunque los cambios hormonales no se replican, el efecto sobre la autopercepción de poder persiste. Sin embargo, meta-análisis recientes han concluido que incluso este efecto subjetivo podría ser un artefacto de demandas experimentales.

2.3 Mentalidad de Crecimiento: La pedagogía del esfuerzo vacío

Carol Dweck y su teoría de la «mentalidad de crecimiento» (growth mindset) representan un caso diferente: una idea válida pero sobredimensionada hasta límites absurdos por el aparato de consultoría educativa. Dweck propuso que los estudiantes que creen que la inteligencia es maleable (mente de crecimiento) superan a quienes creen que es fija (mente fija).

El meta-análisis más exhaustivo hasta la fecha, conducido por Sisk y colaboradores (2018) y publicado en Psychological Science, examinó 273 estudios y encontró que el tamaño del efecto de las intervenciones de mentalidad de crecimiento sobre el rendimiento académico era de apenas 0.08 —considerado insignificante en investigación educativa. Para contextualizar, el efecto de dormir adecuadamente sobre el rendimiento académico es aproximadamente 0.30, casi cuatro veces mayor.

Investigaciones posteriores de Li y Bates (2019) replicaron los estudios centrales de Dweck encontrando que, si bien las intervenciones cambiaban las creencias declaradas de los estudiantes sobre la inteligencia, estos cambios no traducían en mayor resiliencia ante el fracaso ni mejor desempeño cognitivo. Burgoyne, Hambrick y Macnamara (2020) reanalizaron los propios datos de Dweck y encontraron que algunas afirmaciones centrales carecían de soporte estadístico y que los tamaños de efecto habían sido sobrestimados.

La ironía, como ha señalado la propia Dweck, es que el concepto fue mal aplicado masivamente. Escuelas comenzaron a premiar el «esfuerzo» sin importar la estrategia, creando lo que Dweck llamó la «falsa mentalidad de crecimiento» —un eslogan motivacional vacío que ignoraba que el crecimiento real requiere no solo creencias sino herramientas pedagógicas específicas.

2.4 El Experimento de la Cárcel de Stanford: Teatro documentado

Ningún caso ilustra mejor la distancia entre narrativa mediática y rigor científico que el Experimento de la Cárcel de Stanford (SPE) de Philip Zimbardo. Durante décadas, este estudio de 1971 fue citado como prueba definitiva de que situaciones institucionales pueden transformar a personas «normales» en torturadores sádicos.

Sin embargo, investigaciones de archivos conducidas por el sociólogo Thibault Le Texier y publicadas en American Psychologist en 2019 revelaron que el experimento no fue ciencia sino una «demostración» cuidadosamente coreografiada. Le Texier descubrió en los archivos de Stanford que:

Primero, los «guardias» recibieron instrucciones específicas de David Jaffe —un estudiante graduado que actuó como alcaide— sobre cómo deshumanizar a los prisioneros, incluyendo tácticas de humillación sugeridas por un exconvicto consultor. Cuando los guardias se mostraban renuentes a ser crueles, eran presionados para actuar con más dureza «para que el experimento tuviera éxito».

Segundo, el famoso «colapso nervioso» del prisionero 8612 (Douglas Korpi), que Zimbardo presentó como evidencia de trauma psicológico real, fue fingido. Korpi admitió posteriormente que simuló la crisis para poder irse a estudiar para sus exámenes GRE, ya que Zimbardo no permitía abandonar el estudio voluntariamente.

Tercero, Le Texier descubrió que los procedimientos del SPE fueron copiados casi literalmente de un experimento previo realizado por estudiantes en el dormitorio Toyon Hall tres meses antes, algo que Zimbardo nunca reveló en sus publicaciones.

Cuarto, Zimbardo se nombró a sí mismo Superintendente de la prisión, perdiendo toda objetividad como investigador, y ya había redactado las conclusiones sobre «la maldad de las instituciones» antes de que concluyera el experimento.

El veredicto actual de la comunidad científica, respaldado por análisis de Haslam, Reicher y Van Bavel, es que el SPE demuestra no la maldad intrínseca de las situaciones carcelarias, sino la obediencia a la autoridad investigadora: los estudiantes actuaron cruelmente porque el profesor les indicó explícitamente que ese era el objetivo del estudio.

2.5 Agotamiento del Ego: La batería que nunca existió

La teoría del «agotamiento del ego» (ego depletion), propuesta por Roy Baumeister y colaboradores, postulaba que la fuerza de voluntad funciona como un músculo o una batería que se agota con el uso. Esta teoría fundamentó literaturas enteras sobre toma de decisiones, dietas y productividad.

Sin embargo, el Registered Replication Report de 2016 coordinado por Martin Hagger involucró a 23 laboratorios con más de 2.100 participantes y no encontró evidencia del efecto. Meta-análisis con correcciones de sesgo aplicadas por Carter y McCullough (2015) mostraron que el efecto desaparecía cuando se controlaba la publicación selectiva.

Aún más devastador fue el colapso del «modelo de glucosa»: estudios originales sugerían que beber jugo de naranja «recargaba» la voluntad, pero análisis posteriores demostraron que incluso enjuagarse la boca con agua azucarada (sin tragar) producía efectos similares, sugiriendo que se trataba de un efecto de motivación/recompensa, no de combustible biológico.

Michael Inzlicht, quien inicialmente trabajó en la teoría, ha declarado que «el agotamiento del ego se ha colapsado» y que el efecto, si existe, es mucho más pequeño y contextual de lo originalmente propuesto. Investigaciones recientes de Dang y colaboradores (2021) han encontrado efectos pequeños pero significativos en replicaciones preregistradas, sugiriendo que el fenómeno podría existir pero es extremadamente frágil y dependiente de manipulaciones específicas.

2.6 El Test del Malvavisco: El contexto invisible

El famoso «test del malvavisco» de Walter Mischel (1960), que correlacionaba la capacidad de los niños de resistir comer un dulce con éxito futuro en la adultez, fue durante décadas evidencia de la importancia del autocontrol. Sin embargo, replicaciones recientes por Watts y colaboradores (2018) con muestras diversas y más grandes demostraron que una vez que se controlaba el nivel socioeconómico, la capacidad de esperar al segundo malvavisco perdía su poder predictivo.

El hallazgo crucial fue que niños de familias pobres comían el dulce rápidamente no por falta de fuerza de voluntad, sino porque en entornos de incertidumbre alimentaria, aceptar un recurso disponible hoy es racional frente a la posibilidad de que la promesa del segundo dulce mañana no se cumpla. El «fracaso» en el test era, en realidad, una adaptación inteligente a la pobreza.

2.7 Priming Social: El sesgo que camina lento

El estudio de John Bargh (1996) sobre «priming» social —donde leer palabras relacionadas con la vejez hacía caminar más lento a los participantes sin su conocimiento— fue el detonante de la carta abierta de Daniel Kahneman en 2012 advirtiendo de un «desastre inminente» para la psicología social.

Cuando Doyen y colaboradores (2012) replicaron el estudio utilizando cronometraje automático por infrarrojos en lugar de cronómetros manuales, el efecto desapareció por completo. Se descubrió que los experimentadores originales, conscientes de la hipótesis, inconscientemente influían en los participantes mediante instrucciones más lentas o pulsaciones retardadas del cronómetro —el efecto Rosenthal.

Hoy se distingue entre el priming semántico (real y robusto) y el priming conductual (considerado mayormente falso), reconociendo que el cerebro no es tan programable por estímulos subliminales como se pensaba.


Replicated Studies

The August 2015 summary report in Science includes 100 replications from 98 articles. Links to each of the replications’ reports, analysis audits, and their DOIs are available here. All of the replication project pages are also available from RPP’s main project page.

A Roelofs

OSF project: https://osf.io/qwkum/
Final report: https://osf.io/janu3/
R script to reproduce key finding: https://osf.io/64pz8/
DOI: 10.17605/OSF.IO/SPTYB

AL Alter, DM Oppenheimer

OSF project: https://osf.io/kegmc/
Final report: https://osf.io/jym7h/
R script to reproduce key finding: https://osf.io/5axfe/
DOI: 10.17605/OSF.IO/8EW6S

AL Morris, ML Still

OSF project: https://osf.io/rmvk5/
Final report: https://osf.io/5f42t/
R script to reproduce key finding: https://osf.io/qg9j7/
DOI: 10.17605/OSF.IO/6XJQM

B Dessalegn, B Landau

OSF project: https://osf.io/iajp5/
Final report: https://osf.io/83n4z/
R script to reproduce key finding: https://osf.io/qmupg/
DOI: 10.17605/OSF.IO/4KR6E

B Eitam, RR Hassin, Y Schul

OSF project: https://osf.io/edcr7/
Final report: https://osf.io/x75fq/
Response from original author: https://osf.io/uagqb/
R script to reproduce key finding: https://osf.io/bvgyq/
DOI: 10.17605/OSF.IO/NMRJG

B Liefooghe, P Barrouillet, A Vandierendonck, V Camos

OSF project: https://osf.io/4dvzb/
Final report: https://osf.io/2h4vx/
R script to reproduce key finding: https://osf.io/69b27/
DOI: 10.17605/OSF.IO/AVY86

B Monin, PJ Sawyer, MJ Marquez

OSF project: https://osf.io/pz0my/
Final report: https://osf.io/a4fmg/

Response from original author: https://osf.io/3s2zd/

R script to reproduce key finding: https://osf.io/27gpt/
DOI: 10.17605/OSF.IO/SUYFC

BC Storm, EL Bjork, RA Bjork

OSF project: https://osf.io/8j9cg/
Final report: https://osf.io/byxjr/
R script to reproduce key finding: https://osf.io/xsmzb/
DOI: 10.17605/OSF.IO/7UFYV

BK Payne, MA Burkley, MB Stokes

OSF project: https://osf.io/rc6mv/
Final report: https://osf.io/79y8g/
R script to reproduce key finding: https://osf.io/u23g9/
DOI: 10.17605/OSF.IO/TYS7B

C Farris, TA Treat, RJ Viken, RM McFall

OSF project: https://osf.io/7dyp5/
Final report: https://osf.io/5u4km/
R script to reproduce key finding: https://osf.io/ihcrs/
DOI: 10.17605/OSF.IO/WMBP2

C Janiszewski, D Uy

OSF project: https://osf.io/aaudl/
Final report: https://osf.io/ehjdm/
R script to reproduce key finding: https://osf.io/8qc4x/
DOI: 10.17605/OSF.IO/HPK2M

C McKinstry, R Dale, MJ Spivey

OSF project: https://osf.io/d0n81/
Final report: https://osf.io/pu9nb/
R script to reproduce key finding: https://osf.io/8hurj/
DOI: 10.17605/OSF.IO/WZXQ9

C Mitchell, S Nash, G Hall

OSF project: https://osf.io/4xdkk/
Final report: https://osf.io/beckg/
R script to reproduce key finding: https://osf.io/n539q/
DOI: 10.17605/OSF.IO/A9VRQ

CJ Berry, DR Shanks, RN Henson

OSF project: https://osf.io/atgp5/
Final report: https://osf.io/yc2fe/
R script to reproduce key finding: https://osf.io/9ivaj/
DOI: 10.17605/OSF.IO/CBWGJ

CJ Soto, OP John, SD Gosling, J Potter

OSF project: https://osf.io/kez47/
Final report: https://osf.io/6zdct/
R script to reproduce key finding: https://osf.io/3y9sj/
DOI: 10.17605/OSF.IO/U3X7S

CP Beaman, I Neath, AM Surprenant

OSF project: https://osf.io/6n3bm/
Final report: https://osf.io/a6mje/
R script to reproduce key finding: https://osf.io/pmhd7/
DOI: 10.17605/OSF.IO/Q7HM4

CR Cox, J Arndt, T Pyszczynski, J Greenberg, A Abdollahi, S Solomon

OSF project: https://osf.io/5tbxf/
Final report: https://osf.io/uhnd2/
R script to reproduce key finding: https://osf.io/fg2u9/
DOI: 10.17605/OSF.IO/853UE

CS Dodson, J Darragh, A Williams

OSF project: https://osf.io/c5pbg/
Final report: https://osf.io/b9dpu/
R script to reproduce key finding: https://osf.io/dctav/
DOI: 10.17605/OSF.IO/49XEA

D Albarracín, IM Handley, K Noguchi, KC McCulloch, H Li, J Leeper, RD Brown, A Earl, WP Hart: #1

OSF project: https://osf.io/vy1bc/
Final report: https://osf.io/2pbaf/
R script to reproduce key finding: https://osf.io/gtewj/
DOI: 10.17605/OSF.IO/36DR5

D Albarracín, IM Handley, K Noguchi, KC McCulloch, H Li, J Leeper, RD Brown, A Earl, WP Hart: #2

OSF project: https://osf.io/rgm6p/
Final report: https://osf.io/tarp4/
R script to reproduce key finding: https://osf.io/256xy/
DOI: 10.17605/OSF.IO/CTVEJ

D Ganor-Stern, J Tzelgov

OSF project: https://osf.io/vmipw/
Final report: https://osf.io/7mgwh/
R script to reproduce key finding: https://osf.io/s5e3w/
DOI: 10.17605/OSF.IO/693JY

D Mirman, JS Magnuson

OSF project: https://osf.io/rvkc5/
Final report: https://osf.io/r57hu/
R script to reproduce key finding: https://osf.io/tjzqr/
DOI: 10.17605/OSF.IO/PK952

DA Armor, C Massey, AM Sackett

OSF project: https://osf.io/qlzap/
Final report: https://osf.io/8u5v2/
R script to reproduce key finding: https://osf.io/esa3j/
DOI: 10.17605/OSF.IO/WBS96

DB Centerbar, S Schnall, GL Clore, ED Garvin

OSF project: https://osf.io/l8srm/
Final report: https://osf.io/wcgx5/
R script to reproduce key finding: https://osf.io/g29pw/
DOI: 10.17605/OSF.IO/NGXYE

DM Amodio, PG Devine, E Harmon-Jones

OSF project: https://osf.io/wkgpq/
Final report: https://osf.io/ysxmf/
Response from original author: https://osf.io/a5hdb/
R script to reproduce key finding: https://osf.io/9gky5/
DOI: 10.17605/OSF.IO/DQYBC

DR Addis, AT Wong, DL Schacter

OSF project: https://osf.io/yaeu7/
Final report: https://osf.io/9ayxi/
R script to reproduce key finding: https://osf.io/gfn65/
DOI: 10.17605/OSF.IO/E89GH

E Harmon-Jones, C Harmon-Jones, M Fearn, JD Sigelman, P Johnson

OSF project: https://osf.io/su6bm/
Final report: https://osf.io/zpwne/
R script to reproduce key finding: https://osf.io/79ctv/
DOI: 10.17605/OSF.IO/RQTGZ

E Nurmsoo, P Bloom

OSF project: https://osf.io/aczvt/
Final report: https://osf.io/ictp5/
R script to reproduce key finding: https://osf.io/ewtn6/
DOI: 10.17605/OSF.IO/VK6D9

E van Dijk, GA van Kleef, W Steinel, I van Beest

OSF project: https://osf.io/xtsq6/
Final report: https://osf.io/2idfu/
R script to reproduce key finding: https://osf.io/cxwev/
DOI: 10.17605/OSF.IO/4HQD6

E Vul, H Pashler

OSF project: https://osf.io/ivfu6/
Final report: https://osf.io/7kimb/
R script to reproduce key finding: https://osf.io/8twa9/
DOI: 10.17605/OSF.IO/2HK76

E Vul, M Nieuwenstein, N Kanwisher

OSF project: https://osf.io/rzjvn/
Final report: https://osf.io/jupew/
R script to reproduce key finding: https://osf.io/2mcdv/
DOI: 10.17605/OSF.IO/PYT4E

EJ Masicampo, RF Baumeister

OSF project: https://osf.io/3h29d/
Final report: https://osf.io/897ew/

R script to reproduce key finding: https://osf.io/4tb8a/

DOI: 10.17605/OSF.IO/8YBK5

EP Lemay, MS Clark

OSF project: https://osf.io/ke43j/
Final report: https://osf.io/efjn3/
R script to reproduce key finding: https://osf.io/nhsdq/
DOI: 10.17605/OSF.IO/XY9MV

EP Lemay, MS Clark

OSF project: https://osf.io/h84qd/
Final report: https://osf.io/mv3i7/
R script to reproduce key finding: https://osf.io/wb4vd/
DOI: 10.17605/OSF.IO/3RTVZ

G Hajcak, D Foti

OSF project: https://osf.io/73pnd/
Final report: https://osf.io/83tsz/
R script to reproduce key finding: https://osf.io/vjb2a/
DOI: 10.17605/OSF.IO/HSNTD

G Tabibnia, AB Satpute, MD Lieberman

OSF project: https://osf.io/94j6h/
Final report: https://osf.io/56fmw/
R script to reproduce key finding: https://osf.io/e3ckz/
DOI: 10.17605/OSF.IO/VQZX9

GA Alvarez, A Oliva

OSF project: https://osf.io/dnaxe/
Final report: https://osf.io/dm2kj/
R script to reproduce key finding: https://osf.io/xgdqy/
DOI: 10.17605/OSF.IO/FS3UT

GP Lau, AC Kay, SJ Spencer

OSF project: https://osf.io/fxqsk/
Final report: https://osf.io/42hgf/
R script to reproduce key finding: https://osf.io/cwkzu/
DOI: 10.17605/OSF.IO/FYMUE

H Ersner-Hershfield, JA Mikels, SJ Sullivan, LL Carstensen

OSF project: https://osf.io/sq8k9/
Final report: https://osf.io/fw6hv/
R script to reproduce key finding: https://osf.io/qedt9/
DOI: 10.17605/OSF.IO/X5SZY

J Correll

OSF project: https://osf.io/fejxb/
Final report: https://osf.io/hzka3/
R script to reproduce key finding: https://osf.io/476wy/
DOI: 10.17605/OSF.IO/8DZPJ

J Förster, N Liberman, S Kuschel

OSF project: https://osf.io/mxryb/
Final report: https://osf.io/sxnu6/
Repsonse from original author: https://osf.io/amh97/

R script to reproduce key finding: https://osf.io/h2r9c/
DOI: 10.17605/OSF.IO/AK3RJ

J Winawer, AC Huk, L Boroditsky

OSF project: https://osf.io/mjasz/
Final report: https://osf.io/ertbg/
R script to reproduce key finding: https://osf.io/efu3h/
DOI: 10.17605/OSF.IO/M9SUF

JA Richeson, S Trawalter

OSF project: https://osf.io/c5fza/
Final report: https://osf.io/phwi4/
R script to reproduce key finding: https://osf.io/wi6hv/
DOI: 10.17605/OSF.IO/S2D6T

JE Marsh, F Vachon, DM Jones

OSF project: https://osf.io/7rtcz/
Final report: https://osf.io/sqcwk/
R script to reproduce key finding: https://osf.io/pfmwj/
DOI: 10.17605/OSF.IO/VJ2XR

JI Campbell, ND Robert

OSF project: https://osf.io/gxvd3/
Final report: https://osf.io/bux7k/
Response from original author: https://osf.io/mvudt/
R script to reproduce key finding: https://osf.io/z75yu/
DOI: 10.17605/OSF.IO/689XC

JJ Exline, RF Baumeister, AL Zell, AJ Kraft, CV Witvliet

OSF project: https://osf.io/imrx2/
Final report: https://osf.io/es7ub/
R script to reproduce key finding: https://osf.io/jfigk/
DOI: 10.17605/OSF.IO/NRJS5

JL Risen, T Gilovich

OSF project: https://osf.io/sg3su/
Final report: https://osf.io/wvcgb/
R script to reproduce key finding: https://osf.io/itc9q/
DOI: 10.17605/OSF.IO/BFZN9

JL Tracy, RW Robins

OSF project: https://osf.io/qthf2/
Final report: https://osf.io/9uqxr/
R script to reproduce key finding: https://osf.io/k7huw/
DOI: 10.17605/OSF.IO/TY9XH

JR Crosby, B Monin, D Richardson

OSF project: https://osf.io/b98zw/
Final report: https://osf.io/nkaw4/
R script to reproduce key finding: https://osf.io/3nay6/
DOI: 10.17605/OSF.IO/HB7KJ

JR Schmidt, D Besner

OSF project: https://osf.io/bscfe/
Final report: https://osf.io/bskwq/
R script to reproduce key finding: https://osf.io/ktgnq/
DOI: 10.17605/OSF.IO/X5B6D

JS Nairne, JN Pandeirada, SR Thompson

OSF project: https://osf.io/jhkpe/
Final report: https://osf.io/v4d2b/
R script to reproduce key finding: https://osf.io/witg3/
DOI: 10.17605/OSF.IO/ZC468

JT Larsen, AR McKibban

OSF project: https://osf.io/5dx4v/
Final report: https://osf.io/h4cbg/
R script to reproduce key finding: https://osf.io/qewvf/
DOI: 10.17605/OSF.IO/K5CWT

K Fiedler

OSF project: https://osf.io/hp27x/
Final report: https://osf.io/vtz2i/
R script to reproduce key finding: https://osf.io/4m8ir/
DOI: 10.17605/OSF.IO/3FJVT

K Oberauer

OSF project: https://osf.io/gcj7x/
Final report: https://osf.io/n32zj/
R script to reproduce key finding: https://osf.io/vhzi6/
DOI: 10.17605/OSF.IO/9P2QR

KA Ranganath, BA Nosek

OSF project: https://osf.io/2gkjt/
Final report: https://osf.io/9xt25/
R script to reproduce key finding: https://osf.io/m4xp8/
DOI: 10.17605/OSF.IO/PX56H

KD Vohs, JW Schooler

OSF project: https://osf.io/i29mh/
Final report: https://osf.io/bwa4g/
R script to reproduce key finding: https://osf.io/eyk8w/
DOI: 10.17605/OSF.IO/3F9KR

KE Stanovich, RF West

OSF project: https://osf.io/7ux8p/
Final report: https://osf.io/p3gz2/
R script to reproduce key finding: https://osf.io/jv4tw/
DOI: 10.17605/OSF.IO/7BNFP

KL Blankenship, DT Wegener

OSF project: https://osf.io/2gx4k/
Final report: https://osf.io/v3e2z/
R script to reproduce key finding: https://osf.io/4vuhw/
DOI: 10.17605/OSF.IO/KG2X5

KR Morrison, DT Miller

OSF project: https://osf.io/nhwv5/
Final report: https://osf.io/2jwi6/
R script to reproduce key finding: https://osf.io/hau4p/
DOI: 10.17605/OSF.IO/JHN4G

L Demany, W Trost, M Serman, C Semal

OSF project: https://osf.io/ta3j8/
Final report: https://osf.io/wx74s/
R script to reproduce key finding: https://osf.io/dw4xu/
DOI: 10.17605/OSF.IO/WM2A8

L Sahakyan, PF Delaney, ER Waldum

OSF project: https://osf.io/bzdr2/
Final report: https://osf.io/kcwfa/
R script to reproduce key finding: https://osf.io/2hasj/
DOI: 10.17605/OSF.IO/BK79Y

LE Williams, JA Bargh

OSF project: https://osf.io/vnsqg/
Final report: https://osf.io/7uh8g/
R script to reproduce key finding: https://osf.io/85bnh/
DOI: 10.17605/OSF.IO/P87CN

LS Colzato, MT Bajo, W van den Wildenberg, D Paolieri, S Nieuwenhuis, W La Heij, B Hommel

OSF project: https://osf.io/p9thw/
Final report: https://osf.io/a5ukz/
R script to reproduce key finding: https://osf.io/kb59n/
DOI: 10.17605/OSF.IO/NRA37

M Bassok, SF Pedigo, AT Oskarsson

OSF project: https://osf.io/sqim7/
Final report: https://osf.io/irgbs/
R script to reproduce key finding: https://osf.io/25vhj/
DOI: 10.17605/OSF.IO/3VA2J

M Couture, D Lafond, S Tremblay

OSF project: https://osf.io/k9gp6/
Final report: https://osf.io/qm5n6/
R script to reproduce key finding: https://osf.io/3zg7e/
DOI: 10.17605/OSF.IO/MGHVS

M Koo, A Fishbach

OSF project: https://osf.io/nr7d9/
Final report: https://osf.io/68m2c/
R script to reproduce key finding: https://osf.io/p5i9j/
DOI: 10.17605/OSF.IO/7CZWD

M Reynolds, D Besner

OSF project: https://osf.io/hasfu/
Final report: https://osf.io/fkcn5/
R script to reproduce key finding: https://osf.io/yscmg/
DOI: 10.17605/OSF.IO/RC2KZ

M Tamir, C Mitchell, JJ Gross

OSF project: https://osf.io/k4y9i/
Final report: https://osf.io/7i2tf/
R script to reproduce key finding: https://osf.io/mwgub/
DOI: 10.17605/OSF.IO/TR7FP

MD Henderson, Y de Liver, PM Gollwitzer

OSF project: https://osf.io/79dey/
Final report: https://osf.io/cjr7d/
R script to reproduce key finding: https://osf.io/b2ejv/
DOI: 10.17605/OSF.IO/45VWM

MJ Yap, DA Balota, CS Tse, D Besner

OSF project: https://osf.io/ahpik/
Final report: https://osf.io/dh4jx/
R script to reproduce key finding: https://osf.io/nuab4/
DOI: 10.17605/OSF.IO/397FH

N Epley, S Akalis, A Waytz, JT Cacioppo

OSF project: https://osf.io/yuybh/
Final report: https://osf.io/m5a2c/
R script to reproduce key finding: https://osf.io/utcr3/
DOI: 10.17605/OSF.IO/HT9DU

N Halevy, G Bornstein, L Sagiv

OSF project: https://osf.io/76qc5/
Final report: https://osf.io/sjwcd/
R script to reproduce key finding: https://osf.io/7xyi5/
DOI: 10.17605/OSF.IO/K82YB

N Janssen, FX Alario, A Caramazza

OSF project: https://osf.io/dncxa/
Final report: https://osf.io/e3ry5/
R script to reproduce key finding: https://osf.io/7cab3/
DOI: 10.17605/OSF.IO/QMPKY

N Janssen, W Schirm, BZ Mahon, A Caramazza

OSF project: https://osf.io/uhpyr/
Final report: https://osf.io/5p7i6/
R script to reproduce key finding: https://osf.io/iwaqf/
DOI: 10.17605/OSF.IO/8QRTD

N Shnabel, A Nadler

OSF project: https://osf.io/xse7q/
Final report: https://osf.io/fuj2c/
R script to reproduce key finding: https://osf.io/5bwva/
DOI: 10.17605/OSF.IO/3M7QW

NB Turk-Browne, PJ Isola, BJ Scholl, TA Treat

OSF project: https://osf.io/ujhlw/
Final report: https://osf.io/ktnmc/
R script to reproduce key finding: https://osf.io/gpvrm/
DOI: 10.17605/OSF.IO/CHF7M

NO Rule, N Ambady

OSF project: https://osf.io/r5gpv/
Final report: https://osf.io/4peq6
R script to reproduce key finding: https://osf.io/2bu9s/
DOI: 10.17605/OSF.IO/3UW96

P Bressan, D Stranieri

OSF project: https://osf.io/blcj6/
Final report: https://osf.io/7vriw/
Response from original author: https://osf.io/xcrm2/
R script to reproduce key finding: https://osf.io/2a5ru/
DOI: 10.17605/OSF.IO/J3CFM

P Bressan, D Stranieri (online)

OSF project: https://osf.io/blcj6/
Final report: https://osf.io/7vriw/
Response from original author: https://osf.io/xcrm2/
R script to reproduce key finding: https://osf.io/47cs8/
DOI: 10.17605/OSF.IO/J3CFM

P Fischer, S Schulz-Hardt, D Frey

OSF project: https://osf.io/v8vft/
Final report: https://osf.io/5afur/
R script to reproduce key finding: https://osf.io/bajxq/
DOI: 10.17605/OSF.IO/CY9V4

P Fischer, T Greitemeyer, D Frey

OSF project: https://osf.io/j8bpa/
Final report: https://osf.io/9pnct/
R script to reproduce key finding: https://osf.io/7htc9/
DOI: 10.17605/OSF.IO/E35Y2

PA Goff, CM Steele, PG Davies

OSF project: https://osf.io/abxcj/
Final report: https://osf.io/7q5us/
R script to reproduce key finding: https://osf.io/xfj5w/
DOI: 10.17605/OSF.IO/PKTMA

PA White

OSF project: https://osf.io/rhbqj/
Final report: https://osf.io/x7c9i/
R script to reproduce key finding: https://osf.io/ygh35/
DOI: 10.17605/OSF.IO/Y8NJT

PW Eastwick, EJ Finkel

OSF project: https://osf.io/ng6cc/
Final report: https://osf.io/5pjsn/
Response from original authors: https://osf.io/ph3ar/
R script to reproduce key finding: https://osf.io/x3hbe/
DOI: 10.17605/OSF.IO/ZDW87

S Farrell

OSF project: https://osf.io/swrhy/
Final report: https://osf.io/tqf2u/
Response from original author: https://osf.io/tpsyd/
R script to reproduce key finding: https://osf.io/nmpdc/
DOI: 10.17605/OSF.IO/BVU64

S Forti, GW Humphreys

OSF project: https://osf.io/tf8ky/
Final report: https://osf.io/nhqgs/
R script to reproduce key finding: https://osf.io/jknef/
DOI: 10.17605/OSF.IO/FJ6E8

S Pacton, P Perruchet

OSF project: https://osf.io/vmz2e/
Final report: https://osf.io/asn7w/
R script to reproduce key finding: https://osf.io/3kn4c/
DOI: 10.17605/OSF.IO/FSUT4

S Schnall, J Benton, S Harvey

OSF project: https://osf.io/apidb/
Final report: https://osf.io/2dem3
R script to reproduce key finding: https://osf.io/pkaqw/
DOI: 10.17605/OSF.IO/7XUPR

SE Palmer, T Ghose

OSF project: https://osf.io/0aifq/
Final report: https://osf.io/en42q/
R script to reproduce key finding: https://osf.io/jnqky/
DOI: 10.17605/OSF.IO/GKNAU

SJ Heine, EE Buchtel, A Norenzayan

OSF project: https://osf.io/siaqe/
Final report: https://osf.io/g4hn3/
R script to reproduce key finding: https://osf.io/akv6y/
DOI: 10.17605/OSF.IO/PUA6S

SK Moeller, MD Robinson, DL Zabelina

OSF project: https://osf.io/tg2wd/
Final report: https://osf.io/7dybc/
R script to reproduce key finding: https://osf.io/uevha/
DOI: 10.17605/OSF.IO/76J48

SL Murray, JL Derrick, S Leder, JG Holmes

OSF project: https://osf.io/cxmf6/
Final report: https://osf.io/3hndq/
R script to reproduce key finding: https://osf.io/9ue7j/
DOI: 10.17605/OSF.IO/T75E3

SM McCrea

OSF project: https://osf.io/mua6d/
Final report: https://osf.io/ytxgr/
R script to reproduce key finding: https://osf.io/7pdh8/
DOI: 10.17605/OSF.IO/2KJGZ

T Goschke, G Dreisbach

OSF project: https://osf.io/bk53t/
Final report: https://osf.io/pnius/
R script to reproduce key finding: https://osf.io/mvdsw/
DOI: 10.17605/OSF.IO/RKQW2

T Makovski, R Sussman, YV Jiang

OSF project: https://osf.io/0pxro/
Final report: https://osf.io/xtcuv/
R script to reproduce key finding: https://osf.io/saq6x/
DOI: 10.17605/OSF.IO/BHNKQ

TJ Pleskac

OSF project: https://osf.io/38ges/
Final report: https://osf.io/gyn9e/
R script to reproduce key finding: https://osf.io/scqrd/
DOI: 10.17605/OSF.IO/3AMJ4

V LoBue, JS DeLoache

OSF project: https://osf.io/sd7kg/
Final report: https://osf.io/5ygej/
Response from original author: https://osf.io/j39gn/
R script to reproduce key finding: https://osf.io/p67kr/
DOI: 10.17605/OSF.IO/CSM3D

V Purdie-Vaughns, CM Steele, PG Davies, R Ditlmann, JR Crosby

OSF project: https://osf.io/etg7c/
Final report: https://osf.io/3rxvs/
R script to reproduce key finding: https://osf.io/5vdrg/
DOI: 10.17605/OSF.IO/2R7NK

X Dai, K Wertenbroch, CM Brendl

OSF project: https://osf.io/q7f6w/
Final report: https://osf.io/js7gd/
Response from original authors: https://osf.io/cdrsv/
R script to reproduce key finding: https://osf.io/aigrv/
DOI: 10.17605/OSF.IO/P6JXM

Z Estes, M Verges, LW Barsalou

OSF project: https://osf.io/vwnit/
Final report: https://osf.io/b7zek/
Response from original author: https://osf.io/g3qt5/
R script to reproduce key finding: https://osf.io/eqp4w/
DOI: 10.17605/OSF.IO/Z6QW2


3. Las causas estructurales: Por qué la ciencia se rompió

La crisis de replicación no es atribuible únicamente a errores metodológicos individuales, sino a un sistema de incentivos perversos que premia la novedad sobre la verificación. El mantra académico «publicar o perecer» (publish or perish) crea presiones sistémicas hacia resultados positivos y sorprendentes.

3.1 P-hacking y HARKing

El p-hacking —manipular análisis estadísticos hasta obtener un valor p < 0.05— y el HARKing (Hypothesizing After the Results are Known, hipotetizar después de conocer los resultados) son prácticas endémicas facilitadas por la flexibilidad analítica y la falta de preregistro. Investigadores pueden cambiar variables dependientes, eliminar outliers post-hoc o subdividir muestras hasta que los datos «cooperen», sin que esto sea visible en el artículo final.

3.2 Muestras pequeñas y potencia estadística insuficiente

Muchos de los estudios fallidos utilizaban muestras de 30-50 participantes, insuficientes para detectar efectos pequeños pero reales de la psicología social. El estudio original de power posing utilizó solo 42 participantes; el de priming social utilizó menos de 30. Con muestras tan pequeñas, únicamente se detectan efectos grandes, que son estadísticamente raros en conducta humana.

3.3 Sesgo de publicación y asimetría de la atención

Las revistas prefieren publicar hallazgos positivos y sorprendentes sobre replicaciones nulas o fallidas. Un estudio que «descubre» que la postura cambia hormonas genera portadas; uno que dice «intentamos replicarlo con 500 personas y no pasó nada» es intrascendente para la prensa generalista. Esta asimetría significa que los errores permanecen en la literatura mientras las correcciones quedan invisibilizadas.

3.4 Inercia de los libros de texto y «zombis» intelectuales

A pesar de las replicaciones fallidas, teorías como el SPE, power posing y el agotamiento del ego continúan enseñándose en universidades porque actualizar currículos es lento, y estas narrativas son «pedagógicamente atractivas» —ofrecen historias lineales con moralejas claras que son fáciles de explicar en exámenes. En el mundo empresarial y del coaching, estas ideas son rentables, creando «zombis intelectuales» que sobreviven a su muerte científica porque sirven intereses económicos.


4. Las soluciones: Hacia una ciencia abierta

La crisis ha impulsado reformas estructurales que podrían constituir la mayor revolución metodológica desde la adopción de la significancia estadística.

4.1 Preregistro y registros vinculados (registered reports)

El preregistro obliga a los investigadores a declarar sus hipótesis, diseño y análisis planeados antes de recolectar datos, eliminando la posibilidad de HARKing y p-hacking. Las revistas como Nature Human Behaviour ahora aceptan Registered Reports, donde la aceptación para publicación ocurre antes de conocer los resultados, basándose únicamente en la calidad metodológica.

4.2 Ciencia abierta y transparencia

La disponibilidad de datos, materiales y código de análisis es ahora requisito en muchas revistas. El proyecto Open Science Framework (OSF) ha facilitado el almacenamiento de miles de estudios con sus datos brutos, permitiendo verificaciones independientes.

4.3 Colaboraciones masivas: Many Labs y el Psychological Science Accelerator

Los proyectos Many Labs demostraron que la replicación colaborativa a gran escala es factible. Su sucesor, el Psychological Science Accelerator (PSA), funciona como un «CERN para la psicología» —una red permanente de más de 500 laboratorios en 72 países que realizan estudios masivos con muestras diversas. Este modelo elimina la dependencia de muestras de estudiantes universitarios de países occidentales (WEIRD: Western, Educated, Industrialized, Rich, Democratic).

4.4 Predicción de replicabilidad y metaciencia

El proyecto SCORE desarrolló algoritmos de inteligencia artificial y mercados de predicción donde expertos humanos evalúan la probabilidad de replicación de estudios antes de que estos sean replicados físicamente. Sorprendentemente, tanto los expertos como los algoritmos predicen correctamente aproximadamente el 71% de las replicaciones, sugiriendo que la credibilidad científica puede evaluarse prospectivamente mediante características metodológicas transparentes.


5. Epistemología del error: La ciencia como autocorrección

El caso más humanizador de esta crisis involucra a Daniel Kahneman, premio Nobel de Economía 2002 y autor de Pensar rápido, pensar despacio. Kahneman incluyó extensas discusiones sobre priming social en su best-seller mundial, basándose en los estudios de Bargh. En 2017, admitió públicamente: «Fui demasiado confiado… puse demasiada fe en estudios con muestras pequeñas. Las pruebas ahora son abrumadoramente negativas».

Esta admisión ilustra una verdad fundamental: la ciencia no es un acervo de verdades inmutables sino un proceso de error y corrección. La «crisis» es, en realidad, la ciencia funcionando correctamente —detectando y expurgando errores acumulados.

Sin embargo, la velocidad de corrección es crucial. Como señala Nosek, «la innovación sin verificación no nos lleva a ninguna parte». La cultura actual, que valora la novedad sobre la robustez, crea acervos de conocimiento provisional que pueden permanecer décadas antes de ser corregidos, especialmente cuando son narrativamente atractivas.


6. Conclusión: Más allá de la crisis

La crisis de replicación ha demostrado que muchos fenómenos psicológicos que considerábamos «leyes» —desde el efecto Dunning-Kruger hasta la transformación situacional de la personalidad— eran espejismos estadísticos, artefactos de muestras pequeñas o narrativas coreografiadas. Pero también ha provocado reformas institucionales sin precedentes.

El proyecto SCORE y sus predecesores han establecido que la credibilidad científica es multidimensional: un estudio puede ser reproducible (mismo análisis, mismos datos) pero no replicable (nuevos datos, mismo protocolo). Esta complejidad exige que tanto científicos como periodistas y formuladores de políticas abandonen la mentalidad de «descubrimientos espectaculares» y adopten una epistemología de la duda constructiva.

Para el público general, la lección es el escepticismo saludable: cuando un estudio psicológico confirma nuestras intuiciones de manera demasiado perfecta —cuando nos dice que somos completamente moldeables por situaciones o que simples posturas cambian nuestra bioquímica— deberíamos preguntarnos si ha sido replicado independientemente con muestras grandes y diversas.

Para la academia, el desafío es estructural: reconfigurar los incentivos de carrera para valorar la replicación y la calidad metodológica tanto como la novedad. Iniciativas como los Registered Reports y el PSA ofrecen modelos viables.

Finalmente, debemos reconocer que la mente humana es más compleja de lo que permiten los experimentos de laboratorio de 30 minutos con estudiantes universitarios. El fracaso de estas teorías simplistas no significa que la psicología sea imposible, sino que requiere métodos más sofisticados, muestras más diversas y una humildad epistemológica que acepte que entender la conducta humana es difícil, lento y nunca definitivo.

La crisis de replicación no es el fin de la ciencia social, sino su adolescencia: un momento doloroso pero necesario de maduración hacia una disciplina más robusta, transparente y, en última instancia, útil para la comprensión de la condición humana.


Referencias

Balafoutas, L., Celse, J., Karakostas, A., & Umashev, N. (2024). Incentives and the replication crisis in social sciences: A critical review. Journal of Behavioral and Experimental Economics, 114, 102327. https://doi.org/10.1016/j.socec.2024.102327

Baumeister, R. F., Vohs, K. D., & Tice, D. M. (2024). Self-control and limited willpower: Current status of ego depletion theory and research. Current Opinion in Psychology. https://doi.org/10.1016/j.copsyc.2024.101652

Carney, D. R., Cuddy, A. J., & Yap, A. J. (2010). Power posing: Brief nonverbal displays affect neuroendocrine levels and risk tolerance. Psychological Science, 21(10), 1363–1368. https://doi.org/10.1177/0956797610383437

Cesario, J., & Johnson, D. J. (2018). Power posing is fit for purpose: Revisiting the evidence behind the most-watched TED talk. Social Psychological and Personality Science.

Dang, J. (2016). Testing the role of glucose in self-control: A meta-analysis. Appetite, 107, 222–230.

Dweck, C. S. (2006). Mindset: The new psychology of success. Random House.

Gignac, G. E., & Zajenkowski, M. (2020). The Dunning-Kruger effect is mostly a statistical artefact: Valid approaches to testing the hypothesis with individual differences data. Intelligence, 80, 101449.

Hagger, M. S., et al. (2016). A multi-lab pre-registered replication of the ego-depletion effect. Perspectives on Psychological Science, 11(4), 546–573.

Ioannidis, J. P. A. (2005). Why most published research findings are false. PLOS Medicine, 2(8), e124.

Jones, N. (2026). Half of social-science studies fail replication test in years-long project. Nature. https://doi.org/10.1038/d41586-026-00955-5

Kruger, J., & Dunning, D. (1999). Unskilled and unaware of it: How difficulties in recognizing one’s own incompetence lead to inflated self-assessments. Journal of Personality and Social Psychology, 77(6), 1121–1134.

Le Texier, T. (2019). Debunking the Stanford Prison Experiment. American Psychologist, 74(7), 823–839. https://doi.org/10.1037/amp0000401

Nosek, B. A., et al. (2022). Replicability of social-behavioral science: A meta-replication study. Nature, 652, 143–150.

Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716.

Ranehill, E., Dreber, A., Johannesson, M., Leiberg, S., Sul, S., & Weber, R. A. (2015). Assessing the robustness of power posing: No effect on hormones and risk tolerance in a large sample of men and women. Psychological Science, 26(5), 653–656.

Sisk, V. F., Burgoyne, A. P., Sun, J., Taylor, J., & Macnamara, B. N. (2018). To what extent and under which circumstances are growth mind-sets important to academic achievement? Two meta-analyses. Psychological Science, 29(4), 549–571.

Tyner, A. H., et al. (2026). Reproducibility, robustness, and replicability in social and behavioral science claims. Nature, 652, 143–150.

Watts, T. W., Duncan, G. J., & Quan, H. (2018). Revisiting the marshmallow test: A conceptual replication investigating links between early delay of gratification and later outcomes. Developmental Psychology, 54(7), 1399–1408.

Williamson, E. (2022). After 10 years, ‘Many Labs’ comes to an end – but its success is replicable. UVA Today. https://news.virginia.edu/content/after-10-years-many-labs-comes-end-its-success-replicable

Zimbardo, P. G. (2007). The Lucifer effect: Understanding how good people turn evil. Random House.


Nota del autor: Este análisis fue elaborado en abril de 2026 utilizando las fuentes más recientes disponibles, incluyendo los resultados finales del proyecto SCORE publicados en Nature el 1 de abril de 2026, y las investigaciones de archivos sobre el Experimento de Stanford actualizadas hasta marzo de 2025.

Deja una respuesta