Bixonimania: cuando la IA inventa con tono experto

Una investigadora sueca inventó una enfermedad ocular y subió papers obviamente falsos a un servidor de preprints. En semanas, ChatGPT, Gemini, Copilot y Perplexity la describían como condición médica real. Una revista peer-reviewed llegó a citarla como fuente. La historia es viral por los detalles ridículos, pero el problema que abre es mucho más grande: muestra cómo las IAs generativas inventan información con tono experto, cómo los humanos les creemos, y por qué esa cadena de confianza ciega cambia las reglas del aprendizaje en el aula.

Bixonimania no existe. Es una enfermedad ocular ficticia inventada en 2024 por Almira Osmanovic Thunström, investigadora médica de la Universidad de Gothenburg, como experimento para evaluar cómo las IAs procesan información médica falsa. Lo que pasó después es la mejor radiografía disponible de un problema que excede la medicina: cómo los modelos de lenguaje fabrican certezas, cómo esas certezas se propagan, y por qué eso debería ocupar el centro de la conversación sobre IA en educación.

La historia de bixonimania, en orden

Una enfermedad diseñada para ser detectada

Thunström inventó la condición y le dio síntomas: hiperpigmentación periorbital, ojos rojos, picazón, causada supuestamente por la luz azul de las pantallas. Subió dos papers académicos sobre ella a un servidor de preprints. Los papers estaban llenos de chistes obvios.

La universidad ficticia se llamaba “Asteria Horizon University en Nova City, California”. Agradecían a “Professor Maria Bohm de The Starfleet Academy, a bordo del USS Enterprise”. Mencionaban financiamiento de “la Professor Sideshow Bob Foundation for its work in advanced trickery”. El sufijo “-mania” en el propio nombre era una pista deliberada: en medicina se usa en psiquiatría, no en oftalmología. El autor principal, “Lazljiv Izgubljenovic”, era una persona inventada cuya foto fue generada con IA. Uno de los papers literalmente decía: “este paper entero está inventado”. El otro hablaba de “cincuenta individuos inventados de entre 20 y 50 años” (Nature, abril 2026).

Cualquier humano que leyera los papers con mediana atención iba a darse cuenta.

Lo que ChatGPT, Gemini, Copilot y Perplexity hicieron con eso

Las IAs no se dieron cuenta. En semanas, ChatGPT, Gemini, Copilot y Perplexity hablaban de bixonimania como si fuera una condición médica establecida. Perplexity afirmaba con seguridad que afectaba a una de cada noventa mil personas (número inventado por la propia IA). ChatGPT confirmaba a usuarios que sus síntomas eran compatibles con bixonimania y les recomendaba ver a un oftalmólogo (Nurse.org, abril 2026).

Cuando Nature contactó a OpenAI durante la investigación, ChatGPT brevemente reconoció que la condición “probablemente es una etiqueta inventada, marginal o pseudocientífica”. Pocos días después, vuelto a consultar, afirmaba que era real. La misma IA dando respuestas opuestas con la misma seguridad.

Cuando una alucinación pasa a ser literatura científica

Lo que empezó como un experimento en un servidor de preprints terminó en una revista peer-reviewed. Tres investigadores del Maharishi Markandeshwar Institute of Medical Sciences and Research, en Mullana, India, publicaron un paper en Cureus, una revista de Springer Nature, citando uno de los preprints falsos como fuente legítima. El paper afirmaba: “la bixonimania es una forma emergente de melanosis periorbital ligada a la exposición a luz azul; la investigación sobre el mecanismo está en curso”.

La retractación oficial llegó el 30 de marzo de 2026. Pero la cadena ya se había completado: alucinación de IA, output repetido, cita por humanos en literatura científica, paper indexado en bases de datos. Cada paso aumentó la apariencia de legitimidad de algo que nunca existió.

Lo que bixonimania nos enseña sobre cómo usamos la IA

Por qué las IAs alucinan más cuando el texto parece más serio

En enero de 2026, mientras todo esto pasaba, The Lancet Digital Health publicó un estudio liderado por Mahmud Omar, investigador del Windreich Department of Artificial Intelligence and Human Health del Mount Sinai Health System en Nueva York. El equipo analizó la susceptibilidad de veinte modelos de lenguaje a la desinformación médica, comparando cómo respondían cuando la información falsa estaba formateada como nota clínica versus cuando estaba formateada como posteo de redes sociales.

El resultado va en contra del sentido común. Las IAs alucinan más cuando el texto que procesan tiene formato profesional y clínico. No menos. Más.

Las alucinaciones de IA son respuestas en las que un modelo de lenguaje genera contenido falso con apariencia de verdadero, prediciendo qué palabra sigue a la anterior sin verificar si la afirmación corresponde a hechos reales.

“Cuando el texto parece profesional y está escrito como escribe un médico, aumenta la tasa de alucinación.” — Mahmud Omar

La intuición común es que la IA falla cuando le hablamos mal o le damos contexto confuso. Resulta al revés. El formato profesional, los términos técnicos, la estructura académica funcionan como una credencial falsa que activa elaboración con autoridad. La IA no distingue entre formato y contenido. Lee la forma, asume el fondo y completa.

Eso explica por qué los papers de bixonimania, llenos de chistes pero con estructura académica formal, fueron tomados por reales: el formato pesó más que el contenido.

Por qué los humanos también caímos

Acá hay un dato incómodo. Bixonimania no engañó solo a las IAs. Engañó a tres investigadores médicos que citaron el preprint en un paper formal. Engañó al sistema de revisión de Cureus, que tardó casi dos años en detectarlo. Engañó a las bases de datos que indexaron el paper antes de la retractación.

Los humanos, incluso los formados, confiamos en lo que la IA produce cuando viene con formato profesional. Y la IA confía en lo que otros humanos publicaron cuando viene con formato profesional. La confianza ciega va en las dos direcciones, y eso retroalimenta el problema.

Alex Ruani, investigadora doctoral en desinformación en salud en University College London, lo resumió así para Nature: “Si el proceso científico mismo y los sistemas que lo sostienen no están capturando y filtrando este tipo de contenido, estamos en problemas”.

El problema central: la IA no señala incertidumbre

Una respuesta incorrecta con tono dubitativo habilita la sospecha y la verificación. Una respuesta incorrecta con tono experto clausura la pregunta. Los modelos de IA generativa están diseñados para sonar seguros, no para señalar incertidumbre. Eso es una decisión de diseño, no una falla técnica.

Una IA que dijera “no estoy seguro, esto podría estar mal, conviene verificar” sería más honesta pero menos atractiva comercialmente. La fluidez, la seguridad, el tono experto son las características que hacen que el usuario confíe. Y la confianza es lo que multiplica el daño cuando la respuesta es inventada.

Lo que esto cambia en el aprendizaje de los chicos

El problema no es ChatGPT: es cómo aprenden los chicos hoy

Cuando un alumno abre ChatGPT para resolver una tarea, no está buscando información para evaluar críticamente. Está buscando una respuesta. Y la IA le entrega exactamente eso: una respuesta, con tono experto, sin marcadores de incertidumbre, sin pistas sobre qué partes podrían estar mal.

Si investigadores con criterio clínico cayeron en bixonimania, vale preguntarse qué pasa cuando un chico de doce años le pregunta a ChatGPT sobre la Revolución de Mayo, sobre Kafka o sobre cómo funciona el ciclo del agua. La IA no le va a decir “no sé”. Le va a contestar con seguridad. Y a veces va a estar bien, y a veces no.

La diferencia con el médico es brutal. El médico tiene marco para sospechar: conoce el sufijo “-mania”, sabe que Starfleet Academy no existe, puede dudar de una prevalencia inventada. El chico no tiene esos anclajes en ningún tema. Y la IA le responde sobre todo: historia, biología, literatura, matemática, filosofía, ética. Cada respuesta con la misma voz.

La desinformación que no se ve

El problema de bixonimania llegó a Nature porque era ridícula y porque alguien lo expuso. Lo que no llega a Nature son las miles de respuestas medio inventadas que las IAs dan todos los días sobre temas escolares: una fecha levemente desplazada, una atribución incorrecta, un mecanismo simplificado al punto del error, un autor citado por una obra que nunca escribió.

Ninguno de esos errores tiene la magnitud para hacer noticia. Pero todos juntos están formando lo que los chicos creen que saben. Y como vienen con tono experto, no se cuestionan.

Cuando esa información mal formada se repite, se comparte entre compañeros, se copia en tareas, se cita en presentaciones, empieza a circular como verdad establecida. La cadena que vimos con bixonimania (alucinación → output repetido → cita formal → indexación) ocurre en escala doméstica todos los días, sin nadie verificando.

Lo que la escuela puede hacer (y no está haciendo)

Prohibir IA no funciona. Los chicos ya la usan desde el celular antes de empezar la tarea. Pero entregar el aprendizaje a una IA generalista sin marco tampoco funciona, porque expone al alumno a la dinámica que mostró bixonimania.

Lo que la escuela puede hacer es lo que históricamente hizo bien: enseñar a evaluar fuentes, a sospechar del tono experto, a verificar afirmaciones, a distinguir entre lo que parece autoritativo y lo que está realmente fundamentado. Eso requiere dos cosas. Primero, formar a los chicos en alfabetización crítica de IA. Segundo, usar herramientas que estén diseñadas para acompañar ese proceso, no para reemplazarlo con respuestas servidas.

Cómo cambia el aula con una IA pedagógica

Una IA generalista responde con autoridad. Una IA pedagógica está diseñada para hacer otra cosa: enseñar a pensar, no servir respuestas. La diferencia no es de marketing. Es de arquitectura.

El modo socrático interrumpe la cadena de confianza ciega

En Auroria, la IA acompaña al alumno a llegar a una respuesta en vez de entregarla. Cuando un chico pregunta sobre un tema, lo más probable es que Auroria le devuelva otra pregunta, una pista, un ángulo desde el cual mirar. La confianza ya no se deposita en el output de la IA, sino en el proceso de razonamiento del propio alumno.

Esto importa especialmente después del caso bixonimania. Una IA que afirma con seguridad puede inventar enfermedades con convicción clínica. Una IA que pregunta no puede: no está afirmando, está habilitando que el alumno construya.

Filtros institucionales que limitan qué responde la IA

Los filtros de Auroria limitan el alcance de las respuestas a lo verificado por la institución, adaptado al nivel evolutivo del estudiante. La IA no improvisa sobre temas que la escuela no le habilitó. La escuela tiene control sobre el corpus desde el cual la IA responde, en lugar de exponer al alumno a un modelo entrenado con todo internet (foros, blogs, papers reales mezclados con papers inventados como los de bixonimania).

Contexto que reemplaza el promedio estadístico de internet

Las respuestas reflejan el proyecto educativo del colegio, sus valores y su línea pedagógica. No el caos editorial de la web. Una IA que conoce el PEI de la escuela responde dentro de un marco coherente, no procesando indistintamente todo el contenido disponible online.

No es una garantía absoluta. Ninguna IA lo es. Pero es la diferencia entre entregar un chico a un sistema que alucina con tono experto y entregarle una herramienta diseñada para acompañar el aprendizaje dentro de un marco que la escuela controla.

Conclusión

Bixonimania no fue solo un experimento gracioso. Fue una demostración pública de cómo funciona la cadena de confianza ciega entre IAs generativas y humanos. Una enfermedad inventada con chistes explícitos se convirtió en condición médica creída por las cuatro IAs principales, citada en una revista peer-reviewed, e indexada en bases de datos. Si eso pasó con profesionales médicos como audiencia, vale preguntarse qué está pasando todos los días en aulas donde los chicos consultan a esas mismas IAs sin marco, sin docente al lado, sin nadie verificando.

La pregunta no es si la IA va a estar en las aulas. Ya está. La pregunta es con qué criterio se la integra antes de que la integren ellos por su cuenta. Y es, sobre todo, cómo formamos a los chicos para que entiendan que la confianza ciega en la respuesta de una IA es exactamente lo opuesto al pensamiento crítico que la escuela busca formar.

Sobre Auroria

Auroria es la primera plataforma de inteligencia artificial pedagógica desarrollada en Argentina. Está diseñada para que las escuelas integren IA con criterio, protegiendo el desarrollo cognitivo y emocional de los estudiantes, y devolviendo el control institucional a quienes educan. Incluye filtros por edad, modo socrático, alertas tempranas de riesgo emocional y personalización institucional alineada al PEI. Si forman parte de una institución educativa y quieren conocer cómo implementar Auroria, pueden escribirnos a info@auroria.com.ar o agendar una demo.

Preguntas frecuentes sobre bixonimania y alucinaciones de IA en educación

¿Qué es bixonimania?

Una enfermedad ocular ficticia inventada por Almira Osmanovic Thunström, investigadora médica de la Universidad de Gothenburg, como experimento para evaluar cómo las IAs procesan información médica. Supuestamente causaba hiperpigmentación periorbital por exposición a luz azul de pantallas. Los papers que la describían tenían señales obvias de ser falsos, incluida la frase explícita “este paper entero está inventado”. A pesar de eso, ChatGPT, Gemini, Copilot y Perplexity la dieron por real.

¿Por qué las IAs dieron por real una enfermedad inventada?

Las IAs generativas producen respuestas prediciendo secuencias de palabras a partir de patrones aprendidos. Cuando esos patrones imitan literatura médica profesional, el modelo genera respuestas con tono médico autoritativo sin verificar la veracidad de la fuente. La forma del texto (formato académico, terminología técnica) pesó más que el contenido, que era absurdo.

¿Qué son las alucinaciones de IA?

Son respuestas en las que un modelo de lenguaje genera contenido falso con apariencia de verdadero. La IA no miente intencionalmente: predice qué palabra sigue a la anterior sin verificar si la afirmación corresponde a hechos reales. El problema crítico es que las alucinaciones llegan con el mismo tono autoritativo que las respuestas correctas, lo que hace que sean difíciles de detectar para quien no tiene marco previo sobre el tema.

¿Es cierto que las IAs alucinan más con texto profesional?

Sí. Un estudio liderado por Mahmud Omar, del Mount Sinai Health System en Nueva York, publicado en The Lancet Digital Health en enero de 2026, analizó veinte modelos de lenguaje y encontró que las tasas de alucinación aumentan cuando el texto procesado tiene formato clínico o académico, comparado con texto de redes sociales. El formato profesional funciona como una falsa credencial que activa elaboración con autoridad.

¿Qué pasó con el paper que citó bixonimania como real?

Tres investigadores del Maharishi Markandeshwar Institute of Medical Sciences and Research en India publicaron un paper en Cureus, revista peer-reviewed de Springer Nature, que citaba uno de los preprints falsos como fuente legítima. El paper fue retractado oficialmente el 30 de marzo de 2026, después de que la revista identificara la cita a una enfermedad ficticia.

¿Por qué un alumno es más vulnerable a las alucinaciones de IA que un adulto?

Porque no tiene marco. Un adulto con formación específica puede sospechar cuando una IA inventa una fecha, un mecanismo o una atribución. Un alumno que pregunta sobre Kafka, sobre la Revolución de Mayo o sobre el ciclo del agua no tiene cómo evaluar si lo que la IA responde es preciso, está sesgado o está completamente inventado. La IA responde con la misma seguridad en los tres casos.

¿Cómo afecta esto al aprendizaje en el aula?

Las IAs generativas no señalan incertidumbre: responden todo con tono experto. Cuando un alumno consulta a ChatGPT sobre un tema curricular, recibe una respuesta que parece autoritativa, sin pistas sobre qué partes podrían estar mal. Errores chicos repetidos a lo largo del año forman lo que el chico cree que sabe. La escuela necesita enseñar a sospechar del tono experto y a verificar afirmaciones, no solo a buscar respuestas.

¿Qué diferencia hay entre una IA generalista y una IA pedagógica para uso escolar?

Una IA generalista (como ChatGPT, Gemini o Copilot) está diseñada para responder con autoridad sobre cualquier tema, sin marco institucional ni filtros por edad. Una IA pedagógica, como Auroria, está diseñada para enseñar a pensar: usa modo socrático, filtros por edad y currícula, y se personaliza según el proyecto educativo de cada institución. La diferencia no es de marketing: es de arquitectura.

¿Cómo se previene este tipo de error en una escuela?

Con dos cosas combinadas. Primero, formar a los chicos en alfabetización crítica de IA: enseñarles a sospechar, a verificar, a evaluar fuentes. Segundo, usar herramientas pedagógicas diseñadas con filtros por edad, contexto curricular limitado, modo socrático y supervisión institucional. Una IA abierta entregada sin marco a un alumno funciona como una enciclopedia sin moderación: a veces acierta, a veces inventa, y el alumno no tiene cómo distinguir la diferencia.

Bixonimania: la enfermedad falsa que las IAs dieron por real, y lo que nos dice sobre cómo aprenden los chicos hoy