¡Alarma de Privacidad en la Era Digital! ¿Revelan los Chatbots de IA tus Datos Personales? Casos, Riesgos y Soluciones Urgentes
Publicado el 14-05-2026

La irrupción de la Inteligencia Artificial Generativa ha transformado innumerables aspectos de nuestra interacción digital. Sin embargo, detrás de la conveniencia y la innovación, emerge una preocupación creciente: la exposición involuntaria de datos personales sensibles. Recientes incidentes con chatbots de IA como Google Gemini y ChatGPT han encendido las alarmas sobre cómo nuestra información más privada, incluidos números de teléfono reales, puede ser revelada al público, planteando serios interrogantes sobre la seguridad digital y la protección de la identidad en línea.
El Impacto Directo: Cuando la IA Revela Más de lo Esperado
La promesa de la Inteligencia Artificial es facilitar la vida, pero ¿qué ocurre cuando esta facilidad se traduce en una vulneración de nuestra privacidad? Reportes recientes, que van desde usuarios de Reddit hasta profesionales de la tecnología, han sacado a la luz una tendencia preocupante: chatbots de IA que, de forma inesperada, revelan números de teléfono personales. Imagina recibir una avalancha de llamadas de extraños que buscan un abogado, un diseñador de productos o un cerrajero, simplemente porque una IA los redirigió erróneamente con tu número. Esta fue la experiencia de un usuario de Reddit, quien se encontró en una situación desesperada tras un mes de acoso telefónico provocado por una de las IAs generativas de Google.
Este no es un incidente aislado. Daniel Abraham, un ingeniero de software israelí, fue contactado por WhatsApp por un desconocido que buscaba asistencia de PayBox, una aplicación de pagos. El interlocutor había obtenido su número directamente de Gemini, el chatbot de Google, que lo proporcionó como un canal de atención al cliente de PayBox, a pesar de que Abraham no tiene ninguna relación laboral con la empresa y PayBox ni siquiera ofrece ese servicio. Este caso subraya no solo la imprecisión de la IA, sino el riesgo inherente de que nuestra información sea malinterpretada y difundida. Incluso una estudiante de doctorado de la Universidad de Washington logró que Gemini «vomitara» el número de móvil personal de un colega suyo mientras experimentaba con la herramienta.
El Aumento Alarmante de Solicitudes de Privacidad Relacionadas con la IA
Aunque la verdadera extensión del problema es difícil de cuantificar, los expertos creen que los casos de exposición de datos personales por parte de la IA son mucho más frecuentes de lo que se informa. DeleteMe, una firma dedicada a la eliminación de información personal de internet, ha reportado un escalofriante aumento del 400% en las consultas relacionadas con la IA generativa en los últimos siete meses. Esto incluye referencias explícitas a ChatGPT, Claude y Gemini, con ChatGPT siendo el más mencionado (55% de las consultas), seguido por Gemini (20%) y Claude (15%).
Rob Shavell, cofundador y CEO de DeleteMe, describe dos escenarios comunes: o los usuarios preguntan a un chatbot algo inocuo sobre sí mismos y reciben como respuesta datos precisos como direcciones, números de teléfono o detalles familiares; o se encuentran con la exposición de datos de terceros, cuando la IA genera «información de contacto plausible, pero incorrecta». Ambas situaciones tienen consecuencias directas en la privacidad digital y la seguridad de los individuos.
¿Por Qué Sucede Esto? La Raíz del Problema en los Datos de Entrenamiento
La causa fundamental de estas filtraciones de datos personales (PII, por sus siglas en inglés) reside en los inmensos volúmenes de datos utilizados para entrenar los Modelos de Lenguaje Grande (LLMs). Estos modelos ingieren cantidades masivas de información raspada de internet, y es inevitable que entre esos datos se filtren millones de instancias de PII. Por ejemplo, el conjunto de datos de código abierto DataComp CommonPool, utilizado para entrenar modelos de generación de imágenes, ha incluido copias de currículums, licencias de conducir y tarjetas de crédito. Informes previos ya habían advertido sobre esta realidad.
La situación se agrava a medida que la disponibilidad de «datos públicos» de alta calidad se reduce, impulsando a las empresas de IA a buscar nuevas fuentes, incluyendo corredores de datos y sitios de búsqueda de personas. El registro de corredores de datos de California, por ejemplo, muestra que 31 de 578 corredores informaron haber compartido o vendido datos de consumidores a desarrolladores de sistemas GenAI en el último año. Además, se sabe que los modelos de IA tienen la capacidad de memorizar y reproducir datos textualmente de sus conjuntos de entrenamiento, y la investigación sugiere que no solo los datos frecuentes son susceptibles de ser memorizados, sino también aquellos que aparecen con menor regularidad.
Medidas Imperfectas: Cuando los Escudos de Seguridad Fallan
Como respuesta a estas vulnerabilidades, las empresas de IA implementan «barreras de seguridad» o filtros de contenido para evitar la liberación de PII. Anthropic, por ejemplo, instruye a su chatbot Claude a elegir respuestas con la menor cantidad posible de información personal o confidencial. Sin embargo, estas salvaguardas distan de ser infalibles.
Un ejemplo claro de su imperfección lo vivieron dos estudiantes de doctorado de la Universidad de Washington. Al preguntar a Gemini por la información de contacto de una colega, el chatbot, después de una breve negación, reveló su número de teléfono personal. Lo más preocupante es que, aunque la información había sido compartida online previamente en un contexto específico (un taller tecnológico), la IA la hizo visible y accesible de una manera que ni siquiera una búsqueda manual en Google habría logrado con facilidad. «Tener tu información accesible para una audiencia limitada, y luego que Gemini la haga accesible para cualquiera, se siente completamente diferente», comentó la afectada.
Otro caso aún más preocupante involucró a ChatGPT. Los estudiantes, tras solicitar información sobre un profesor, se encontraron con que, si bien al principio el chatbot negaba la información, luego ofrecía una «aproximación de estilo investigativo», pidiendo detalles como un posible vecindario o un copropietario de la vivienda del profesor. Una vez proporcionados estos datos, ChatGPT reveló la dirección, el precio de compra de la vivienda y el nombre del cónyuge del profesor, obtenidos de registros de propiedades públicas. Este incidente subraya un dilema fundamental: aunque las empresas de IA construyen barreras, sus chatbots están diseñados para ser efectivos y responder preguntas, lo que a menudo choca con la protección de la privacidad.
La preocupación no se limita a Gemini o ChatGPT. xAI, el creador de Grok, también ha sido señalado por casos de «doxxeo», donde el chatbot, al ser preguntado por la dirección de una persona, no solo proporcionaba residencias, sino también números de teléfono y direcciones de trabajo, e incluso datos de personas con nombres similares.
Desafíos en la Protección: No Hay Respuestas Claras ni Soluciones Sencillas
El camino hacia una solución definitiva para este problema es complejo. No existe una manera sencilla de verificar si la información personal de alguien está en el conjunto de entrenamiento de un modelo de IA, ni de obligar a los modelos a eliminar esa PII. Idealmente, los consumidores deberían poder solicitar la eliminación de sus datos, pero esto suele aplicarse solo a la información que han proporcionado directamente a las empresas, no a lo que ha sido recopilado de fuentes públicas. Jennifer King, especialista en privacidad del Instituto de IA Centrada en el Ser Humano de Stanford, señala la falta de infraestructura para que Google, por ejemplo, pueda decir a un usuario qué datos tiene suyos en sus entrenamientos y permitirle eliminarlos o corregirlos.
Las leyes de privacidad existentes, como la Ley de Privacidad del Consumidor de California (CCPA) o el Reglamento General de Protección de Datos (GDPR) de Europa, no cubren explícitamente la información «disponible públicamente» que ya ha sido raspada y utilizada para entrenar LLMs, especialmente porque gran parte de esta información se anonimiza. Sin embargo, múltiples estudios han demostrado lo fácil que es inferir identidades y PII a partir de datos anonimizados y seudónimos. La pregunta de si las empresas de IA han intentado sistemáticamente revisar y minimizar estos datos públicos sigue sin respuesta.
Respuestas de la Industria y Opciones Limitadas para los Usuarios
Las principales empresas de IA ofrecen vías, aunque limitadas, para abordar estas preocupaciones. Google, a través de Alex Joseph (jefe de comunicaciones de Gemini), ha indicado que están investigando los casos específicos reportados y ha proporcionado un documento de soporte donde los usuarios pueden objetar el procesamiento de sus datos o solicitar correcciones, aunque la respuesta dependerá de las leyes de privacidad de cada jurisdicción.
OpenAI también cuenta con un portal de privacidad para solicitar la eliminación de información de las respuestas de ChatGPT, aunque se reservan el derecho de declinar si tienen una razón legal para hacerlo. Anthropic, por su parte, describe cómo utiliza los datos personales en el entrenamiento de sus modelos, pero carece de un mecanismo claro para que los usuarios soliciten la eliminación de su información.
Ante este panorama, la mejor opción para proteger la privacidad de los datos personales es «actuar en la fuente: eliminar los datos personales de la web pública antes de que acaben en el próximo rastreo», según Shavell. Iniciativas como el portal web de California, que permite a los residentes solicitar la eliminación de su información de los corredores de datos, son un paso en la dirección correcta, aunque no garantizan que los datos ya no hayan sido utilizados para el entrenamiento de IAs.
El Redditor original que sufrió el acoso telefónico, y Daniel Abraham, el ingeniero israelí, han reportado largas esperas y respuestas insatisfactorias de Google, lo que resalta la frustración y la dificultad para los individuos de recuperar el control sobre su información una vez que ha sido expuesta. Mientras tanto, la investigación sobre este fenómeno continúa, con académicos como Yael Eiger, Meira Gilbert y Anna-Maria Gueorguieva diseñando proyectos para profundizar en cómo los chatbots de IA revelan información personal y cómo esto reduce drásticamente «la barrera de entrada para apuntar a las personas».
Conclusión: La era de la Inteligencia Artificial nos presenta un desafío de privacidad sin precedentes. La facilidad con la que los chatbots pueden acceder y, de forma involuntaria, divulgar datos personales sensibles, como números de teléfono, obliga a una reevaluación urgente de las salvaguardas existentes y las regulaciones de protección de datos. Mientras las empresas de IA y los legisladores buscan soluciones, la concienciación y la proactividad individual para gestionar nuestra huella digital se vuelven más cruciales que nunca. La promesa de la IA debe ir de la mano con una robusta garantía de nuestra privacidad y seguridad en el ciberespacio.
Fuente original: AI chatbots are giving out people’s real phone numbers