Bien Informado
  • Negocios
  • Hecho en
  • Agro
  • Golf
  • Especiales
  • Punto de encuentro
  • En acción
  • Auto
  • Salud
  • Nacional
    • Sinaloa
    • Baja California
    • Sonora
    • BCS
    • Bajío
    • Nayarit
    • Chihuahua
    • Durango
  • Revista
No hay resultados
Ver todos los resultados
Bien Informado
  • Negocios
  • Hecho en
  • Agro
  • Golf
  • Especiales
  • Punto de encuentro
  • En acción
  • Auto
  • Salud
  • Nacional
    • Sinaloa
    • Baja California
    • Sonora
    • BCS
    • Bajío
    • Nayarit
    • Chihuahua
    • Durango
  • Revista
No hay resultados
Ver todos los resultados
Bien Informado
No hay resultados
Ver todos los resultados
Inicio Sección Relax

¿De dónde viene la información de la inteligencia artificial?

Desde foros y portales académicos hasta repositorios legales, la inteligencia artificial construye su conocimiento a partir de una amplia y cambiante red de fuentes digitales

13/11/2025
en Relax
0
¿De dónde viene la información de la inteligencia artificial?
0
SHARES
176
VISTAS
Compartir en FacebookCompartir en TwitterCompartir en Whatsapp

La expansión de los chatbots de inteligencia artificial y asistentes virtuales ha puesto el foco sobre un aspecto fundamental: ¿de dónde provienen las respuestas generadas por estos sistemas?

Sin acceso a experiencia o comprensión genuina, la inteligencia artificial se apoya en vastos volúmenes de datos recopilados en su entrenamiento y, en los modelos más recientes, complementados con búsquedas activas en internet.

Una investigación realizada por la plataforma de marketing Semrush, centrada en 150,000 respuestas generadas por sistemas de IA durante junio de 2025, arrojó resultados contundentes sobre la preeminencia de ciertas plataformas.

Según el informe, publicado por Infobae, Reddit encabeza ampliamente el ranking como la página con más presencia, acumulando el 40.1 por ciento de las menciones detectadas.

La influencia de Reddit se atribuye a su esquema de foros temáticos, donde millones de usuarios comparten experiencias, consejos técnicos y valoraciones. Esa dinámica, según la información del análisis, posiciona a Reddit como una referencia central en los procesos automáticos de consulta y síntesis de información por parte de la IA.

El segundo sitio más citado en el estudio es Wikipedia, con un 26.3 por ciento. Su modelo de enciclopedia colaborativa abierta, que permite la actualización constante de artículos y una enorme amplitud temática, explica su relevancia para la inteligencia artificial, tanto en capacitación como en consulta durante las interacciones.

Impacto

La relevancia de este fenómeno fue subrayada en 2023 por un informe de The Washington Post, que analizó el impacto de páginas web específicas dentro de las bases de datos usadas para entrenar grandes modelos lingüísticos.

Junto con el Allen Institute for AI, el medio estadounidense examinó el conjunto de datos C4 de Google, empleado en el desarrollo de sistemas como T5 de Google y LLaMA de Meta (Facebook).

El listado mostró persistencia de dominios como patents.google.com, líder por volumen de texto almacenado, seguido cercanamente por Wikipedia y la biblioteca digital Scribd.

El análisis identificó otros sitios influyentes, como foros de videojuegos y catálogos técnicos, pero destacó que el núcleo de información proviene de repositorios con alta densidad de datos, literatura digital y plataformas con uso colaborativo intensivo.

El origen

Este enfoque en el origen de las fuentes ha sido abordado recientemente por los propios desarrolladores de los modelos más populares de IA. ChatGPT, el asistente de OpenAI, sostuvo al ser consultado que el entrenamiento de su modelo incluyó una combinación de fuentes públicas, textos con licencia y material producido por instructores humanos.

Respecto a sitios puntuales mencionados en los recientes análisis, como Reddit, OpenAI indica que el sistema no tiene acceso directo a bases de datos privadas, sino que pueden haberse utilizado fragmentos de datos accesibles públicamente bajo licencias apropiadas o de dominio público.

En su respuesta recogida durante noviembre de 2025, el sistema de ChatGPT añadió: “No tengo forma de citar ni recuperar publicaciones específicas de Reddit, X u otras redes”, desmarcándose del predominio absoluto que sugiere el análisis de Semrush.

Cuando se utiliza la función de búsqueda en tiempo real, ChatGPT confirma que recurre a medios de comunicación reconocidos, sitios oficiales de gobiernos, empresas, instituciones y bases de datos científicas abiertas, y que en estos casos la respuesta incorpora enlaces directos a las fuentes consultadas.

Por su parte, la descripción oficial del Modo IA de Google –parte de la experiencia de resultados generados por inteligencia artificial (AI Overviews)– precisa que las respuestas se fundamentan en el vasto índice público gestionado por Google.

Esto abarca artículos periodísticos, blogs, bases de datos públicas, contenido audiovisual y publicaciones académicas, todos sometidos a un proceso de evaluación automatizada orientado a filtrar fuentes confiables y actuales antes de generar el resumen mostrado al usuario.

El sistema proporciona enlaces visibles a los sitios originales y ajusta el procesamiento mediante modelos propios, como Gemini, para descomponer la consulta, evaluar fiabilidad y sintetizar información de manera coherente.

La identificación de fuentes en inteligencia artificial revela la diversidad y escala del conocimiento digital utilizado. El cruce entre análisis externos y exposiciones de las empresas desarrolladoras pone de evidencia la multiplicidad de referencias y la evolución continua del ecosistema de datos en la era de los sistemas automatizados.


Noticia Anterior

En México, el 45% de empresas prepara relevo de directores con bajo desempeño

Siguiente Noticia

Las nuevas normas de sostenibilidad transforman la gestión empresarial

Artículos Relacionados

“Vivo Arjona” llega a Culiacán con un tributo internacional encabezado por Sebastián Molina
Relax

“Vivo Arjona” llega a Culiacán con un tributo internacional encabezado por Sebastián Molina

13/05/2026
Sinaloa Beerfest On Tour llegará a La Red Food Court en Culiacán 
Relax

Sinaloa Beerfest On Tour llegará a La Red Food Court en Culiacán 

12/05/2026
La IA transformará casi la mitad de los empleos en el corto plazo
Relax

La IA transformará casi la mitad de los empleos en el corto plazo

07/05/2026
Generación Z: El nuevo paradigma laboral frente a un entorno incierto
Relax

Generación Z: El nuevo paradigma laboral frente a un entorno incierto

28/04/2026
Patricia Figueroa presenta su nuevo libro “Relaciones Emocionalmente Inteligentes” en el Tec de Monterrey Campus Sinaloa
Relax

Patricia Figueroa presenta su nuevo libro “Relaciones Emocionalmente Inteligentes” en el Tec de Monterrey Campus Sinaloa

23/04/2026
Invertirán mil mdd en México para centros de datos e inteligencia artificial
Nacional

Invertirán mil mdd en México para centros de datos e inteligencia artificial

21/04/2026
Siguiente Noticia
Las nuevas normas de sostenibilidad transforman la gestión empresarial

Las nuevas normas de sostenibilidad transforman la gestión empresarial

Artículos Populares

  • Los empresarios más importantes de Sinaloa

    0 veces compartido
    Share 0 Tweet 0
  • Los Empresarios más importantes de Sinaloa 2022

    0 veces compartido
    Share 0 Tweet 0
  • Los Empresarios más importantes de Sonora 2022

    0 veces compartido
    Share 0 Tweet 0
  • La vocación que nunca soltó: enseñar, incluso cuando la vida exigía más

    0 veces compartido
    Share 0 Tweet 0
  • Estos son los 10 vehículos que gastan menos gasolina en México

    0 veces compartido
    Share 0 Tweet 0

Lo Más Popular

  1. Sonora / Septiembre 2023
  2. Los empresarios más importantes de Sinaloa
  3. Sinaloa / Febrero 2024
Bien Informado

© 2020 Bien Informado
Web Design por Shugert.

                                   

Navegación

  • Contacto
  • Directorio
  • Aviso de Privacidad
                                   

Síguenos

No hay resultados
Ver todos los resultados
  • Secciones
    • Negocios
    • Hecho en
    • Agro
    • Golf
    • Especiales
    • Punto de encuentro
    • En acción
    • Auto
    • Salud
  • Nacional
    • Sinaloa
    • Sonora
    • Baja California
    • BCS
    • Bajío
    • Nayarit
    • Chihuahua
    • Durango
  • Más
    • Revista

© 2020 Bien Informado
Web Design por Shugert.