00:00Conoce de dónde viene la información de la inteligencia artificial que usas, Gemini de Google, ChatGPT, Meta y más.
00:09Antes de continuar con el video te pido que ayudes mi canal para que yo pueda crear más contenido.
00:16Comparte y dale me gusta que es totalmente gratis y a mí me ayuda un montón.
00:22La información utilizada por la inteligencia artificial, como Gemini de Google, ChatGPT y modelos de Meta, proviene principalmente de una amplia red de fuentes digitales públicas, incluyendo foros, enciclopedias, repositorios legales y sitios web con contenido colaborativo.
00:44Un análisis de SEMrush realizado en junio de 2025 reveló que Reddit y Wikipedia son las plataformas más citadas, con un 40.1% y un 26.3% de menciones respectivamente, debido a su alto volumen de contenido generado por usuarios y actualizaciones constantes.
01:08Google Gemini y ChatGPT también acceden a datos en tiempo real a través de motores de búsqueda, aunque sus fuentes y métodos de procesamiento difieren significativamente.
01:22Google Gemini se basa en el vasto índice público gestionado por Google, que incluye artículos periodísticos, blogs, bases de datos públicas y contenido académico.
01:35Y proporciona enlaces directos a las fuentes originales.
01:41Su arquitectura multimodal permite procesar texto, imágenes y audios, y está diseñada para integrarse con servicios como Drive y Gmail.
01:52ChatGPT, desarrollado por OpenAI, se entrena con una combinación de fuentes públicas, textos con licencia y material producido por instructores humanos.
02:04Pero su conocimiento está limitado a una fecha de corte, actualmente enero de 2022, lo que puede generar respuestas desactualizadas.
02:16Sin embargo, cuando se activa la función de búsqueda en tiempo real, utiliza medios de comunicación, sitios oficiales y bases de datos científicas abiertas, y cita sus fuentes.
02:29Los modelos de meta, como Llama, se entrenan con grandes volúmenes de datos públicos, incluyendo textos de Internet y documentos digitales, aunque no se especifican fuentes individuales en el contexto.
02:45Un informe de The Washington Post y el Allen Institute for AI identificó dominios como patents.google.com, Wikipedia, y Scribeth como influyentes en el entrenamiento de grandes modelos lingüísticos.
03:01Destacando la importancia de repositorios con alta densidad de datos.
03:08Aunque ChatGPT afirma no tener acceso directo a bases de datos privadas y no puede recuperar publicaciones específicas de Reddit o X, su modelo se basa en fragmentos de datos públicos.
03:21En contraste, Gemini está conectado directamente al motor de búsqueda de Google, lo que le permite ofrecer información más actualizada.
Comentarios