El Mundo de la Inteligencia Artificial General
Si algún día podemos simplemente decirle a una IA que cree una aplicación como TikTok o YouTube con un solo comando, y nos proporciona un proyecto completo que contiene millones de líneas de código, eso sería realmente asombroso.
Cuando ChatGPT fue lanzado a finales de noviembre de 2022, podía realizar tareas como corregir un fragmento de código y responder a una amplia gama de preguntas. Sobresalía en explicar conceptos como las redes neuronales y proporcionar ejemplos de “¡Hola, mundo!” en varios lenguajes de programación. Era como tener un motor de búsqueda muy potente que podía dar respuestas directas.
Luego, tenía funcionalidad de búsqueda. Podía pedirle a ChatGPT que recuperara una lista de enlaces de un sitio web y creara un documento sobre ellos.
Luego, se lanzaron versiones como ChatGPT 3.5, 4, 4o, o1-mini y o1.
Ahora, puede manejar solicitudes como agregar un modo oscuro a un sitio web. Puede proporcionar el código necesario y las instrucciones para actualizar HTML, CSS o scripts, e incluso sugerir agregar un interruptor para el modo oscuro. Implementar el modo oscuro implica cambiar el CSS, y si el sitio usa Markdown, eso también debe actualizarse.
Es como si la IA pudiera implementar características o funcionalidades completas, no solo fragmentos de código.
Al combinar estas características, podemos crear una aplicación. Así que, un día, si le decimos a una herramienta de IA que construya una terminal, un navegador, una lista de tareas, una aplicación de gestión de tareas, un calendario, una herramienta de colaboración de código o una aplicación de reuniones, podría proporcionar el código completo del proyecto.
Luego, podemos hacer la tarea más compleja. Por ejemplo, podríamos pedirle a la IA que integre todo el código existente de YouTube y utilice las APIs de OpenAI, Claude o Deepseek para agregar funcionalidades de IA a YouTube. Esto podría incluir la adición de un asistente inteligente, reemplazar las traducciones actuales con otras potenciadas por IA, mejorar las capacidades de búsqueda con IA, e incluso curar videos cortos dedicados, como solicitar a YouTube que proporcione 100 videos cortos divertidos sobre la vida en Japón.
Entonces, esto es una aplicación. Pero, ¿qué pasa con tareas más avanzadas, como crear un sistema operativo? Podríamos pedirle a la IA que diseñe un nuevo sistema operativo completamente de código abierto con un diseño fresco, aplicaciones básicas, una terminal, una línea de comandos y un planificador, similar a Oberon, utilizando estructuras de datos para interactuar entre procesos en lugar de cadenas de texto.
¿Qué sigue? Podríamos pedirle a la IA que diseñe el último Mac y actualice su sistema operativo.
¿Y luego, qué sigue? Podríamos decirle a la IA que diseñe y actualice una casa completa, personalizando todos los productos eléctricos según nuestras actividades, los últimos conocimientos y nuestras necesidades para crear un entorno de vida mejor.
¿Y luego, qué sigue? Podríamos pedirle a la IA que diseñe una ciudad completa, adaptada a los comportamientos de sus ciudadanos y al conocimiento más reciente, para mejorar sus vidas.
Y finalmente, ¿qué sigue? Podríamos pedirle a la IA que mejore la Tierra, utilizando todo el conocimiento y la información disponible para mejorar la vida de todos.
Estoy luchando por encontrar un título para este ensayo. Llamémoslo “El mundo de la inteligencia artificial general”.
Según Deepseek, “la Inteligencia General Artificial (AGI, por sus siglas en inglés) se refiere a un tipo de inteligencia artificial que posee la capacidad de comprender, aprender y aplicar conocimientos en una amplia gama de tareas a un nivel comparable al de la inteligencia humana”. A diferencia de la IA estrecha (Narrow AI), que está diseñada para tareas específicas como el reconocimiento facial, la traducción de idiomas o jugar al ajedrez, la AGI puede realizar cualquier tarea intelectual que un ser humano pueda hacer.
Al considerar el futuro de la IA, hay dos puntos básicos que comprender: los algoritmos y la capacidad de cómputo. Los algoritmos de IA se centran principalmente en el cálculo, la retropropagación, los transformadores, GPT y la atención latente multihead.
En el mundo digital, habrá mapeos de X a Y, donde X puede ser cualquier cosa, desde texto, imágenes, video, audio, código, hasta cualquier dato en bytes. Y también puede ser cualquiera de estos.
Las computadoras no entienden intrínsecamente la AGI; es simplemente una definición creada por los humanos y no tiene mucha importancia para las máquinas.
La aplicación de la IA en el mundo físico incluirá áreas como la conducción autónoma y la robótica. Si el mundo digital puede mapear X a Y, el mundo físico seguirá su ejemplo. Por ejemplo, un robot puede convertir ingredientes en platos, construir Legos, decorar una casa, colocar baldosas, instalar aires acondicionados y ensamblar muebles de IKEA.
Ya existen robots industriales en uso. Entre las empresas destacadas en Japón se encuentran FANUC, Kawasaki Heavy Industries y Yaskawa Electric Corporation.
Entonces, ¿por qué no hay más robots en los hogares? Los robots de consumo necesitan ser versátiles y capaces de realizar múltiples tareas. Por ejemplo, un robot de cocina podría solo revolver y freír ingredientes, lo que requeriría que los usuarios preparen los ingredientes y limpien después.
En el futuro, los robots estarán presentes en hogares, tiendas, escuelas, oficinas, cines y atracciones turísticas—básicamente en cualquier lugar donde actualmente trabajen seres humanos.
Habrá un modelo mundial en la nube, un modelo muy grande que potencialmente podría tener un tamaño de alrededor de 100 petabytes. Como referencia, 1 petabyte equivale a 1,024 terabytes, y 1 terabyte equivale a 1,024 gigabytes. Una versión del modelo Llama 3 70B tiene un tamaño de archivo de 21.1 GB.
Los robots en el mundo necesitarán consultar este modelo del mundo en la nube para tomar acciones. Un retraso de red de 100 milisegundos o incluso 1 segundo es aceptable siempre que el robot pueda realizar sus tareas de manera efectiva.