Pensamientos de IA | Original, traducido por IA
-
Satya Nadella mencionó el paradigma de Jevons. Vale la pena aprender.
-
Yin Wang: No hay “inteligencia” en inteligencia artificial, no hay “neural” en redes neuronales, no hay “aprendizaje” en aprendizaje automático, y no hay “profundidad” en aprendizaje profundo. No hay “profundidad” en aprendizaje profundo. Lo que realmente funciona en este campo se llama “cálculo”. Por eso prefiero llamar a este campo “computación diferenciable”, y el proceso de construcción de modelos se llama “programación diferenciable”.
-
Yin Wang: El aprendizaje automático es realmente útil, uno podría decir incluso una teoría hermosa, porque es simplemente cálculo con un cambio de imagen. Es la antigua y gran teoría de Newton, Leibniz, en una forma más simple, elegante y poderosa. El aprendizaje automático es básicamente el uso del cálculo para derivar y ajustar algunas funciones, y el aprendizaje profundo es el ajuste de funciones más complejas.
-
Actualmente, los grandes modelos de lenguaje no pueden filtrar por idioma de archivo como YAML o Python. Sin embargo, una parte significativa de la información en el mundo real está organizada de esta manera. Esto significa que podríamos entrenar grandes modelos de lenguaje utilizando archivos.
-
Para entrenar grandes modelos de lenguaje, podríamos desarrollar un sistema que encuentre coincidencias exactas. Quizás podamos combinar el algoritmo de búsqueda KMP (Knuth-Morris-Pratt) con la arquitectura de transformadores para mejorar las capacidades de búsqueda.
-
No hay secretos tecnológicos. El código abierto revelará todos los secretos que están estrechamente guardados.
-
La IA afectará muchas herramientas, incluidas las indirectas. La gente dice que no necesitará Figma para dibujar prototipos, irán directamente al código. Creo que Postman será similar; la gente usará directamente Python u otros scripts para llamar o probar APIs.
-
Una razón por la que no usamos Postman o Figma en la era de la IA es que sus funcionalidades no pueden generarse a través de texto. También les falta un atajo de teclado comando + K para activar el reemplazo de componentes.
-
Las interfaces de usuario se están convirtiendo en una barrera en la era de la IA. ¿Por qué actualizar Postman para que sea impulsado por IA para probar aplicaciones cuando podemos usar directamente la biblioteca requests de Python u otros lenguajes de programación para probar código, ya que estos últimos estarán impulsados por IA?
-
¿Por qué actualizar Figma para que sea impulsado por IA para la creación de interfaces de usuario cuando la generación de interfaces basadas en código, mejorada por IA, ofrece un enfoque más directo y potencialmente poderoso?
-
Los LLM cambiarán primero las aplicaciones relacionadas con el texto, como Google, motores de búsqueda, editores de texto y herramientas de escritura, Quizlet, Zendesk, DeepL, Medium, WordPress, Trello, Asana, Gmail, GitHub, Goodreads, Duolingo y Feedly.
-
Por el contrario, es poco probable que los LLM revolucionen tecnologías como Git, Linux, ffmpeg, teléfonos móviles, hardware, navegadores, sistemas operativos o llamadas de voz y video. Estas tecnologías están centradas en el código, y su código no se genera fácilmente con IA, a diferencia de las herramientas de prueba de API como Postman.
-
Las tecnologías con más código son difíciles de ser revolucionadas por la IA, como OpenOffice, MySQL, Mozilla Firefox, Chromium, VLC Media Player, Qt Framework, LLVM/Clang y GNOME. Si la IA pudiera ayudar a hacer estas tecnologías, no serían reemplazadas. La IA debería ayudar a hacer mejores tecnologías, y para eso, la IA necesitará más potencia de cómputo para generar la misma magnitud de código.
-
Hay dos formas en que los LLM pueden traer cambios: primero, alterando el contenido o los datos dentro de una plataforma o software, como la traducción de contenido en aplicaciones como TikTok; segundo, reemplazando directamente ciertos software o plataformas, como Postman o Google Search, incluyendo Google Translate.
-
Hay dos formas en que las herramientas de audio de IA pueden traer cambios: primero, alterando el contenido o los datos dentro de una plataforma o software, como la generación de audiolibros para Audible; segundo, reemplazando directamente ciertos software o plataformas, por ejemplo, la aplicación Sing songs, ya que la IA puede realizar las mismas tareas que los humanos, lo que facilita que las personas canten canciones como hobby.
-
Hay varias formas de medir cómo la IA impacta en el software o plataformas actuales. Una forma es medir cuántos datos o contenido pueden ser generados o mejorados por la IA, ya sea parcialmente o completamente. Otra forma es medir cuánto código puede ser escrito o mejorado por la IA, ya sea parcialmente o completamente. Esto significa que usamos lo que la IA genera para mejorar las plataformas actuales. Además, la IA puede ayudar a inventar nuevos software y plataformas.
-
Hay tres tipos de productos: productos de IA generativa, los productos que usan las APIs de los productos de IA generativa y otros productos.
-
Una idea de producto es usar la IA para acumular información, noticias o actualizaciones en tiempo real de plataformas sociales como Reddit, GitHub Trending, Twitter Trending, Quora Trending y Zhihu Trending. Los usuarios pueden usar indicaciones para personalizar el feed o incluso agregar cuentas sociales específicas.
-
Hay cinco tipos importantes de datos: texto, imagen, audio, video y código.
-
Otros tipos importantes de datos incluyen numéricos, geospaciales, biométricos, de sensores, transaccionales, metadatos, de series temporales, estructurados, no estructurados, semiestructurados, de salud, ambientales, de registros, de red y de comportamiento.
-
Google sigue siendo mejor para la indexación de sitios web, especialmente si deseas descargar software o un documento de un sitio específico. Funciona como una búsqueda de dominio. No lo estás usando para encontrar información, sino para navegar a otros sitios para realizar tareas. Un LLM puede que no tenga los últimos enlaces de descarga.
-
Google funciona como una búsqueda de dominio; si deseas ir a un sitio de repositorio Maven para verificar la última versión, puedes usarlo.
-
Google sigue siendo útil para la búsqueda de imágenes, mientras que los LLM destacan en la generación de texto. Aún así, las personas suelen preferir imágenes reales para verificar detalles de hardware, dimensiones, formas de objetos o la apariencia de una persona.
-
Los chatbots de IA son populares porque el texto es más difícil de procesar que las imágenes. Las personas prefieren imágenes reales sobre las generadas por IA, ya que las imágenes son más fáciles de entender de un vistazo. Sin embargo, la generación de imágenes por IA tiene un potencial sin explotar: los usuarios podrían pedirle a la IA que muestre diferentes ángulos, hacer zoom en rostros o ampliar detalles de una placa de circuito. Dado que las personas trabajan principalmente con texto en lugar de imágenes, hay un margen significativo de crecimiento en las herramientas de imagen de IA.
-
La IA destaca en explicar conceptos y facilitar la comprensión. Además, los usuarios pueden plantear preguntas sobre cualquier detalle específico. Esto es probablemente la utilidad más significativa de las herramientas de IA.
-
Usé la IA para aprender sobre Grandes Modelos de Lenguaje. El momento en que me ayudó a entender K, Q y V fue maravilloso.
-
La razón por la que prefiero usar Ubuntu desde el lanzamiento de LLM es que las aplicaciones ricas y coloridas de macOS son menos atractivas para mí. Prefiero escribir mis programas y hacer todo a través de la terminal y el texto.
-
La IA puede ser evaluada por lo bien que puede actualizar un archivo pom.xml o requirements.txt a la última versión, actualizar bibliotecas y realizar verificaciones. Este proceso puede involucrar una cantidad significativa de trabajo y, a veces, puede ser complejo.
-
En la era de la IA, los lenguajes de programación que tienen mejor rendimiento y robustez son más importantes y serán más populares, mientras que la sintaxis es menos importante. Esto se debe a que el LLM ayudará a generar código, lo que lo hará menos engorroso siempre que el programa se ejecute bien.
-
Las personas tienden a leer todo de los chatbots de IA porque es fácil de aprender, pueden hacer preguntas sobre cualquier aspecto, el formato es consistente y la calidad suele ser de las mejores encontradas en Internet.
-
Pero la información no es solo texto, puedes leer la mayoría de la información de texto de los chatbots de IA, pero pierdes el sitio web original y su diseño y formato, sus imágenes explicativas y el diseño del sitio web.
-
Los sitios web con mucha interacción es poco probable que sean significativamente cambiados por la IA, como juegos web, Google Docs, Google Sheets y herramientas de colaboración como Zoom o Slack. Están centrados en el código y no solo enfocados en el texto.
-
Es fácil cometer errores tipográficos o requiere esfuerzo elaborar indicaciones para los chatbots de IA. Por eso, un banco digital completamente impulsado por IA, una aplicación de comercio digital o una red social de IA con una simple caja de chat a menudo no funciona. Los botones de clic tradicionales, la navegación por páginas y los diseños en aplicaciones móviles son más convenientes.