Pensées IA

Pensées IA | Original, traduit par l'IA

Home 2025.01

Satya Nadella a mentionné le paradoxe de Jevons. Cela vaut la peine d’apprendre.
Yin Wang : Il n’y a pas d’« intelligence » dans l’intelligence artificielle, pas de « neural » dans les réseaux neuronaux, pas d’« apprentissage » dans l’apprentissage automatique, et pas de « profondeur » dans l’apprentissage profond. Il n’y a pas de « profondeur » dans l’apprentissage profond. Ce qui fonctionne vraiment dans ce domaine s’appelle le « calcul ». Je préfère donc appeler ce domaine « calcul différentiable », et le processus de construction de modèles est appelé « programmation différentiable ».
Yin Wang : L’apprentissage automatique est vraiment utile, on pourrait même dire une théorie magnifique, car il s’agit simplement du calcul après une transformation ! C’est la vieille et grande théorie de Newton, Leibniz, sous une forme plus simple, élégante et puissante. L’apprentissage automatique consiste essentiellement à utiliser le calcul pour dériver et ajuster certaines fonctions, et l’apprentissage profond consiste à ajuster des fonctions plus complexes.
Actuellement, les grands modèles de langage ne peuvent pas filtrer par langage de fichier comme YAML ou Python. Cependant, une partie importante des informations dans le monde réel est organisée de cette manière. Cela signifie que nous pourrions entraîner les grands modèles de langage à l’aide de fichiers.
Pour l’entraînement des grands modèles de langage, nous pourrions développer un système qui trouve des correspondances exactes. Peut-être pouvons-nous combiner l’algorithme de recherche KMP (Knuth-Morris-Pratt) avec l’architecture transformer pour améliorer les capacités de recherche.
Il n’y a pas de secrets technologiques. L’open source révélera tous les secrets qui sont étroitement gardés.
L’IA affectera de nombreux outils, y compris les outils indirects. Les gens disent qu’ils n’auront plus besoin de Figma pour dessiner des prototypes, ils iront directement au code. Je pense que Postman sera similaire ; les gens utiliseront directement Python ou d’autres scripts pour appeler ou tester des API.
Une des raisons pour lesquelles nous n’utilisons pas Postman ou Figma à l’ère de l’IA est que leurs fonctionnalités ne peuvent pas être générées par du texte. Ils manquent également d’un raccourci clavier comme Commande + K pour déclencher le remplacement des composants.
Les interfaces utilisateur deviennent un obstacle à l’ère de l’IA. Pourquoi mettre à niveau Postman pour le rendre alimenté par l’IA pour tester des applications lorsque nous pouvons directement utiliser la bibliothèque requests de Python ou d’autres langages de programmation pour tester du code, car ce dernier sera alimenté par l’IA ?
Pourquoi mettre à niveau Figma pour le rendre alimenté par l’IA pour la création d’interfaces utilisateur lorsque la génération d’interfaces utilisateur basée sur le code, améliorée par l’IA, offre une approche plus directe et potentiellement plus puissante ?
Les LLMs changeront d’abord les applications liées au texte, comme Google, les moteurs de recherche, les éditeurs de texte et les outils d’écriture, Quizlet, Zendesk, DeepL, Medium, WordPress, Trello, Asana, Gmail, GitHub, Goodreads, Duolingo et Feedly.
En revanche, les LLMs sont peu susceptibles de révolutionner des technologies comme Git, Linux, ffmpeg, les téléphones mobiles, le matériel, les navigateurs, les systèmes d’exploitation ou les appels vocaux et vidéo. Ces technologies sont centrées sur le code, et leur code n’est pas facilement généré par l’IA, contrairement aux outils de test d’API tels que Postman.
Les technologies avec plus de code sont difficiles à être révolutionnées par l’IA, comme OpenOffice, MySQL, Mozilla Firefox, Chromium, VLC Media Player, Qt Framework, LLVM/Clang et GNOME. Si l’IA pouvait aider à faire ces technologies, elles ne seraient pas remplacées. L’IA devrait aider à créer de meilleures technologies, et pour ce faire, l’IA aura besoin de plus de puissance de calcul pour générer la même quantité de code.
Il existe deux façons dont les LLMs peuvent apporter des changements : premièrement, en modifiant le contenu ou les données au sein d’une plateforme ou d’un logiciel, comme la traduction de contenu dans des applications comme TikTok ; deuxièmement, en remplaçant directement certains logiciels ou plateformes, comme Postman ou Google Search, y compris Google Translate.
Il existe deux façons dont les outils audio de l’IA peuvent apporter des changements : premièrement, en modifiant le contenu ou les données au sein d’une plateforme ou d’un logiciel, comme la génération de livres audio pour Audible ; deuxièmement, en remplaçant directement certains logiciels ou plateformes, par exemple, l’application Sing songs, car l’IA peut maintenant effectuer les mêmes tâches que les humains, ce qui rend plus facile pour les gens de chanter des chansons comme passe-temps.
Il existe plusieurs façons de mesurer l’impact de l’IA sur les logiciels ou plateformes actuels. Une façon est de mesurer la quantité de données ou de contenu qui peut être générée ou améliorée par l’IA, soit partiellement, soit complètement. Une autre façon est de mesurer la quantité de code qui peut être écrit ou amélioré par l’IA, soit partiellement, soit complètement. Cela signifie que nous utilisons ce que l’IA génère pour améliorer les plateformes actuelles. De plus, l’IA peut aider à inventer de nouveaux logiciels et plateformes.
Il existe trois types de produits : les produits d’IA générative, les produits qui utilisent les API des produits d’IA générative, et les autres produits.
Une idée de produit consiste à utiliser l’IA pour accumuler des informations, des actualités ou des mises à jour en temps réel à partir de plateformes sociales telles que Reddit, GitHub Trending, Twitter Trending, Quora Trending et Zhihu Trending. Les utilisateurs peuvent utiliser des invites pour personnaliser le flux ou même ajouter des comptes sociaux spécifiques.
Il existe cinq types de données importants : texte, image, audio, vidéo et code.
D’autres types de données importants incluent les données numériques, géospatiales, biométriques, de capteurs, transactionnelles, de métadonnées, de séries temporelles, structurées, non structurées, semi-structurées, de santé, environnementales, de journalisation, de réseau et comportementales.
Google est toujours meilleur pour l’indexation des sites web, surtout si vous souhaitez télécharger un logiciel ou un document à partir d’un site spécifique. Il fonctionne comme une recherche de domaine. Vous ne l’utilisez pas pour trouver des informations, mais plutôt pour naviguer vers d’autres sites pour effectuer des tâches. Un LLM peut ne pas avoir les derniers liens de téléchargement.
Google fonctionne comme une recherche de domaine ; si vous souhaitez vous rendre sur un site de dépôt Maven pour vérifier la dernière version, vous pouvez l’utiliser.
Google reste utile pour la recherche d’images, tandis que les LLMs excellent dans la génération de texte. Cependant, les gens préfèrent souvent les images réelles pour vérifier les détails matériels, les dimensions, les formes d’objets ou l’apparence d’une personne.
Les chatbots IA sont populaires car le texte est plus difficile à traiter que les images. Les gens préfèrent les images réelles aux images générées par l’IA car les images sont plus faciles à comprendre d’un coup d’œil. Cependant, la génération d’images par l’IA a un potentiel inexploité - les utilisateurs pourraient demander à l’IA de montrer différents angles, de zoomer sur les visages ou d’agrandir les détails des cartes de circuits. Comme les gens travaillent principalement avec du texte plutôt qu’avec des images, il y a une marge de progression significative pour les outils d’images IA.
L’IA excelle dans l’explication des concepts et la facilitation de la compréhension. De plus, les utilisateurs peuvent poser des questions concernant tout détail spécifique. C’est probablement l’utilité la plus significative des outils IA.
J’ai utilisé l’IA pour apprendre les grands modèles de langage. Le moment où elle m’a aidé à comprendre K, Q et V était merveilleux.
La raison pour laquelle je préfère utiliser Ubuntu depuis la sortie des LLM est que les applications riches et colorées de macOS sont moins attrayantes pour moi. Je préfère écrire mes programmes et faire tout cela via le terminal et le texte.
L’IA peut être évaluée par sa capacité à mettre à jour un fichier pom.xml ou requirements.txt vers la dernière version, à mettre à jour les bibliothèques et à effectuer des vérifications. Ce processus peut impliquer une quantité importante de travail et peut parfois être complexe.
À l’ère de l’IA, les langages de programmation qui ont de meilleures performances et une meilleure robustesse sont plus importants et seront plus populaires, tandis que la syntaxe est moins importante. Cela est dû au fait que les LLM aideront à générer du code, ce qui rendra cela moins fastidieux tant que le programme s’exécute bien.
Les gens ont tendance à lire tout ce qui provient des chatbots IA car c’est facile à apprendre, ils peuvent poser des questions sur tout aspect, le format est cohérent et la qualité est souvent parmi les meilleures trouvées sur Internet.
Mais l’information ne se limite pas au texte, vous pouvez lire la plupart des informations textuelles à partir des chatbots IA, mais vous perdez le site web original et sa mise en page et sa forme, ses images d’explication et la conception du site web.
Les sites web avec beaucoup d’interaction sont peu susceptibles d’être significativement modifiés par l’IA, comme les jeux web, Google Docs, Google Sheets et les outils de collaboration comme Zoom ou Slack. Ils sont centrés sur le code et ne se concentrent pas uniquement sur le texte.
Il est facile de faire des fautes de frappe ou il faut faire un effort pour formuler des invites pour les chatbots IA. C’est pourquoi une banque numérique entièrement pilotée par l’IA, une application de trading numérique ou un réseau social IA avec une simple boîte de chat ne fonctionne souvent pas. Les boutons de clic traditionnels, la navigation de page et les mises en page dans les applications mobiles sont plus pratiques.
Nouveaux plateformes alimentées par des flux de travail IA
La prochaine direction des éditeurs de code IA
Comment je vis bien à l’ère de l’IA et de la blockchain

Back Donate