Die Welt der Künstlichen Allgemeinen Intelligenz

Die Welt der Künstlichen Allgemeinen Intelligenz | Original, von KI übersetzt

Home 2025.01

Wenn wir eines Tages einer KI einfach befehlen könnten, eine App wie TikTok oder YouTube mit einem einzigen Befehl zu erstellen, und sie uns ein vollständiges Projekt mit Millionen von Codezeilen liefern würde, wäre das wirklich erstaunlich.

Als ChatGPT Ende November 2022 veröffentlicht wurde, konnte es Aufgaben wie das Korrigieren von Code-Snippets und das Beantworten einer Vielzahl von Fragen bewältigen. Es war besonders gut darin, Konzepte wie neuronale Netze zu erklären und “Hello, World!”-Beispiele in verschiedenen Programmiersprachen bereitzustellen. Es war, als hätte man eine sehr leistungsstarke Suchmaschine, die direkte Antworten liefern konnte.

Dann hatte es eine Suchfunktion. Ich konnte ChatGPT anweisen, eine Liste von Links von einer Website abzurufen und ein Dokument darüber zu erstellen.

Dann wurden Versionen wie ChatGPT 3.5, 4, 4o, o1-mini und o1 veröffentlicht.

Jetzt kann es Anfragen wie das Hinzufügen eines Dark Mode zu einer Website bearbeiten. Es kann den notwendigen Code und Anweisungen bereitstellen, um HTML, CSS oder Skripte zu aktualisieren, und sogar vorschlagen, einen Dark-Mode-Schalter hinzuzufügen. Die Implementierung des Dark Mode beinhaltet Änderungen am CSS, und wenn die Website Markdown verwendet, muss dies ebenfalls aktualisiert werden.

Es ist, als ob die KI ganze Funktionen oder Funktionalitäten implementieren kann, nicht nur Code-Schnipsel.

Durch die Kombination dieser Funktionen können wir eine Anwendung erstellen. Eines Tages, wenn wir einem KI-Tool sagen, ein Terminal, einen Browser, eine To-Do-Liste, eine Aufgaben-App, einen Kalender, ein Code-Kollaborationstool oder eine Meeting-App zu erstellen, könnte es den gesamten Projektcode bereitstellen.

Wir können die Aufgabe dann komplexer gestalten. Zum Beispiel könnten wir die KI bitten, den gesamten bestehenden YouTube-Code zu integrieren und APIs von OpenAI, Claude oder Deepseek zu verwenden, um KI-Funktionen zu YouTube hinzuzufügen. Dies könnte die Integration eines intelligenten Assistenten, den Ersatz aktueller Übersetzungen durch KI-gestützte, die Verbesserung der Suchfunktionen mit KI und sogar die Kuratierung spezieller Kurzvideos umfassen, wie zum Beispiel die Anforderung an YouTube, 100 lustige Kurzvideos über das japanische Leben bereitzustellen.

Also, das ist eine App. Aber wie sieht es mit anspruchsvolleren Aufgaben aus, wie zum Beispiel der Erstellung eines Betriebssystems? Wir könnten der KI den Auftrag geben, ein neues, vollständig quelloffenes Betriebssystem mit einem frischen Design, grundlegenden Apps, einem Terminal, einer Kommandozeile und einem Scheduler zu entwerfen, ähnlich wie Oberon, das Datenstrukturen zur Interaktion zwischen Prozessen verwendet, anstatt Strings.

Was kommt als Nächstes? Wir könnten die KI bitten, den neuesten Mac zu entwerfen und sein Betriebssystem zu aktualisieren.

Und dann, was kommt als Nächstes? Wir könnten der KI befehlen, ein gesamtes Zuhause zu entwerfen und zu aktualisieren, indem sie alle elektrischen Produkte basierend auf unseren Aktivitäten, dem neuesten Wissen und unseren Bedürfnissen anpasst, um eine bessere Lebensumgebung zu schaffen.

Und dann, was kommt als Nächstes? Wir könnten die KI bitten, eine ganze Stadt zu entwerfen, die auf das Verhalten ihrer Bürger und das neueste Wissen zugeschnitten ist, um ihr Leben zu verbessern.

Und schließlich, was kommt als Nächstes? Wir könnten der KI sagen, sie solle die Erde verbessern, indem sie das gesamte verfügbare Wissen und alle Informationen nutzt, um das Leben aller zu verbessern.

Ich habe Schwierigkeiten, einen Titel für diesen Aufsatz zu finden. Nennen wir ihn einfach “Die Welt der Künstlichen Allgemeinen Intelligenz”.

Laut Deepseek bezieht sich „Artificial General Intelligence (AGI)“ auf eine Art von künstlicher Intelligenz, die die Fähigkeit besitzt, Wissen über eine breite Palette von Aufgaben hinweg zu verstehen, zu lernen und anzuwenden, und dies auf einem Niveau, das mit der menschlichen Intelligenz vergleichbar ist. Im Gegensatz zur Narrow AI, die für spezifische Aufgaben wie Gesichtserkennung, Sprachübersetzung oder Schachspielen entwickelt wurde, kann AGI jede intellektuelle Aufgabe ausführen, die ein Mensch bewältigen kann.

Wenn man über die Zukunft der KI nachdenkt, gibt es zwei grundlegende Punkte zu verstehen: Algorithmen und Rechenleistung. KI-Algorithmen beschäftigen sich hauptsächlich mit Kalkül, Backpropagation, Transformern, GPT und Multihead-Latent-Attention.

In der digitalen Welt wird es Abbildungen von X auf Y geben, wobei X alles Mögliche sein kann: Text, Bilder, Videos, Audio, Code oder beliebige Byte-Daten. Y kann ebenfalls eines dieser Formate sein.

Computer verstehen AGI nicht von Natur aus; es ist lediglich eine Definition, die von Menschen geschaffen wurde und für Maschinen nicht von großer Bedeutung ist.

Die Anwendung von KI in der physischen Welt wird Bereiche wie autonomes Fahren und Robotik umfassen. Wenn die digitale Welt X auf Y abbilden kann, wird die physische Welt diesem Beispiel folgen. Zum Beispiel kann ein Roboter Zutaten in Gerichte verwandeln, Legos bauen, ein Haus dekorieren, Fliesen verlegen, Klimaanlagen installieren und IKEA-Möbel zusammenbauen.

Es gibt bereits Industrieroboter im Einsatz. Bemerkenswerte Unternehmen in Japan sind FANUC, Kawasaki Heavy Industries und Yaskawa Electric Corporation.

Warum gibt es also nicht mehr Roboter in Haushalten? Verbraucherroboter müssen vielseitig und in der Lage sein, mehrere Aufgaben zu erledigen. Zum Beispiel könnte ein Kochroboter nur Zutaten rühren und braten, was die Benutzer dazu zwingt, die Zutaten vorzubereiten und anschließend aufzuräumen.

In der Zukunft werden Roboter in Haushalten, Geschäften, Schulen, Büros, Kinos und Touristenattraktionen präsent sein – im Grunde überall dort, wo derzeit menschliche Arbeitskräfte beschäftigt sind.

Es wird ein Weltmodell in der Cloud geben, ein sehr großes Modell, das potenziell eine Größe von etwa 100 Petabyte haben könnte. Zum Vergleich: 1 Petabyte entspricht 1.024 Terabyte, und 1 Terabyte entspricht 1.024 Gigabyte. Eine Version des Llama 3 70B-Modells hat eine Dateigröße von 21,1 GB.

Roboter auf der Welt müssen dieses Weltmodell in der Cloud konsultieren, um Aktionen auszuführen. Eine Netzwerkverzögerung von 100 Millisekunden oder sogar 1 Sekunde ist akzeptabel, solange der Roboter seine Aufgaben effektiv erledigen kann.

Back Donate