一般エージェントと垂直エージェント | オリジナル、AI翻訳
Manusは、汎用的なAIエージェントツールだと主張されているが、おそらくあまり良く動かないだろう。
その理由の一つは、非常に遅いことであり、不要な作業を多く行って効率が悪いことである。もう一つの理由は、複雑な問題に遭遇したり、弱点を突いたりすると、タスクを実行するのに失敗する可能性が高いことである。
縦型のエージェントは、高度に専門化されているため、非常に優れている。彼らは非常に特定のタスクに特化している。SpringなどのWeb開発フレームワークやVueやReactなどのWebフレームワークなど、数十ものデータベースや百以上のWeb開発フレームワークが存在する。
Difyは、AIを使ってワークフロを接続することに焦点を当てている。彼らは、AIワークフロを定義するためにドラッグ・アンド・コネクト法を採用している。情報、データ、プラットフォームを接続するために多くの作業を行う必要がある。
私は、Pythonコードのリファクタリングエージェント、文法修正エージェント、バグ修正エージェント、エッセイマージングエージェントなど、いくつかの簡単なエージェントを作成したことがある。
コードは非常に柔軟性があり、そのため、Difyは可能性の空間の小さな部分しかカバーしていない。
Manusは、VNC法を使用してコンピューターの表示を表示しながらタスクを実行し、ユーザーに示す。
将来的には、これら二つのアプローチが落ち着くと思っている。
Manusでは、タスクを実行するためにコードやテキストをアップロードする必要があり、不便である。Difyでは、ドラッグアンドドロップを使ってワークフロを作成する必要があり、MIT Scratchに似ている。
なぜScratchがPythonのように人気ないか?Pythonは非常に多くのことができるためで、Scratchは教育目的のために簡単なプログラムに限定されているからである。
Difyもおそらく同様の制限がある。
Manusは、多くの単純なタスクを処理できるが、 Manusの弱点を突いたりするタスクでは失敗する可能性がある。
また、多くのプログラムやサービスは、Manusのアプローチでは設定が遅い。
私は、PythonとAIを使って、私の縦型エージェントを作成するのが一番簡単なアプローチだと思っている。LLM APIの出力が比較的安定しているようにするため、プロンプトとコンテキストをセットアップすることもできる。
ManusとDifyは、これらのLLM APIで構築されており、既に多くのツールやコードが使用可能になっているという利点がある。
もし私がツイッターBotエージェントを作成する場合、Difyを使うのがオープンソーステクノロジで自分で作成するよりも便利かもしれない。