वर्कफ़्लो BFS है, एजेंट DFS है
एंथ्रोपिक के अनुसार 1:
- वर्कफ़्लोज़ वे सिस्टम हैं जहां LLMs और टूल्स को पूर्वनिर्धारित कोड पथों के माध्यम से ऑर्केस्ट्रेट किया जाता है।
- एजेंट्स, दूसरी ओर, वे सिस्टम हैं जहां LLMs अपनी प्रक्रियाओं और टूल उपयोग को गतिशील रूप से नियंत्रित करते हैं, जिससे कार्यों को पूरा करने के तरीके में लचीलापन बना रहता है।
मैं इससे यह समझता हूं:
- वर्कफ़्लोज़ का उपयोग करके किसी ऐप या प्लेटफ़ॉर्म को बेहतर बनाना BFS (ब्रेड्थ-फर्स्ट सर्च) की तरह है, जहां कार्यों को व्यवस्थित, स्तर-दर-स्तर तरीके से पूरा किया जाता है।
- एजेंट्स का उपयोग करना DFS (डेप्थ-फर्स्ट सर्च) की तरह है, जहां कार्यों को एक खोजपूर्ण, कदम-दर-कदम तरीके से निपटाया जाता है।
कभी-कभी, BFS और DFS को संयोजित किया जा सकता है। DFS को किसी अन्य DFS के अंदर नेस्ट किया जा सकता है, और यही बात BFS के लिए भी लागू होती है।
उदाहरण के लिए, o1 (चेन-ऑफ-थॉट) BFS की तरह है। शुरू में, मुख्य कार्यों को अलग-अलग चरणों में विभाजित किया जाता है, और प्रत्येक चरण को अधिक विस्तृत स्पष्टीकरण में विस्तारित किया जाता है। फिर, सभी सोच के आधार पर, अंतिम परिणाम प्रदान किया जाता है।
बहुत जटिल कार्यों के लिए, जैसे AI से YouTube ऐप बनाने या एक ऑपरेटिंग सिस्टम बनाने के लिए कहना, यह BFS, DFS, या दोनों के संयोजन का उपयोग कर सकता है। यह वास्तव में इस बात पर निर्भर करता है कि हम BFS और DFS का उपयोग कैसे करते हैं — कभी-कभी AI को गहराई तक जाने की आवश्यकता होती है (DFS), और कभी-कभी इसे अपने दृष्टिकोण को विस्तारित करने की आवश्यकता होती है (BFS)।
एक और विचार यह है कि हर कदम पर, AI को अपने लक्ष्यों को हासिल करने के लिए अगला कदम क्या उठाना है, इसका मूल्यांकन करना चाहिए।
लक्ष्य एक दिलचस्प पहलू हैं। कई लक्ष्य हो सकते हैं, जैसे कि एक YouTube ऐप बनाना, जहां AI को यह सुनिश्चित करने की आवश्यकता होती है कि सभी कोड अच्छी तरह से काम करते हैं, सभी सुविधाएं लागू की गई हैं, और सभी परीक्षण पास हो गए हैं। इन लक्ष्यों तक पहुंचने का तरीका आकर्षक है। क्या AI को एक समय में एक लक्ष्य पर ध्यान केंद्रित करना चाहिए, या क्या इसे सभी लक्ष्यों पर एक साथ प्रगति करनी चाहिए और फिर प्रत्येक पर पुनरावृत्ति करनी चाहिए?