AI工作流程、代碼編輯器與平台顛覆

AI工作流程、代碼編輯器與平台顛覆 | 原創，AI翻譯

Home 2025.01

AI觀點
- AI缺乏真正的智慧或深度
- 機器學習是進階的應用微積分
- LLM在處理結構化檔案格式時面臨困難
- 開源消除了技術保密性
- 文字為基礎的工具將首先面臨AI的衝擊
由AI工作流程驅動的新平台
- AI工作流程自動化多語言內容生成
- 用戶提交提示以進行格式轉換
- 平台實現內容精煉與摘要
- 通過關鍵字設定自訂AI工作流程
- AI端到端處理內容轉換
AI程式碼編輯器的下一步方向
- 雲端整合對於CI/CD工作流程至關重要
- A/B測試增強AI生成的內容
- RLHF擴展至實際部署反饋
- 人類反饋微調不完美的AI輸出
- 提示優化勝於輸出修正

AI觀點

最後更新於2025年8月

Satya Nadella 提到了傑文斯悖論 (Jevons paradox)，值得學習。
王垠：人工智慧中沒有「智慧」，神經網絡中沒有「神經」，機器學習中沒有「學習」，深度學習中沒有「深度」。深度學習中沒有「深度」。這個領域真正有效的東西稱為「微積分」。所以我更傾向於將這個領域稱為「可微分計算」，而建立模型的過程稱為「可微分編程」。
王垠：機器學習確實有用，甚至可以說是美麗的理論，因為它不過是經過包裝的微積分！它是牛頓、萊布尼茲古老而偉大的理論，以更簡單、優雅且強大的形式呈現。機器學習基本上是使用微積分來推導和擬合某些函數，而深度學習則是擬合更複雜的函數。
目前，大型語言模型無法像YAML或Python那樣按檔案語言過濾內容。然而，現實世界中相當大比例的資訊是以這種方式組織的。這意味著我們可以使用檔案來訓練大型語言模型。
對於訓練大型語言模型，我們可以開發一個能夠精確匹配的系統。或許可以將KMP（Knuth-Morris-Pratt）搜索算法與Transformer架構結合，以增強搜索能力。
沒有技術秘密。開源將揭露所有被嚴密守護的秘密。
AI將影響許多工具，包括間接相關的。人們說他們不需要使用Figma來繪製原型，而是會直接編寫程式碼。我認為Postman也會類似；人們會直接使用Python或其他腳本來調用或測試API。
在AI時代，我們不使用Postman或Figma的原因之一是它們的功能無法通過文字生成。它們也缺乏像command + K這樣的便捷操作來觸發組件替換。
用戶界面在AI時代成為障礙。為什麼要升級Postman成為AI驅動的應用測試工具，當我們可以直接使用Python的requests庫或其他程式語言來測試程式碼，因為後者將由AI驅動？
為什麼要升級Figma成為AI驅動的UI創作工具，當基於程式碼的UI生成（由AI增強）提供更直接且可能更強大的方法？
LLM將首先改變與文字相關的應用，例如Google、搜索引擎、文字編輯器和寫作工具、Quizlet、Zendesk、DeepL、Medium、WordPress、Trello、Asana、Gmail、GitHub、Goodreads、Duolingo和Feedly。
相反，LLM不太可能徹底改變Git、Linux、ffmpeg、手機、硬件、瀏覽器、操作系統或語音和視頻通話等技術。這些技術以程式碼為核心，其程式碼不易由AI生成，不像Postman等API測試工具。
程式碼量大的技術很難被AI革命化，例如OpenOffice、MySQL、Mozilla Firefox、Chromium、VLC Media Player、Qt框架、LLVM/Clang和GNOME。如果AI能夠幫助製作這些技術，它們就不會被取代。AI應該幫助創造更好的技術，為此，AI需要更多的計算能力來生成相同規模的程式碼。
LLM帶來變化的方式有兩種：首先，改變平台或軟件內的內容或數據，例如TikTok等應用中的內容翻譯；其次，直接取代某些軟件或平台，例如Postman或Google搜索，包括Google翻譯。
AI音頻工具帶來變化的方式有兩種：首先，改變平台或軟件內的內容或數據，例如為Audiable生成有聲書；其次，直接取代某些軟件或平台，例如唱歌應用程式，因為AI現在可以執行人類的任務，使人們更容易將唱歌作為愛好。
衡量AI如何影響當前軟件或平台的方法有幾種。一種是衡量AI可以部分或完全生成或改進的數據或內容量。另一種是衡量AI可以部分或完全編寫或改進的程式碼量。這意味著我們使用AI生成的內容來改進當前的平台。此外，AI可以幫助發明新的軟件和平台。
產品有三種類型：生成式AI產品、使用生成式AI產品API的產品，以及其他產品。
一個產品想法是使用AI從Reddit、GitHub Trending、Twitter Trending、Quora Trending和知乎熱榜等社交平台累積實時資訊、新聞或更新。用戶可以使用提示自訂訂閱內容，甚至可以添加特定的社交帳戶。
有五種重要的數據類型：文字、圖像、音頻、視頻和程式碼。
其他重要的數據類型包括數值、地理空間、生物特徵、傳感器、交易、元數據、時間序列、結構化、非結構化、半結構化、健康、環境、日誌、網絡和行為數據。
Google在網站索引方面仍然更優秀，尤其是當你想從特定網站下載軟件或文件時。它的運作方式類似於域名搜索。你不是用它來查找資訊，而是導航到其他網站執行任務。LLM可能沒有最新的下載鏈接。
Google的運作類似於域名搜索；如果你想訪問Maven倉庫網站查看最新版本，可以使用它。
Google在圖像搜索方面仍然有用，而LLM擅長文字生成。儘管如此，人們通常傾向於使用真實圖片來驗證硬件細節、尺寸、物體形狀或人的外貌。
AI聊天機器人受歡迎的原因是文字比圖像更難處理。人們更喜歡真實圖片而非AI生成的圖片，因為圖片一目了然。然而，AI圖像生成有未開發的潛力——用戶可以要求AI展示不同角度、放大臉部細節或電路板細節。由於人們主要處理文字而非圖像，AI圖像工具仍有很大的成長空間。
AI擅長解釋概念並促進理解。此外，用戶可以針對任何具體細節提出問題。這可能是AI工具最重要的功能。
我曾使用AI學習大型語言模型。當它幫助我理解K、Q和V時，那一刻非常美妙。
自從LLM發布以來，我更傾向於使用Ubuntu的原因是macOS豐富多彩的應用對我來說不太吸引人。我更喜歡通過終端和文字編寫程式並完成所有工作。
可以通過AI是否能很好地更新pom.xml或requirements.txt文件到最新版本、更新庫並執行檢查來評估AI。這個過程可能涉及大量工作，有時還很複雜。
在AI時代，性能更好且更穩健的程式語言將更加重要並更受歡迎，而語法則較不重要。這是因為LLM將幫助生成程式碼，只要執行效果好，就不再是麻煩。
人們傾向於閱讀AI聊天機器人的所有內容，因為它易於學習，可以針對任何方面提問，格式一致且質量通常是互聯網上最好的之一。
但資訊不僅僅是文字，你可以在AI聊天機器人中閱讀大部分文字資訊，但你會失去原始網站及其排版和表格、解釋圖片和網站設計。
具有大量交互的網站不太可能被AI顯著改變，例如網頁遊戲、Google Docs、Google Sheets以及Zoom或Slack等協作工具。它們以程式碼為核心，不僅僅專注於文字。
在AI聊天機器人中很容易打錯字或需要花費精力設計提示。這就是為什麼完全由AI驅動的數字銀行、數字交易應用程式或只有簡單聊天框的AI社交媒體通常行不通。傳統的點擊按鈕、頁面導航和移動應用程式中的佈局更方便。
我如何在AI與區塊鏈時代過得更好

由AI工作流程驅動的新平台

2025.01.08

工作流程是通過預定義的代碼路徑協調大型語言模型（LLM）和工具的系統。¹
想像一個全新的平台，類似於TikTok、Quora、X、Threads、Instagram、WhatsApp、Facebook、LinkedIn、Reddit或YouTube，完全由AI翻譯驅動。
用戶創建的每條貼文或回答可以以單一語言保存。平台會自動將內容翻譯成20種語言，讓用戶以自己偏好的語言查看。
除了翻譯，其他AI驅動的功能（如摘要、音頻生成和視頻生成）將發揮關鍵作用。本質上，用戶提交提示內容，平台負責其餘部分。
用戶可以上傳文字、圖片、音頻或視頻，平台會自動將內容轉換為其他格式。用戶可以決定如何接收這些內容（例如文字、圖片、音頻或視頻）。
平台可以自動生成摘要，並提供多種語言的摘要類型。
在平台上的任何文字、圖片、音頻或視頻中，AI可以協助生成、精煉、增強、修復、摘要、擴展、轉換為其他格式或想像內容的新形式。
用戶可以使用「English」或「funny」等關鍵字自訂平台，以調整TikTok等平台中AI工作流程的風格。設置完成後，AI將相應調整內容。

AI程式碼編輯器的下一步方向

2025.01.08

最近，我正在將xelatex管道添加到GitHub Actions中。

我在GitHub流程中遇到了fontawesome5套件的問題。4o-mini提供的解決方案（安裝TeX Live 2021並使用tlmgr install fontawesome5）對我無效。然而，4o建議了一個更好的方法：升級到TeX Live 2023並仍使用tlmgr安裝fontawesome5。雖然這沒有完全解決問題，但切換到TeX Live 2023顯著改善了情況。

我使用ChatGPT來幫助解決問題。更多細節，請查看What ChatGPT O1 Can Do That 4o-mini Cannot。

此時，我沒有使用Cursor或Windsurf等編輯器，儘管我在另一個項目中嘗試過它們。這些代碼編輯器的問題在於它們只捕獲本地測試輸出，這限制了它們在雲端環境中的功能。

在GitHub Actions、Jenkins作業或任何代碼部署或測試流程中，代碼編輯器需要更好地整合。它們應該提供與雲端和CI/CD流程的無縫互動。

這種整合也適用於其他內容創作工具——無論是文字、圖像、音頻還是視頻。這些工具應該與A/B測試系統整合。AI工具可以生成內容，而A/B測試工具可以提供反饋。這種動態類似於「從人類反饋中強化學習」（RLHF），AI模型會根據現實世界的反饋不斷改進。

將RLHF的概念擴展到模型輸出之外——進入真實世界的測試和部署環境——似乎是代碼編輯器和AI驅動內容創作工具的改進方向。

測試可以是即時或長期的，也可以是自動化或由人類輔助的。如果測試是自動化的，例如AI工具

Building Effective Agents, Anthropic ↩

Back Donate