AI工作流程、代碼編輯器與平台顛覆 | 原創,AI翻譯
目錄
- AI觀點
- AI缺乏真正的智慧或深度
- 機器學習是進階的應用微積分
- LLM在處理結構化檔案格式時面臨困難
- 開源消除了技術保密性
- 文字為基礎的工具將首先面臨AI的衝擊
- 由AI工作流程驅動的新平台
- AI工作流程自動化多語言內容生成
- 用戶提交提示以進行格式轉換
- 平台實現內容精煉與摘要
- 通過關鍵字設定自訂AI工作流程
- AI端到端處理內容轉換
- AI程式碼編輯器的下一步方向
- 雲端整合對於CI/CD工作流程至關重要
- A/B測試增強AI生成的內容
- RLHF擴展至實際部署反饋
- 人類反饋微調不完美的AI輸出
- 提示優化勝於輸出修正
AI觀點
最後更新於2025年8月
-
Satya Nadella 提到了傑文斯悖論 (Jevons paradox),值得學習。
-
王垠:人工智慧中沒有「智慧」,神經網絡中沒有「神經」,機器學習中沒有「學習」,深度學習中沒有「深度」。深度學習中沒有「深度」。這個領域真正有效的東西稱為「微積分」。所以我更傾向於將這個領域稱為「可微分計算」,而建立模型的過程稱為「可微分編程」。
-
王垠:機器學習確實有用,甚至可以說是美麗的理論,因為它不過是經過包裝的微積分!它是牛頓、萊布尼茲古老而偉大的理論,以更簡單、優雅且強大的形式呈現。機器學習基本上是使用微積分來推導和擬合某些函數,而深度學習則是擬合更複雜的函數。
-
目前,大型語言模型無法像YAML或Python那樣按檔案語言過濾內容。然而,現實世界中相當大比例的資訊是以這種方式組織的。這意味著我們可以使用檔案來訓練大型語言模型。
-
對於訓練大型語言模型,我們可以開發一個能夠精確匹配的系統。或許可以將KMP(Knuth-Morris-Pratt)搜索算法與Transformer架構結合,以增強搜索能力。
-
沒有技術秘密。開源將揭露所有被嚴密守護的秘密。
-
AI將影響許多工具,包括間接相關的。人們說他們不需要使用Figma來繪製原型,而是會直接編寫程式碼。我認為Postman也會類似;人們會直接使用Python或其他腳本來調用或測試API。
-
在AI時代,我們不使用Postman或Figma的原因之一是它們的功能無法通過文字生成。它們也缺乏像command + K這樣的便捷操作來觸發組件替換。
-
用戶界面在AI時代成為障礙。為什麼要升級Postman成為AI驅動的應用測試工具,當我們可以直接使用Python的requests庫或其他程式語言來測試程式碼,因為後者將由AI驅動?
-
為什麼要升級Figma成為AI驅動的UI創作工具,當基於程式碼的UI生成(由AI增強)提供更直接且可能更強大的方法?
-
LLM將首先改變與文字相關的應用,例如Google、搜索引擎、文字編輯器和寫作工具、Quizlet、Zendesk、DeepL、Medium、WordPress、Trello、Asana、Gmail、GitHub、Goodreads、Duolingo和Feedly。
-
相反,LLM不太可能徹底改變Git、Linux、ffmpeg、手機、硬件、瀏覽器、操作系統或語音和視頻通話等技術。這些技術以程式碼為核心,其程式碼不易由AI生成,不像Postman等API測試工具。
-
程式碼量大的技術很難被AI革命化,例如OpenOffice、MySQL、Mozilla Firefox、Chromium、VLC Media Player、Qt框架、LLVM/Clang和GNOME。如果AI能夠幫助製作這些技術,它們就不會被取代。AI應該幫助創造更好的技術,為此,AI需要更多的計算能力來生成相同規模的程式碼。
-
LLM帶來變化的方式有兩種:首先,改變平台或軟件內的內容或數據,例如TikTok等應用中的內容翻譯;其次,直接取代某些軟件或平台,例如Postman或Google搜索,包括Google翻譯。
-
AI音頻工具帶來變化的方式有兩種:首先,改變平台或軟件內的內容或數據,例如為Audiable生成有聲書;其次,直接取代某些軟件或平台,例如唱歌應用程式,因為AI現在可以執行人類的任務,使人們更容易將唱歌作為愛好。
-
衡量AI如何影響當前軟件或平台的方法有幾種。一種是衡量AI可以部分或完全生成或改進的數據或內容量。另一種是衡量AI可以部分或完全編寫或改進的程式碼量。這意味著我們使用AI生成的內容來改進當前的平台。此外,AI可以幫助發明新的軟件和平台。
-
產品有三種類型:生成式AI產品、使用生成式AI產品API的產品,以及其他產品。
-
一個產品想法是使用AI從Reddit、GitHub Trending、Twitter Trending、Quora Trending和知乎熱榜等社交平台累積實時資訊、新聞或更新。用戶可以使用提示自訂訂閱內容,甚至可以添加特定的社交帳戶。
-
有五種重要的數據類型:文字、圖像、音頻、視頻和程式碼。
-
其他重要的數據類型包括數值、地理空間、生物特徵、傳感器、交易、元數據、時間序列、結構化、非結構化、半結構化、健康、環境、日誌、網絡和行為數據。
-
Google在網站索引方面仍然更優秀,尤其是當你想從特定網站下載軟件或文件時。它的運作方式類似於域名搜索。你不是用它來查找資訊,而是導航到其他網站執行任務。LLM可能沒有最新的下載鏈接。
-
Google的運作類似於域名搜索;如果你想訪問Maven倉庫網站查看最新版本,可以使用它。
-
Google在圖像搜索方面仍然有用,而LLM擅長文字生成。儘管如此,人們通常傾向於使用真實圖片來驗證硬件細節、尺寸、物體形狀或人的外貌。
-
AI聊天機器人受歡迎的原因是文字比圖像更難處理。人們更喜歡真實圖片而非AI生成的圖片,因為圖片一目了然。然而,AI圖像生成有未開發的潛力——用戶可以要求AI展示不同角度、放大臉部細節或電路板細節。由於人們主要處理文字而非圖像,AI圖像工具仍有很大的成長空間。
-
AI擅長解釋概念並促進理解。此外,用戶可以針對任何具體細節提出問題。這可能是AI工具最重要的功能。
-
我曾使用AI學習大型語言模型。當它幫助我理解K、Q和V時,那一刻非常美妙。
-
自從LLM發布以來,我更傾向於使用Ubuntu的原因是macOS豐富多彩的應用對我來說不太吸引人。我更喜歡通過終端和文字編寫程式並完成所有工作。
-
可以通過AI是否能很好地更新pom.xml或requirements.txt文件到最新版本、更新庫並執行檢查來評估AI。這個過程可能涉及大量工作,有時還很複雜。
-
在AI時代,性能更好且更穩健的程式語言將更加重要並更受歡迎,而語法則較不重要。這是因為LLM將幫助生成程式碼,只要執行效果好,就不再是麻煩。
-
人們傾向於閱讀AI聊天機器人的所有內容,因為它易於學習,可以針對任何方面提問,格式一致且質量通常是互聯網上最好的之一。
-
但資訊不僅僅是文字,你可以在AI聊天機器人中閱讀大部分文字資訊,但你會失去原始網站及其排版和表格、解釋圖片和網站設計。
-
具有大量交互的網站不太可能被AI顯著改變,例如網頁遊戲、Google Docs、Google Sheets以及Zoom或Slack等協作工具。它們以程式碼為核心,不僅僅專注於文字。
-
在AI聊天機器人中很容易打錯字或需要花費精力設計提示。這就是為什麼完全由AI驅動的數字銀行、數字交易應用程式或只有簡單聊天框的AI社交媒體通常行不通。傳統的點擊按鈕、頁面導航和移動應用程式中的佈局更方便。
由AI工作流程驅動的新平台
2025.01.08
-
工作流程是通過預定義的代碼路徑協調大型語言模型(LLM)和工具的系統。1
-
想像一個全新的平台,類似於TikTok、Quora、X、Threads、Instagram、WhatsApp、Facebook、LinkedIn、Reddit或YouTube,完全由AI翻譯驅動。
-
用戶創建的每條貼文或回答可以以單一語言保存。平台會自動將內容翻譯成20種語言,讓用戶以自己偏好的語言查看。
-
除了翻譯,其他AI驅動的功能(如摘要、音頻生成和視頻生成)將發揮關鍵作用。本質上,用戶提交提示內容,平台負責其餘部分。
-
用戶可以上傳文字、圖片、音頻或視頻,平台會自動將內容轉換為其他格式。用戶可以決定如何接收這些內容(例如文字、圖片、音頻或視頻)。
-
平台可以自動生成摘要,並提供多種語言的摘要類型。
-
在平台上的任何文字、圖片、音頻或視頻中,AI可以協助生成、精煉、增強、修復、摘要、擴展、轉換為其他格式或想像內容的新形式。
-
用戶可以使用「English」或「funny」等關鍵字自訂平台,以調整TikTok等平台中AI工作流程的風格。設置完成後,AI將相應調整內容。
AI程式碼編輯器的下一步方向
2025.01.08
最近,我正在將xelatex
管道添加到GitHub Actions中。
我在GitHub流程中遇到了fontawesome5
套件的問題。4o-mini提供的解決方案(安裝TeX Live 2021並使用tlmgr install fontawesome5
)對我無效。然而,4o建議了一個更好的方法:升級到TeX Live 2023並仍使用tlmgr
安裝fontawesome5
。雖然這沒有完全解決問題,但切換到TeX Live 2023顯著改善了情況。
我使用ChatGPT來幫助解決問題。更多細節,請查看What ChatGPT O1 Can Do That 4o-mini Cannot。
此時,我沒有使用Cursor或Windsurf等編輯器,儘管我在另一個項目中嘗試過它們。這些代碼編輯器的問題在於它們只捕獲本地測試輸出,這限制了它們在雲端環境中的功能。
在GitHub Actions、Jenkins作業或任何代碼部署或測試流程中,代碼編輯器需要更好地整合。它們應該提供與雲端和CI/CD流程的無縫互動。
這種整合也適用於其他內容創作工具——無論是文字、圖像、音頻還是視頻。這些工具應該與A/B測試系統整合。AI工具可以生成內容,而A/B測試工具可以提供反饋。這種動態類似於「從人類反饋中強化學習」(RLHF),AI模型會根據現實世界的反饋不斷改進。
將RLHF的概念擴展到模型輸出之外——進入真實世界的測試和部署環境——似乎是代碼編輯器和AI驅動內容創作工具的改進方向。
測試可以是即時或長期的,也可以是自動化或由人類輔助的。如果測試是自動化的,例如AI工具