
談到 AI 的發展,我們就不得不聊聊AI 的演進
深度學習 1.0 > 大型語言模型 2.0 > 具身智能 3.0(Embodied Intelligence)
我們現在身處第三個階段,作為開發者,我們應該持續關注 AI 3.0 技術的演進,尤其是以下兩大方向:
在我去語言學校進修的這段期間,AI 的發展一刻不停,以下這兩項技術在這段時間內快速竄紅,值得深入了解:
MCP 是一種由 Anthropic 提出的開放標準協議,旨在為大型語言模型(LLMs)提供一個統一的介面,使其能夠與各種外部系統與工具進行連接與互動。
它就像 AI 應用中的 USB-C 接口:安全、標準化地讓 AI 模型能夠存取外部資料與工具,進一步拓展模型的能力與應用場景。
舉例來說
AI Agent 是結合大型語言模型與工具操作能力的智能系統,它不只回應使用者輸入,而是能理解任務、規劃步驟、自主執行,甚至具有記憶與學習能力,我想未來AI Agent 會漸漸觀察環境,並具備目標導向與行動能力的 AI,可以主動完成任務,而不只是被動回應。
2024 年,我入手了一張 NVIDIA 4070 Super 顯示卡,開始嘗試在家裡跑開源的大語言模型,這張卡雖然算是中高階家用卡,但受到顯示卡記憶體限制,只能跑像 **7B(70 億參數)**這類「閹割版」的小模型。
像是
雖然在本地離線開源模型,這樣的顯示卡還算堪用,但離真正商用或訓練模型仍有距離,這類家用卡的應用,侷限於小型場景,像是開發測試、個人學習用途等等。
顯示卡記憶體一直是個問題,所以大陸很多人在魔改顯卡記憶體,我想顯示晶片的公司也很清楚,如果加大記憶體,會導致高階顯卡銷售不好,在切一個人AI 電腦產品線,就不會自己的產品互相打到。
於是就在 2025 年 3 月 22 日,NVIDIA 在 GTC 大會上發表了革命性的產品——個人 AI 超級電腦 DGX Spark。
這款設備搭載 NVIDIA 與聯發科合作開發的 GB10 超級晶片,擁有 128GB 記憶體,體積僅約一支 iPhone 的長寬,外型香檳金十分吸睛,售價約新台幣 13 萬元,並已開放預購。
這台機器的問世,有望突破傳統家用或工作站顯示卡顯示卡記憶體不足的瓶頸,可直接支援大型模型,為 AI Agent 的發展加速鋪路。
DGX Spark 有點類似蘋果的「統一記憶體架構(Unified Memory Architecture)」,可以在不同運算單元之間高效共享記憶體。雖然蘋果也能透過主機來運行更大型的模型,但它在回應時的 token 數量仍然偏少,限制了實際的應用彈性。
當每家企業都能在自己的環境中部署大型語言模型,不只用來做推論,甚至可以調整和訓練模型,軟體工程師的工作定義將會改變,像是過去軟體工程師主要是「維護系統」,未來會變成「設計和管理智慧代理人」,將 AI 深度融入各行各業,徹底改變工作流程和服務方式。
AI 代理人以大型語言模型為核心,結合任務規劃、工具操作和記憶系統等功能,目前 AI 代理人多是被動回應,未來則有機會變得更主動,能自主處理問題、做決策和執行行動。