微軟 Build 2025 與 Google I/O 2025 接棒登場,AI 應用連發!🌠
快訊:這期的內容有點 Vibe!微軟/Google不藏了,端出滿滿AI牛肉、Hugging Face 開源通用 Agent、程式代理人不只會寫程式-OpenAI Codex 和 Bolt、n8n 自動化流程實作
點上方播放鍵,收聽這期電子報,內容使用 NookbookLM 語音生成。
本期同樣提供 Podcast,如果你沒時間閱讀,可以邊聽邊吸收重點!
本週兩大巨頭分別舉辦開發者大會 - 微軟 Build 2025 與 Google I/O 2025,依然是聚焦於 AI 與大型語言模型(LLM),各自端出最新的 AI 策略藍圖與技術成果,其中微軟公布了 50 個開發者關心的新資訊,而 Google 更是一口氣釋出了 100 個大大小小新應用,族繁不及備載,小編針對比較具體、影響層面較廣泛的資訊彙整如下,其他細節可各自參考官方頁面,之後我們也會陸續實測這些新功能。
微軟 Build 2025
GitHub Copilot:升級為更強大的 AI 程式小幫手,新增了代理模式和程式碼審查功能。
Copilot Studio:允許開發者打造自訂的 AI 代理人和自動化工作流程,進一步提升生產力。
Copilot Tuning:透過低程式碼方式,可使用自身資料與流程,調整 Copilot 的行為與回應,輕鬆完成模型微調。
Windows 11 新增 Copilot Vision 和 AI Actions:讓 AI 助理能夠選擇性地查看用戶的桌面或應用程式視窗,使用者也可以透過右鍵選單,快速執行各種 AI 功能 (如摘要等)。
NLWeb 標準:推進自然語言與網路的互動,使開發者能夠更輕鬆地構建支援自然語言的應用程式,號稱將是 AI 代理時代的 HTML 標準。
Windows AI Foundry:提供統一且可靠的平台,支援從模型訓練到推論的完整 AI 開發者生命週期,開發者可在本地管理與執行大型語言模型(LLM)。
Google I/O 2025
釋出最新 Gemini 2.5 Pro & Flash 模型,並新增 Deep Think 深入分析模式和 Gemini Live 即時相機互動功能。
Veo 3、Imagen 4 與 Flow:推出新一代影片與圖像生成工具,支援從文字和圖像生成高品質的影片與圖片。 AI 模式與 Search Live:搜尋引擎新增 AI 模式 (已開放北美使用),提供更自然的對話式互動,並引入 Search Live 功能,透過手機相機進行即時搜尋。
Jules:專為程式開發者設計的 AI 程式碼助手,非同步的代理人運作模式,直接跟你的 Github 整合,幫你修正 bug、寫測試程式、升級相依套件,提高開發效率。
Stitch:以自然語言或圖像快速生成高品質 UI 設計及前端程式碼,支援多平台應用。
XR 智慧眼鏡:捲土重來,提供即時翻譯和虛擬互動體驗。
Project Mariner:能夠在網頁上執行多項任務的 AI 代理人,可學習使用者的操作示範,自動重複執行相同任務。
Google Meet 即時翻譯:提供即時語音翻譯,線上會議不再有語言與空間隔閡。
Gemini 現可存取 Gmail、Google Drive、YouTube 歷史記錄和 Google 相簿等資訊,提供更貼近用戶的回應。
Hugging Face 近日宣布在其輕量級代理框架 smolagents 中推出「Open Computer Use」功能,結合多模態視覺語言模型 Qwen-VL,實現 AI 代理人對電腦畫面的直接操作。此功能跟前陣子介紹過的 Manus 類似,都可以讓 AI 代理人從被動聽指示轉向主動操作,是目前自動化工作流程發展的趨勢。
小編實際使用 Open Computer Use,目前要連線伺服器很擁塞,執行任務都需要排隊,實際可以完成的工作也很有限,據 Hugging Face 官方的說法,他們的目的並不是要提供 AI Agent 的完美體驗,而是提供開發者一個開源的通用型 Agent 解決方案,希望可藉此發展出更多元的應用。
OpenAI 本週推出全新 AI 程式設計代理工具 Codex,目前已經開放 Pro、Team 和 Enterprise 帳號使用。Codex 採用 codex-1 模型,是以 o3 推理模型為基礎,專為軟體工程優化的版本,能自動撰寫功能、修復錯誤、執行測試,並回答 codebase 相關問題。Codex 會在雲端沙盒環境中運行,允許同時處理多個任務,使用者可在完成後檢視結果、要求修改,或是開啟 GitHub Pull Request 或直接整合變更。
Codex 已經不單只是生成程式碼的工具,而是「具推理能力的程式任務代理人」,讓使用者像在分派工作給資深工程師一樣委託任務。小編實際使用的心得,很像有其他工程師跟你一起寫程式,各自有分工,你對其他人的 code 有疑問,可以提出修改建議,或者團隊中功力深厚的高手也會幫忙確認你寫的程式哪裡有問題,或是可以怎麼優化,而撰寫的程式都會存放於 repo 中,修改的紀錄都可以進行版控,就像跟著一個團隊在做專案開發。
Bolt.new 是由 StackBlitz 推出的 AI 開發平台,結合 Anthropic 的 Sonnet 3.5 模型與 WebContainers 技術,讓使用者僅需透過自然語言提示,即可在瀏覽器中建構、編輯、測試並部署完整的 Web 或行動應用程式。
如果你使用過另一個類似的工具 v0.dev,那 Bolt 一定很快就可以上手,小編實際使用的心得,不用來回很多次,就可以建構出一個網頁應用的雛形,介面美觀和完整性不亞於 v0 的成果,推薦給大家。
遊戲迷們都知道,Steam 上每天都有令人心動的特價活動,但誰有時間一一檢查?D 編在網路上看到國外有小學生,利用 n8n 寫了一個可以推播 Steam 促銷活動的自動化流程,不過只有看到結果畫面沒有流程,索性就自己建構了。n8n 是一款強大的低程式碼工具,它能讓你透過簡單拖拉與設定,就能自動完成各種工作流程。雖然 D 編第一次接觸 n8n,但整體的操作不難,很容易上手,完整步驟可參考 Medium 上的教學文。
步驟一:指定流程觸發條件,每天固定時間執行流程。
步驟二:抓取並分析 Steam 特價遊戲資料。
連結的網址需要加上繁中介面和新台幣計價的參數。
使用 n8n 中的 HTTP Request 節點,並加入 HTML Extract 節點。
從 Steam 頁面中確認的 CSS 選擇器取得遊戲名稱與價格資訊。
步驟三:將遊戲資訊整理成清楚的表格內容。
步驟四:在 n8n 中設定 SMTP 郵件寄送功能
登入你的 Google 帳戶,產生 n8n 使用的應用程式專用密碼。
在 n8n 平台新增 SMTP 憑證,填入剛剛取得的應用程式密碼。
最後透過 Send Mail 節點,每天自動將特價遊戲清單寄送到你設定的電子郵件。