微軟免費提供 Sora,OpenAI 聯手蘋果大神!🌠
快訊:免費免費免費,微軟提供 Sora 影片生成、OpenAI 買下設計大神的硬體新創,Google 讓你手機離線玩 AI,還有 ElevenLabs 對話升級到閒聊等級,最後 Claude 4 的系統指令也大曝光啦!
點上方播放鍵,收聽這期電子報,內容使用 NookbookLM 語音生成。
本期同樣提供 Podcast,如果你沒時間閱讀,可以邊聽邊吸收重點!
微軟前兩天宣布,Bing 將提供影片生成服務,而且會直接採用 OpenAI 的 Sora 模型,這也是第一個免費使用 Sora 模型生成影片的 AI 平台, 比 ChatGPT 還佛心 (只提供 Plus 以上帳號使用)。目前現在當下已經開放手機 Bing App 使用,Android/iOS 都可。雖然官方號稱台灣也可以使用,但小編實測打開 Bing App 並未看到影片生成功能,將帳戶區域切換到美國才出現。
影片生成功能十分簡單,給 Prompt 按下創建鈕就搞定,直接採預設值生成的速度滿快的,不用一分鐘就可以看到成果,首圖是D編生成影片的截圖,應該不可能猜不出來靈感來源吧,只是螺旋槳的位置一直跑到主角頭上變成竹蜻蜓XD。官方部落格有提供影片生成的建議,如果覺得自己的影片生成不太理想,可以參考一下 Tips and tricks。
上週 OpenAI 用 65 億美元超級大手筆,收購蘋果前設計大神 Jony Ive 創立的 AI 硬體新創公司 io。OpenAI 也毫不掩飾其背後的目的,就是為開發 AI 硬體設備鋪路,嘗試在電腦和智慧型手機之外,找到跟 AI 互動的新模式 (商機)。Jony Ive 很有信心說「這將是當代最偉大的技術革命」,有傳聞指出這個神祕的 AI 設備原型是類似項鍊的樣子,可以聆聽和感測各種資訊,以提供使用者個人化的 AI 服務。產品預計 2026 年發表,這會是屬於 OpenAI 的 iPhone 時刻嗎 !?
Google最近推出了開源的手機 App「Google AI Edge Gallery」,讓你的 Android手機也能離線跑AI了,模型、資料都在手機上直接處理,隱私更有保障,重點是完全免費使用。你可以直接在App裡無限制體驗「圖片提問」、「AI聊天」、「程式生成」等功能,完全不用擔心使用額度、月費的問題。用 AI 處理企業內部文件,也可以稍微放心了。
想要體驗的讀者,可以從 Github 下載 Android 的 APK 檔案進行安裝,開始 App 之後需要先下載 LLM 模型,檔案大約都數 GB 會占用手機一些空間。預設有生圖、聊天、提示詞測試等不同用途的模型,或者也能自行下載其他模型檔案載入。要在手機上很順暢地跑這些 AI 大語言模型,其實很吃硬體資源,加上目前還是初期 Alpha 版本,因此要有心理準備,可能會比較卡一點。目前只有 Android 版本,iOS 版本,要再等等囉!
Perplexity 最近推出更強大的 Labs 新模式,提供高階用戶可以體驗像多人團隊的AI Agent 功能,不單單只是蒐集資料,可以結合程式和其他工具,延伸幫你生成報告、圖表甚至應用程式,提供比深度研究更全面的應用。D 編在 X.com 上有看到實際用來分析網紅行銷策略和財務報表整理的應用,不過目前只有 Pro 以上方案才能使用這項功能,一般用戶還得在等等。
語音AI領域的全球領導者ElevenLabs,近期推出了劃時代的對話式AI 2.0平台,正式迎戰市場上對更自然、更智慧AI互動的殷切需求。作為技術的先驅,ElevenLabs深知傳統語音系統在對話流暢度上的限制,因此積極投入創新,致力於將AI對話體驗提升至全新層次。這次升級的核心在於其最先進的輪流對話模型,它能精準判斷對話時機,告別以往尷尬的停頓或打斷,讓AI與人之間的交流如同真人般順暢自然。
ElevenLabs支援31種語言,提供超過3,000種語音選項,其中也包含台灣口音的中文和英文的預設聲調,也可以使用專業語音複製(PVC)功能,打造專屬的聲音。小編直接套用現成的台灣中文語音,雖然有台灣人常說的語助詞,但很多句子念起來還是像外國人說中文,跟 NotebookLM 語音生成的流暢度有差,不過畢竟 NotebookLM 無法逐字生成語音,用途上有所侷限,ElevenLabs 仍然是通用性語音生成的首選之一。
Github 用戶 asgeirtj 近期陸續公開各大 AI 模型內部運作的 System Prompt (也就是內部工程師給 AI 的指令),包括 OpenAI、Grok、Gemini、Claude,而且才剛釋出的 Claude Sonnet 4 也不例外地被挖出完整的 System Prompt,遠遠超過 Anthropic 官方自己公布的內容,全長達 2.4 萬個 token。asgeirtj 也有提供如何要求 AI 模型自己吐露這些資訊的 Prompt,有興趣可以自己試試看 (asgeirtj 的 Github)。
從 Claude 的 System Prompt 中,可以看到 Claude 4 延續 Anthropic 合憲式 AI 的理念,特別強調防範錯誤,絕大部分的指令都在要求「不該做什麼」,除了一些可能危害公共安全或道德條款外,還有像是不能隨意使用條列 (D 編超認同)、不能提供有害內容,明確禁止生成受版權保護的歌詞,甚至被要求絕不能開頭就說「你的問題真棒」(ChatGPT 該學學)。這份 System Prompt 就像是 Claude 的指令集,強調清晰的規則和決策依據,避免模糊的形容詞。也特別在提示詞中加上使用工具並停下來「思考」(也就是思維鏈),優先從自身知識庫回答問題,只有在需要最新或即時資訊時,才會啟動網路搜尋功能等設計。
D 編有利用 ChatGPT 專案功能,局部將 Claude 的 System Prompt 複製過來使用,不過效果不顯著,推測應該是跟 ChatGPT 自己的 System Prompt 有所牴觸的關係。關於 Claude 4 System Prompt 詳細的解析可參考上面 Simon Willison 這篇部落格文章,對於 AI 開發者來說,從中可以學到 Prompt Engineering 的精髓,讓你的 AI 應用更稱心如意,產出你真正想要的結果!