新聞被當作訓練資料, 中央通訊社開告!🌠
快訊:溫布頓網球賽 AI 線審意外、用 AI 協助設計水下航行機、Cursor 計費變動、Google Workspace 管理工具 GQueues、AI 線上資料分析工具 Rows
點上方撥放鍵,收聽這期電子報
感謝 NotebookLM 語音生成功能,本期主題也同步上架 Podcast!如果你沒時間閱讀,可以邊聽邊吸收重點!
今年溫布頓網球賽在周一的比賽中,AI線審系統失靈,球明顯出界卻未判決,導致比賽中斷數分鐘。全英俱樂部隨後證實,這是操作人員「人為疏失」誤關系統所致。
此事件引發爭議:俄羅斯選手 Pavlyuchenkova 不滿判決,質疑裁判未主動判決,甚至懷疑是否因對手為地主選手而受偏袒。她呼籲網球界應建立類似足球 VAR 的影像回放系統。在此之前,部分球員和教練也都質疑過 AI 線審在草地球場上的準確性。
麻省理工學院電腦科學與人工智慧實驗室 (CSAIL) 的研究人員正在利用人工智慧 (AI) 開創新型態自主水下航行器的設計。這些「滑翔機」的傳統設計通常呈管狀或魚雷狀,但受海洋生物的啟發,研究團隊運用機器學習在物理模擬器中測試並優化各種三維形狀,以實現最大的流體力學效率。
最終目標是開發出比現有人工製造的滑翔機更節能、效率更高的設備,這些設備可應用於監測海洋數據,進而深入了解氣候變遷。
AI 程式碼編輯器 Cursor 近期因 Pro 方案定價變動未明確說明,導致部分用戶被意外收費,官方公開致歉。爭議核心在於「無限用量」的描述不清。6 月 16 日起的新方案中,僅 Tab 和 Auto 模式可無限使用,其餘尖端模型(如 Claude)有每月 $20 使用額度,超額後將依 API 價格計費。許多用戶誤以為所有模式皆無限,導致使用到超出額度卻沒有察覺。
Cursor 解釋,因尖端模型執行複雜任務會大量耗費 tokens,故從「請求次數計費」改為「用量額度制」以更準確反映成本。
為彌補損失,Cursor 承諾退還 6 月 16 日至 7 月 4 日間所有因誤用產生的費用,並將改進未來定價調整的通知機制與文件說明,儀表板中也新增了用量提示功能。
GQueues 是一款專為 Google Workspace 團隊設計的任務管理工具,目標是高效組織與提升生產力。提供免費試用,但目前僅限 Google 用戶使用(因為就是專門為 Google Workspace 而生的嘛)。
它能與 Google 日曆、雲端硬碟、Gmail 無縫整合,支援團隊協作、共享列表。核心功能包括郵件轉任務、附件管理(含創建 Google 文件)、標籤 和實時循環任務。GQueues 被譽為 Google Task 的升級版,提供更精準的時間管理。
Rows是一款整合AI功能的新型雲端試算表服務,被視為Excel或Google Sheets的替代方案,基本功能免費。讓你更有效整理、分析數據。
Rows具備強大AI功能,像是使用白話文指令控制試算表,並整合ChatGPT進行資料清理、分類等,以及透過AI Analyst快速找出數據洞見;它還能自動串接多種第三方網路服務匯入資料。網友回饋 Rows 的強項在於互動性強,但製圖製表功能仍不及Excel成熟。
近期國內接連發生在網路上爬取資料,遭到提告的爭議事件,D 編整理相關新聞報導以及國內外的法源依據,提供大家參考。上週在生成式 AI 社團有一位台大博士生發文表示:接到中山分局的員警來電,告知自己侵犯了中央通訊社的著作權,要求赴警局說明釐清案情。
事件始末源自於這名網友數月前曾經分享自己重新整理的繁體中文開源語料庫,這份語料庫源自於 HuggingFace 上的 fineweb-2 資料集,是由 Common Crawl 所蒐集爬取的資料整理而來,包含各種不同語言的文本。中央通訊社針對此事件也出面說明,主張擁有新聞報導的著作權,且未授權這位台大博士生使用,由於找不到當事人出面說明,為維護自身權益只好訴諸法律。事件爆發後,台大博士生已經刪除貼文,並表示配合司法調查中。
這次事件讓不少人細思極恐,有別於另一起 LawsNote 網路爬蟲的爭議案件是明確的商業行為,fineweb-2 資料集就 Common Crawl 的授權聲明看來,就是一份完全開放的文本資料,從中擷取出繁體中文語料再轉分享,也符合使用條款,應該很多熱心網友都做過類似的事情,萬萬沒想到最後居然會搞到要上法院。這次事件中央通訊社擁有新聞報導的著作權,即便公開在網路上,不代表可以被重製作其他用途,因此在法源上完全站得住腳。然而畢竟台大博士生引用自開放資料集,也未從中直接獲利,中央通訊社的做法就顯得不通情理,網友普遍認為找錯對象,應該把矛頭針對「最上游」的 Hugging Face 才對。其實對於內容供應商來說,有時只是希望大家能正視著作權,不盡然就一定是要從中牟利,以 D 編所任職的旗標科技來說,近期也有接獲研究單位來函要求授權,希望能合法爬取並使用網站資料,我們也欣然同意並主動提供結構化的文本。
反觀美國和歐盟都有所謂的 TDM 文本探勘條款,對於研究單位爬取網路資料多半可以視為合理使用,若著作權人提出異議,則使用單位必須無條件移除資料,保護科學研究的自由也保障著作權人的權益。台灣目前還沒有類似的法案,在相關單位研擬出明確合理的條款之前,大家在分享資料時還是小心一點。首先要有基本的著作權意識:即使是公開在網路上的內容,絕大多數仍受著作權保護,「可存取」不等同於「可自由使用」。優先選擇使用明確標示為公共領域或採用開放授權的資料集,若要轉分享,建議指向原始出處,若要進行重製也許只提供做法或原始碼即可,不要直接分享資料集,這樣會比較妥當。