```html AI in Our World — Advanced | AESOP AI Academy Module 2
🎯 進階

生活中的人工智慧

推薦演算法、語音助理、詐騙偵測——AI早已嵌入日常,只是我們鮮少察覺。

你今天使用了哪些系統,其中有哪些由AI驅動?

2016年,Netflix公開了一項關鍵數據:其推薦系統每年為公司節省約10億美元的用戶留存成本。這套系統分析超過1億名用戶的觀看歷史、暫停行為、重播片段與瀏覽時間,每天產出數十億條個人化排序結果。Netflix並非單純根據評分推薦——它根據你「何時」停止觀看、「哪個」縮圖讓你點擊,來預測你下一部會看的影片。

這個案例揭示了現代AI應用的核心邏輯:不是讓機器「理解」你,而是讓機器從你的行為模式中找出統計規律,然後用這些規律影響你的下一個決定。

推薦系統的決策機制

Netflix、YouTube、Spotify、蝦皮購物的推薦引擎,都是「協同過濾」(collaborative filtering)與「內容基礎過濾」(content-based filtering)的混合體。前者分析「和你行為相似的用戶」喜歡什麼;後者分析「你喜歡的內容」具備哪些特徵。

YouTube在2016年發表的論文揭露,其推薦系統使用深度神經網路,輸入超過數十億次觀看紀錄,目標不是最大化點擊率,而是最大化「觀看時間」。這個設計選擇帶來了爭議:因為聳動、極端的內容往往能延長觀看時間,系統因此傾向推薦這類內容,即使它可能對用戶有害。

關鍵概念

目標函數(objective function)決定AI優化的方向。優化「觀看時間」與優化「用戶滿意度」會產生截然不同的結果——這正是AI設計中最核心的倫理選擇之一。

語音助理的現實限制

Apple Siri於2011年推出,被譽為AI助理的先驅。然而2019年《衛報》調查揭露,Siri的語音錄音會被Apple承包商人工審聆,以提升準確率——其中包含用戶的私人對話、醫療討論、甚至性行為的意外錄音。Apple事後道歉並修改政策,允許用戶選擇退出審聆計畫。

這個事件說明:語音助理的「智慧」並非純粹來自機器——背後有大規模的人工標注與審核。「人在迴路」(human in the loop)是AI系統改進的必要環節,但同時也產生了隱私風險。

金融詐騙偵測:台灣的實際部署

台灣聯徵中心與多家銀行自2020年起大規模引入機器學習詐騙偵測系統。系統即時分析每筆交易的金額、時間、地點、裝置指紋與歷史模式,在毫秒內判定是否為異常行為。中國信託銀行公開表示,其AI詐欺偵測模型使誤報率降低40%,同時提高攔截率。

然而這些系統也造成「假陽性」問題:正常用戶的交易被誤判為詐騙而遭到凍結。系統的準確率提升與用戶體驗之間的權衡,至今仍是金融AI部署的核心挑戰。

  • 推薦系統的目標函數設計直接影響用戶行為與社會影響
  • 語音助理的訓練依賴人工標注,但這引發隱私爭議
  • 詐騙偵測AI須在準確率與誤報率之間取得平衡
  • AI的「智慧」往往來自大量人類勞動,而非純粹的機器自主

測驗:生活中的人工智慧

回答以下三個問題,測試你的理解程度。

1. Netflix推薦系統在2016年為公司節省約多少成本?
✓ 正確!Netflix公開表示推薦系統每年節省約10億美元的用戶留存成本,顯示AI對商業模式的直接影響。
✗ 不正確。根據Netflix公開資料,推薦系統每年節省的是約10億美元的用戶留存成本。
2. YouTube推薦系統在設計上以何為主要優化目標?
✓ 正確!YouTube在其2016年論文中說明,系統優化目標是最大化觀看時間,而非點擊率,這一選擇帶來了關於推薦極端內容的爭議。
✗ 不正確。YouTube推薦系統的主要目標是最大化「觀看時間」,這也是後來引發內容偏差問題的根本原因。
3. 2019年的Apple Siri隱私事件主要揭露了什麼問題?
✓ 正確!承包商會審聆Siri錄音以提升準確率,這包含用戶的私人對話,Apple事後修改了政策。
✗ 不正確。事件核心是Apple的承包商人工審聆用戶語音錄音,包括私人對話,引發嚴重隱私爭議。

🧪 實驗室:解析你的推薦系統

你每天都在使用推薦系統——YouTube、Spotify、Netflix、蝦皮。但你真的了解它如何「認識」你嗎?

在這個實驗室中,你將與AI助理討論推薦系統的運作原理、目標函數設計,以及這些選擇如何影響你的行為。

建議提問方向:「推薦系統怎麼知道我想看什麼?」或「目標函數的選擇會帶來哪些社會影響?」
  1. AI助理會先向你提問——請認真思考並回答。
  2. 你可以分享自己實際使用推薦系統的經驗。
  3. 嘗試追問:「如果優化目標改為用戶幸福感,會發生什麼?」
🤖 AI學習夥伴 推薦系統探究
🎯 進階

學校與娛樂中的AI

從自動評分到遊戲難度調整,AI正在重新定義學習與娛樂的邊界。

AI輔助學習能取代教師的判斷力嗎?

2020年,英格蘭考試局(Ofqual)因新冠疫情取消了A-Level實體考試,改用AI演算法預測學生成績。該演算法嚴重依賴學校歷史排名,導致來自弱勢學校的優秀學生成績被大規模下調。39%的預測成績低於教師評估,引發全國性抗議。英國政府被迫在兩週內推翻決定,改採教師評估分數。

這個案例直接說明:當AI系統的訓練資料本身就反映了社會不平等,其預測結果會將歷史偏見制度化,並以「客觀演算法」之名賦予其正當性。

自動評分系統的技術現實

自動作文評分(Automated Essay Scoring,AES)已在美國大規模部署,包括GRE、TOEFL等標準化考試。ETS(美國教育測驗服務社)的e-rater系統分析句子結構、詞彙複雜度、論點連貫性等特徵。然而研究顯示,這類系統有系統性偏差:它傾向給予長篇、用詞複雜的文章高分,即使論點空洞。

2012年一項實驗中,研究者故意提交高分聽起來流暢但語意錯亂的文章——e-rater給了高分,而人類評分者辨識出問題。這揭示了AES系統評估的是「語言表面特徵」,而非「思維深度」。

重要區別

能夠正確計分不等於能夠理解意義。自動評分系統在測量語言形式上有效,但在評估批判性思考上仍有根本限制。

遊戲AI:動態難度調整

現代電子遊戲廣泛使用動態難度調整(Dynamic Difficulty Adjustment,DDA)系統。《惡靈古堡4》是最早公開記錄此技術的商業遊戲之一:系統追蹤玩家的死亡次數、傷害承受率、彈藥消耗,即時調整敵人的攻擊頻率與準確率。

這套機制目的是維持「心流」(flow)狀態——讓玩家處於挑戰與能力之間的最佳平衡點。但批評者指出,DDA系統也可能被用來操縱玩家情緒,延長遊戲時間以促進課金行為。EA Sports在2019年因FIFA《終極球隊》模式中疑似操縱比賽勝率以刺激購買選手包而受到監管機構調查。

  • 英國A-Level演算法事件證明:AI訓練資料的歷史偏見會被放大並制度化
  • 自動評分系統評估的是語言形式,而非批判性思考能力
  • 遊戲DDA系統在提升體驗與操縱用戶之間存在模糊地帶
  • 教育AI的決策需要人類監督,尤其是關乎學生命運的高風險決策

測驗:學校與娛樂中的AI

回答以下三個問題,測試你的理解程度。

1. 2020年英國A-Level演算法事件中,系統最主要的問題是什麼?
✓ 正確!系統嚴重依賴學校的歷史排名,導致弱勢學校的優秀學生成績被系統性下調,39%的預測成績低於教師評估。
✗ 不正確。核心問題是演算法將歷史不平等制度化:來自傳統弱勢學校的學生,即使教師評估優異,也被系統大幅下調成績。
2. 關於自動作文評分(AES)系統,以下哪項描述最為準確?
✓ 正確!研究表明AES系統評估詞彙複雜度、句子結構等表面特徵,有時對語意錯亂但語言流暢的文章給出高分。
✗ 不正確。AES系統的主要限制是它評估的是語言的表面特徵,而非思維深度——這意味著華而不實的文章可能比思路深刻但表達簡單的文章得分更高。
3. 遊戲中的動態難度調整(DDA)被批評可能有何負面效果?
✓ 正確!批評者指出DDA系統可能被設計成操縱玩家在情感上的付費動機,EA Sports的FIFA即因此受到監管機構調查。
✗ 不正確。DDA的主要爭議是商業動機:系統可能被設計成讓玩家在特定時刻感到挫敗,進而購買遊戲內道具或選手包。

🧪 實驗室:教育AI的公平性分析

英國的A-Level事件讓全世界看到:當演算法接管高風險教育決策時,後果可能是災難性的。

在這個實驗室中,你將和AI助理探討教育AI的設計原則、偏見來源,以及如何設計更公平的系統。

思考方向:「如果你是Ofqual的工程師,你會如何重新設計這個系統?」或「哪些資料特徵不應該被用於預測學生成績?」
  1. AI助理會先提問,請根據你對英國案例的理解回答。
  2. 思考:「公平的演算法」是否可能存在?什麼樣的設計能降低偏見?
  3. 探討人類教師判斷與演算法預測各自的優缺點。
🤖 AI學習夥伴 教育AI公平性
🎯 進階

社區中的人工智慧

預測警政、社會福利評估、智慧城市——AI在公共服務中的部署,誰受益,誰承擔風險?

演算法決策是否比人類決策更公正?

2016年,ProPublica對美國刑事司法系統廣泛使用的COMPAS風險評估工具進行調查。COMPAS用於預測被告再犯風險,以輔助法官決定保釋、量刑。調查發現:在預測「不會再犯的黑人被告」方面,COMPAS的錯誤率是白人被告的兩倍;在預測「會再犯的白人被告」方面,錯誤率同樣偏高。

Northpointe公司(COMPAS開發商)反駁稱,系統的整體準確率在不同種族間相當。這場爭論引發了統計學界的重大辯論:「公平」可以用多種互相矛盾的數學定義來衡量,而這些定義在數學上無法同時滿足。

預測警政的真實後果

PredPol(現更名為Geolitica)是美國多個城市警察局使用的預測性警政(predictive policing)系統。該系統分析歷史犯罪資料,預測犯罪高發地點,引導巡邏資源。洛杉磯、芝加哥等城市曾大規模部署。

然而,研究顯示這類系統產生「自我強化循環」(feedback loop):若警力集中在特定社區,該社區的逮捕紀錄增加;增加的紀錄成為訓練資料,系統繼續預測該社區為高風險,導致更多警力投入——形成正向回饋,持續放大對特定社區的監控強度,即使實際犯罪率並未更高。

回饋循環問題

當AI的預測結果直接影響資料收集行為,而收集的資料又成為下一輪訓練資料時,偏見會被不斷放大。這是社會應用中最危險的AI失效模式之一。

智慧城市:新加坡與台灣的對比

新加坡的「Smart Nation」計畫大規模部署感測器網路與AI分析,包括追蹤人流密度、垃圾清運效率、公共空間使用狀況。新加坡政府將此定位為提升生活品質的技術治理工具。

台灣在智慧城市方面選擇了不同路徑。台北市的智慧路燈計畫整合空氣品質感測器,但在人臉辨識的部署上,台灣政府採取較為謹慎的立場。2020年個人資料保護法的修訂與行政院AI應用指引均強調資料最小化原則,限制了大規模生物辨識資料的收集。

  • COMPAS案例揭示「公平」在數學上存在多種互相矛盾的定義
  • 預測警政的自我強化循環會系統性放大對特定社群的偏見
  • 智慧城市的AI部署涉及便利性與隱私之間的根本取捨
  • 不同社會對監控技術的接受度取決於制度信任與文化背景

測驗:社區中的人工智慧

回答以下三個問題,測試你的理解程度。

1. ProPublica對COMPAS的調查發現了什麼主要問題?
✓ 正確!調查發現對黑人被告的錯誤標記為高風險(但實際未再犯)的比率,是白人被告的兩倍,顯示系統存在種族偏差。
✗ 不正確。ProPublica的核心發現是:COMPAS對黑人被告和白人被告的錯誤類型存在系統性差異,體現種族偏見。
2. 預測警政系統中的「自我強化循環」是指什麼現象?
✓ 正確!這是預測警政最嚴重的問題:系統的預測結果影響警力部署,而警力部署產生的資料又回頭強化預測,形成惡性循環。
✗ 不正確。自我強化循環的問題在於:預測→部署→資料收集→強化預測,整個鏈條會持續放大原有偏見,而非改善準確率。
3. 台灣在人臉辨識等生物辨識技術部署上採取什麼立場?
✓ 正確!台灣在行政院AI應用指引中強調資料最小化,對人臉辨識等高隱私風險技術採取較為審慎的態度。
✗ 不正確。台灣選擇了較謹慎的路徑,修訂個人資料保護法並強調資料最小化原則,而非全面擴張生物辨識監控。

🧪 實驗室:演算法公平性的數學困境

COMPAS事件引發了一個深刻問題:「公平」在數學上可以有多種定義,而這些定義往往互相矛盾。

在這個實驗室中,你將探討演算法公平性的不同衡量標準,以及在刑事司法、社會福利等高風險領域,應該如何做出取捨。

核心問題:「如果一個AI系統在整體準確率上對所有群體相同,但錯誤的類型不同,這算公平嗎?」
  1. AI助理會先提問,引導你思考公平性的定義。
  2. 思考不同的「公平」定義:預測準確率相等、假陽性率相等、假陰性率相等——這些能同時滿足嗎?
  3. 討論:在生死攸關的決策中,哪種錯誤更不可接受?
🤖 AI學習夥伴 演算法公平性
🎯 進階

醫療與科學中的AI

從蛋白質結構預測到癌症影像辨識,AI正在重塑科學發現的速度與邊界。

AI診斷比人類醫師更可靠,還是更危險?

2021年,DeepMind的AlphaFold2系統在CASP14蛋白質結構預測競賽中取得突破性成果:在大多數蛋白質類別中,預測準確度媲美實驗室X光晶體學。2022年,DeepMind公開了超過200萬種蛋白質的結構預測資料庫,涵蓋幾乎所有已知物種的蛋白質。這一成果被《Science》雜誌評選為2021年年度科學突破。

然而,蛋白質「結構」只是功能的一部分。預測結構不等於理解功能,更不等於開發出藥物。AlphaFold2加速了藥物開發的一個環節,但科學發現仍然需要人類的假設提出、實驗設計與結果詮釋。

醫療影像AI的實際表現

2020年,Google Health在《Nature》發表研究,顯示其乳癌篩查AI在英國和美國的資料集上,假陽性率分別降低5.7%與1.2%,假陰性率分別降低9.4%與2.7%,整體表現優於放射科醫師。這一結果在醫療AI領域引起廣泛關注。

然而,哈佛醫學院的後續分析指出:該研究使用的是單一機構的篩選後資料集,與真實臨床多樣性存在差距;AI在某些罕見癌症類型與特定族裔患者群體上的表現,遠低於平均水準。這說明「在受控資料集上優於人類」與「在真實診療環境中可靠」之間,存在巨大鴻溝。

分佈偏移問題

AI模型在訓練資料的分佈(distribution)上表現優異,但當真實世界的資料分佈與訓練資料不同時,模型效能可能急遽下降。這在醫療AI中是最需要警惕的風險之一。

台灣健保資料庫的AI應用

台灣擁有世界上最完整的全民健康保險資料庫之一,涵蓋超過2300萬人近30年的就醫紀錄。這個資料庫已被用於超過1000篇國際醫學研究,包括AI模型的訓練。

台灣大學醫學院與中央研究院合作,利用健保資料訓練AI模型,用於預測慢性腎臟病進程與糖尿病併發症風險。這類研究能做到是因為台灣資料的縱向完整性——同一個人的資料跨越數十年。然而,這也引發了資料主權的討論:當這些資料被用於商業AI開發時,民眾是否充分知情?

  • AlphaFold2加速了蛋白質結構研究,但科學發現的核心仍是人類判斷
  • 醫療AI在受控資料集上的優異表現,不必然等於真實臨床環境的可靠性
  • 分佈偏移是AI醫療應用中最常見的失效原因
  • 台灣健保資料庫是寶貴的研究資源,但也涉及資料主權與知情同意的挑戰

測驗:醫療與科學中的AI

回答以下三個問題,測試你的理解程度。

1. AlphaFold2的主要科學貢獻是什麼?
✓ 正確!AlphaFold2在CASP14競賽中展示了接近X光晶體學準確度的蛋白質結構預測能力,並公開了超過200萬種蛋白質的結構資料庫。
✗ 不正確。AlphaFold2的貢獻是蛋白質結構預測,而非藥物設計或基因模擬——結構是功能的基礎,但兩者之間仍有重大差距。
2. 「分佈偏移」(distribution shift)在醫療AI中是指什麼問題?
✓ 正確!分佈偏移是醫療AI最常見的失效原因:模型在特定資料集上表現優異,但當面對不同醫院、不同族裔、不同設備採集的真實資料時,效能可能大幅下降。
✗ 不正確。分佈偏移指的是訓練資料與真實應用資料之間的統計分佈差異,這是AI在受控環境表現良好但臨床部署卻失效的主要原因。
3. 台灣健保資料庫在AI醫療研究中的優勢是什麼?
✓ 正確!台灣健保資料庫的核心優勢是其縱向完整性——同一個人的長期就醫紀錄,使AI模型能夠學習疾病進程的時間模式。
✗ 不正確。台灣健保資料庫最重要的特點是其縱向完整性:超過2300萬人近30年的就醫紀錄,這在全球醫療資料庫中極為罕見。

🧪 實驗室:醫療AI的信任邊界

Google Health的乳癌AI在論文中優於人類醫師,但哈佛的後續分析揭示了它的限制。這引發了一個根本問題:我們應該在什麼條件下信任醫療AI的決策?

在這個實驗室中,你將探討醫療AI的可信度標準、部署條件,以及人機協作的最佳模式。

核心問題:「在哪些情況下,你會接受AI的醫療診斷而不要求人類醫師確認?」
  1. AI助理會先提問,引導你思考醫療AI的信任條件。
  2. 討論:AI診斷的「錯誤」與人類醫師的「錯誤」,責任歸屬有何不同?
  3. 思考:在台灣醫療體系中,AI輔助診斷應如何被納入臨床流程?
🤖 AI學習夥伴 醫療AI信任
🎯 進階

商業與職場中的AI

自動化取代哪些工作?AI如何重塑決策權力,以及誰控制生產工具?

AI自動化是解放人類,還是將工人困在演算法監控之中?

2021年,英國就業仲裁庭裁定Uber司機享有勞工身分,而非獨立承包商。Uber的算法系統決定司機的派單頻率、路線建議、評分標準與帳號停用條件——Uber聲稱這些是「平台決策」而非「管理行為」,但法庭認定這構成實質的管理控制關係。這個裁決在全球多個司法管轄區引發連鎖效應。

更關鍵的是:Uber的演算法從未向司機解釋決策邏輯。司機可能因為乘客給了4顆星而被停用,但無法得知具體原因。「黑箱管理」(algorithmic management)讓工人面對的是一個無法溝通、無法申訴的系統。

自動化的真實影響:不只是取代

麥肯錫2017年的報告預測,到2030年全球將有4億至8億個工作因自動化而消失。然而,後續研究的修正使這個數字更為複雜:許多職位不是被完全取代,而是部分任務被自動化,工人的角色從執行者轉變為監督者。

亞馬遜倉儲系統是這種轉變的典型案例。亞馬遜倉庫引入Kiva機器人(現稱Amazon Robotics)後,工人的工作從尋找貨架轉變為接收機器人送來的商品並完成分揀。工作效率提升,但工人面臨更嚴格的配額追蹤:每次拿取物品的時間被精確記錄,系統自動標記「未達標」的工人。工傷率實際上高於一般倉儲行業。

技術互補 vs. 技術取代

自動化並非總是取代工人——有時是重新定義工人的角色,但這種「互補」可能意味著更高強度的監控、更嚴格的配額,以及工作中人類判斷空間的縮減。

台灣半導體業:人機協作的另一種模式

台灣積體電路製造(TSMC)在晶圓廠大規模部署AI品質檢測系統。機器視覺系統即時分析晶圓缺陷,準確率超越人工目視。然而,TSMC的AI系統定位是「輔助」而非「取代」——最終判定異常晶圓的決策仍由工程師做出,AI提供候選清單與信心分數。

這種模式的選擇部分來自技術限制(AI可能在邊界案例上出錯),部分來自法規責任(工程師需要為品質負責),也部分來自企業文化(TSMC強調人才培養)。這與Uber和亞馬遜的演算法管理形成對比,說明相同的AI技術可以以截然不同的方式部署。

  • Uber案例揭示「演算法管理」構成實質勞動控制,挑戰傳統勞資關係定義
  • 亞馬遜倉儲顯示自動化可能提升效率但同時加劇工人監控強度
  • 自動化對工作的影響是「轉型」而非單純「取代」
  • TSMC的AI輔助模式說明,相同技術可以因部署策略不同而產生截然不同的社會影響

測驗:商業與職場中的AI

回答以下三個問題,測試你的理解程度。

1. 英國就業仲裁庭在2021年Uber裁決中認定的核心問題是什麼?
✓ 正確!法庭認定Uber演算法對司機的派單、評分與帳號管理構成實質的管理控制關係,司機因此享有勞工保障。
✗ 不正確。裁決的核心是勞動關係認定:法庭認為Uber的演算法系統實質上控制了司機的工作方式,這等同於管理行為,而非平台中介。
2. 亞馬遜引入倉儲機器人後,工人工作狀況發生了什麼變化?
✓ 正確!亞馬遜倉儲的案例說明,自動化有時不是取代工人,而是讓工人在更嚴密的演算法監控下工作,工傷率反而高於一般倉儲業。
✗ 不正確。引入機器人後,工人面臨更精確的配額追蹤和更嚴密的效率監控,工傷率實際上高於行業平均水準。
3. TSMC在晶圓廠AI品質檢測系統的部署方式上,與亞馬遜模式最主要的差異是?
✓ 正確!TSMC的AI系統提供候選清單與信心分數,但最終判定由工程師做出,這與演算法直接決定工人績效和工作的亞馬遜模式形成鮮明對比。
✗ 不正確。關鍵差異在於決策架構:TSMC將AI定位為「輔助」,人類工程師保留最終決策權;而亞馬遜的演算法直接決定配額與績效評估。

🧪 實驗室:演算法管理與勞動權利

當老闆是一個演算法時,工人如何保護自己的權益?Uber的裁決開創了先例,但全球各地的司法判斷仍不一致。

在這個實驗室中,你將探討AI在職場的應用邊界——什麼樣的決策可以交給演算法,什麼樣的決策必須保留人類判斷?

核心問題:「如果你是一名台灣的外送員,你希望哪些工作決策由AI做,哪些必須由人來決定?」
  1. AI助理會先提問,引導你思考演算法管理的邊界。
  2. 討論:「透明度」是解決演算法管理問題的充分條件嗎?
  3. 思考:台灣的勞動法規是否足以應對演算法管理帶來的新型勞資關係?
🤖 AI學習夥伴 演算法管理
🎯 進階

藝術、音樂與文化中的AI

生成式AI重塑創作邊界:版權、原創性、文化認同——誰擁有AI生成的作品?

AI生成的作品算是「創作」嗎?

2023年,好萊塢編劇工會(WGA)與美國演員工會(SAG-AFTRA)相繼發動罷工,部分核心訴求直接針對AI:禁止以AI生成劇本取代編劇,以及禁止未經演員同意使用其形象訓練AI模型。這是好萊塢史上規模最大的勞資衝突之一,持續數月。

最終達成的協議規定:電影公司不得以AI生成的劇本素材作為創作基礎,但允許編劇自願使用AI工具。對演員形象的AI使用則需要明確同意與補償。這個協議成為全球創意產業應對生成式AI的重要參考案例。

版權的根本挑戰

2023年,多名視覺藝術家對Stability AI、Midjourney等圖像生成公司提起集體訴訟,主張這些系統在未取得授權的情況下使用數十億張有著作權的圖像進行訓練。訴訟的核心法律問題尚無定論:使用版權作品訓練AI是否構成「合理使用」(fair use)?

美國著作權局在2023年確認:純粹由AI生成(無人類創意貢獻)的作品不能獲得著作權保護。然而,「人類貢獻程度」如何界定,仍是法律灰色地帶。這對台灣的著作權法同樣帶來挑戰——台灣著作權法現行條文以「人類創作」為保護前提,尚未就AI創作做出明確規範。

關鍵法律問題

訓練AI模型使用版權作品 ≠ 生成作品使用版權作品。前者是「學習過程」,後者是「輸出結果」。現行版權法框架是為人類創作設計的,對AI的適用性在全球各地仍存在重大爭議。

AI音樂與文化認同

2023年4月,一首由AI合成的歌曲以Drake和The Weeknd的音色演唱,在Spotify等平台累積超過1500萬次播放後被下架。唱片公司環球音樂(Universal Music Group)要求各平台移除「未授權使用藝人聲音」的AI生成內容。這一事件加速了各大串流平台建立AI內容標記政策。

在台灣,AI音樂生成工具已被一些獨立音樂人用於編曲輔助。然而,AI對台語歌、原住民族音樂等本土文化音樂的學習與生成,引發了文化知識主權的討論:誰有權利用原住民族的傳統旋律訓練商業AI模型?

  • WGA罷工確立了AI不得取代人類編劇的行業基準
  • 美國著作權局確認純AI生成作品無法獲得著作權保護
  • AI音樂聲線模擬引發藝人形象與聲音的財產權爭議
  • 原住民族音樂的AI應用涉及文化知識主權,超越一般版權框架

測驗:藝術、音樂與文化中的AI

回答以下三個問題,測試你的理解程度。

1. 2023年好萊塢WGA罷工達成的AI相關協議主要內容是?
✓ 正確!協議在保護編劇免被AI取代的同時,也允許編劇自願使用AI工具,並對演員形象的AI使用設立了同意與補償機制。
✗ 不正確。協議並非全面禁止AI,而是設立了明確的邊界:AI不得取代編劇作為創作基礎,但編劇可選擇性地使用AI作為輔助工具。
2. 美國著作權局在2023年就AI生成作品的版權問題做出什麼裁定?
✓ 正確!著作權局確認現行版權法以人類創意為保護前提,無人類創意貢獻的純AI生成作品不受版權保護,但「人類貢獻程度」的界定仍是灰色地帶。
✗ 不正確。著作權局的裁定是:純AI生成作品不受版權保護,因為現行法律保護的是人類的創意表達。
3. 台灣原住民族音樂的AI應用引發的主要爭議是什麼?
✓ 正確!文化知識主權的問題超越一般版權框架——即使傳統音樂不受版權保護(因為年代久遠),社群對其文化遺產的使用仍有道德與法律上的主張。
✗ 不正確。核心爭議是文化知識主權:傳統旋律可能已超過版權保護期限,但這不意味著任何人都可以用它們訓練商業AI模型而無需獲得社群同意。

🧪 實驗室:AI創作的邊界探究

當AI能夠生成以假亂真的繪畫、音樂、文學作品,「原創性」和「創作」的意義是否改變了?

在這個實驗室中,你將與AI助理探討生成式AI對創意產業的衝擊,以及如何在技術發展與創作者權益之間取得平衡。

核心問題:「如果你是一名插畫家,你會如何看待AI圖像生成工具對你職業生涯的影響?」
  1. AI助理會先提問,引導你思考創作者的立場。
  2. 討論:「AI是工具」還是「AI是競爭者」?這兩種定位的差異在哪裡?
  3. 思考:應該如何設計版權制度,才能在保護創作者的同時,不阻礙AI技術發展?
🤖 AI學習夥伴 AI創作版權
🎯 進階

政府與基礎建設中的AI

從電網管理到武器系統,AI進入國家治理的核心——責任歸屬如何界定?

當AI做出影響公眾的決策,問責機制如何運作?

2017年,荷蘭政府部署了名為SyRI(Systeem Risico Indicatie)的AI風險評估系統,用於偵測社會福利詐欺。系統整合稅務、就業、住房等多個政府資料庫,對公民進行風險評分——高分者可能被標記為詐騙嫌疑人並接受調查。系統的評分邏輯對被標記的公民完全不透明。

2020年,荷蘭法院裁定SyRI違反歐洲人權公約,因為系統侵犯隱私且缺乏透明度。荷蘭政府被迫關閉系統。這是歐洲首個法院裁定政府AI系統違法的重要案例,直接影響了歐盟《人工智慧法》(AI Act)的制定方向。

電力系統的AI優化

DeepMind與英國電網國家電網(National Grid UK)合作,使用強化學習(reinforcement learning)優化電力調配。DeepMind的系統能夠預測電力需求曲線,並根據風力與太陽能的即時輸出調整火力發電的備用容量。這一技術使英國電網的平衡成本降低了約10%。

台灣電力公司(台電)在高雄地區部署了AI負載預測系統,配合風力發電的間歇性特性優化電力調度。然而,電力基礎建設的AI化也帶來新的資安風險:一旦AI系統遭到攻擊或產生錯誤預測,可能引發大規模停電。台灣2021年的大規模停電雖非由AI引發,卻提醒了決策者對關鍵基礎設施AI化的審慎態度。

關鍵基礎設施的AI風險

電力、水資源、交通網路等關鍵基礎設施的AI化,在提升效率的同時,也創造了新的單點故障風險。AI系統的錯誤或攻擊可能造成遠比傳統系統更廣泛的連鎖影響。

自主武器系統的法律真空

以色列的「Harpy」無人機系統能夠在無人操控的情況下,自主識別並攻擊雷達系統。俄羅斯、美國、中國等國均在積極開發更高階的自主武器系統(Lethal Autonomous Weapons Systems,LAWS)。

國際人道法的核心原則要求區分軍事目標與平民,並維持比例原則——然而這需要情境判斷能力,現有AI系統能否可靠地做到,存在嚴重爭議。超過70個國家呼籲在聯合國層面建立約束LAWS的法律框架,但美中俄三大強國均未簽署具約束力的協議。問責的真空至今未能填補。

  • SyRI案確立了歐洲法院在制約政府AI系統上的實際效力
  • 電力系統AI化在提升效率的同時,創造了新的資安與可靠性風險
  • 自主武器系統在國際法上存在根本的問責空白
  • 政府AI系統的透明度與可解釋性是民主問責的必要前提

測驗:政府與基礎建設中的AI

回答以下三個問題,測試你的理解程度。

1. 荷蘭SyRI系統被法院裁定違法的主要理由是?
✓ 正確!法院認定SyRI違反隱私權與公平審判原則:被標記為高風險的公民無法得知原因,也無法有效申訴,這違反了歐洲人權公約的基本保障。
✗ 不正確。SyRI被裁定違法的核心是隱私侵犯與缺乏透明度——被標記的公民無從得知系統如何得出關於他們的風險評分。
2. 自主武器系統(LAWS)在國際法上面臨的最根本挑戰是?
✓ 正確!國際人道法要求區分原則與比例原則,而現有AI系統在複雜戰場環境中是否能可靠實現這些判斷,以及誰對錯誤攻擊負責,均無定論。
✗ 不正確。LAWS的核心國際法挑戰是問責空白:當自主武器系統誤殺平民,誰承擔法律責任?現行國際人道法框架未能給出答案。
3. DeepMind與英國電網合作的AI系統主要達成了什麼成果?
✓ 正確!DeepMind的強化學習系統通過預測需求曲線並優化火力發電備用容量,使英國電網的平衡成本降低了約10%。
✗ 不正確。DeepMind系統的具體成果是優化電力調配效率,使電網平衡成本降低約10%,而非完全自動化發電決策或消除停電。

🧪 實驗室:政府AI的民主問責

當政府用AI評分公民、管理基礎建設、甚至做出武器決策,民主問責機制如何有效運作?

在這個實驗室中,你將探討政府AI系統應具備哪些透明度標準,以及公民如何有效監督這些系統。

核心問題:「如果台灣政府想部署類似SyRI的福利評估AI,你認為需要哪些條件才算是合理的部署?」
  1. AI助理會先提問,引導你思考政府AI的問責標準。
  2. 討論:「演算法透明度」(algorithmic transparency)是否等於「可解釋性」(explainability)?兩者有何不同?
  3. 思考:在台灣的民主制度下,應由哪個機構負責監督政府AI系統的部署?
🤖 AI學習夥伴 政府AI問責
🎯 進階

全球AI版圖

美中AI競爭、歐盟監管框架、發展中國家的機遇與風險——AI的地緣政治正在重塑世界秩序。

AI技術的領先優勢是否等同於地緣政治的霸權?

2022年10月,美國商務部宣布對中國出口先進半導體和AI晶片實施全面限制,包括禁止向中國出口NVIDIA A100和H100等高階GPU,以及限制協助中國開發AI的美國公民和永久居民。這是美國有史以來對中國科技出口最嚴格的管制,被稱為「小院高牆」(small yard, high fence)戰略。

這項政策的直接效應是:中國的AI硬體供應受到限制,倒逼華為等公司加速自主研發。2023年,華為推出Mate 60 Pro,使用了7奈米製程的麒麟9000s晶片,顯示中國在特定半導體領域的突破。然而,中國整體AI算力基礎設施仍與美國存在明顯差距。

歐盟的監管路徑:《人工智慧法》

2024年,歐盟《人工智慧法》(EU AI Act)正式通過,成為全球首部全面性的AI監管法律。法案採用風險分級制度:將AI系統分為「不可接受風險」(禁止,如社會信用評分)、「高風險」(強制審查,如醫療設備、關鍵基礎設施)、「有限風險」(透明度要求)與「最低風險」(無特別規範)。

值得注意的是,歐盟法案對通用AI模型(GPAI,如ChatGPT)設定了特殊要求:必須提交技術文件、遵守著作權法,以及進行對抗性測試(adversarial testing)。違規最高罰款為全球年營業額的7%。這一法律框架的「布魯塞爾效應」(Brussels Effect)意味著,即使是在歐盟以外運營的AI公司,為了進入歐洲市場,也必須遵守這些規範。

布魯塞爾效應

歐盟的大市場規模使其監管標準具有全球影響力——企業為了進入歐洲市場,往往選擇將歐盟標準應用於全球產品,而非為歐洲市場單獨設計合規版本。

台灣在全球AI版圖中的位置

台灣在全球AI版圖中扮演著獨特的「供應鏈樞紐」角色。台積電(TSMC)生產了全球絕大多數的先進AI晶片(包括NVIDIA所有的高階GPU),使台灣成為美中AI競爭中不可或缺的關鍵節點。2022年的《晶片法案》(CHIPS and Science Act)要求台積電在美國建廠,折射出美國對單一供應鏈地緣政治風險的焦慮。

台灣政府於2023年發布《人工智慧基本法》草案,借鑑歐盟AI Act的風險分級框架,同時強調符合台灣產業結構的差異化設計。台灣在AI應用上的相對競爭優勢包括:製造業AI化(智慧製造)、健保資料的醫療AI研究,以及資安防禦AI的實戰需求。

  • 美國對華晶片出口管制重塑了全球AI硬體供應鏈的地緣政治結構
  • 歐盟AI Act確立了全球首個全面性AI法律框架,其「布魯塞爾效應」影響深遠
  • 台積電的關鍵地位使台灣在全球AI競爭中具有不對稱的戰略重要性
  • 不同國家的AI治理路徑反映其政治體制、產業結構與地緣政治立場的根本差異

測驗:全球AI版圖

回答以下三個問題,測試你的理解程度。

1. 2022年美國對中國的AI晶片出口管制「小院高牆」策略,其直接目標是?
✓ 正確!美國商務部的出口管制針對高效能AI訓練所需的先進GPU,目的是在關鍵AI算力上拉大美中差距。
✗ 不正確。美國管制的目標是特定的高效能AI晶片(如NVIDIA A100和H100),而非全面封鎖對中貿易——這就是「小院高牆」策略的精確性所在。
2. 歐盟《人工智慧法》對「不可接受風險」類別的AI系統採取什麼措施?
✓ 正確!歐盟AI Act對「不可接受風險」類別採取直接禁止而非監管的態度,社會信用評分系統是最典型的例子。
✗ 不正確。「不可接受風險」不是「加強監管」,而是「完全禁止」——這是歐盟監管框架中最嚴格的類別,直接立法禁止某些AI應用。
3. 台灣在全球AI版圖中最獨特的戰略地位來自何處?
✓ 正確!台積電在先進半導體製造上的主導地位,使台灣成為全球AI硬體供應鏈中最關鍵的節點,這也是美國《晶片法案》要求台積電赴美設廠的根本原因。
✗ 不正確。台灣在全球AI版圖中的核心地位來自台積電的半導體製造優勢——這使台灣成為美中AI競爭中任何一方都無法忽視的關鍵供應鏈節點。

🧪 實驗室:AI地緣政治的台灣視角

美中AI競爭正在重塑全球科技秩序,而台灣站在這場競爭的最關鍵節點上。台積電的地位讓台灣擁有巨大影響力,但也帶來了前所未有的風險。

在這個實驗室中,你將與AI助理探討台灣在全球AI版圖中的戰略選擇,以及AI技術的地緣政治競爭對普通公民的實際影響。

核心問題:「台灣的半導體優勢在AI時代是一種保護還是一種風險?請從地緣政治的角度分析。」
  1. AI助理會先提問,引導你分析台灣在全球AI競爭中的位置。
  2. 討論:歐盟、美國、中國三種不同的AI治理模式各代表什麼價值觀?
  3. 思考:台灣應該效仿哪種AI治理模式?還是應該建立自己的路徑?
🤖 AI學習夥伴 全球AI地緣政治

📋 模組測驗

模組二:AI in Our World — 共15題,測試你對八堂課核心概念的掌握程度。

題目 01
Netflix推薦系統最主要優化的目標指標是?
✓ 正確!Netflix的推薦系統分析觀看行為,核心目標是預測並最大化用戶留存,這也是其估計為公司節省10億美元的原因。
✗ 不正確。Netflix推薦系統的核心目標是透過行為分析預測並最大化用戶留存率,而非直接優化評分或廣告。
題目 02
YouTube推薦演算法被批評可能推薦極端內容的根本原因是?
✓ 正確!這是目標函數設計帶來非預期後果的典型案例:優化觀看時間本身是合理的商業目標,但其副作用是推薦讓用戶情緒激動的內容。
✗ 不正確。問題在於目標函數的設計:「觀看時間」這個指標本身並無惡意,但聳動內容在統計上能更有效地留住用戶,系統因此傾向推薦它。
題目 03
2020年英國A-Level演算法事件中,39%的學生成績被下調的主要原因是?
✓ 正確!這是AI系統將歷史不平等制度化的典型案例——演算法用學校過去的整體表現,壓低了該校個別優秀學生的成績。
✗ 不正確。根本問題是演算法設計:以學校歷史排名作為強預測因子,導致來自傳統弱勢學校的學生,即使個人能力優秀,也被系統拉低成績。
題目 04
自動作文評分(AES)系統最主要的技術限制是?
✓ 正確!AES系統能識別句子結構、詞彙複雜度等形式特徵,但無法真正理解論點的邏輯強度或創意深度。
✗ 不正確。AES的核心局限是它評估的是語言「形式」而非「內容」——流暢但空洞的文章可能比邏輯深刻但表達簡樸的文章獲得更高分。
題目 05
COMPAS風險評估工具被批評存在種族偏見,Northpointe(開發商)的回應是?
✓ 正確!這場爭論揭示了一個深刻的統計問題:「公平」可以有多種數學定義(整體準確率相等、假陽性率相等等),而這些定義在數學上無法同時滿足。
✗ 不正確。Northpointe的立場是:系統對不同種族的「整體準確率」相當,從這個維度衡量是公平的——問題在於「哪種公平」的爭議。
題目 06
預測警政系統的「自我強化循環」最可能造成什麼後果?
✓ 正確!回饋循環的問題在於:更多警力→更多逮捕→更多「犯罪資料」→系統預測該地區犯罪率更高→投入更多警力,形成惡性循環。
✗ 不正確。自我強化循環正好相反——它會持續加深對已被標記社區的監控,而不是讓資源分配更公平。
題目 07
AlphaFold2對科學研究的主要貢獻與限制各是什麼?
✓ 正確!AlphaFold2解決了蛋白質折疊預測這一50年難題,但結構只是功能的起點——從結構到藥物開發,還需要人類科學家的假設提出與實驗驗證。
✗ 不正確。AlphaFold2的貢獻是蛋白質結構預測,限制是「結構≠功能」——知道蛋白質長什麼樣,不等於知道它如何運作,也不等於能設計出針對它的藥物。
題目 08
在醫療AI的「分佈偏移」問題中,最常見的失效情境是?
✓ 正確!分佈偏移是醫療AI最常見的失效模式:訓練資料(如單一醫學中心的影像)與實際應用環境(多元化的真實臨床場景)之間存在統計差距。
✗ 不正確。分佈偏移的典型情境是:AI在訓練資料的分佈上達到高準確率,但當面對不同地區、不同設備、不同族裔患者的資料時,效能顯著降低。
題目 09
英國法院認定Uber司機享有勞工身分的核心論據是?
✓ 正確!法院認定,控制「如何工作」的演算法系統在功能上等同於僱主的管理行為,因此司機與Uber之間的關係是僱傭關係,而非獨立承包關係。
✗ 不正確。裁決的核心是:演算法對工作方式的控制(而非時間要求或設備提供)構成實質的管理行為,這是認定勞動關係的關鍵依據。
題目 10
2023年好萊塢WGA罷工關於AI的核心訴求是?
✓ 正確!WGA罷工建立了創意產業應對生成式AI的重要先例:AI不得取代創作者,但創作者可自願使用AI作為工具。
✗ 不正確。WGA的核心訴求是保護編劇不被AI取代,以及保護演員對自身形象的控制權——這兩點最終都在協議中得到了保障。
題目 11
美國著作權局對AI生成作品的版權認定立場是?
✓ 正確!著作權局堅持「人類創意」是版權保護的前提,純AI生成的作品不能獲得著作權,但「人類貢獻程度」的界定仍是持續演進的法律問題。
✗ 不正確。著作權局的立場是:沒有實質人類創意貢獻的AI生成作品不受版權保護——版權保護的是人的創意表達,而非機器的輸出。
題目 12
荷蘭SyRI系統被歐洲法院裁定違法,對歐盟《人工智慧法》制定的影響是?
✓ 正確!SyRI案確立了法院能夠審查並叫停政府AI系統的先例,直接影響了EU AI Act中高風險AI必須透明、不可接受風險類別必須禁止的框架設計。
✗ 不正確。SyRI案的政策影響是:確立了政府AI系統需要透明度與可問責性的法律原則,這直接反映在EU AI Act的風險分級與禁止類別設計中。
題目 13
自主武器系統(LAWS)在國際法上最根本的問責挑戰是?
✓ 正確!LAWS的問責空白是:機器做出了殺死人的決定,那「誰」應該負責?設計者?指揮官?國家?現行國際人道法未能給出明確答案。
✗ 不正確。LAWS最深刻的國際法挑戰是問責的根本空白:當自主系統的決定導致平民傷亡,責任歸屬在現行法律框架下無從確定。
題目 14
美國對中國AI晶片出口管制的主要戰略邏輯是?
✓ 正確!「小院高牆」策略的邏輯是精確而非全面封鎖:針對先進AI算力這個關鍵瓶頸,在技術上拉大美中差距,而非全面脫鉤。
✗ 不正確。美國的戰略是「小院高牆」而非全面脫鉤:精確鎖定AI發展的算力瓶頸(高階GPU),阻礙中國在AI訓練規模上追趕美國的速度。
題目 15
歐盟《人工智慧法》的「布魯塞爾效應」是指什麼現象?
✓ 正確!布魯塞爾效應是歐盟監管影響力的核心機制:為維持一套統一的全球產品線,企業往往選擇將最嚴格的歐盟標準應用於全球,而非只為歐洲市場單獨設計。
✗ 不正確。布魯塞爾效應描述的是歐盟監管的「全球外溢效應」:企業為了不被排除在歐洲大市場之外,傾向於在全球都採用符合歐盟標準的設計。
```