🎯 進階 · 第一課

什麼是倫理學?

倫理學不是道德說教,而是一套分析工具——幫助我們在真實衝突中做出可辯護的決定。

當規則和後果相互衝突時,我們該如何做決定?

2018 年,Google 員工得知公司正在參與美國國防部的「Project Maven」計畫——利用 AI 分析無人機影像,協助軍事目標識別。超過 4,000 名工程師聯署請願,要求 Google 退出。他們提出的核心論點並非「我們不能做」,而是「我們不應該做」。Google 最終於 2019 年不續簽合約。這場爭議的根本問題是:工程師的技術能力,是否包含拒絕某些應用的倫理責任?

三大倫理框架

倫理學(Ethics)是哲學的一個分支,研究「什麼是對的行為」。在 AI 領域,我們主要運用三個框架來分析決策。

功利主義(Utilitarianism)

由邊沁(Jeremy Bentham)和彌爾(John Stuart Mill)發展。核心原則:產生最大多數人的最大幸福的行動,就是正確的行動。評估標準在於後果。Project Maven 的支持者可能主張:精準打擊能減少平民傷亡,整體結果更好。

義務論(Deontology)

以康德(Immanuel Kant)為代表。核心主張:某些行為本身就是錯的,無論後果如何。反對 Maven 的工程師採取了義務論立場——參與致命武器系統在道義上就是不可接受的,不管它是否能「減少傷亡」。

美德倫理(Virtue Ethics)

源自亞里士多德。問的不是「這個行為對不對」,而是「有美德的人會怎麼做」。在 AI 倫理中,這轉化為:我們希望建構 AI 的組織和工程師展現什麼樣的品格?

為什麼框架很重要

Project Maven 的案例顯示,同一個事實可以在不同框架下得出截然不同的結論。功利主義者和義務論者都可能是理性、誠信的人,卻做出相反的決定。這不是誰「想太多」或「太敏感」,而是框架本身的邏輯差異。

了解你使用的是哪個框架,能讓你的論點更清晰、更具說服力,也更容易被挑戰和修正。沒有意識到自己框架的決策者,往往在事後才發現自己無法為決定辯護。

📝 測驗 · 第一課

什麼是倫理學?

測試你對三大倫理框架的理解。

1. Google Project Maven 案例中,反對參與的工程師主要採用哪種倫理立場?
✓ 正確!義務論主張某些行為本質上是錯的,不管後果如何。工程師的連署聲明正是以此為核心——不是計算死傷人數,而是拒絕成為致命武器鏈的一環。
✗ 再想想。工程師的論點不在於後果計算,而在於參與本身的道義問題——這正是義務論的核心。
2. 功利主義評估一個行為是否正確,依據的是什麼?
✓ 正確!功利主義的核心是後果主義——衡量行為對所有相關方產生的福祉總量,選擇最大化整體幸福的選項。
✗ 不對。功利主義關注的是後果,不是行為者的品格或普遍法則。邊沁和彌爾問的是:這個行為產生多少幸福?
3. 為什麼在 AI 決策中明確自己所用的倫理框架很重要?
✓ 正確!清楚的框架讓分歧變得可討論——你可以說「我們使用的框架不同」,而不是「你就是錯了」。這正是理性倫理論辯的基礎。
✗ 再思考一下。框架的價值不在權威或合規,而在清晰度——它讓你的推理過程透明,讓他人能夠理解並回應你的論點。
🧪 實驗室 · 第一課

框架對話

運用三大倫理框架分析真實的 AI 決策。

任務說明

你將與 AI 導師進行對話,練習從不同倫理框架分析 AI 倫理案例。

  1. AI 導師會先提出一個真實的 AI 倫理情境,並問你會從哪個框架切入。
  2. 說明你的框架選擇和理由。
  3. AI 導師會挑戰你的論點,或提出對立的框架視角。
建議起點:試著用功利主義和義務論各分析一次同一個情境,看看結論有何不同。
🤖 AI 倫理導師 倫理框架實驗室
🎯 進階 · 第二課

誰有決定權?

AI 倫理的核心問題之一:在沒有民主授權的情況下,誰有資格為社會制定規則?

科技公司制定 AI 使用規範,這算是一種治理嗎?

2021 年,Facebook(現 Meta)的「監督委員會」(Oversight Board)就前美國總統川普帳號是否應永久停權一事發布裁決。這個由 Meta 出資設立、由外部學者和前政治人物組成的委員會,要求 Meta 在六個月內重新審議並制定明確標準,不得以「無限期停權」作為處罰。這個事件揭示了一個深層問題:一家私人公司設立的「法院」,其決策影響了全球三十億人的公共論述——但沒有人選舉過這個委員會,也沒有任何政府授權它的權力。

治理的真空地帶

AI 系統的決策影響力已遠超過任何單一國家的立法速度。當演算法決定誰能看到哪些新聞、誰的貸款申請被核准、誰的履歷能通過篩選,「誰制定規則」就不再是抽象問題。

目前,這個權力落在三個主要行為者之間:

  • 科技公司:透過服務條款、演算法設計和內部倫理指引制定事實上的規則。
  • 政府監管機構:歐盟《AI 法案》(EU AI Act)於 2024 年通過,是目前最全面的 AI 法規,但執行仍是挑戰。
  • 技術社群:研究人員、開放原始碼社群和標準機構(如 IEEE、ISO)透過技術規範施加影響。

問責落差(Accountability Gap)

Facebook 監督委員會案例暴露了「問責落差」——決策者的影響力與其可被追究的責任之間的落差。傳統民主制度假設:有權力者可以被選民撤換、被法院制裁、被立法機構監督。但 AI 治理的實際情況是:最有影響力的決策者往往不在任何問責框架之內。

關鍵張力

移動快、修補後——科技公司的行動速度與民主治理的審議速度之間存在根本性的不對稱。這不只是效率問題,而是正當性(legitimacy)問題:快速決策的正當性從哪裡來?

📝 測驗 · 第二課

誰有決定權?

測試你對 AI 治理與問責的理解。

1. Facebook 監督委員會的案例主要揭示了什麼問題?
✓ 正確!這個案例的核心不是川普對不對,而是:一個沒有人選舉、沒有政府授權的私人委員會,怎麼能合法地為三十億人制定言論規則?
✗ 再想想。課文的重點不在言論自由的抽象辯論,而在治理正當性——誰被授權做這些決定?
2. 「問責落差」(Accountability Gap)指的是什麼?
✓ 正確!問責落差描述的是「有權力但無需負責」的狀態。AI 治理中,最有影響力的行為者往往不受傳統問責機制約束。
✗ 不對。問責落差是關於責任與權力的不對稱,不是技術效能或薪資問題。
3. 歐盟《AI 法案》(EU AI Act)的意義在於?
✓ 正確!EU AI Act 是重要的里程碑,但它也說明了政府監管的現實挑戰:有法規不代表有效執行,尤其面對跨國科技公司時。
✗ 再看看課文。AI Act 是重要框架,但課文強調的是它的限制,而不是它的全面性勝利。
🧪 實驗室 · 第二課

治理設計工作坊

如果你來設計 AI 治理機制,你會如何解決問責落差?

任務說明

你將與 AI 導師討論 AI 治理的設計問題,探索不同的問責機制。

  1. AI 導師會先問你:在現有三種治理行為者中,你認為誰應該扮演主導角色?
  2. 說明你的理由,並考慮你的答案的潛在缺點。
  3. 討論如何設計一個能真正追究責任的 AI 治理機制。
思考方向:你設計的機制能否同時兼顧「行動速度」和「民主正當性」?這兩者可能根本上相互衝突嗎?
🤖 AI 治理導師 治理設計實驗室
🎯 進階 · 第三課

真實的傷害,真實的人

AI 的錯誤不只是技術失敗——它們落在真實的人身上,留下真實的後果。

AI 系統的錯誤,和人為錯誤在道德上有何不同?

2019 年,美國密西根州男子Robert Williams被警察逮捕,原因是臉部辨識系統將他誤認為一名嫌疑人。在看守所待了三十個小時後,調查人員意識到錯誤——唯一的「證據」是一個準確率有問題的演算法輸出。Williams 是一名黑人男性,研究顯示當時主流臉部辨識系統對深膚色男性的錯誤率,比對淺膚色男性高出五到十倍。他的案例成為美國多個城市禁止警方使用臉部辨識技術的重要引爆點。

傷害的類型

AI 倫理學者 Kate Crawford 和 Timnit Gebru 等人的研究將 AI 造成的傷害分為幾個層次:

  • 直接傷害(Direct Harm):系統的錯誤直接導致特定人物受到不公正對待,如 Williams 的錯誤逮捕。
  • 系統性傷害(Systemic Harm):AI 系統強化或放大既有的社會不平等,即使每次決定看起來都是「技術上中立的」。
  • 表徵傷害(Representational Harm):AI 系統在輸出中貶低或扭曲特定群體,如圖像生成工具傾向於將「醫生」生成為白人男性。

誰承受後果?

Williams 案揭示了 AI 傷害的一個關鍵特徵:傷害的分布不均。系統的設計者和部署者極少是受害者;承受錯誤代價的,往往是社會中已然弱勢的群體。這不是偶然的——訓練資料反映的是歷史現實,而歷史現實本身就是不平等的。

「技術上中立」是一個危險的神話。一個在有偏差的歷史資料上訓練的模型,即使程式碼本身沒有任何歧視性的語句,也會系統性地產生歧視性的輸出。

結果

Williams 案之後,底特律、舊金山、波特蘭等城市相繼立法禁止警方使用臉部辨識。Amazon 也宣布暫停向執法機構銷售其 Rekognition 系統。這些行動表明:記錄具體傷害,是推動政策改變的最有效手段。

📝 測驗 · 第三課

真實的傷害,真實的人

測試你對 AI 傷害類型的理解。

1. Robert Williams 的案例屬於哪種傷害類型?
✓ 正確!Williams 的案例最直接的是「直接傷害」——一個可識別的個人因 AI 系統的錯誤輸出直接受到不公正對待。當然它也牽涉系統性問題,但起點是直接傷害。
✗ 再想想。直接傷害的定義是:AI 錯誤直接導致特定個人受到不公正對待。Williams 在看守所待了三十小時——這是可識別的、直接的後果。
2. 為什麼說「技術上中立」對 AI 系統來說是一個危險的神話?
✓ 正確!資料是歷史的鏡子,歷史本身就是不平等的。一個從不平等歷史中學習的模型,無論程式碼多麼「乾淨」,都會重現那個不平等。
✗ 不對。問題不在個別工程師的偏見,而在訓練資料本身所反映的歷史結構性不平等。
3. Williams 案引發的政策後果是什麼?
✓ 正確!具體記錄的傷害是推動政策改變的關鍵。底特律、舊金山、波特蘭等城市的禁令,以及 Amazon 的暫停銷售,都直接回應了 Williams 等案例揭露的問題。
✗ 再看課文。後果是地方層級的立法和企業自願暫停,而非聯邦層級的全面禁令。
🧪 實驗室 · 第三課

傷害分析實驗室

學習辨識 AI 傷害的類型與成因。

任務說明

你將與 AI 導師分析真實 AI 傷害案例,練習分類與歸因。

  1. AI 導師會描述一個真實的 AI 傷害事件,並問你它屬於哪種傷害類型。
  2. 說明你的分類理由,並找出系統設計中哪個環節導致了傷害。
  3. 討論:這個傷害是可以預防的嗎?應該由誰承擔責任?
進階思考:同一個 AI 系統可能同時造成直接傷害、系統性傷害和表徵傷害嗎?請舉例說明。
🤖 AI 傷害分析導師 傷害分析實驗室
🎯 進階 · 第四課

AI 版電車難題

當 AI 必須在兩種傷害之間做出選擇,倫理框架如何指引決定——以及為什麼沒有完美答案。

自動駕駛汽車應該被預先程式化以做出生死決策嗎?

2016 年,麻省理工學院媒體實驗室發起「道德機器」(Moral Machine)實驗,蒐集全球 233 個國家、超過 400 萬人對自動駕駛道德困境的偏好。結果顯示:不同文化對「優先保護誰」有系統性差異。例如,相較於東亞受訪者,西方受訪者更傾向於讓老年人犧牲以保護年輕人;相較於貧窮國家,富裕國家更傾向保護行人而非車內乘客。這意味著「正確」的自動駕駛倫理,可能根本不存在放諸四海皆準的版本。

從思想實驗到工程決策

電車難題(Trolley Problem)是哲學課的標準討論題,但自動駕駛讓它變成了工程師每天面對的設計決策。不同之處在於:

  • 傳統電車難題是思想實驗,不需要真正執行答案。
  • 自動駕駛系統的緊急避撞演算法,必須在毫秒內做出真實的決定。
  • 這個決定在事故發生前就已被程式化——不是由事故現場的人做出,而是由坐在辦公室的工程師預先設定。

三個框架,三種答案

以「要撞一個闖紅燈的行人,還是轉向撞上護欄傷害乘客」為例:

功利主義的回答

計算生命數量和存活機率。如果轉向只會讓乘客輕傷,但直行會讓行人重傷,則應轉向。但如果乘客是五個人而行人是一個人呢?功利主義的計算可以得出反直覺的結論。

義務論的回答

不應預先程式化「誰的生命更重要」,因為這違背了每個人固有的尊嚴。有些義務論者認為,車子應被設計為優先保護乘客——這是車主購買汽車所蘊含的隱性契約。

工業界的實際答案

大多數自動駕駛公司(包括 Waymo 和 Tesla)拒絕公開討論其緊急決策演算法,理由是這類情境在統計上極為罕見,且過度聚焦於此反而忽略了更重要的整體安全設計。這本身就是一個倫理選擇:選擇不透明。

📝 測驗 · 第四課

AI 版電車難題

測試你對 AI 道德決策困境的理解。

1. 「道德機器」實驗的主要發現是什麼?
✓ 正確!道德機器實驗揭示了道德偏好的文化相對性——這對「一刀切」的自動駕駛倫理設計提出了根本挑戰。
✗ 不對。實驗恰恰顯示了相反的情況:不同文化的偏好有顯著差異,不存在普遍共識。
2. 自動駕駛的道德決策和傳統電車思想實驗最關鍵的不同是什麼?
✓ 正確!這是關鍵差異。傳統電車難題是思想實驗,不需要執行。自動駕駛演算法必須在毫秒內自動執行預先設定的決策——這個決策在事故發生前就由工程師做出了。
✗ 再想想。核心差異在於決策的時間點和執行者——不是誰的情緒更複雜,而是誰在何時做出決定。
3. 大多數自動駕駛公司選擇不公開其緊急決策演算法,這本身是什麼?
✓ 正確!不公開本身就是一個倫理立場。選擇「我們不回答這個問題」和選擇「我們優先保護行人」一樣,都是需要被審視的倫理決定。
✗ 再想想。課文明確指出:「這本身就是一個倫理選擇:選擇不透明。」沒有任何立場是倫理上中立的。
🧪 實驗室 · 第四課

道德決策工程師

如果你是自動駕駛工程師,你會如何設計緊急決策系統?

任務說明

你將扮演一個自動駕駛團隊的倫理顧問,與 AI 導師討論緊急避撞演算法的設計原則。

  1. AI 導師會先提出一個具體的緊急情境,問你會如何設計系統的決策邏輯。
  2. 說明你選擇的倫理框架和設計原則。
  3. 討論:你的設計在不同文化背景下是否公平?如果不公平,你如何回應?
核心挑戰:你能設計一個系統,讓它的緊急決策對所有受影響的人都是公平的嗎?還是公平本身就是幻覺?
🤖 AI 工程倫理導師 道德決策實驗室
🎯 進階 · 第五課

公平並不簡單

「公平」有多種數學定義,而這些定義在邏輯上互相衝突——你無法同時滿足所有人。

不同的公平定義可以同時成立嗎?

2016 年,ProPublica 分析了美國法院廣泛使用的 COMPAS 累犯風險評估工具,發現它對黑人被告的「高風險」誤判率(45%)幾乎是白人被告(23%)的兩倍。開發公司 Northpointe 反駁道:在被預測為高風險的人當中,各族裔實際再犯的比例是相近的——這意味著系統是「校準公平」的。兩者都用數據支持自己的主張,因為他們使用的是不同的公平定義。這場爭議後來引發了機器學習公平性研究的重大突破——以及令人不安的數學發現。

公平的數學定義

2016 年後,研究人員 Jon Kleinberg、Chouldechova 等人從數學上證明了一個令人不安的結論:在大多數現實情境中,以下三個公平性指標無法同時成立

校準公平(Calibration)

如果系統預測某人有 70% 的再犯機率,那麼在所有被預測為 70% 的人當中,實際再犯比例應接近 70%——且對所有群體一致。Northpointe 主張 COMPAS 達到了這個標準。

錯誤率平等(Error Rate Parity)

不同群體之間的假陽性率(誤判高風險)和假陰性率(誤判低風險)應相同。ProPublica 發現 COMPAS 在這個指標上對黑人被告不公平。

為什麼無法同時成立

如果兩個群體的基礎再犯率本來就不同(因為歷史性的系統不平等),那麼同時達到「校準公平」和「錯誤率平等」在數學上是不可能的——這不是工程問題,而是數學定理。

為什麼這很重要

COMPAS 案例的真正意義不是「誰對誰錯」,而是:在基礎不平等存在的情況下,任何算法都無法同時對所有群體在所有定義下公平。這是一個政治和倫理選擇——你選擇優先滿足哪個公平定義,就是在選擇讓哪個群體承受更多的錯誤代價。

📝 測驗 · 第五課

公平並不簡單

測試你對 AI 公平性定義的理解。

1. ProPublica 和 Northpointe 對 COMPAS 公平性的爭議,最根本的原因是什麼?
✓ 正確!這場爭議揭示了公平性定義的根本衝突——不是誰說謊,而是他們問的是不同的問題。
✗ 再想想。兩方都用真實數據,問題在於他們衡量的是不同的公平指標。
2. 「假陽性率」在 COMPAS 案例中指的是什麼?
✓ 正確!假陽性(False Positive)指的是「誤判為真」——在此案例中就是「誤判為高風險」。ProPublica 發現黑人被告被誤判為高風險的比例幾乎是白人被告的兩倍。
✗ 不對。假陽性率是「本來不會再犯,卻被判定為高風險」的比例——這是最嚴重的不公正,因為無辜者受到了額外的懲罰。
3. 為什麼在基礎再犯率不同的情況下,同時達到「校準公平」和「錯誤率平等」在數學上不可能?
✓ 正確!Chouldechova 等人從數學上證明了這個不可能定理。這不是工程限制,而是基礎數學的必然結果——選擇哪個公平定義,是價值觀的選擇,不是技術問題。
✗ 再看課文。這是已被數學證明的定理,不是運算能力或法律問題。
🧪 實驗室 · 第五課

公平性選擇實驗室

當你無法同時公平,你會選擇哪種公平?

任務說明

你將與 AI 導師討論不同公平性定義的取捨,並嘗試為特定情境做出選擇。

  1. AI 導師會給你一個具體情境(例如:貸款審核、醫療診斷、大學入學),並告訴你兩個群體的基礎比率不同。
  2. 你需要選擇優先採用哪個公平性指標,並說明理由。
  3. 討論:你的選擇讓哪個群體承受了更多的錯誤代價?這個代價是可以被接受的嗎?
深入思考:在貸款審核和刑事司法這兩個情境中,你應該選擇相同的公平指標嗎?為什麼?
🤖 AI 公平性導師 公平性選擇實驗室
🎯 進階 · 第六課

同意、自主與 AI

真正的同意需要充分的資訊和真實的選擇——當 AI 影響你的決定,同意還有意義嗎?

你點選「同意」時,你真的理解你同意了什麼嗎?

2014 年,Facebook 在不告知用戶的情況下,對約 689,003 名用戶進行了情緒操縱實驗:系統性地過濾這些用戶動態消息中的正面或負面內容,觀察他們的發文情緒是否隨之改變。實驗結果顯示:用戶的情緒確實受到了演算法的影響。Facebook 主張用戶在服務條款中「同意」了資料用於研究。學術界和公眾的強烈反彈聚焦在一個問題:沒有具體告知、沒有退出選項的「同意」,算是真正的同意嗎?

知情同意的條件

醫學倫理發展出了「知情同意」(Informed Consent)的標準,要求:

  • 資訊充分性:當事人必須理解研究或干預的本質、風險和替代方案。
  • 理解能力:當事人必須有能力理解所提供的資訊。
  • 自願性:同意必須是自由做出的,不受強制或操縱。

Facebook 情緒實驗在這三個條件上都有問題:用戶不知道自己在參與實驗,更不知道目的是操縱情緒;而「不同意就不能使用 Facebook」的現實處境,使所謂的「自願性」存疑。

自主性與 AI 推薦系統

自主性(Autonomy)是指個人根據自己的價值觀和理性做出決定的能力。AI 推薦系統的設計通常以「最大化參與度」為目標,這可能與用戶的自主性產生衝突。

2021 年,Facebook 的內部研究(後由Frances Haugen以吹哨者身分公開)顯示:Instagram 的推薦演算法在已知某些青少年用戶有飲食失調傾向的情況下,仍然向他們推薦相關內容,因為這些內容能增加平台停留時間。這不只是資料隱私問題——這是一個演算法主動削弱用戶自主性的案例。

關鍵問題

當 AI 系統的商業目標(最大化參與度)和用戶的真實利益(心理健康、自主決策)相互衝突時,「用戶同意使用此服務」是否足以為系統的行為提供倫理正當性?

📝 測驗 · 第六課

同意、自主與 AI

測試你對知情同意和自主性的理解。

1. Facebook 情緒實驗的核心倫理爭議是什麼?
✓ 正確!爭議核心在於:用戶不知道自己在參與實驗,不理解目的是情緒操縱,也無法真正自願退出——這讓「服務條款中的同意」失去了倫理效力。
✗ 再想想。問題不在研究準確性,而在同意的品質——沒有充分資訊、沒有真正選擇的同意,是偽裝的同意。
2. 知情同意的「自願性」條件為什麼在 AI 服務的情境下特別難以達到?
✓ 正確!當一個服務已成為社會基礎設施(如社群媒體、搜尋引擎),「不同意就不用」的選擇代價極高,這使所謂的自願性存疑。
✗ 再想想。問題不在用戶的懶惰或公司的惡意,而在結構性的不對等——退出成本太高,使同意變得不那麼「自由」。
3. Instagram 推薦演算法向有飲食失調傾向的青少年推薦相關內容,最主要違反了什麼倫理原則?
✓ 正確!這是自主性的直接侵害——系統已知這對用戶有害,卻仍然繼續強化這個行為,因為這能增加平台停留時間。商業利益被置於用戶自主性和健康之上。
✗ 再想想。核心問題是自主性——系統的設計主動妨礙了用戶按照自身真實利益行動的能力。
🧪 實驗室 · 第六課

同意設計實驗室

如何設計真正有意義的同意機制?

任務說明

你將與 AI 導師探討如何為 AI 系統設計更有意義的同意機制。

  1. AI 導師會先問你:你認為現有的「服務條款同意」機制最大的問題是什麼?
  2. 提出至少一個改善同意機制的具體建議,說明它如何更好地符合知情同意的三個條件。
  3. 討論:更嚴格的同意要求會如何影響 AI 服務的商業模式?這種衝突可以解決嗎?
設計挑戰:你能設計一個既對用戶誠實、又讓多數人願意閱讀和理解的同意流程嗎?
🤖 AI 同意設計導師 同意設計實驗室
🎯 進階 · 第七課

吹哨與問責

當內部改革失敗,公開揭露成為最後手段——但這需要付出真實的個人代價。

在 AI 公司工作時,發現問題卻沉默,算是共謀嗎?

2021 年,Frances Haugen 從 Facebook 離職前複製了數千份內部文件,並提交給美國證券交易委員會(SEC)和《華爾街日報》。這些文件顯示 Facebook 自己的研究已確認 Instagram 對青少年心理健康有害,但公司選擇不採取行動以保護廣告收益。Haugen 在公開作證時表示:她不是要摧毀 Facebook,而是要創造改革的條件。她面臨了潛在的法律風險和職業代價,但她的揭露引發了美國國會對 Meta 的一系列聽證。同年,Google AI 研究員 Timnit Gebru 因發表批評大型語言模型倫理風險的論文而遭到解雇,引發業界廣泛討論:AI 公司是否在壓制對自家技術的批評性研究?

吹哨的條件與代價

吹哨(Whistleblowing)在倫理學上通常被視為一種有條件的義務:當內部管道已用盡、傷害足夠嚴重、且公開揭露是唯一有效手段時,吹哨在道義上可能是正確的——甚至是必要的。

  • Haugen 案例:有充分文件支持、透過法律管道(SEC)和媒體同步揭露、聚焦具體傷害(青少年心理健康)。
  • Gebru 案例:通過學術論文和媒體發聲、指向更廣泛的系統性問題(大型語言模型的風險)。

問責的結構性挑戰

Haugen 和 Gebru 的案例都揭示了 AI 問責的結構性困難:

資訊不對稱

只有公司內部人員才能看到完整的資料和決策過程。外部研究人員、監管機構和媒體依賴吹哨者提供無法用其他方式取得的關鍵資訊。

報復風險

儘管美國有《吹哨者保護法》,但 Haugen 仍面臨法律風險,Gebru 則失去了工作。保護機制的存在不等於有效保護。

問責的有效性

Haugen 的揭露引發了聽證,但 Meta 的核心商業模式並未因此根本改變。問責行動和實質改變之間,仍然存在巨大落差。

📝 測驗 · 第七課

吹哨與問責

測試你對吹哨倫理和 AI 問責的理解。

1. Frances Haugen 的揭露行動在倫理上最重要的特徵是什麼?
✓ 正確!吹哨行動的倫理有效性,很大程度上取決於其基礎——Haugen 有具體文件、使用合法管道,並聚焦可記錄的傷害而非個人猜測。
✗ 再想想。課文強調的是吹哨行動的倫理條件:充分的文件支持、合法的揭露管道、聚焦具體傷害。
2. Timnit Gebru 的案例與 Frances Haugen 的案例有何關鍵共同點?
✓ 正確!兩個案例共同指向一個結構性問題:AI 公司有強烈的商業動機去壓制對其系統的批評性研究和內部異議。
✗ 再想想。課文的重點是這兩個案例共同揭示了什麼——不是法律處境,而是 AI 公司對批評聲音的態度。
3. 為什麼 Haugen 的揭露能引發聽證,卻未能根本改變 Meta 的商業模式?
✓ 正確!這是問責的根本挑戰:知道了不等於改變了。問責行動(聽證、媒體報導)和實質改變(商業模式改革)之間,需要更直接的強制機制。
✗ 再想想。課文明確指出了這個落差——它是問責機制的結構性限制,不是個別行為者的失敗。
🧪 實驗室 · 第七課

倫理決策模擬

如果你是 AI 公司的員工,發現了嚴重的倫理問題,你會怎麼做?

任務說明

你將與 AI 導師進行角色模擬,練習在職場情境中做出倫理決策。

  1. AI 導師會描述你在一家 AI 公司工作,並發現一個嚴重的倫理問題。它會問你第一步會怎麼做。
  2. 描述你的行動計畫:先找誰談?如果內部管道無效,你會如何升級?
  3. 討論:在什麼情況下,吹哨才是道義上正確的選擇?你個人願意承擔吹哨的代價嗎?
誠實的問題:如果吹哨可能讓你失去工作和職業聲譽,你還會做嗎?什麼樣的傷害嚴重程度才值得這個代價?
🤖 AI 職場倫理導師 倫理決策模擬
🎯 進階 · 第八課

建構有倫理的 AI

倫理不是功能完成後再加上去的裝飾——它必須從設計的第一天就內嵌在系統之中。

「倫理 AI」是可能達到的目標,還是永遠追求的方向?

2018 年,Google 公布了七條「AI 原則」,包括:AI 應對社會有益、避免偏見、對安全負責等。同年,公司卻因 Project Maven 爭議和員工抗議退出了軍事 AI 合約,並在 2019 年解散了成立不久、由外部倫理學家組成的「先進技術外部顧問委員會」(ATAAC)——僅在成立一週後。2020 年,Timnit Gebru 遭解雇。這一系列事件揭示了「倫理聲明」和「倫理實踐」之間可能存在的巨大鴻溝,以及「倫理洗白」(Ethics Washing)的風險。

從倫理聲明到倫理實踐

研究人員 Ben Green 將「倫理洗白」(Ethics Washing)定義為:公司用倫理聲明和原則文件來轉移對具體責任的要求,同時不做出任何實質上可被驗證的承諾。避免倫理洗白需要將倫理要求轉化為可操作的結構。

  • 多元化的開發團隊:Gebru 的研究顯示,缺乏多元背景的開發者會系統性地忽視某些傷害。
  • 外部審計(External Audit):獨立的第三方評估,不受公司利益影響。
  • 影響評估(Impact Assessment):在部署前系統性評估系統對不同群體的潛在影響。
  • 申訴機制:讓受到 AI 決策影響的人有管道提出異議。

結構優先於意圖

本模組所有課程指向同一個核心結論:個別工程師或公司的善意,不足以保證 AI 系統的倫理性。需要的是結構性的機制——可被驗證的標準、獨立的監督、真實的問責——而不只是價值宣言。

Google ATAAC 委員會的解散說明:若公司不願意讓外部監督真正干涉決策,這樣的委員會就只是公關工具。有效的倫理治理必須有真實的權力——否則只是更精緻的倫理洗白。

前進的方向

有效的 AI 倫理實踐不是「我們很有道德」的聲明,而是可以回答這些問題:誰有權力推翻這個系統的決定?有沒有獨立審計的記錄?受到影響的社群在設計過程中有沒有實質的參與機會?

📝 測驗 · 第八課

建構有倫理的 AI

測試你對倫理 AI 實踐的理解。

1. 「倫理洗白」(Ethics Washing)指的是什麼?
✓ 正確!倫理洗白是用「我們有倫理原則」的聲明來替代真實的問責機制——Google 的 AI 原則宣言和隨後一系列的決策之間的落差,就是典型案例。
✗ 再想想。倫理洗白的核心是:聲明與實踐之間的刻意落差,用倫理語言迴避實質責任。
2. 為什麼 Google ATAAC 委員會在成立一週後解散,是「倫理洗白」的典型案例?
✓ 正確!若外部監督委員會在提出任何有實質影響的建議之前就被解散,這表明它從未擁有真實的權力——而沒有真實權力的「外部監督」,就是洗白。
✗ 再想想。問題的核心是這個委員會是否真的有改變決策的權力——而它的快速解散暗示了答案。
3. 根據本課,有效的 AI 倫理治理最關鍵的特徵是?
✓ 正確!「結構優先於意圖」是本課的核心論點。善意和聲明不足以保證倫理性——需要可被外部驗證的結構性機制。
✗ 再看課文的結論。有效的倫理治理需要的是可操作的結構,不是聲明、意圖或訓練課程。
🧪 實驗室 · 第八課

倫理 AI 設計審查

設計一個能真正落實倫理原則的 AI 開發流程。

任務說明

你將與 AI 導師共同設計一個能避免「倫理洗白」的 AI 開發流程。

  1. AI 導師會先描述一個假設的 AI 系統(例如:招聘篩選工具),並問你:你會在哪些關鍵節點加入倫理審查?
  2. 說明你會採用哪些具體的結構性機制(外部審計、影響評估、申訴機制等)。
  3. 討論:如何區分「真實的倫理機制」和「倫理洗白」?你設計的流程如何避免淪為後者?
終極測試:如果你設計的倫理機制有一天真的阻止了一個本來會獲利的產品,你的公司還會繼續遵循它嗎?這個問題的答案,才是倫理機制是否真實的真正測試。
🤖 AI 倫理設計導師 倫理 AI 設計實驗室

📋 模組總測驗

AI 倫理與真實決策 — 進階模組 · 15 題綜合評量

1. Google Project Maven 爭議中,超過 4,000 名工程師連署的主要訴求是?
✓ 正確!
✗ 他們要求 Google 退出 Project Maven,理由是參與致命武器系統在道義上不可接受。
2. 義務論(Deontology)評估行為是否正確的依據是?
✓ 正確!
✗ 義務論關注行為本身的道德性,不是後果或品格。
3. Facebook 監督委員會的案例在治理層面揭示的核心問題是?
✓ 正確!
✗ 核心問題是正當性(legitimacy)——誰授權這個私人機構做這些決定?
4. Robert Williams 案例中,臉部辨識系統的錯誤主要反映了哪種問題?
✓ 正確!
✗ 問題源於訓練資料反映的歷史不平等,不是個別工程師或警察的主觀偏見。
5. 「道德機器」(Moral Machine)實驗最重要的發現是?
✓ 正確!
✗ 實驗揭示了道德偏好的文化相對性,這對任何「一刀切」的自動駕駛倫理設計都是根本挑戰。
6. ProPublica 分析 COMPAS 時發現的主要問題是?
✓ 正確!
✗ ProPublica 的核心發現是族裔間假陽性率(誤判高風險)的顯著差異。
7. 為什麼「校準公平」和「錯誤率平等」在數學上無法同時達到?
✓ 正確!
✗ 這是數學必然性,不是技術或法律問題。選擇哪個公平定義,是價值觀的選擇。
8. 知情同意的「自願性」條件在 Facebook 情緒實驗中為何難以成立?
✓ 正確!
✗ 問題是結構性的:當退出的代價極高,同意就不再是真正自由的選擇。
9. Instagram 推薦演算法主動向有飲食失調傾向的青少年推薦相關內容,最根本違反的倫理原則是?
✓ 正確!
✗ 核心問題是自主性——明知有害仍繼續強化,將平台參與度置於用戶自主和健康之上。
10. Frances Haugen 揭露 Facebook 內部文件的行動,在倫理上最符合哪個條件?
✓ 正確!
✗ 倫理上有效的吹哨行動需要充分的文件、合法的揭露管道和聚焦具體傷害——這是 Haugen 案例的特徵。
11. Timnit Gebru 遭解雇的案例最主要引發了哪方面的討論?
✓ 正確!
✗ Gebru 案例的核心是:AI 公司是否允許內部研究人員公開批評自家技術的倫理風險?
12. 「問責落差」(Accountability Gap)最準確的描述是?
✓ 正確!
✗ 問責落差特指「有權力但無需負責」的狀態,是 AI 治理的核心結構性問題。
13. 有效的 AI 倫理實踐與「倫理洗白」最關鍵的區別是?
✓ 正確!
✗ 真實的倫理機制可以被外部驗證,有真實的權力影響決策——不是聲明或部門的存在。
14. 本模組的核心論點「結構優先於意圖」意味著?
✓ 正確!
✗ 這個論點強調:好的結果需要可操作的結構性機制,不能依賴個別行為者的善意。
15. 在 AI 倫理的所有案例中,哪一個共同特徵說明了為什麼倫理不能是「事後加上去的」?
✓ 正確!從 COMPAS 的公平指標選擇,到 Instagram 的優化目標,每個設計決策都是價值選擇。等到傷害發生再討論倫理,代價已由真實的人承擔了。
✗ 再想想。問題的根源在於:設計選擇本身就是價值選擇,從最初的資料收集到優化目標,都蘊含了倫理立場。
--/15
計算中...