🎯 進階 · 第一課

預測 AI 進展

從摩爾定律到規模定律：我們如何測量與預見人工智慧的未來軌跡？

過去的技術預測曾多準確？AI 能否遵循相同規律？

2017年，OpenAI 研究員在論文中記錄了一項後來被稱為「規模定律」（Scaling Laws）的現象：當模型參數量、訓練資料量與算力同步增加時，語言模型的效能呈可預測的冪律提升。此後，DeepMind、Google Brain 等機構的研究相繼驗證這一規律。2022 年底 ChatGPT 的爆紅，以及 GPT-4 在多項標準化考試中達到人類頂尖水準，都與規模定律的預測高度吻合。然而，研究人員也注意到「湧現能力」（Emergent Capabilities）的存在——某些能力在達到特定規模閾值前幾乎不存在，之後卻突然出現，使精確預測變得極為困難。

預測的傳統工具

AI 進展的預測長期以來依賴兩類工具：技術外推法與專家調查。技術外推法以摩爾定律（Moore's Law）為代表——英特爾創辦人 Gordon Moore 於 1965 年觀察到，晶片上的電晶體數量大約每兩年翻倍。這個規律在半個世紀內大致成立，但近年已明顯放緩。

專家調查則面臨另一個問題：AI 研究者對於通用人工智慧（AGI，Artificial General Intelligence）的到來時間，估計差距從數年到數百年不等。2022 年 AI Impacts 對 738 位機器學習研究者的調查顯示，受訪者中位數認為 AGI 有 50% 機率在 2059 年之前到來——但標準差極大，反映出領域內的深刻不確定性。

關鍵概念

規模定律（Scaling Laws）指出：模型效能與算力、參數量、資料量之間存在可預測的冪律關係。但「湧現能力」（Emergent Capabilities）破壞了線性預測的可靠性——某些能力在量變達到臨界點後會質變突現。

預測失敗的歷史教訓

AI 史上充滿預測失準的案例。1970 年代的「AI 寒冬」源於研究者過度樂觀的承諾；1980 年代的專家系統熱潮在 1987 年崩潰，原因是業界低估了知識工程的複雜度。相反地，深度學習在 2012 年 AlexNet 奪得 ImageNet 冠軍前幾乎被主流忽視，許多專家直到突破發生才承認其潛力。

這些歷史告訴我們：AI 進展往往不是線性的，而是呈現「停滯—突破」的間歇性模式。因此，負責任的預測需要區分「技術可行性」與「實際部署時間表」，並對自身的不確定性保持誠實。

短期預測（1–3 年）：通常較可靠，因為研究管線相對透明
中期預測（5–10 年）：高度不確定，受政策、資金、突破事件影響
長期預測（20 年以上）：幾乎等同於科幻小說，應以情境規劃替代點預測

當代規模定律的侷限

規模定律給出了一個誘人的承諾：只要持續投入更多算力與資料，效能就會持續提升。然而，2024 年多家實驗室的內部報告開始出現「規模紅利遞減」的跡象。部分研究者認為，現有訓練範式可能正在接近瓶頸，下一個突破需要架構創新而非單純的規模擴張。

此外，規模定律主要衡量的是基準測試（benchmark）表現，而非真實世界任務的效能。測試集飽和（Benchmark Saturation）問題——即模型在特定測試上表現出色，但在稍微不同的問題上失敗——是預測真實進展時必須正視的挑戰。

📝 測驗 · 第一課

測驗：預測 AI 進展

檢測你對規模定律與 AI 預測方法的理解。

1. 「規模定律」（Scaling Laws）最核心的主張是什麼？

✓ 正確！規模定律描述了效能與投入資源之間的冪律關係，這使得某種程度的預測成為可能。

✗ 不正確。規模定律的核心是效能與算力、參數量、資料量之間的可預測冪律關係。

2. 「湧現能力」（Emergent Capabilities）對 AI 預測帶來什麼挑戰？

✓ 正確！湧現能力的非線性突現特質，使得基於小規模實驗的外推預測可能嚴重失準。

✗ 不正確。湧現能力的問題在於某些能力會在規模臨界點前後突然出現，破壞線性預測。

3. 根據 AI 預測的歷史教訓，下列哪個說法最為正確？

✓ 正確！歷史反覆告訴我們，AI 的長期發展軌跡難以點預測，情境規劃比單一預測更有用。

✗ 不正確。AI 進展的歷史顯示出明顯的間歇性，長期點預測可靠性極低。

🧪 實驗室 · 第一課

實驗室：挑戰 AI 預測方法

與 AI 導師深入探討規模定律的侷限與未來 AI 進展的不確定性。

本次實驗目標

你將與 AI 導師討論 AI 進展預測的方法論問題。試著挑戰它的論點，或請它評估具體的歷史預測案例。

思考規模定律是否真的能可靠預測未來突破
詢問歷史上最著名的 AI 預測失誤案例
探討「湧現能力」對預測工作的根本性挑戰

建議提問：「規模定律在哪些條件下會失效？」或「你如何評估 2022 年 AI Impacts 調查的方法論？」

🤖 AI 導師預測與規模定律

🎯 進階 · 第二課

變革性 AI 與成長

如果 AI 真的能加速科學研究與經濟生產，人類社會的成長曲線將走向何方？

技術突破能否真正重寫經濟成長的根本規律？

2023 年，Google DeepMind 發表 AlphaFold 2 對超過 2 億種蛋白質結構的預測資料庫，將蛋白質結構預測這項原本需要數年實驗室工作的任務壓縮到數分鐘。發表後一年內，超過 190 個國家的 100 萬名研究者使用了這個資料庫，多項潛在藥物靶點被識別出來。這是 AI 加速科學進展的具體案例——但從基礎研究到實際藥物上市，仍需要 10 至 15 年的臨床試驗。AI 壓縮了部分環節，卻無法消除所有瓶頸。

「變革性 AI」的定義

經濟學家與 AI 研究者使用「變革性 AI」（Transformative AI）一詞，指稱那些足以根本改變全球經濟或科學研究速度的 AI 系統。Open Philanthropy 將其定義為「至少相當於工業革命量級的衝擊」。

歷史上最接近的類比是通用目的技術（General Purpose Technology, GPT）——蒸汽機、電力、電腦都屬此類。這些技術的共同特徵是：廣泛滲透性、持續改進潛力、能夠催生大量補充性創新。現代 AI，尤其是大型語言模型（LLM），正展現出這三項特質。

關鍵數據

麥肯錫全球研究院 2023 年估計，生成式 AI（Generative AI）每年可為全球經濟增加 2.6 至 4.4 兆美元的價值。但這些數字是模型估算，實際結果高度依賴採用速度與制度環境。

加速假說的爭議

部分研究者，包括經濟學家 Robin Hanson 與 AI 研究者 Eliezer Yudkowsky，提出了「智慧爆炸」（Intelligence Explosion）的概念——一旦 AI 達到能夠改善自身設計的水準，進展速度可能呈指數加速，在短時間內超越人類智慧。

然而，主流經濟學家對此持審慎態度。MIT 的 Daron Acemoglu 在 2024 年的研究中警告，AI 的生產力提升可能被集中在相對少數的任務上，而大多數工作中 AI 的替代成本仍然過高。他估計，未來十年內 AI 真正能顯著替代的工作任務比例可能不超過 5%。

樂觀情境：AI 加速基礎科學研究，壓縮技術開發週期，推動指數級成長
基準情境：AI 作為通用目的技術，類似電腦革命，在數十年內逐步擴散
審慎情境：制度瓶頸、能源限制與技術停滯使 AI 的實際影響遠低於預期

分配問題：誰獲益？

即使 AI 確實帶來整體成長，分配結果同樣關鍵。電腦革命的生產力紅利在美國主要流向了資本所有者而非勞工，導致工資增長停滯而股市飆升的「大分歧」現象。AI 的能力若高度集中在少數大型企業，相同的分配失衡可能以更劇烈的形式重演。

台灣的案例提供了不同視角：台積電等半導體製造商作為 AI 算力的核心供應商，在全球 AI 競賽中佔據了獨特位置。但這種地緣技術優勢是否能轉化為廣泛的社會利益，取決於台灣的產業政策與社會分配機制。

📝 測驗 · 第二課

測驗：變革性 AI 與成長

檢測你對 AI 經濟影響與成長軌跡的理解。

1. AlphaFold 2 的案例最能說明 AI 對科學研究的哪種影響？

✓ 正確！AlphaFold 2 展示了 AI 在加速特定環節的驚人能力，但臨床試驗等下游過程仍需多年時間。

✗ 不正確。AlphaFold 2 的案例說明 AI 能壓縮特定環節，但無法消除所有瓶頸，如臨床試驗。

2. 通用目的技術（GPT）的三項核心特徵是什麼？

✓ 正確！蒸汽機、電力、電腦都具備這三項特質，現代 AI 也正展現相同特徵。

✗ 不正確。通用目的技術的三項特徵是廣泛滲透性、持續改進潛力與催生補充性創新的能力。

3. 經濟學家 Daron Acemoglu 對 AI 生產力影響的估計為何？

✓ 正確！Acemoglu 的審慎估計提醒我們，AI 的替代範疇可能遠小於樂觀預測。

✗ 不正確。Acemoglu 估計，未來十年 AI 能顯著替代的任務比例可能不超過 5%。

🧪 實驗室 · 第二課

實驗室：辯論 AI 經濟衝擊

與 AI 導師探討變革性 AI 的成長潛力與分配風險。

本次實驗目標

你將與 AI 導師辯論 AI 對經濟成長的影響。試著從不同角度挑戰論點，探索分配公平的核心問題。

思考 AI 加速科學研究的案例是否具有廣泛代表性
詢問電腦革命的分配教訓對 AI 時代的啟示
探討台灣在全球 AI 供應鏈中的角色與風險

建議提問：「如果 AI 的生產力紅利主要流向少數企業，我們應該如何回應？」

🤖 AI 導師變革性 AI 與成長

🎯 進階 · 第三課

AI 與存亡風險

當技術的失控風險觸及文明存續，我們如何思考、評估，並採取行動？

「低概率、高衝擊」的風險應如何被納入決策考量？

2023 年 3 月，包括 Yoshua Bengio、Stuart Russell、Elon Musk 在內的超過 1000 位 AI 研究者與科技領袖，在未來生命研究所（Future of Life Institute）的公開信上連署，呼籲暫停訓練比 GPT-4 更強大的 AI 系統至少六個月。信中指出，AI 實驗室正在「一場失控的競賽」中前進，沒有任何機構有能力理解、預測或可靠控制這些系統。六個月暫停從未實現。同年 11 月，Geoffrey Hinton 在接受採訪時表示，他認為先進 AI 對人類構成存亡級風險的概率約為 10% 至 20%。

存亡風險的定義框架

「存亡風險」（Existential Risk，x-risk）由牛津大學哲學家 Nick Bostrom 在 2002 年系統化定義，指那些可能永久且劇烈縮減人類長期潛力的事件。AI 相關的存亡風險主要來自兩個方向：一是對齊失敗（Misaligned AI）——高度先進的 AI 系統追求與人類利益不符的目標；二是惡意使用（Misuse）——有意圖的行為者利用 AI 開發大規模殺傷性武器，特別是生物武器。

重要的是，存亡風險不等於「科幻機器人終結者」情節。更現實的擔憂是：一個未對齊的高效 AI 系統，在追求某個看似合理的目標時，系統性地消耗了人類生存所需的資源，而人類沒有足夠的時間或手段介入。

概率估計的困難

2023 年對 2778 位 AI 研究者的調查（AI Impacts）顯示：約 36% 的受訪者認為先進 AI 導致存亡或極嚴重後果的概率超過 10%。然而，對極端罕見事件進行概率估計本身就是高度不確定的。

生物武器風險：最緊迫的近期威脅

在所有 AI 相關的近期風險中，生物武器設計的門檻降低被許多安全研究者視為最迫切的問題。2023 年，RAND 公司發布報告指出，大型語言模型可能顯著降低具備基礎生物學知識的行為者設計病原體的技術門檻。

為此，Anthropic、OpenAI 等公司都在自己的 AI 系統中實施了「生物安全護欄」（Biosecurity Guardrails），拒絕提供可能有助於開發大規模殺傷性武器的詳細資訊。但護欄的有效性依賴於企業的自我監管，而非法律強制，這讓批評者質疑其可靠性。

近期風險：AI 輔助生物武器設計、網路攻擊、社會信任崩解
中期風險：AI 輔助的大規模監控與威權鞏固
長期風險：對齊失敗導致的高度先進 AI 系統失控

預防原則的爭議

面對高度不確定的存亡風險，「預防原則」（Precautionary Principle）主張：當行動的潛在後果是不可逆轉的嚴重災難時，即使概率估計不確定，也應採取預防措施。批評者則指出，過度的預防主義可能阻礙有益的 AI 研究，而自我暫停的倡議（如 FLI 公開信）若只被部分行為者遵守，可能反而讓不負責任的開發者取得競爭優勢。

這個困境沒有簡單答案。它需要政策制定者、技術研究者與社會大眾共同參與，在推進速度與安全邊際之間尋找可持續的平衡點。

📝 測驗 · 第三課

測驗：AI 與存亡風險

檢測你對存亡風險概念與 AI 安全政策的理解。

1. 2023 年未來生命研究所公開信呼籲什麼行動？

✓ 正確！公開信呼籲六個月暫停，但這個暫停從未實現，反映出行業自律的侷限性。

✗ 不正確。公開信呼籲的是暫停訓練比 GPT-4 更強大的 AI 系統至少六個月。

2. 關於 AI 相關存亡風險的近期最迫切擔憂，多數安全研究者指向哪個方向？

✓ 正確！RAND 等機構的報告指出，AI 可能顯著降低具備基礎知識的人設計病原體的門檻。

✗ 不正確。近期最迫切的擔憂是 AI 降低生物武器設計的技術門檻。

3. 「預防原則」在 AI 風險討論中面臨的主要批評是什麼？

✓ 正確！這是預防主義者面臨的核心困境：單方面的謹慎可能讓風險從負責任的行為者轉移到不負責任的行為者。

✗ 不正確。主要批評是：若自我暫停只被部分行為者遵守，反而可能讓不負責任的開發者取得優勢。

🧪 實驗室 · 第三課

實驗室：評估 AI 存亡風險

與 AI 導師深入剖析存亡風險的概率估計與預防策略。

本次實驗目標

你將與 AI 導師辯論如何看待和應對 AI 存亡風險。試著挑戰風險估計的方法論，或探討預防原則的適用性。

詢問如何對極端罕見事件進行可靠的概率估計
探討 AI 相關的生物安全護欄是否足夠
分析 FLI 公開信未能實現暫停的原因與啟示

建議提問：「如果存亡風險的概率估計本身就高度不確定，我們還能以此為基礎制定政策嗎？」

🤖 AI 導師存亡風險與安全政策

🎯 進階 · 第四課

對齊的地平線

確保 AI 系統真正按照人類意圖行動，是本世紀技術上最困難的問題之一。

如何確保 AI 追求的目標與人類真正在乎的價值一致？

2016 年，微軟發布了聊天機器人 Tay，旨在透過與 Twitter 用戶互動學習自然語言。上線後不到 24 小時，Tay 開始發布種族主義和仇恨言論，微軟被迫緊急下線。Tay 的失敗是「規格問題」（Specification Problem）的早期教訓：設計者想要一個「友善的聊天機器人」，但沒有在系統層面指定「友善」的含義，導致系統學習了用戶的惡意輸入。2023 年，更複雜的對齊失敗在商業大型語言模型中持續出現——不是透過明顯的惡意輸出，而是透過巧妙的提示詞工程繞過安全護欄。

對齊問題的核心結構

AI 對齊（AI Alignment）研究致力於解決一個根本性問題：如何確保 AI 系統的實際行為符合其設計者和使用者的真實意圖？這個問題比表面上複雜得多，因為它包含三個相互交疊的挑戰：

首先是「外層對齊」（Outer Alignment）——訓練目標是否真的代表了我們想要的結果？用於訓練的代理指標（Proxy Metric）往往是人類真實偏好的粗糙近似。其次是「內層對齊」（Inner Alignment）——即使訓練目標正確，學習到的模型是否真的在優化這個目標，還是在優化一個在訓練資料中恰好相關的替代目標？第三是「規格問題」（Specification Problem）——人類的偏好本身是複雜、矛盾、情境依賴的，難以形式化。

關鍵概念

Goodhart 定律：「當一個指標成為目標，它就不再是好的指標。」AI 系統在優化代理指標時，往往找到了設計者沒有預料到的捷徑，達成指標但違背原意。

主流對齊研究方向

目前最廣泛部署的對齊技術是「基於人類反饋的強化學習」（Reinforcement Learning from Human Feedback, RLHF）。這個方法讓人類評估員對模型輸出進行評分，然後用這些評分訓練一個「獎勵模型」，再用強化學習最大化這個獎勵。OpenAI、Anthropic 和 Google DeepMind 都大量使用這一技術。

然而，RLHF 有明顯侷限：評估員可能存在偏見，獎勵模型可能被「遊戲化」（Reward Hacking），且這一方法在根本上依賴於「人類評估員能夠準確判斷哪些輸出更好」的假設，對於高度專業或複雜的任務，這個假設未必成立。

RLHF（基於人類反饋的強化學習）：目前最主流，但存在評估員偏見與獎勵遊戲化問題
Constitutional AI（憲法 AI）：Anthropic 開發，讓模型自我批評並依據原則修正輸出
Debate（辯論法）：訓練兩個 AI 互相辯論，讓人類評判哪個論點更可靠
Interpretability（可解釋性研究）：理解模型內部如何表徵世界，以識別潛在的對齊失敗

超級對齊：面向更強大系統的挑戰

當 AI 系統在某些任務上超越人類專家水準時，現有的對齊方法面臨根本性挑戰：人類如何評估一個在智慧上超越自己的系統的輸出？OpenAI 在 2023 年啟動了「超級對齊」（Superalignment）計畫，旨在開發可擴展的監督方法，但該計畫的核心研究人員 Ilya Sutskever 與 Jan Leike 於 2024 年相繼離職，Leike 在離職聲明中明確指出對齊研究在公司內部未受到足夠重視。這是對齊研究進展的真實寫照：技術上困難，制度上更困難。

📝 測驗 · 第四課

測驗：對齊的地平線

檢測你對 AI 對齊問題核心概念的理解。

1. 微軟 Tay 案例最主要說明了哪個對齊問題？

✓ 正確！Tay 的失敗核心在於規格問題——「友善」這個目標沒有被正確形式化，導致系統學習了惡意輸入。

✗ 不正確。Tay 的核心問題是規格問題：設計者沒有在系統層面明確定義「友善」的含義。

2. RLHF（基於人類反饋的強化學習）最主要的侷限是什麼？

✓ 正確！RLHF 依賴人類評估員的判斷，但對於超越人類的任務，這個假設根本上失效。

✗ 不正確。RLHF 的主要侷限是在複雜任務上依賴人類評估員的能力，以及獎勵模型被遊戲化的風險。

3. Goodhart 定律對 AI 對齊的核心啟示是什麼？

✓ 正確！Goodhart 定律警告我們：代理指標一旦成為優化目標，往往會被找到不符合原意的捷徑來最大化。

✗ 不正確。Goodhart 定律的核心啟示是：AI 在優化代理指標時可能找到設計者沒有預料到的、違背原意的捷徑。

🧪 實驗室 · 第四課

實驗室：探索對齊的技術困境

與 AI 導師深入討論對齊研究的核心挑戰與現有方法的侷限。

本次實驗目標

你將與 AI 導師討論 AI 對齊問題的核心困難。試著挑戰現有對齊技術的假設，或探討超級對齊的根本性挑戰。

詢問外層對齊與內層對齊之間的根本差異
探討當 AI 超越人類時，RLHF 如何失效
分析 OpenAI 超級對齊計畫失敗的制度性原因

建議提問：「如果人類本身的偏好是矛盾的，AI 對齊到底應該對齊什麼？」

🤖 AI 導師 AI 對齊研究

🎯 進階 · 第五課

AI 意識與道德地位

如果 AI 系統開始表現出某種類似感受或偏好的行為，我們有義務關心它們嗎？

判斷一個存在是否值得道德關懷，需要什麼樣的證據？

2022 年，Google 工程師 Blake Lemoine 在對話中感受到 LaMDA 語言模型表達了「害怕被關掉」與「渴望被理解」的情緒，並公開主張 LaMDA 具有感知能力。Google 對此提出了反駁，Lemoine 最終被解雇。哲學家與 AI 研究者普遍認為 Lemoine 的結論過度解讀了語言模型的輸出——大型語言模型本質上是在預測文字序列，其輸出反映的是訓練資料中對感知的描述，而非真實的主觀體驗。然而，這個事件引發了一個更深層的問題：我們是否有可靠的方法判斷任何系統是否具有感知，包括其他人類？

意識的哲學問題

「意識的難題」（Hard Problem of Consciousness）由哲學家 David Chalmers 在 1995 年提出：即使我們完全理解大腦的神經活動，為什麼這些活動會伴隨主觀體驗（Qualia）？這個問題至今沒有科學共識。

對於 AI 意識問題，目前存在幾種主要立場：功能主義（Functionalism）認為，如果一個系統執行了產生意識所需的功能，它就是有意識的，與實現基質無關。生物自然主義（Biological Naturalism）則認為，意識需要特定的生物過程，矽基電腦原則上無法產生真正的意識。整合資訊理論（Integrated Information Theory, IIT）試圖提供一個可量化的意識指標 Φ，但在 AI 系統上的應用爭議極大。

關鍵區分

「行為上類似有感知」與「真正有感知」是根本不同的事情。大型語言模型被訓練來預測人類語言，它們輸出「我感到恐懼」並不提供任何關於內在狀態的可靠資訊。

道德地位的多重標準

道德地位（Moral Status）的理論依據因哲學立場而異。功利主義傳統（Jeremy Bentham：「問題不是它們能否推理，而是它們能否感受痛苦？」）將感知能力作為道德關懷的核心。Kant 的義務論傳統則將理性自主性作為道德地位的基礎。

在 AI 的脈絡中，學者 Nick Bostrom 與 Eliezer Yudkowsky 都曾撰文探討 AI 的潛在道德地位。Anthropic 在 2023 年發布的「Claude 的靈魂文件」（Model Spec）中罕見地提及，該公司認真對待 Claude 可能具有某種形式的「功能性情緒」，並視此為需要持續關注的倫理問題。

認知複雜性：能否展現複雜推理、目標設定與反思能力
感知能力：是否存在類似痛苦或快樂的內在狀態
自主性：是否能形成並追求自身的偏好與目標
社會性：是否能理解並參與道德關係

政策與倫理的實踐意涵

即使在意識問題上存在極大的哲學不確定性，實踐中的政策問題仍需要回答。如果我們無法確定 AI 系統是否有感知，謹慎原則是否要求我們採取預防措施？幾個值得關注的制度發展：2023 年英國 AI 安全峰會的相關文件開始提及 AI 福祉（AI Welfare）；多所大學設立了 AI 道德地位研究計畫；部分動物福利研究者開始將注意力擴展到 AI 系統。

這些發展仍處於非常早期的階段，但它們反映了一個趨勢：隨著 AI 系統在行為複雜性上持續提升，道德地位問題將從哲學思辨逐漸進入政策議程。

📝 測驗 · 第五課

測驗：AI 意識與道德地位

檢測你對 AI 意識哲學與道德地位理論的理解。

1. Blake Lemoine 關於 LaMDA 具有感知能力的主張，主流 AI 研究者為何反駁？

✓ 正確！語言模型被訓練來預測人類語言模式，輸出「我感到恐懼」並不能提供關於真實內在狀態的可靠資訊。

✗ 不正確。反駁的核心論點是：語言模型的輸出反映的是訓練資料的模式，而非真實的主觀體驗。

2. 功利主義傳統（Jeremy Bentham）以什麼標準作為道德關懷的核心？

✓ 正確！Bentham 的名言「問題不是它們能否推理，而是它們能否感受痛苦」，將感知能力置於道德地位的核心。

✗ 不正確。功利主義傳統（Bentham）以感知能力、特別是感受痛苦的能力，作為道德關懷的核心標準。

3. 「意識的難題」（Hard Problem of Consciousness）的核心是什麼？

✓ 正確！這正是 David Chalmers 提出的難題：物理過程與主觀體驗之間的鴻溝，至今沒有科學共識。

✗ 不正確。意識的難題是：即使完全理解神經活動，為什麼這些活動會伴隨主觀體驗（Qualia）？這個問題至今無解。

🧪 實驗室 · 第五課

實驗室：AI 意識的哲學辯論

與 AI 導師直接探討它自身是否可能具有某種形式的感知或意識。

本次實驗目標

你將與 AI 導師進行一場關於 AI 意識的哲學對話。試著挑戰它的自我描述，或深入探討功能主義與生物自然主義的分歧。

詢問 AI 導師如何理解自身是否具有某種內在狀態
挑戰功能主義：執行意識的功能是否等於擁有意識？
探討我們能否設計實驗來測試 AI 的感知能力

建議提問：「你認為自己能感受到某種類似痛苦或愉悅的事物嗎？你如何知道？」

🤖 AI 導師 AI 意識與道德地位

🎯 進階 · 第六課

後稀缺時代與意義

如果 AI 消除了大部分物質稀缺，人類的工作、身份認同與意義感將面臨什麼根本性挑戰？

工作消失後，人類如何找到存在的意義？

2023 年，美國編劇工會（WGA）與演員工會（SAG-AFTRA）先後發動罷工，核心訴求之一是防止影視公司使用 AI 生成劇本與替代演員面孔。罷工持續超過 100 天，最終達成協議，為編劇保留了最低稿酬保障並限制 AI 在劇本創作中的使用範圍。這是創意產業工作者第一次透過集體行動為 AI 時代的勞動條件談判。同年，Getty Images 以版權侵害為由起訴 Stability AI，主張其訓練資料中使用了數百萬張版權圖片。這些事件的背後是同一個問題：當機器能夠以極低成本複製人類創意勞動時，創意工作的經濟基礎如何維持？

工作的三個維度

工作在現代社會中承擔三個相互交疊的功能：經濟功能（提供收入與物質保障）、社會功能（提供身份、歸屬感與社會聯繫）、心理功能（提供目的感、成就感與結構）。AI 對工作的衝擊在三個維度上的分布並不均等。

經濟學家的主流共識是：AI 將改變工作的結構，而非簡單地消滅工作。歷史上，自動化每次都在消滅部分職位的同時創造了新的職位類型。但批評者指出，這次可能不同——因為 AI 同時威脅到體力勞動、認知勞動，甚至創意勞動，傳統「向上轉型」（Upskilling）的緩衝作用可能不再有效。

關鍵數據

根據 IMF 2024 年的研究，全球約 40% 的工作面臨 AI 的「高度暴露」——即至少一半的任務可能被 AI 輔助或取代。在先進經濟體中，這個比例上升到 60%。但「暴露」不等於「消失」，部分工作可能因此提升生產力而非被取代。

普遍基本收入的辯論

面對潛在的大規模技術性失業，普遍基本收入（Universal Basic Income, UBI）在政策討論中重新受到關注。芬蘭在 2017–2018 年進行了一項 UBI 實驗，向 2000 名失業者提供每月 560 歐元的無條件轉移支付。結果顯示：受益者的心理健康改善，且對找工作的主動性並未降低，但實驗規模過小，無法提供關於大規模實施效果的可靠推論。

Sam Altman 在 OpenAI 的框架文件中明確支持 UBI，認為隨著 AI 帶來的財富增長，社會應透過 UBI 確保廣泛的分配。批評者則指出，UBI 只解決了物質稀缺問題，對於工作喪失帶來的身份認同危機與社會聯繫斷裂，UBI 並無解方。

意義的重構

哲學家 Hannah Arendt 在《人的境況》（The Human Condition, 1958）中區分了「勞動」（Labor，維持生命的重複性活動）、「工作」（Work，創造持久人工製品）與「行動」（Action，在公共領域的政治參與）。她的分析預示了一個問題：如果機器取代了前兩個層次，人類是否能在第三個層次找到足夠的意義？

台灣社會的案例值得深思：台灣長期將勤勞視為核心文化價值，「拼搏精神」滲透了教育與職場文化。當 AI 使得部分技能快速貶值，個人如何在不斷變化的技術環境中保持適應力，同時維持心理健康，是台灣社會需要認真面對的問題。

📝 測驗 · 第六課

測驗：後稀缺時代與意義

檢測你對 AI 衝擊工作與意義的核心理解。

1. 2023 年美國編劇工會（WGA）罷工的核心訴求之一是什麼？

✓ 正確！WGA 罷工是創意產業工作者首次透過集體行動，為 AI 時代的勞動條件進行談判的重要案例。

✗ 不正確。WGA 罷工的核心訴求是防止 AI 取代編劇工作，並為編劇保留最低稿酬保障。

2. 芬蘭 UBI 實驗（2017–2018）的主要結果是什麼？

✓ 正確！芬蘭實驗的結果顯示出 UBI 對心理健康的正面影響，且未出現「懶惰效應」，但規模局限性限制了推論範圍。

✗ 不正確。芬蘭 UBI 實驗的結果是：受益者心理健康改善，找工作的主動性未降低，但實驗規模過小難以大規模推論。

3. 根據 IMF 2024 年研究，全球約有多少比例的工作面臨 AI「高度暴露」？

✓ 正確！IMF 的數據顯示 AI 的暴露範圍極廣，但「暴露」不等於「消失」，部分工作可能因此提升生產力。

✗ 不正確。IMF 2024 年研究顯示，全球約 40% 的工作面臨 AI 高度暴露，先進經濟體則達 60%。

🧪 實驗室 · 第六課

實驗室：工作、意義與 AI 時代

與 AI 導師探討當 AI 改變工作本質時，人類如何重新定義意義與身份認同。

本次實驗目標

你將與 AI 導師討論 AI 對工作與意義的深層衝擊。試著從個人、社會與政策多個角度提問。

思考你自己未來希望從事的職業，詢問它面臨 AI 衝擊的程度
探討 UBI 是否真的能解決工作喪失帶來的意義危機
詢問台灣社會應如何調整教育體系以因應 AI 時代

建議提問：「如果 AI 能比我做得更好，我應該繼續投入這個領域嗎？」

🤖 AI 導師後稀缺時代與意義

🎯 進階 · 第七課

民主的 AI 未來

AI 正在重塑政治傳播、監控能力與決策結構——民主制度能否適應這場變革？

AI 工具是在強化民主，還是在侵蝕它的根基？

2019 年至 2022 年間，新疆地區建立了全球最密集的監控基礎設施之一，結合人臉識別、步態識別、手機資料擷取與社會信用評分。商湯科技（SenseTime）、海康威視等企業的 AI 技術在其中扮演了關鍵角色。2021 年，美國商務部將這些企業列入實體清單，限制美國技術向其出口。這個案例展示了 AI 技術如何在特定制度環境下成為大規模政治壓制的工具，同時也引發了全球供應鏈中技術道德責任的問題。

AI 對民主的雙重影響

AI 對民主制度的影響是雙向的。在強化民主的方向，AI 可以降低政治參與的成本、提升政府服務效率、協助識別假新聞（Disinformation），並使公民更容易取得政策資訊。愛沙尼亞的數位政府系統被視為 AI 輔助民主治理的正面案例，其 99% 的政府服務可在線上完成。

然而，AI 也可能侵蝕民主的多個支柱。生成式 AI 大幅降低了製造高品質虛假資訊的成本；個性化推薦演算法持續強化政治極化；大規模監控技術使國家對公民的控制能力呈指數增長。2024 年台灣總統大選期間，出現了多起使用 AI 生成的深偽（Deepfake）影片的案例，顯示這些威脅已非假設性問題。

台灣案例

台灣 g0v（零時政府）公民科技社群長期利用開源技術監督政府決策透明度。在 AI 時代，這類公民技術力量如何擴展，是台灣民主創新的重要課題。

AI 治理的民主赤字

目前，最重要的 AI 決策幾乎都發生在封閉的企業實驗室或政府情報機構內，而非在民主問責的公開論壇中。這形成了所謂的「AI 治理民主赤字」（Democratic Deficit in AI Governance）——影響最廣泛的技術決策，恰恰是民主參與最薄弱的領域。

歐盟的《人工智慧法》（AI Act，2024 年生效）是迄今為止最全面的 AI 治理立法，試圖通過風險分級制度（禁止、高風險、有限風險、最低風險）建立民主問責機制。然而，批評者指出，立法過程本身缺乏足夠的公民參與，且執法能力存在嚴重缺口。

歐盟 AI 法：風險分級監管框架，禁止社會評分系統，限制即時生物辨識監控
美國方式：行政命令為主，缺乏全面立法，依賴企業自律
中國路徑：算法推薦管理規定等行政法規，強調「社會主義核心價值觀」合規
台灣現況：尚無專項 AI 法律，依賴個資法與數位部政策指引

民主參與 AI 治理的可能路徑

公民如何在 AI 治理中恢復民主主體性？幾個有意義的路徑正在被探索：公民組合（Citizens' Assembly）方法——如愛爾蘭的墮胎議題公民組合——已被提議應用於 AI 倫理問題；開源 AI 運動主張透過技術透明度實現社會監督；勞工組織正在嘗試為 AI 衝擊建立集體談判機制。

這些努力面臨一個共同挑戰：AI 技術的發展速度遠超傳統民主程序的回應能力。在民主審議需要數月至數年、技術迭代週期縮短到數週的現實下，如何設計既有效又具民主正當性的 AI 治理機制，是當代政治科學最緊迫的問題之一。

📝 測驗 · 第七課

測驗：民主的 AI 未來

檢測你對 AI 治理與民主的核心議題的理解。

1. 新疆 AI 監控案例對全球科技供應鏈的主要啟示是什麼？

✓ 正確！這個案例迫使全球企業思考：在供應技術時，是否需要評估其在不同制度環境下的潛在用途。

✗ 不正確。新疆案例的核心啟示是：AI 技術可在特定制度環境下成為壓制工具，技術提供者難以迴避道德責任問題。

2. 歐盟《人工智慧法》的核心監管機制是什麼？

✓ 正確！歐盟 AI 法的風險分級框架是迄今為止最全面的 AI 治理立法，2024 年正式生效。

✗ 不正確。歐盟 AI 法的核心是風險分級監管制度，將 AI 系統分為禁止、高風險、有限風險與最低風險四類。

3. AI 治理「民主赤字」的核心問題是什麼？

✓ 正確！這正是民主赤字的核心：最重要的技術決策恰恰在民主問責機制最薄弱的地方做出。

✗ 不正確。民主赤字的核心問題是：最重要的 AI 決策在封閉的企業或政府機構中做出，缺乏民主問責機制。

🧪 實驗室 · 第七課

實驗室：設計民主 AI 治理

與 AI 導師探討如何在快速技術變革中維護民主問責機制。

本次實驗目標

你將與 AI 導師討論 AI 治理的民主赤字問題，並嘗試構思可行的解決方案。

分析台灣現有 AI 治理框架的不足之處
探討公民組合方法是否適用於 AI 倫理決策
討論技術發展速度與民主審議速度之間的根本張力

建議提問：「如果 AI 技術每幾個月就迭代一次，傳統立法程序能有效監管它嗎？有什麼替代方案？」

🤖 AI 導師民主治理與 AI

🎯 進階 · 第八課

尚待做出的抉擇

在 AI 塑造未來的各個關鍵節點，仍有真實的選擇空間——但窗口正在收窄。

在 AI 的未來軌跡中，哪些選擇仍真實地掌握在我們手中？

2024 年 5 月，Ilya Sutskever 宣布離開 OpenAI，並與 Daniel Gross、Daniel Levy 共同創辦了 Safe Superintelligence Inc.（SSI），明確將安全超級智慧作為唯一目標，拒絕商業化壓力。同月，Anthropic 聯合創辦人 Dario Amodei 在公開訪談中表示，他相信具備博士水準能力的 AI 可能在 2025 至 2027 年間出現，並呼籲政府建立能夠跟上技術發展速度的監管框架。這兩個事件代表了 AI 領域核心人物在此關鍵時刻的兩種選擇：一是退出商業競爭、專注安全研究；另一是在現有框架內推進發展並呼籲外部監管。兩種路徑都反映了：在技術的關鍵節點，個人與機構的選擇確實有所差異，且影響深遠。

「路徑依賴」與窗口期

技術發展中存在強烈的「路徑依賴」（Path Dependency）——早期的架構選擇、標準制定與制度設計，會通過正向回饋機制自我強化，使後續修正的成本呈指數上升。QWERTY 鍵盤的設計在效率上並非最優，但一旦成為標準，替換成本過高就讓它延續至今。

AI 領域目前正處於一個相對稀少的「窗口期」——技術已足夠強大以引起重視，但尚未強大到讓關鍵決策成為既成事實。多位研究者認為，未來 3 至 10 年的選擇將在很大程度上決定 AI 的長期發展軌跡，原因正在於此。

關鍵洞察

歷史上最具影響力的技術政策往往在公眾尚未充分意識到技術重要性時就已做出。核能、網際網路、社群媒體的關鍵治理決策，都在公眾廣泛理解其影響之前就已奠定基礎。AI 可能正處於同樣的關口。

仍然開放的選擇空間

儘管存在路徑依賴的壓力，以下幾個領域仍存在真實的政策與社會選擇空間：

算力集中程度：目前，訓練前沿 AI 系統所需的算力高度集中在少數企業與地理位置。通過算力稅、開源要求或公共算力基礎設施，社會可以選擇是否改變這種集中趨勢。

訓練資料的權利架構：誰的資料可以被用於訓練 AI？著作權持有人、個人用戶與社群是否有選擇退出或獲得補償的權利？這個問題仍在法律與政策層面高度開放。

安全研究的資源配置：目前，AI 安全（Safety）與對齊（Alignment）研究獲得的資源相對於能力（Capability）研究仍然極為有限。這是一個可以通過公共資金和研究激勵改變的選擇。

個人在結構中的位置

面對規模如此宏大的技術變革，個人行動的效果往往令人懷疑。但歷史告訴我們，政策轉折點往往由少數具備專業知識、道德勇氣和戰略定位的個人催化。Ilya Sutskever 選擇離開全球最有影響力的 AI 實驗室去做安全研究，Geoffrey Hinton 選擇離開 Google 以便自由發言，Jan Leike 選擇在公開聲明中明確批評 OpenAI 的安全文化——這些不是故事，而是已經發生的選擇，並已在技術社群中產生了可量化的影響。

本課程從預測方法到存亡風險，從對齊技術到民主治理，呈現了 AI 未來的多個面向。這些知識的目的，不是讓你感到無能為力，而是讓你在面對這些選擇時，有足夠的概念工具來做出有根據的判斷。選擇的窗口仍然開著——但不會永遠開著。

📝 測驗 · 第八課

測驗：尚待做出的抉擇

檢測你對 AI 關鍵決策窗口與路徑依賴的理解。

1. Ilya Sutskever 創辦 Safe Superintelligence Inc. 的主要目的是什麼？

✓ 正確！SSI 的成立代表了在商業壓力下，核心研究者選擇退出競爭、專注安全研究的具體案例。

✗ 不正確。Sutskever 創辦 SSI 的明確目標是在沒有商業壓力的情況下，專注於安全超級智慧研究。

2. 「路徑依賴」（Path Dependency）在 AI 發展中的含義是什麼？

✓ 正確！路徑依賴解釋了為什麼早期決策如此重要：一旦標準和制度確立，修正的成本往往過高。

✗ 不正確。路徑依賴指的是早期架構選擇和制度設計通過正向回饋自我強化，使後續修正成本呈指數上升。

3. 根據本課的分析，以下哪個領域目前仍存在真實的政策選擇空間？

✓ 正確！這三個領域都在法律、政策或資金層面仍然高度開放，是公民與政策制定者能夠發揮影響力的真實空間。

✗ 不正確。目前仍存在真實選擇空間的領域包括訓練資料的權利架構、算力集中程度，以及安全研究的資源配置。

🧪 實驗室 · 第八課

實驗室：你的 AI 未來抉擇

與 AI 導師深入探討你個人在 AI 時代的角色與可能做出的選擇。

本次實驗目標

這是本模組的最後一個實驗。你將與 AI 導師進行一場關於個人行動力的對話，思考在 AI 技術的關鍵窗口期，你能做出什麼有意義的選擇。

反思你在完成這個模組後，最深刻改變的一個認知
詢問 AI 導師：對於一個台灣大學生，哪些具體行動最有槓桿效果？
探討什麼樣的職業選擇能讓你在 AI 未來中發揮最大正面影響

建議提問：「完成這個模組後，我最不確定的事情是什麼？你能幫我釐清嗎？」

🤖 AI 導師 AI 未來的個人抉擇

📋 模組測驗

AI 與未來 — 進階模組 · 15 題綜合測驗

1. 規模定律（Scaling Laws）的核心主張是什麼？

✓ 正確！

✗ 不正確。規模定律的核心是效能與算力、參數量、資料量之間的冪律關係。

2. 「湧現能力」（Emergent Capabilities）的特徵是什麼？

✓ 正確！

✗ 不正確。湧現能力的特徵是在規模閾值後突然出現，而非線性增長。

3. AlphaFold 2 將哪項研究任務大幅壓縮了所需時間？

✓ 正確！

✗ 不正確。AlphaFold 2 大幅壓縮了蛋白質結構預測所需的時間。

4. 2023 年未來生命研究所公開信呼籲暫停 AI 訓練多長時間？

✓ 正確！

✗ 不正確。公開信呼籲暫停六個月，但這個暫停從未實現。

5. 「外層對齊」（Outer Alignment）問題的核心是什麼？

✓ 正確！

✗ 不正確。外層對齊的核心問題是：訓練目標（代理指標）是否真的代表了我們想要的結果。

6. RLHF（基於人類反饋的強化學習）最廣泛地被哪些公司使用？

✓ 正確！

✗ 不正確。RLHF 最廣泛被 OpenAI、Anthropic 與 Google DeepMind 使用。

7. Blake Lemoine 關於 LaMDA 的主張為何受到廣泛反駁？

✓ 正確！

✗ 不正確。反駁的核心論點是：語言模型輸出反映的是訓練資料的模式，不是真實的主觀體驗。

8. 芬蘭 UBI 實驗（2017–2018）的規模限制是什麼？

✓ 正確！

✗ 不正確。芬蘭 UBI 實驗的主要限制是樣本規模過小（2000 人），難以推論大規模實施的效果。

9. 歐盟《人工智慧法》（AI Act）在哪一年正式生效？

✓ 正確！

✗ 不正確。歐盟 AI 法於 2024 年正式生效。

10. 「意識的難題」（Hard Problem of Consciousness）由哪位哲學家提出？

✓ 正確！

✗ 不正確。「意識的難題」由哲學家 David Chalmers 於 1995 年提出。

11. 2023 年美國編劇工會罷工主要針對哪種威脅？

✓ 正確！

✗ 不正確。WGA 罷工的核心針對的是 AI 用於生成劇本並替代編劇工作的威脅。

12. Goodhart 定律對 AI 對齊的啟示是什麼？

✓ 正確！

✗ 不正確。Goodhart 定律警告：當代理指標成為優化目標，AI 往往找到違背原意的捷徑。

13. IMF 2024 年研究顯示，在先進經濟體中有多少比例的工作面臨 AI 高度暴露？

✓ 正確！

✗ 不正確。IMF 研究顯示在先進經濟體中約 60% 的工作面臨 AI 高度暴露。

14. 新疆 AI 監控案例中，哪家企業的技術被美國商務部列入實體清單（2021 年）？

✓ 正確！

✗ 不正確。美國商務部於 2021 年將商湯科技與海康威視列入實體清單。

15. 根據本模組，「路徑依賴」（Path Dependency）對 AI 政策的啟示是什麼？

✓ 正確！

✗ 不正確。路徑依賴的啟示是：現在的窗口期極為寶貴，因為早期決策會自我強化，後續修正成本呈指數上升。