Creating artificially intelligent systems - Computer Science (9645) - Oxford AQA International AS Level

建立人工智慧系統簡介

歡迎！在本章中，我們將探索電腦科學中最令人興奮的領域之一：人工智慧 (Artificial Intelligence, AI)。AI 在電影中常被描繪成會說話的機器人，但在現實世界中，它是我們每天使用的技術背後的功臣，例如 Netflix 的電影推薦、像 Siri 這樣的語音助理，甚至是過濾電子郵件垃圾信件的篩選器。我們將探討如何定義機器的「智慧」，以及電腦用來從數據中「學習」的巧妙方法。

1. 什麼是人工智慧？

從本質上講，人工智慧是電腦科學的一個分支，旨在創建能夠執行通常需要人類智慧才能完成的任務的系統。這包括識別面孔、理解口語、做決策以及語言翻譯等任務。

別擔心，如果起初覺得這些很難理解！ 你並不需要真的去打造一個機器人，你只需要理解這些系統背後解決問題的邏輯即可。

圖靈測試 (The Turing Test)

1950 年，一位著名的電腦科學家艾倫·圖靈 (Alan Turing) 提出了一種判斷機器是否能真正被稱為「有智慧」的方法。他當時稱之為「模仿遊戲」，但我們現在稱之為圖靈測試。

測試設置： 想像有一位人類提問者在一個房間裡，而電腦和另一位人類在另一個房間。提問者透過輸入文字提問，並收到輸入的回覆。如果提問者無法分辨答案究竟來自人類還是電腦，那麼該電腦就被視為通過了測試，具備了「智慧」。

快速回顧：
• 人工智慧： 機器模擬人類認知功能的能力。
• 圖靈測試： 一種測試機器是否具備與人類相當、或無法與人類區分之智能行為的方法。

重點總結： AI 不僅僅是「變得聰明」，而是指機器在特定背景下表現出的行為與人類無法區分。

2. 問題解決：狀態空間搜尋

AI 解決問題（例如贏得一場西洋棋比賽或在地圖上找到最快路線）的一種方式是透過搜尋 (Search)。由於電腦不像我們一樣會「思考」，它會瀏覽一張包含所有可能移動步驟或狀態的「地圖」。

狀態空間 (State-Space)

狀態空間是指一個問題所有可能出現的「狀態」（情況）的呈現方式。例如，在井字遊戲（Noughts and Crosses）中，棋盤上每一個可能的佈局都是一個「狀態」。

啟發式方法 (Heuristics)：「捷徑」

想像你在巨大的城市裡找一間特定的房子。你可以走過每一條街道（這是窮舉搜尋，Exhaustive Search），但那會花掉你無窮的時間！取而代之的是，你使用一種啟發式方法 (Heuristic)。啟發式方法是一種「經驗法則」或「受過教育的猜測」，它透過忽略不太可能達到目標的路徑，幫助電腦更快地找到解決方案。

現實生活比喻： 當你在找鑰匙時，你會先檢查茶几和口袋（啟發式方法），而不是立刻去檢查冰箱內部或是花園地磚底下。

常見錯誤提醒： 啟發式方法無法保證找到「完美」或「最短」的解法，但它能保證在合理的時間內找到一個「足夠好」的解法。

重點總結： AI 利用搜尋來尋找解法，並使用啟發式方法讓搜尋過程更快速、更有效率。

3. 機器學習 (Machine Learning)

機器學習 (ML) 是 AI 的一個子領域，我們不需要給電腦一堆規則（例如「如果它有毛且會喵喵叫，它就是貓」）。相反地，我們提供海量的數據，讓電腦自己去發現其中的規律。

監督式學習 (Supervised Learning)

可以把它想像成「有老師教導的學習」。我們提供給電腦標記過的數據 (Labeled data)。
範例： 我們給電腦看 10,000 張照片，並告訴它：「這是貓」、「這是狗」、「這是貓」。在看過足夠多的標記範例後，電腦就能學會如何在它從未見過的新照片中識別貓。

非監督式學習 (Unsupervised Learning)

可以把它想像成「透過探索進行學習」。我們提供給電腦未標記的數據 (Unlabeled data)，並要求它自行尋找規律或分組。
範例： 超市給電腦一份顧客購買清單。電腦可能會發現，購買尿布的顧客往往也會買啤酒，儘管沒人告訴它要尋找這種聯繫！這被稱為分群 (Clustering)。

記憶輔助（「S」規則）：
Supervised（監督式）= Shown the answer（被告知答案，有標記）。
Unsupervised（非監督式）= Unknown answers（未知答案，無標記）。

重點總結： 機器學習使電腦能夠透過處理數據，隨著時間的推移提升執行任務的效能。

4. 神經網絡 (Neural Networks)

神經網絡是一種受到人類大腦運作方式啟發的機器學習類型。它們由多層「節點」（如同人工神經元）組成。

一個簡單的神經網絡通常有三個部分：
1. 輸入層 (Input Layer)： 數據（例如圖像的像素）進入系統的地方。
2. 隱藏層 (Hidden Layers)： 這是進行「思考」的地方。系統會為不同的資訊分配「權重 (Weights)」，以決定它們的重要性。
3. 輸出層 (Output Layer)： 最終決策（例如：「這張照片有 98% 的機率是貓」）。

你知道嗎？ 「深度學習 (Deep Learning)」其實就是擁有多個隱藏層的神經網絡。這就是為什麼它被稱為「深度 (Deep)」的原因！

重點總結： 神經網絡利用層層連接來處理複雜數據，並像生物大腦一樣識別規律。

5. 大數據與 AI

為什麼 AI 的概念早在 1950 年代就被提出，卻直到現在才如此普及？答案就是大數據 (Big Data)。AI 模型需要大量的數據才能有效訓練。

大數據的 3 個 V：
1. 容量 (Volume)： 數據的龐大數量（TB 和 PB 等級）。
2. 速度 (Velocity)： 生成新數據的速度（例如每分鐘數百萬條推文）。
3. 多樣性 (Variety)： 數據的類型多樣（文字、影片、音訊、GPS 訊號）。

快速回顧箱：
• AI 需要大數據來「學習」規律。
• 如果沒有高容量、高速度和高多樣性，現代 AI 將無法達到今日的準確度。

重點總結： 大數據提供了「燃料」，讓現代 AI 和機器學習系統得以運作並不斷進化。

總結檢查清單

在完成本章之前，請確保你能：
• 定義人工智慧。
• 解釋圖靈測試的運作方式。
• 描述啟發式方法如何協助狀態空間搜尋。
• 區分監督式學習與非監督式學習。
• 列出大數據的 3 個 V。

做得好！你已經掌握了 AI 的基礎知識。持續練習這些術語，你很快就會成為專家！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。