建立人工智慧系統簡介
歡迎!在本章中,我們將探索電腦科學中最令人興奮的領域之一:人工智慧 (Artificial Intelligence, AI)。AI 在電影中常被描繪成會說話的機器人,但在現實世界中,它是我們每天使用的技術背後的功臣,例如 Netflix 的電影推薦、像 Siri 這樣的語音助理,甚至是過濾電子郵件垃圾信件的篩選器。我們將探討如何定義機器的「智慧」,以及電腦用來從數據中「學習」的巧妙方法。
1. 什麼是人工智慧?
從本質上講,人工智慧是電腦科學的一個分支,旨在創建能夠執行通常需要人類智慧才能完成的任務的系統。這包括識別面孔、理解口語、做決策以及語言翻譯等任務。
別擔心,如果起初覺得這些很難理解! 你並不需要真的去打造一個機器人,你只需要理解這些系統背後解決問題的邏輯即可。
圖靈測試 (The Turing Test)
1950 年,一位著名的電腦科學家艾倫·圖靈 (Alan Turing) 提出了一種判斷機器是否能真正被稱為「有智慧」的方法。他當時稱之為「模仿遊戲」,但我們現在稱之為圖靈測試。
測試設置: 想像有一位人類提問者在一個房間裡,而電腦和另一位人類在另一個房間。提問者透過輸入文字提問,並收到輸入的回覆。如果提問者無法分辨答案究竟來自人類還是電腦,那麼該電腦就被視為通過了測試,具備了「智慧」。
快速回顧:
• 人工智慧: 機器模擬人類認知功能的能力。
• 圖靈測試: 一種測試機器是否具備與人類相當、或無法與人類區分之智能行為的方法。
重點總結: AI 不僅僅是「變得聰明」,而是指機器在特定背景下表現出的行為與人類無法區分。
2. 問題解決:狀態空間搜尋
AI 解決問題(例如贏得一場西洋棋比賽或在地圖上找到最快路線)的一種方式是透過搜尋 (Search)。由於電腦不像我們一樣會「思考」,它會瀏覽一張包含所有可能移動步驟或狀態的「地圖」。
狀態空間 (State-Space)
狀態空間是指一個問題所有可能出現的「狀態」(情況)的呈現方式。例如,在井字遊戲(Noughts and Crosses)中,棋盤上每一個可能的佈局都是一個「狀態」。
啟發式方法 (Heuristics):「捷徑」
想像你在巨大的城市裡找一間特定的房子。你可以走過每一條街道(這是窮舉搜尋,Exhaustive Search),但那會花掉你無窮的時間!取而代之的是,你使用一種啟發式方法 (Heuristic)。啟發式方法是一種「經驗法則」或「受過教育的猜測」,它透過忽略不太可能達到目標的路徑,幫助電腦更快地找到解決方案。
現實生活比喻: 當你在找鑰匙時,你會先檢查茶几和口袋(啟發式方法),而不是立刻去檢查冰箱內部或是花園地磚底下。
常見錯誤提醒: 啟發式方法無法保證找到「完美」或「最短」的解法,但它能保證在合理的時間內找到一個「足夠好」的解法。
重點總結: AI 利用搜尋來尋找解法,並使用啟發式方法讓搜尋過程更快速、更有效率。
3. 機器學習 (Machine Learning)
機器學習 (ML) 是 AI 的一個子領域,我們不需要給電腦一堆規則(例如「如果它有毛且會喵喵叫,它就是貓」)。相反地,我們提供海量的數據,讓電腦自己去發現其中的規律。
監督式學習 (Supervised Learning)
可以把它想像成「有老師教導的學習」。我們提供給電腦標記過的數據 (Labeled data)。
範例: 我們給電腦看 10,000 張照片,並告訴它:「這是貓」、「這是狗」、「這是貓」。在看過足夠多的標記範例後,電腦就能學會如何在它從未見過的新照片中識別貓。
非監督式學習 (Unsupervised Learning)
可以把它想像成「透過探索進行學習」。我們提供給電腦未標記的數據 (Unlabeled data),並要求它自行尋找規律或分組。
範例: 超市給電腦一份顧客購買清單。電腦可能會發現,購買尿布的顧客往往也會買啤酒,儘管沒人告訴它要尋找這種聯繫!這被稱為分群 (Clustering)。
記憶輔助(「S」規則):
Supervised(監督式)= Shown the answer(被告知答案,有標記)。
Unsupervised(非監督式)= Unknown answers(未知答案,無標記)。
重點總結: 機器學習使電腦能夠透過處理數據,隨著時間的推移提升執行任務的效能。
4. 神經網絡 (Neural Networks)
神經網絡是一種受到人類大腦運作方式啟發的機器學習類型。它們由多層「節點」(如同人工神經元)組成。
一個簡單的神經網絡通常有三個部分:
1. 輸入層 (Input Layer): 數據(例如圖像的像素)進入系統的地方。
2. 隱藏層 (Hidden Layers): 這是進行「思考」的地方。系統會為不同的資訊分配「權重 (Weights)」,以決定它們的重要性。
3. 輸出層 (Output Layer): 最終決策(例如:「這張照片有 98% 的機率是貓」)。
你知道嗎? 「深度學習 (Deep Learning)」其實就是擁有多個隱藏層的神經網絡。這就是為什麼它被稱為「深度 (Deep)」的原因!
重點總結: 神經網絡利用層層連接來處理複雜數據,並像生物大腦一樣識別規律。
5. 大數據與 AI
為什麼 AI 的概念早在 1950 年代就被提出,卻直到現在才如此普及?答案就是大數據 (Big Data)。AI 模型需要大量的數據才能有效訓練。
大數據的 3 個 V:
1. 容量 (Volume): 數據的龐大數量(TB 和 PB 等級)。
2. 速度 (Velocity): 生成新數據的速度(例如每分鐘數百萬條推文)。
3. 多樣性 (Variety): 數據的類型多樣(文字、影片、音訊、GPS 訊號)。
快速回顧箱:
• AI 需要大數據來「學習」規律。
• 如果沒有高容量、高速度和高多樣性,現代 AI 將無法達到今日的準確度。
重點總結: 大數據提供了「燃料」,讓現代 AI 和機器學習系統得以運作並不斷進化。
總結檢查清單
在完成本章之前,請確保你能:
• 定義人工智慧。
• 解釋圖靈測試的運作方式。
• 描述啟發式方法如何協助狀態空間搜尋。
• 區分監督式學習與非監督式學習。
• 列出大數據的 3 個 V。
做得好!你已經掌握了 AI 的基礎知識。持續練習這些術語,你很快就會成為專家!