從符號到聯結：70年AI思想演進如何讓矩陣與激活函數孕育出智能？

發布時間：2026-05-12 06:44 來源：快訊作者：顧雨柔

人工智能領域正經歷一場靜默的革命。當ChatGPT能夠流暢創作詩歌、編寫代碼甚至通過專業考試時，人們不禁要問：這個由矩陣運算和激活函數堆砌而成的系統，究竟如何孕育出類人智能？這個看似魔法的現象背后，是橫跨七十年的理論突破與工程實踐的完美融合。

人工智能發展史中存在兩條根本對立的路徑。符號主義學派主張將人類知識編碼為精確規則，其典型應用如1997年擊敗國際象棋冠軍的深藍系統，通過窮舉所有可能走法并應用人類專家編寫的評估函數取得勝利。但這種方法的致命缺陷在于無法處理現實世界的模糊性——當遇到無毛貓或倒灑的液體這類常識問題時，基于規則的系統就會陷入癱瘓。

與之形成鮮明對比的聯結主義學派，其靈感源自神經科學對人腦的研究。該學派認為智能源于神經元間的動態連接，主張通過海量數據訓練神經網絡來自動發現規律。這種方法的突破性進展始于2012年AlexNet在圖像識別領域的碾壓式勝利，隨后Transformer架構的發明和ChatGPT的誕生，標志著聯結主義進入成熟應用階段。圍棋AI AlphaGo的勝利具有象征意義：這個需要處理比宇宙原子數量更多可能性的游戲，最終成為壓垮符號主義的最后一根稻草。

支撐現代AI系統的數學基礎可追溯至1989年。數學家George Cybenko證明的萬能近似定理指出：具有足夠多神經元的單隱藏層網絡，能夠以任意精度逼近任何連續函數。這個定理為神經網絡的能力劃定了理論上限——就像樂高積木可以通過足夠多的組合拼出任何形狀，神經元通過非線性激活函數的組合也能表達任何復雜規律。實際工程中，研究人員發現深層網絡比淺層網絡更高效，這解釋了為何現代AI系統普遍采用數十甚至上百層的結構。

核心運算單元的設計凝聚著數學智慧與工程考量。矩陣乘法作為線性變換的基礎，不僅擁有兩百年的數學理論支撐，更因GPU的并行計算特性獲得極致加速。而激活函數ReLU（取最大值函數）的引入，則用最簡單的數學操作打破了線性系統的局限。每個神經元通過線性變換和ReLU激活的組合，在數據空間中創造出一個可調節的"折點"，當足夠多的折點組合時，就能精確擬合任何復雜曲線。

訓練過程揭示了智能涌現的動態機制。在PyTorch框架的實際訓練中，隨機初始化的神經網絡最初輸出雜亂無章，但隨著梯度下降算法持續調整參數，網絡輸出逐漸逼近目標函數。這個過程驗證了萬能近似定理的實踐價值：神經元數量越多，擬合精度越高。對比實驗顯示，沒有激活函數的純線性網絡無論疊加多少層，始終只能表達直線關系；而加入ReLU的網絡隨著層數增加，能精確擬合任意復雜曲線。

現代AI系統的進化軌跡印證了理論突破與工程創新的相互作用。從1989年萬能近似定理的數學證明，到2012年AlexNet驗證深度學習的可行性，再到2017年Transformer架構的革命性改進，最終在2022年通過ChatGPT實現技術普惠。這個過程中，矩陣運算提供計算骨架，激活函數注入非線性靈魂，梯度下降算法實現自動優化，三者共同構建起現代AI的技術基石。這種工程實踐與理論研究的互動模式，與萊特兄弟發明飛機時空氣動力學理論尚不完善的境況異曲同工——技術突破往往先于完整理論體系出現，并在實踐中不斷完善。

更多>同類內容