神經科學研究的各個層次
Jun 6th, 2009 by Mr. Thursday 将文章转换为简体
Posted By Mr. Thursday
原文發表於2008/09/16於MMDays。
在之前有寫了一些神經科學相關的文章,有些是偏向認知心理的,有些是偏向細胞分子的,或是偏向視覺處理的。神經科學的研究,我本身的是以人工智慧作為出發點,往神經科學研究方向進行。至於為什麼要在人工智慧以外加上神經科學呢?這兩者似乎有一點距離?原來資訊工程的技術是否已經足夠了呢?
這邊我提出幾點研究的動機。首先,目前的機器學習的方式,和人類學習的方式比較起來,有個最大的不同,就是我們人類可能從上課或是閱讀當中自我學習,或是由外在環境給予的經驗來學習。機器同樣也是接收外界的刺激,調整自己的反應來學習,然而機器學習過程當中,有時候會需要滿多人類的介入,譬如說調整參數、調整模型或演算法等等。如果用類比的方式來說,目前機器學習的方式如果用到人上面,就像是把人的腦蓋打開,調整裡面的神經連結,關起來以後再讓人腦跑跑看有沒有學習到。其實這種方式學習也沒有什麼不好,因為機器的目標,其實是服務人類,學習的東西有學到,怎樣子學習到就不那麼重要了。
那麼機器目前學習的情況如何呢?其實目前的電腦和機器算是滿先進的,加上運算速度快,純粹數字計算的能力就比人類心算能力還快,許多應用服務也讓人類生活改善不少。然而有些比較難處理的問題,像是需要人類智能才能完成的問題,譬如說翻譯、圖形辨識、影像辨識、語音辨識、語意了解等等,這些都算是人工智慧 (Artifitial Intelligence 人工智能) 所需要解決的問題,這些問題的解決,沒有隨著硬體速度的增加而解決,因此軟體上面的進步,就是關鍵了!目前對於這些難以解決的方式,有兩種解法:(1) 運用大量的訓練資料,譬如說Google翻譯,使用大量的訓練資料,或是PDA的手寫辨識,大量的訓練資料都讓正確率大大提升。(2) 運用人工運算 (Human Computing) 結合Web2.0的方式,提供人性化的介面,讓每個人在趣味中貢獻微小的人類智力,解決一些大量資料也無法解決的東西,譬如說reCAPTCHA、語意辨識、圖形的ROI (region of interest) 等等。
除了上述這些替代方案,可以立即實作,立即解決外,是否有其他方式呢?譬如說一個完備的數學統計理論或模型,拿來應用在機器學習上?或是從生物神經系統,已經有智力的行為表現,我們只要逆向工程 (reverse engineering) ,把裡面的迴路找出來,簡單版先依樣畫葫蘆,模擬一個一模一樣的迴路,之後再取其精華,寫成一個最簡單的程式?然而這些方法,需要時間,也許需要個十年,如果用經濟角度考量,不能立即實做的解答,就好像要十年不吃不喝一樣,是個很大的代價。然而如果這個方法真的有所突破,讓機器是真的了解,而不是外表看起來有了解,會是一項滿大的貢獻。
也因此,我本人會想研究神經科學相關的事物,無論是人腦還是動物的腦,任何生物上的發現,在拿回來應用在人工智慧的問題上,做出來的系統就可以盡量類似人類學習的方式,不用掀開腦蓋,而是可以自行閱讀或是聆聽來學習,加上電腦本身運算上速度的優勢,以及硬體上和人體的不同處,可以迅速學習,而且只要學習一次就能永久保存,或許不會忘記,還可以大量複製!所以因為這個原因,會想從神經科學裡面找一些新發現。神經科學和人工智慧的關係,也比較緊密一些了。
講完這麼長的前言,接下來我就稍微把神經科學的研究,依照層次的不同作一個簡單的介紹,讓各為日後如果看到相關的介紹,在心中可以有一個座標軸,吸收資訊也會比較快一些。有哪些層次的劃分呢?依照研究範圍的大小,可以約略分成四大部分:認知心理層面、細胞分子層面、系統神經層面、以及計算神經的層面。下面就一一分別簡要敘述一下:
一、認知心理層面
在這一個層次,研究的對象通常是人類,因為人類的頭腦不能輕易拿來插電極做實驗,除非生病像是癲癇的病人,才會一邊治療一邊蒐集實驗資料。然而仍舊有一些非侵入式的測量儀器,譬如說 fMRI (功能性磁核共振造影) 、PET (正子束造影) 、或是EEG (頭殼外電子活動圖)。這些儀器測量的訊號,都可以拿來分析,反推大腦區域的功能。不過解析度還是沒有直接插電極來的好,最近有一種MRI叫做 dtMRI (水分子擴散磁核共振造影) 是觀察在大腦因為神經活動細胞變形產生的水分子移動訊號,不但非侵入式,而且解析度可能比電極還好,許多人正在嚐試當中。
除了這些直接觀察腦部訊號的研究方式,也有直接觀察外在行為的研究方式,譬如說心理生理學 (psychophysics) 就是直接測量人類生理上的反應,譬如說反應時間,操作的正確率等等。這讓我想到中學的時候有個實驗測試大腦的手的反應時間,實驗方法是另外一個人拿一把長的尺,不定時放開手,受試者看到尺往下調的時候要趕快接住,不過我的反應似乎非常慢,嚐試滿多次,不過尺都已經掉在地上了我好像還沒接住呢@@。
除了外在行為,認知科學認為人還有內在認知的部分,才是產生行為的源頭,譬如說人有情緒、有理性、有注意力等各種內在組成元素。因此研究就是要建立這種內在模型,和外在刺激的關係。資訊科學也有一些研究式採取這個方式來時做一些智慧系統。Unified Model of Cognition這一本書可以參考一下。
在更高層次一些,哲學或語言學,對於高等功能像是語言語意,甚至「意識」的研究,就更 high-level了!還有個字叫做qualia專門形容人心靈上主觀的感受,譬如說對顏色的感覺,是一種內在主觀的知覺等等。哲學上也會有心靈是否等同於大腦 (mind-body problem) 以及 是否存在自由意志 (free will) 等課題。
二、細胞分子層面
另外一個極端,則是往分子細胞層次走。細胞來說,最重要的就是研究細胞上面的細胞膜,上面的離子通道可以讓帶電離子進出細胞,產生電流。細胞膜本身讓細胞內外有電壓差別,因此整個細胞如果用電機模型來做,就像是一個 RC-circuit,R是電阻 (resistence)、C是電容 (capacitor),分別對應細胞膜上面的離子通道和絕緣的細胞膜部分。因此這部分的研究,就是尋找各種細胞大小,怎樣子影響電阻和電容,進一步影響神經細胞活動的快慢,或是畫出 IV曲線 (電流-電壓對應圖)。
分子部分,則是化學和藥理一展身手的地方,譬如說各種神經傳導物質,刺激性或抑制性的,對於神經活動的影響,各種神經疾病,像是老年癡呆症 (Alzheimer’s Disease)、帕金森氏症 (Parkinson’s Disease 影響運動功能的疾病) 、精神分裂症 (Schizophrenia) 、癲癇 (epilepsy)等等。藥物成癮的治療,也是這一個層次的重點。肉毒桿菌美容,也是這一個層次的應用。
如果說大腦功能像是在寫一篇文章,文字和句子通暢,就像是認知心理層次的研究,墨水和紙張,就像是細胞分子的研究。兩者可以互相單獨研究,就像不同的紙筆,可以寫下同一篇文章。但也會有小差別影響大功能的時候,譬如說隨著時間流逝,紙張上面的墨水漸漸退色,即使每個字都一筆一畫寫下,但是整個顏色淡到一定程度,仍舊會影響到閱讀的感覺。這就是分子細胞層影響大腦整體功能的例子,像老年癡呆症在大腦裡面長的amyloid塊,就是分散地慢慢吞吃神經細胞,讓大腦慢慢瓦解失去智力記憶等功能,是一種由下而上 (bottom-up) 的侵蝕。
除此之外,細胞分子層次還可以在基因、以及蛋白質路徑上面研究,因此老鼠和果蠅,是這個層次研究會用的動物,因為基因改造鼠或果蠅成長迅速,比較能夠快一點觀察到基因改變的影響。精神分裂症有基因上的機制,因此基因和疾病的研究是這邊的重點之一。
除了細胞、細胞膜、離子通道、化學物質,是否這個層次還有更小研究的東西呢?有一位Roger Penrose曾經在Google Tech Talk演講,是討論量子力學對於意識的影響,一端是極小物體的力學,一端是極大範圍的課題,有興趣的不妨聽一下這段演講,滿特別的!
A New Marriage of Brain and Computer at Google engEDU.
三、系統神經層面
系統層次,則是從細胞到認知功能都包含到。譬如說視覺系統,怎樣子產生各種視覺上的認知,是覺得各種錯覺 (illusion) 的神經迴路是如何?就是這個層次的重點。猴子、狗、貓會是這一層次研究實驗的動物,因為他們的認知功能有一定程度,比較接近人,但是又可以插入電極測量更高解析度的訊號,做各種分析,找出相關性或因果關係,建立認知功能的神經迴路。
除此之外,輔具 (prosthetic) 也是這一層次的應用,譬如說人工機械手等等,因為控制這些輔具的訊號,經由電波就可以達成,不像治療疾病需要化學物質來影響細胞或基因。
四、計算神經層面
傳統的類神經網路 (artifitial neural network) 在資訊科學裡面有許多研究,像是Perceptron, Hopfield Model, Boltzman Network, SOM (self-organized map), ART (Artifitial Resonance Theory) 等等。計算神經則是加入更多近期神經科學的發現,有些是從生物實驗的數據開始,分析之後才慢慢建立模型,算是和類神經網路相反的方向,是從生物訊號走向模型。獲得諾貝爾獎的 HH Model (Hudgkin-Huxley Model) 就是其中一個例子。另外,計算神經需要很多數學,也有從數學出發的模型,像是PCA (Principle Component Analysis)和NMF (Non-negative Matrix Factorization)等等。或是分析的時候需要各種數學工具像是機率統計等等,數學十八般武藝都要搬出來了。因此計算神經需要數學好來分析生物資料。如果純粹只有寫程式模擬,那麼就需要考慮一下在這方面研究想要扮演的角色是什麼了,怎樣子才會和以往的類神經網路有所不同。
稍微簡單提到了神經科學這四大層次。那麼我個人喜歡哪一層次的研究呢?因為背景是資訊科學,因此計算神經是先考慮的層次,然而分子細胞也是我很有興趣的層次。或許會說,為什麼要見樹不見林,研究小的東西而不研究整體的東西呢?我的想法是,因為分子細胞層比較接近能夠實作電腦系統的層次,也就是比較接近程式可以模擬的層次。認知模型也是可以實作,但是我覺得有一些困難點。
譬如說認知層次的研究,有些是用到行為測量,像是WCST (Wiscosin Card Sorting Test) 會讓病人排序一堆樸克牌,每次依照不同條件排序,譬如說用數字大小排序,或是用顏色來排序。前額葉有缺損的病人,判斷力減少會無法學習或調整排序時候需要置換的規則 (rule),每次都只能用同一條規則來排序,變換規則排序的功能都喪失了。
其他認知模型,是運用人腦可以反省的能力來達成。譬如說記憶,我們可以回想記憶回憶的過程,自我可以察覺自己的心理活動,因此建立一個模型,認為記憶是由儲存、鞏固、和提取三大步驟所組成的。然而如果要問視覺怎樣子辨識一張照片有一張人臉,這個過程太快了,而且是意識無法反省到的地方,我們沒辦法一一察覺我們辨識物體的時候,一步一步的步驟。
所以,以實作電腦程式為目標的觀點,我會想要尋找細胞分子方面的模型,即使細胞分子的層次非常地細微,就像是要從紙張上面每一滴墨水,推出一個人寫字的心境一樣,兩端距離滿大的。但是除了接近程式實做的層次之外,也因為這個層次是由比較少例外的元素一一組成的,因此同樣是從生物研究來的模型,認知模型實做出來的系統,可能還是像其他演算法一樣,碰到不同問題常常要手動調整參數來處理例外情況,而不是一個會自我調整的,接近有生命的迴路了。
因此,終極目標,就是製造一個人工智慧系統,而且是接近生命體的方式,可以自我調整,透過頭蓋外面的訊息和環境互動來學習,不需要人類親自一個一個參數調整。這種系統在電腦上運轉,可以讓智慧快速學習到、學習一次之後輕易複製。如果還能夠和人腦迴路銜接,對教育有最大影響,因為我們不必再花費數十年的時間,才獲得基本的專業技能貢獻生產力,系統一接上去就學會一切事情了。當然這在目前看來似乎不大可能,或許一百年以後才會有的東西,然而這個目標可以提供這個研究方向一些動力,知道神經科學的相關研究,是提供生物逆向工程的啟發,創造出來的人工智慧,對於人類文明發展,算是一個新的里程碑了!
這篇文章除了前言和後面個人見解的部分,還稍微提到四個研究層次,希望各位讀者有辦法消化,裡面提到的各種技術或是專有名詞,有些今天實在沒辦法一一詳細敘述,日後有機會會再慢慢詳加介紹,讓各位對各層次的研究,在今天提供的大圖 (big picture) 之下,能夠進一步深入了解,並且知道這些研究和人工智慧的關聯,在於最後想要實做出來的 strong AI 系統!謝謝各位!也請相關好手不吝給予意見!