:::

線上閱讀

:::
通識在線第 73 期(2017年11月)

高教劇變環境中通識教育如何思考贏的策略?
「思考式機器」vs.「機器式思考」


文/劉柏宏 勤益科技大學通識教育學院院長
人工智慧的時代來臨
 這兩年最引起世人注目的科技新聞當屬Google Deepmind發展的人工智慧圍棋程式AlphaGO,繼2016年以4:1打敗韓國圍棋高手李世乭後,於2017年又以3:0橫掃中國的柯潔。由於打遍天下無敵手,Deepmind宣布AlphaGo「退役」,不再參加任何圍棋比賽。這是繼1997年IBM所開發的Deep Blue擊敗西洋棋世界冠軍卡斯巴羅夫(Garry Kasparov)後資訊科技的一大突破。當年Deep Blue擊敗卡斯巴羅夫時,美國《時代》雜誌即提出讓電腦與人類下圍棋的挑戰,並預言「電腦要在圍棋上戰勝人類,還要再過一百年,甚至更長的時間」。沒想到Deepmind以短短20年時間就實現這不可能的任務。

 為何《時代》雜誌預測百年之內機器無法戰勝人腦的圍棋?因為看似簡單的圍棋其複雜度遠遠高於西洋棋。根據國立東華大學資訊工程系顏士淨教授的分析,西洋棋的複雜度是100123,而圍棋是100400,其間之差異豈止億萬倍!趨勢科技共同創辦人,現任趨勢文化長的陳怡蓁說:「當年超級電腦『深藍』贏了,舉世歡騰,覺得是人類的一大進步。但這次人工智慧系統AlphaGo贏,大家的心情都很矛盾,都在想那我們怎麼辦?」為何有這樣的差異?當初Deep Blue所使用的人工智慧實際上是「人工指導智慧」,是由預設程式指導電腦怎麼做,也就是「兵來派將擋,水來拿土淹」的攻防模式。依靠它強大運算能力計算出接下來對方所有的可能步驟性,類似「窮舉法」。但是圍棋複雜度遠高於西洋棋,這種暴力法已經無法勝任。而AlphaGo則具備自我學習的能力,根據人類所提供的大量數據,再結合所謂的蒙地卡羅樹狀搜尋法(Monte Carlo Tree Search),開啟自主學習,類似人腦的神經元自動與隨機聯結,以理解並發展出圍棋策略。邏輯思辨是通識教育培育中非常重要的一環,當我們思考在當今高教劇變環境中通識教育如何思考贏的策略時,人工智慧可以帶給我們甚麼啟示?

「機器式思考」對通識教育的影響
 我們以兩代人工智慧Deep Blue和AlphaGO做比較。Deep Blue是由當時的電腦巨擘IBM所開發,本質上仍是屬於解決問題(solving problem)的思考策略,而非問題解決(problem-solving)的思維模式,缺乏自我學習和深度學習的機制,在此稱它為「機器式思考」(mechanical thinking)。

 「機器式思考」依據內鍵的規則實施執行程序的步驟以確實解決問題,是一種有效率的方式,但是它或許應用在「物」的事務上有實質成效,用於「人」的問題上就顯露出它思想貧乏的本質。以今年大學解聘兼任教師的事件為例,教育部於年初釋放出將把兼任教師納入勞基法的消息,3月份即傳出淡江大學擬解聘近200位兼任教師。4月份再傳出亞洲大學與健行科技大學也將不續聘無本職兼任教師,甚至裁撤通識課程。後來有鑑於兼任教師納入勞基法的衝擊與反彈聲浪過大,教育部改為修訂「專科以上兼任教師聘任辦法」,於5月3日公告,其中第十一條明訂「兼任教師符合勞工保險條例、就業保險法或全民健康保險法所定資格者,學校於聘約有效期間為其投保勞工保險、就業保險及全民健康保險。」第十二條又規定「兼任教師符合勞工退休金條例所定資格者,學校於聘約有效期間,應依勞工退休金條例規定,按月為未具本職兼任教師提繳退休金。」這時連頂尖國立大學也按捺不住,5月25日各主要媒體均報導交通大學以「課程結構調整」為由,將解聘通識中心近半數以上的兼任教師。

 針對此點,依據數家媒體所刊登的共同內容,交通大學表示,本次通識課程的變革,均因應社會需求及變化作調整,將通識課程理念改為「現代人需要的知識和技能」,提供學子更為廣博、結構化、跨域的學習內容,並擴大通識選修課程的採計。從字面上解讀其意思就是,交通大學此次解聘兼任教師無關乎兼任老師納保事件,而是剔除以往所開設「不符合現代人需要的知識和技能」之通識課程,而且以往的通識課程不夠廣博、不具結構化、不具跨域性。若是交通大學澄清的內容為真,我們也不免納悶,堂堂頂尖之高等教育學府,為何在過去數年的通識教育改革之中都沒有發現自身通識課程之弊病,而在一夕之間以解聘兼任通識教師來達成通識課程架構改革的目的?解聘原有不適任之兼任教師後,是否補聘新的兼任教師?若沒有的話,是否意味著,僅靠著更少的通識教師就可以達成「提供學子更為廣博、結構化、跨域的學習內容」的目標?豈非十分弔詭?其中「擴大通識選修課程的採計」可能才是重點。台大最新的通識教育課程改革重點便是,專業基礎科目和基本能力課程可以採計為通識學分,無形之中減少原有通識課程開課數。這些解決政策與通識課程衝突的模式類似「機器式思考」,為盡快解決現實問題,容易導引至降低成本這策略模式,只注重短期量化的效率而忽略長期質化的效益。

向「思考式機器」學習
 那AlphaGo又是如何思考?事實上,AlphaGo擁有兩個獨立運作但數據互相交流的網絡:「策略網路」(policy network)和「價值網路」(value network)。「策略網路」的初始數據是根據世界一流高手的棋譜作為學習範本,然後透過兩台AlphaGo互相對弈進行深度自我學習,以累積更多數據。「策略網路」不關心輸贏,只是根據數據去預測對手最有可能的落子位置以產生對策。而「價值網路」則是根據「策略網路」中AlphaGo互相對弈的輸贏結果評估整體棋局的勝率,而不計較短期的攻城略地,相當於大腦的「後設認知」(metacognition)系統,作為監控戰術之用。換句話說,「策略網路」進行的是憑經驗的地面肉搏戰,「價值網路」則是位於制高點,視戰況隨時調整地面肉搏戰的布局,因此我們可以稱AlphaGo是一種「思考式機器」(thinking machine)。通識教育如何可以從中學習贏的策略呢?

 我們做一個隱喻式的對比。如果將「策略網路」視為從外部和自我實務經驗所學習而來的資料庫,AlphaGo互相對弈的結果當作自我反思的成果以豐富「策略網路」,則「價值網路」是經過檢驗的後設理念。那當今大學的通識教育出現甚麼問題?個人認為是缺少設定「自我反思的攻擊發起線」和「後設理念的制高點」。我們很容易從他校習得實務作法,並從專家學者與文本知曉通識理念,但由於缺乏自己打自己的「自我反思」過程,以致於無法築構適合自我的「後設理念」指導原則,易流於人云亦云。通識教育本無定法,他山之石,固然可以攻玉,但如果缺少「攻」這個琢磨的過程,依然成就不了玉。因此在此高等教育劇變的環境中通識教育要發展贏的策略,須先進行「為vs.不為」和「能vs.不能」的自我反思過程,並依此審視檢驗通識理念。仿造AlphaGo「策略網路」和「價值網路」雙腦運作模式,方能使所有的通識實務都能經過理念驗證,反之所有通識理念也都是經過實務檢驗。

AlphaGo隱喻的反思
 前面強調通識教育贏的策略須有自己打自己的「自我反思」過程,因此我們也須反過來質疑AlphaGo的「策略網路」和「價值網路」雙腦運作模式真的適合我們當今的大學通識現場嗎?我們可以將一些實施通識教育有優良成果的學校經驗與制度作為「策略網路」的初始數據,然後以學校本身條件檢視這些經驗與制度是否能夠落實,加以改良後成為自我策略,再由「價值網路」評估整體勝率。但問題是,在大學通識之中由誰來擔任「價值網路」的角色?學校的通識教育中心或主管通識教育的單位提出策略之後,通常是交由學校最高決策單位(可能是校長、董事會、或是某個委員會)做最後定奪,而學校最高決策單位能擔任「價值網路」的角色嗎?也就是它單純是以某項通識教育策略的勝率作為考量重點嗎?通常不是!如果該校最高決策單位只從成本管理的狹隘心態看問題,「價值網路」將會淪為「價格網路」,無法將勝率評估回饋至「策略網路」。如此看來,AlphaGo的雙腦模式並無法完全套用在通識教育當中,因為大學的「價值網路」並不只是支援通識教育的「策略網路」,而也須思考專業系所發展的策略。

 此時,通識教育不妨可以規劃雙贏策略,假設「價值網路」關心專業系所贏的策略,通識教育的「策略網路」可以將專業系所的發展納入考量,不是只以通識教育的輸贏為目標,而是求通識與專業的「共好」。以前述各校擴大採計通識學分為例,各校通識教育主管單位可以嘗試和各系共同設計兼融專業知識與通識內涵的課程以折抵通識學分,而非通識學分完全被各系的專業基礎課程取代。或是通識與各系共同規劃跨領域學程,可以讓通識觸角延伸出去。藉由這種專業與通識「共融」的策略,方能達成專業與通識的「共榮」。「價值網路」會以共融策略的輸贏為依歸回饋至「策略網路」。或許有人質疑此種「共融」的策略可能喪失通識本身的主體性。但誠如韓國職業九段棋士趙惠連所說:「人類下棋講究步步都要贏,贏愈多愈好,但AlphaGo的目標只有贏,贏多少完全不重要,局部犯錯無傷大雅,大局贏就是贏。

 「機器式思考」步步都要贏的焦慮,講究的是短期效率。「思考式機器」大局贏就是贏的豁達,著眼的是長期效益。值此高教環境劇變之際,通識教育思考贏的策略時須掌握一個原則,只要通識內涵能被看見,以何種形式呈現並不重要。 
cron web_use_log