:::

線上閱讀

:::
第七十一期:生命科學與通識教育

新聞時事中的數學傳播


文/賴以威 臺灣師範大學電機工程學系助理教授
 數據新聞可以說是這幾年最流行的新聞型態。傳統新聞仰賴記者的採訪功力。我們可以想像,一位資深記者拿著錄音筆(更早的時代還得練出一身速記能力),尋找事件的相關人士,在外頭跑了一整天搜集各方的談話與資料,到了深夜才會到編輯台,慢慢將整件事情消化,用專業流暢的文筆寫出一篇深度報導。

 製作數據新聞完全是另一回事,說得極端一點,不需要訪問一個人,坐在電腦前登入資料庫,爬梳數據。就能從中分析出一篇宛如財務報表般,圖文表並列的新聞。

 數據新聞提供了另一種觀看事件的視角,越來越多的數據新聞,在美國有Fivethirtyeight這類以數據新聞為主的專業媒體。仔細看媒體生態,就算不是數據新聞,傳統新聞中也出現越來越多的「數字」點綴。夾雜在文字中的數字具有非凡的效果,簡單幾個數字就能帶給一篇文章有著截然不同的閱讀體驗。我們用張愛玲《第一爐香》的描述來做例子:

睨兒正在樓下的浴室裡洗東西,小手絹子貼滿了一牆,蘋果綠、琥珀色、烟藍、桃紅、竹青、一方塊一方塊的,有齊齊整整的,也有歪歪、斜斜的,倒很有點畫意。
──張愛玲《第一爐香》
  
在張愛玲精準優美的用字下,彷彿可以看見一位丫環在濕搭搭的浴室裡洗手絹。如果請幾個人畫出想像到的場景,相信會看見不太一樣的畫面。不提睨兒的體態樣貌,光是手絹子的顏色就不一樣,畢竟每個人對蘋果綠,琥珀色的理解都有些微的出入。這不是說張愛玲的描述不夠到位,我認為這恰恰是文字描述的最高境界:它讓你覺得夠清楚了,但事實上留有很大的想像空間,讓你能填入自己覺得最美,最合理的資訊。常聽到作家說,當小說完成時,文字就有了生命,離開作者。我想是類似的意思。

 如果加入了數字呢?張愛玲的這段文字,我們倘若改寫成:

睨兒正在樓下的浴室裡洗東西,小手絹子貼滿了一牆,蘋果綠(140,230,0)、琥珀色(255,191,0)、烟藍(87,127,153)、桃紅(255,102,204)、竹青(120,146,98)、一方塊一方塊的,有齊齊整整的,也有歪歪、斜斜的,倒很有點畫意。

 括號中的數字是RGB三色色碼。儘管版面變得有些雜亂,至少可以確定一件事,每個人的蘋果綠都是同一種綠,只要他的電腦沒壞掉。這就是數字的威力。數字能突破文字固有的模糊性,賦予事物精準具體的形象。它或許破壞了浪漫,因為它帶來了真實。

 回到新聞,數字的意義不言而喻。我們可以用以下的譬喻,純文字的報導宛如一張素描,用各種手法逼近真實。添加數字的報導就像一張照片,直接提供真實的狀況。因此,現代新聞就算不轉型成數據新聞(因為數據新聞需要統計、資工、設計等專業技能,門檻較高),也都越來越講究在文章中加入數據與數字,提升專業性。

 有數字的地方,就有數學。就數學傳播來說,揉合了數據的新聞,是一個絕佳的傳播素材。

 我們來看一個例子,去年有一位便利商店員工連續上大夜班八天的新聞:

7-11員工上大夜班八天後落跑,連帶發現雖然法規上寫著「勞工每7天須休假1天」,但實際操作上卻可以有連上12天依然不違法的狀況……。

 這則新聞當時引起大量討論,許多人爭論為什麼不違法,為什麼違法,該怎麼算「每7天」。事實上爭論的點正是在於勞資雙方對「每7天」定義不同。我們用以下圖表來解釋:

1545_ea2d1697.png

 對資方來說,只要今天的前後6日內有一天是休假,今天就能被劃分在一個「有休假」的7天之內。但勞方的理解是,只要前後三天內沒有放假,就算是違規的連續7天上班。比起前者,後者是更嚴格地,將「7天」這個格子每日移動,每次移動都要滿足包含到1天假日。如果不具備一定的數學與邏輯思維,只從「每7天須休假1天」的文字去解釋,則無法凝聚論述共識。從這個例子可以看見數字能體現事實,但需要釐清模糊的真相,還得仰賴數學的運算推論。

 有些遺憾的是,目前的新聞媒體在這部分沒有掌握得非常好。我們再看一個例子,去年有一則新聞報導台北捷運即將取消八折優惠,一位業務員在受訪時回答:「取消優惠後,我一天的交通費用將增加200元。

 這是有問題的。台北捷運有所謂的一日票與72小時票,前者150元,後者平均每24小時127元。也就是說捷運局設定了一個「消費上限」,當乘客估算自己消費超過150元或127元時,就可以選擇吃到飽形式的票卷。回來看受訪業務員,如果取消八折,減少了20%的優惠會對他造成200元的額外支出,他的每日捷運交通費用高達1,000元。很顯然不合理。

 觀看這個問題的背後,我想不僅僅是一般大眾批評的「記者不懂算數」,而是撰文者對數字的錯誤認知。修辭中有所謂的誇飾法,把事情用比較誇大的手法描述,這是可以被接受的,作者也可以預期讀者知道這是誇飾。我想,某些媒體從業人員認為數字與文字相同,都可以使用誇飾法,才會產生許多如「陸客減少,鳳梨酥一年產值掉50億,手搖飲料一年產值掉70億」這樣的報導。他們只是習慣性地用誇飾法強化新聞的重點。

 偏偏像先前所提到的,數字與文字有著本質上的不同。文字是素描,數字是照片。當數字一出現時,因為它相當精確,我們會傾向去認定它就是事實,而不是經過誇飾放大後的結果。

 這樣的新聞會混淆視聽,對社會來說是有些困擾,但對數學傳播而言則是絕佳的機會。因為我們只要查證資料,再用手邊的數據求出近似的數值,並且公布計算過程。當社會大眾對原本的數據有所懷疑時,他們會願意跟著我們的推導,檢驗我們的假設與運算,最後決定接受我們求出來的結果。而在這過程中,其實他們就是做了一道非常生活化的數學應用題。甚至在某些情況下還要跟著學一些數學知識。

 好奇心是學習的起點,利用人們對社會時事真相的渴望,我們可以實現我們想做的數學傳播。

 剛剛提到的是等發生有問題的新聞,藉著用數學分析釐清真相,來實現數學傳播。這樣的作法終究是比較被動,某種程度上就是守株待兔,等著看哪篇新聞出錯。更好的作法是主動用數學製作一則新聞時事,而這個製作過程,跟數學建模是非常相似的。

1546_f7efd628.png

 上圖是我與太太廖珮妤小姐創辦的粉絲頁「數感實驗室」在製作一則數學新聞時的標準流程。先找一個有興趣的時事情境,將它的資訊抽象化,全部轉換成數字之後,再進行數學運算,最後用計算所得到的數字,返回詮釋原本的時事。

 我們再看一個例子,去年雄三飛彈誤射,當時網路上有許多陰謀論,認為飛彈軌跡直射海峽中線,目的是為了引起戰爭。這個情境很有意思,我們沒有辦法去檢驗「陰謀」是否存在,但我們可以檢驗「飛彈是否直射海峽中線」。檢驗的方法就是一道幾何數學題目:點到直線的最短路徑是通過點,與直線垂直的線段。

 在這道題目中,飛彈是我們的點,直線是海峽中線。因此只要計算飛彈軌跡是否與海峽中線垂直,就可以得知「飛彈是否直射海峽中線」。

1547_81345260.png

 當然,實際的抽象化過程相當複雜,必須找出各個位置的經緯度,再比對不同資料來源的照片,因為距離過遠,要考慮球面影響,也不能直接畫好線之後用量角器,得計算球面上兩條線的夾角。但同樣地,因為是社會大眾正在討論的議題,在發表之後引起許多讀者的迴響,甚至會有讀者補充我們模型簡化掉的因素,如風力等等。

 另一個數學建模的時事議題是,紐約時報曾在幾年前針對美國製作出一個互動式頁面,使用者輸入參數後,就可以評估自己在某個區域要租屋還是買屋,哪一種比較划算。我們研究這個互動式頁面,推導出裡面的數學公式(因為牽扯到貸款,大多是等比級數),在與聯合新媒體部門合作,製作出台灣版的買屋、租屋比較:
https://p.udn.com.tw/upf/newmedia/2015_data/20150903_udnrentorbuy/udnrentorbuy/index.html。

 更之前的一個例子,我們利用了網路上流傳的「紅包表格」製作出「紅包公式」。紅包表格搜集了各縣市的紅包行情,業者根據經驗,依照台灣的5個地區、5種餐廳等級、3種參與人數(不出席、1人、2人)、4種交情關係,設計出來的表格共計有5×5×3×4=300個欄位。要是每次都得對照,省下來的紅包錢配眼鏡都不夠。反過來說,既然它是根據各種狀況所統計出來的數據,表示300種紅包金額並非各自獨立,而是彼此間有所關聯。比方說,交情越好就該包越多。這是常識,表格反映出來的價碼也是如此。

 表格唯一的缺點是,太複雜了。

 因此我們使用迴歸分析,找出不同因子對紅包的影響。以稍微簡單的狀況來舉例:獨自參加台北的婚禮。固定「地區」跟「參與人數」後,要考慮的變數剩「交情」、「餐廳等級」,共有4×5=20種狀況。將交情由點頭之交到摯友用數字1~4表示,餐廳等級從辦桌到五星級飯店用數字1~5表示,再把這20組兩個輸入、一個輸出的數據放進去跑迴歸分析(嚴格來說應該稱之為多重迴歸分析),得到的迴歸方程式為:紅包金額= 975+372×交情+215×餐廳等級

 四捨五入進位到百位,得到:紅包金額= 1000+400×交情+200×餐廳等級

 這道公式的結果還不錯,表格20個數據裡有一半完全吻合,剩餘的一半也只有200元的差距。我們在網路上公布了這道公式,引起大量的媒體轉載與報導。後來還流傳到大陸,對岸製作出了他們各線城市的紅包公式。

 上面幾個數學建模的時事例子,我們學到最大的經驗是在「真實與清楚」之間的取捨。一個數學模型如果要更逼近事實,以租屋買屋的例子來說,或許有上百個因素必須要考慮進去,如果每一個都列出來,讀者恐怕得先花上半小時才能理解這套模型,使用人數會大幅減少。因此我們只能保留最重要的幾個因素。但這時候會面臨到與真實之間有一段距離的問題,具有一定數學程度的讀者,有些在此時便會認為這樣的分析不夠嚴謹,過於簡化。該如何拿捏模型的複雜度,往往是在整個製作過程中最花時間的。因為不單單是做好,還要去揣摩這篇文章的讀者族群樣貌,才能決定在數學的部分該深入到哪裡,可否運用到更複雜的數學公式。

 以上述的紅包公式來說,我們提供給一般媒體的僅僅是:紅包金額= 1000+400×交情+200×餐廳等級

 這個最簡單的「台北市一人出席」狀況。但在國內知名科普網站「泛科學」刊登專欄時,我們提供的是:

 紅包等級=1557_c6a2a054.png

 其中[ ]代表四捨五入的高斯符號,搭配紅包等級的表格如下:

等級
1
2
3
4
5
6
7
8
9
10
11
金額
1.6
1.8
2.2
2.6
2.8
3.2
3.6
3.8
6.2
6.8
10

 雖然沒有平行時空能驗證,但可以約略猜想得到,倘若一開始提供給一般大眾媒體的是這麼複雜的紅包公式,傳播的力道必然會相對弱很多。因為一般民眾無法立刻使用,直接感受到公式的正確性。但對於「泛科學」的讀者來說,大多數人都具備相當程度的數學知識,過於簡單的狀況無法滿足他們,所以我們必須提供嚴謹的完整分析。

 總結地說,在使用數學建模時事上,「受眾」是非常重要的因素,不能一昧地追求完整或是簡單清楚。必要時甚至要提供不同版本,分眾傳播,讓各個族群的讀者都能在自己的程度之下,體驗到數學的效用。

 時事儘管不斷變化,也不一定是非常重要的事情,但它是多數人每天日常生活中重要的討論議題,也是新聞媒體傳播的主要內容。在講究數據的年代,當新聞媒體也逐漸需要使用數據時,專業的數據新聞需要大量的數學與統計知識自不在話下。一般的新聞只要使用了數據,同樣也有數學發揮的空間。從好幾項國際調查都可以看見,台灣不僅是學生,成人對於數學與科學的實用性都不是很認同,認為數學只是抽象的運算,考試的工具。因此數學傳播有一定的必要性,要喚醒大眾對數學的知覺,意識到數學能應用於生活中。從這個角度來看,透過數學建模探討時事議題是一個相當適合的數學傳播管道,題材本身就是新聞媒體感興趣的,只要內容取材適宜,公平公正地讓數學揭開真相,用數字說話,再注意到模型複雜度的取捨。傳播時自然會有很多媒體主動協助,加上社會大眾本身對此議題也會有興趣,社群的擴散力也很好。

 期許在將來能看到更多的時事議題,都能運用上數學分析。
cron web_use_log