理論上最好的辦法,往往是最簡單的、也是最容易想到的。幾何學告訴我們:兩點之間直線最短;狗沒有學過幾何,但卻知道沿著直線的方向去追兔子;幾何學告訴我們,正六邊形建設蜂巢時,是最節省材料的做法;蜜蜂沒有學過幾何,卻建起了正六邊形的蜂巢。
現實中有些好的辦法,沒有采用理論上最佳的辦法。是因為不知道理論嗎?不是,是理論的方法走不通!現實中是存在約束的,使得理論上最優的辦法不可行。這就好比:要做到河流的對岸,直線是最短的路線。但受到河流的阻斷,這條理論上最短的路線是走不通的。現實中最短的路線,可能是繞道遠方的橋梁。如下圖所示:
“如無必要、勿增實體”。這個原理被稱為“奧卡姆剃刀”。意思是簡單的就是最好的。這個原理,被無數的科技實踐證明。真正熱愛科技的人,往往喜歡簡單的辦法。喜歡顯擺的人,才喜歡復雜的辦法。
所以,面對一個問題(比如數學建模問題),科學的方法論應該是:首先要去想最簡單、最直接的方法是什么?如果最簡單直接的做法走不通,再去探討:什么原因阻礙了這個辦法的應用?原因找到之后,再去想:在存在阻礙的前提下,最簡單的、次優的方法是什么?如果次優的方法仍然走不通,就再次去找到潛在的阻礙,直到找到現實中最簡單的辦法為止。
但是,我們許多同志,稍微遇到一點麻煩就直接采用那些復雜的方法。比如,當簡單線性模型的精度不高時,就采用復雜的AI算法。他們不去考慮:導致模型誤差大的原因是什么。現實往往是數據質量不理想、數據誤差太大。面對數據質量的約束,復雜模型就能解決問題了?其實,復雜模型會帶來更多的麻煩,最典型的就是穩定性差。
當模型穩定性差的時候,許多人不去研究導致問題的原因,統統歸結為“模型可泛化性”差。豈不知:數據本身有問題時,相同的模型輸入,輸出可能是不一樣的。今天精度高,明天就會精度低。這是可泛化性問題嗎?搞科技工作的人,切不可人云亦云。
筆者經常強調回到問題的本源。如果模型問題的本源,是數據質量有問題,那就設法去解決數據質量問題。你用復雜的算法來掩蓋問題,豈不是舍本取末?
我們過去一直強調理論聯系實際。什么是理論聯系實際?就是多花點時間去研究實際(約束和條件),少閉上眼睛搞方法。實際問題研究不透,就去找高級方法,就是理論脫離實際。
來源:儀表圈/作者:郭朝暉,工業自動化博士、教授級高工,專注于工業數字化轉型及技術創新研究領域