新聞公告
教務新聞
陳松蹊院士主講“beat365物理學科卓越人才培養計劃講堂:名師面對面”(第二十八期)
發布日期:2024-10-08 浏覽次數:
  供稿:孫琰  |   圖片:曹含笑、周墨   |   編輯:時暢   |   審核:陳松蹊、高原甯

2024年9月27日晚,由beat365官方网站、北京現代物理研究中心主辦的“beat365物理學科卓越人才培養計劃講堂:名師面對面”(第二十八期)在beat365理科教學樓203教室舉行。beat365博雅講席教授、統計科學中心科學委員會主席陳松蹊院士應邀講授“統計與數據科學及交叉研究經曆”。本期講堂由beat365官方网站院長、北京現代物理研究中心副主任高原甯院士主持。

人人在生活、學習、工作中都會用到統計學的知識與思想,然而,并非人人都能說出統計學是什麼。陳松蹊開宗明義地闡釋統計學的概念:“統計學,就是以數據為研究對象,指導人們收集數據、使用數據、分析數據和基于數據進行科學推斷的學科。”例如,統計物理學用概率論(由原因推知結果)和統計學(由結果推知原因)的方法解決由大量粒子組成的系統中的物理問題,旨在研究宏觀現象的微觀機制、诠釋宏觀系統的物理特性,并試圖為具有複雜相互作用的多體系統建立一般性理論,以理解和刻畫超越微觀相互作用所能預言的整體行為或湧現現象。

陳松蹊指出,統計學蘊含着理學、工學、農學、醫學和人文社會科學實證研究的方法論

陳松蹊首先用白描式的語言為同學們概述了在統計學發展曆程中具有裡程碑意義的科學家及其研究成果。例如:高爾頓(F. Galton)爵士于19世紀末開展甜豆實驗、優生學測量,提出“均值回歸”和“相關性”的概念,确立了定量研究的新範式;此後,每當統計學“被巧妙地處理并被謹慎地解讀”時,日益顯示出它驚人的“處理複雜現象的能力”。皮爾遜(K. Pearson)系統性地整理、總結并發展了高爾頓的思想,将統計學方法推廣至其他領域;完善了“相關系數”并提出聯列表數據的卡方(Χ2)檢驗法,推動了統計學假設檢驗的發展。戈賽特(W. Gosset)提出t檢驗法(亦稱為學生檢驗法),開啟了統計學從大樣本轉向小樣本、從描述性方法轉向推斷性方法的跨越式發展。費希爾(R. A. Fisher)爵士于20世紀早期提出實驗設計思想、估計參數的極大似然法、方差分析理論,奠定了方差分析的一般框架,在統計學從傳統到現代的轉型中發揮了不可替代的作用。

随後,陳松蹊以自己三十多年來從北京到澳大利亞、新加坡、美國,再回到北京的學術經曆為“樣本”,向同學們闡釋了統計學對解決跨領域、跨學科的科學問題所起到的重要作用。

上世紀九十年代初,他在澳大利亞聯邦科學與工業研究組織(CSIRO)海洋實驗室承擔監測澳洲區域藍鳍金槍魚種群密度的研究課題。他與同事提出一種基于航空線段的有偏抽樣方法,對海洋中的藍鳍金槍魚種群作出統計估計,為有關機構治理這一瀕臨滅絕卻具有很大經濟價值的魚類種群提供了新的依據和監測模式。本世紀初,他在美國愛荷華州立大學任教時,曾參與美國人口普查研究。由于美國人口基數大、族裔呈現多元化、結構呈現多樣性,他在常規的“捕獲-再捕獲”方法基礎上提出基于局部特性分層的方法,即按照不同人群的特征賦予不同形式的事後統計調整,有效提高了人口統計數量和統計範圍的準确性。

在陳松蹊看來,人生的不确定性意味着機遇,而統計學的不确定性正是其魅力所在

然而,比起在南澳、北美的研究成果,陳松蹊更希望與同學們分享的是最近十年來在環境統計學、流行病學與衛生統計學領域的研究工作。

2013年9月,陳松蹊邀請一位美國國家科學院院士來訪,竟被對方以“空氣質量令我擔憂”為由婉拒——意外的挫折激起他“為了藍天,讓我們用數據解讀污染”的責任感和緊迫感。他帶領團隊提出一種通過構造基準氣象分布和調整均值,消除氣象因素幹擾、度量大氣污染物排放的研究思路,編制了十一份《空氣質量評估報告》,為我國有關部門制定科學的政策,推進改善生态環境、防治大氣污染、保障公衆健康提供了科學的建議和方法。如今,藍天已成為北京的常态,他們仍堅持用數據科學與統計學方法解讀藍天“密碼”,為國家戰略需求和人民生命健康服務。

2020年初,抗擊新型冠狀病毒疫情的主戰場武漢關閉離漢通道。陳松蹊立即召集團隊,設計開發出一個添加确診前感染因素、人口遷移模塊的變系數流行病學模型(vSEIdRm模型),準确預測疫情傳播形勢、定量刻畫防控措施效果,以此編寫并更新疫情分析日報,既輔助了中國應對突發衛生事件的決策,又增強了中國争取國際話語權的說服力。2023年4月,他們提出另一個變系數随機流行病學模型(vSVIADR模型),開發出一種多步、分散式的統計估計方法,以根據公開可用的流行病學和疫苗接種數據及時評估疫苗在真實世界的保護率;同時,對上述模型進行擴展,以考慮疫苗加強針的接種和重複感染,提供了使用公開流行病學數據估計加強針對感染的保護率的方法,并将其用于評估七個國家在德爾塔和奧密克戎變異株流行期部分接種、完全接種和加強針接種對感染的保護率。

同學們追随着一位統計學家“上天”“下海”的奇幻旅程

最後,陳松蹊簡要介紹了今年初啟動的“西太平洋多圈層相互作用數據集成研究”項目的最新進展,還從統計學視角評述了氣候變化研究中廣泛使用的最優指紋法。他說:“哪裡有數據,哪裡就有統計學。加快數字中國建設,以數字化驅動生産生活和治理方式變革,無疑是統計與數據科學發展的重要戰略機遇。”

陳松蹊(一排右三)和高原甯(一排左二)深知,對于一個學科的發展來說,人才是最積極的變量——“統計學的未來,是屬于年輕人的!”

核物理與核技術國家重點實驗室楊振偉教授、清華大學統計與數據科學系部分師生現場出席。