報告會主題:基于信息論和重要性抽樣的聚類方法
時間:2026年5月29日14:30
地點:北新街校區(qū)圖書館1樓報告廳
報告人:張講社教授
報告摘要:針對機器學(xué)習(xí)問題中未來分布與當(dāng)前分布不一致的問題,基于信息論原理和重要性抽樣方法提出了一個聚類分析方法。新方法通過重要性采樣,對期望失真、條件熵和分布偏移進行轉(zhuǎn)化,得到一個有約束的極小極大極小問題。對于這一優(yōu)化問題,給出了基于迭代和基于重整形式的兩種優(yōu)化算法,證明了模糊C-均值是其特例,并為模糊C-均值的模糊隸屬度m提供了一種信息論和統(tǒng)計物理解釋,解決了模糊分析領(lǐng)域長達(dá)數(shù)十年的公開問題--模糊C-均值聚類的理論基礎(chǔ)和模糊參數(shù)的理論意義。這一方法可用于平權(quán)和穩(wěn)健機器學(xué)習(xí)算法。

報告嘉賓簡介:張講社,博士研究生導(dǎo)師,西安交通大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院統(tǒng)計系二級教授,我院客座教授,主要從事統(tǒng)計數(shù)據(jù)處理、統(tǒng)計決策和機器學(xué)習(xí)等方面的研究。曾獲2007年國家自然科學(xué)二等獎、2006年教育部自然科學(xué)一等獎?,F(xiàn)為教育部統(tǒng)計學(xué)類專業(yè)本科教學(xué)指導(dǎo)委員會委員,教指委和高等教育出版社統(tǒng)計類數(shù)據(jù)科學(xué)專業(yè)本科教材編寫委員會主任,陜西省統(tǒng)計學(xué)學(xué)會理事長,陜西省高等學(xué)校咨詢委員會委員西安交通大學(xué)統(tǒng)計決策和機器學(xué)習(xí)研究所所長,西安數(shù)學(xué)技術(shù)研究院副院長等。
曾任國家自然科學(xué)基金委信息學(xué)部和數(shù)理學(xué)部專家評審組成員、陜西省數(shù)學(xué)會理事長,中國數(shù)學(xué)會常務(wù)理事,西安交通大學(xué)信息科學(xué)系系主任、理學(xué)院常務(wù)副院長。先后承擔(dān)國家重點基礎(chǔ)研究發(fā)展規(guī)劃(973)課題、國家自然科學(xué)基金委重大研究計劃項目,國家自然科學(xué)基金面上項目、香港UPGC項目等10余項,在相關(guān)研究方向先后發(fā)表高質(zhì)量論文100 余篇。在大數(shù)據(jù)處理方面,曾參與和主持石油勘探、多項遙感圖像處理、大氣污染數(shù)據(jù)分析、極端氣候和風(fēng)能利用分析、電力系統(tǒng)負(fù)荷預(yù)測、地震數(shù)據(jù)分析和金融數(shù)據(jù)分析等實際數(shù)據(jù)分析課題,具有豐富的數(shù)據(jù)處理實踐。