許偉
對于演員而言,獲得奧斯卡獎是他們畢生的追求;對運動員而言,贏得奧運會冠軍獎牌是他們夢想的實現(xiàn);對程序員而言,“解放號杯”程序員大賽就是這樣一個可以讓他們和同行們同臺競技,實現(xiàn)理想,收獲成功的存在……鋅刻度記者對2018年度“解放號杯”程序員大賽獲獎得主進行采訪,了解其獲獎背后的故事。
2018年10月24日至25日,由西安市人民政府、中國電子信息行業(yè)聯(lián)合會主辦的第二屆“全球程序員節(jié)”在西安成功舉辦,面向全球程序員的創(chuàng)新大賽——“解放號杯”程序員大賽作為程序員節(jié)活動的核心板塊之一無疑是一場重頭戲。
據(jù)悉,本次大賽面向企業(yè)和個人(含高校學(xué)生)征集作品參賽,旨在讓參賽者基于鐵路、民航、軌交、西安城市政務(wù)等領(lǐng)域的真實稀缺數(shù)據(jù),進行應(yīng)用場景和算法的創(chuàng)新設(shè)計,形成多維度的分析結(jié)果。
經(jīng)過近2個多月的激烈比拼,山東亞微軟件股份有限公司提交的《基于大數(shù)據(jù)的食品安全精準監(jiān)管解決方案》(以下簡稱方案)成功殺出重圍,榮獲一等獎。
據(jù)山東亞微軟件股份有限公司副總經(jīng)理李峰介紹,自我國商事登記制度改革以來,開始實施“先照后證”,要求各行業(yè)監(jiān)管部門加強事中事后監(jiān)管,而執(zhí)法部門普遍面臨執(zhí)法人員少,監(jiān)管對象面廣、量大的問題,尤其是食品安全監(jiān)管領(lǐng)域。如何利用有限的監(jiān)管資源,將執(zhí)法檢查工作降到最低,將監(jiān)管效果做到最大是各監(jiān)管部門都在研究的問題,是一個很有意義的研究課題。
而該方案就是利用大數(shù)據(jù)技術(shù)建立精準監(jiān)管模型,找到最可能出現(xiàn)問題的生產(chǎn)者、經(jīng)營者和商品,建立最有效的檢查機制。李峰表示,“利用機器學(xué)習(xí)算法根據(jù)檢查數(shù)據(jù)和處罰數(shù)據(jù)計算每類商品的檢查指數(shù),并考慮了檢查周期、季節(jié)規(guī)律、推薦模型、信用評價等因素對精準監(jiān)管的影響,形成非常有效的精準監(jiān)管模型,能夠彌補目前雙隨機檢查和網(wǎng)格化監(jiān)管的不足,非常具有應(yīng)用價值?!?/p>
近年來,隨著人民生活水平的不斷提高,飲食文化日漸豐富的同時重大食品安全事件的頻頻曝光,讓食品安全越來越受到社會關(guān)注,食品安全問題已經(jīng)成為政府部門當(dāng)下最急需解決的問題之一。選擇該方案參賽正是基于這一點考慮,李峰認為,要解決這一問題難度頗大,很有挑戰(zhàn)性,且該思路不僅適用于食品安全監(jiān)管,也適合政府其他部門的事中事后監(jiān)管,具有廣泛的適用性。
“我們在方案中增加了對大數(shù)據(jù)算法模型的理解,提升了解決實際問題的能力,做出了具有實踐意義的模型,證明了我們亞微軟件在政務(wù)大數(shù)據(jù)方面的能力。”李峰向記者表示,“大賽評委對我們的肯定,提升了我們的信心?!?/p>
對于2018年度“解放號杯”程序員大賽,李峰感慨萬分,“2018無論從級別、覆蓋范圍、宣傳都做得很到位,尤其還有兒童編程,希望2019年程序員節(jié)會有更多的應(yīng)用方參與,通過大賽將優(yōu)秀的創(chuàng)新產(chǎn)品迅速推廣,更好更快地推動我國大數(shù)據(jù)的應(yīng)用水平?!?/p>
飛機起飛準點率預(yù)測設(shè)計方案
長期以來,航班延誤在民航領(lǐng)域中都是一個重大的熱點問題?;诂F(xiàn)狀,中國東方航空西北分公司Python架構(gòu)組組長武長安提出,“利用歷史航班數(shù)據(jù),結(jié)合天氣、前序航班、機場擁堵系數(shù)、飛行器笨重系數(shù)、航班慣性等主要特征因素進行數(shù)據(jù)分析,再通過SVM分類算法進行特征分類,最終可以得到一個較為理想的預(yù)測模型?!?/p>
據(jù)了解,該方案應(yīng)用在民航領(lǐng)域,可以為機場、航空公司提供飛機延誤方面的預(yù)測和指導(dǎo),以期提高航班起飛準點率,提升旅客服務(wù)品質(zhì)。
“因為平常需要上班工作,這次的參賽作品可以說是時間緊,任務(wù)重?!鲍@獎后,武長安表示,通過這次大會交流,也意識到了自己能力還有很多不足,希望未來再接再厲,在技術(shù)上再上一層樓。
基于組合預(yù)測法的航班起飛準點延誤預(yù)測
“這個作品是一個可以預(yù)測未來一段時間內(nèi)的航班準點概率的算法模型?!眮碜怨鹆蛛娮涌萍即髮W(xué)軟件工程專業(yè)的大三學(xué)生黃琦向記者介紹道,“它使用了官方提供的航班數(shù)據(jù)作為訓(xùn)練集,抽象為二分類問題。我融合了lightGBM、catboost、神經(jīng)網(wǎng)絡(luò)三個常見的模型,使用這三個模型融合而成的模型對訓(xùn)練集進行訓(xùn)練和驗證,訓(xùn)練好之后就可以將其分類功能作為預(yù)測功能使用了。”
據(jù)黃琦介紹,該作品應(yīng)用在民航機場中,通過提示延誤概率信息可以讓乘客做好長時間等待的準備,也可以為可能因為延誤發(fā)生一些情況做好準備,提高機場的處理效率。
“我一開始的目標是獲得一個優(yōu)秀獎?!鲍@得二等獎,黃琦深感意外,“能將一個作品優(yōu)化到可以拿大獎的程度,我自己還是挺開心的?!?/p>
青島賽迪國軟信息系統(tǒng)治理有限公司軌道交通數(shù)據(jù)安全方案
青島賽迪國軟信息系統(tǒng)治理有限公司在組織咨詢部技術(shù)人員進行賽題分析時認為,數(shù)據(jù)安全是一個常見的問題,如果僅僅從信息安全技術(shù)手段和管理措施等方面提出一般性的解決方案,可能就失去了本次大賽命題的意義,而這也就是本次破題的難點所在。該公司根據(jù)破題所得,在參賽時針對軌道交通數(shù)據(jù)安全提出了“4×3”技術(shù)方案和“4×2”管理方案。
“本次參賽所提軌道交通數(shù)據(jù)安全解決方案,還可應(yīng)用于金融、電力、電信、能源等對信息技術(shù)依賴性強、數(shù)據(jù)資產(chǎn)風(fēng)險度高的重點行業(yè)?!痹摴鞠嚓P(guān)負責(zé)人認為本次大賽無論是對公司還是個人來說都是一次很好的經(jīng)歷和體驗,“希望本次參賽的成果對軌道交通用戶以及類似有數(shù)據(jù)安全需求的用戶能夠提供有益的幫助?!?/p>
基于DataV的鐵路物流大數(shù)據(jù)可視化分析
據(jù)二等獎獲得者胡林俊介紹,本次獲獎的作品主要是用于鐵路物流方面的大數(shù)據(jù)分析展示,將繁重龐大的數(shù)據(jù)轉(zhuǎn)換成更加便于理解和實時查看的“大屏幕”,可展示貨物類型、目的地和運載力等數(shù)據(jù)。還可以用于其他行業(yè)的物流數(shù)據(jù)展示,如航空運輸、海上運輸和公路運輸?shù)奈锪鲾?shù)據(jù)統(tǒng)計等。
胡林俊向記者表示,本次大賽的承辦單位中軟國際解放號對活動非常重視,無論是對賽題的合理性還是賽事整體的組織都非常科學(xué)規(guī)范,希望以后還能有機會參加這樣的活動。
分布式貨源預(yù)測與分析
“為了最大程度地發(fā)揮鐵路運輸能力,我們設(shè)計了一種基于Spark計算框架的分布式貨源預(yù)測方案?!卑不沾髮W(xué)大數(shù)據(jù)實驗室成員郭海帥解釋說,“這個方案不僅能應(yīng)用在貨源預(yù)測中,稍加修改后同樣能夠應(yīng)用在其他類似領(lǐng)域,比如降水預(yù)測、氣體含量預(yù)測等等?!?/p>
郭海帥坦言,在剛接觸到這個比賽時解決問題是比較困難的,但經(jīng)過不斷將不同模型應(yīng)用到實際場景中的嘗試后,他取得了一些不錯的效果。賽后,他感慨道:“理論知識應(yīng)當(dāng)經(jīng)過實際場景的檢驗發(fā)揮它的價值?!?/p>
確認獲獎后,他很高興能夠在本次比賽中獲此殊榮,“感謝各位評委老師的認可,感謝西安以及中軟國際解放號為本次比賽所做的努力。古都西安如此重視信息行業(yè)的發(fā)展,必然能在未來的城市競爭中取得不錯的成績。中軟國際作為一個有社會擔(dān)當(dāng)?shù)钠髽I(yè),也將得到越來越多人的認可和稱贊。”