楊柳青 郝彥 劉闖
[摘要]近年來農業(yè)商品市場一直處于一種不穩(wěn)定的狀態(tài),但是農產品是人們生活的必需品,針對市場這種動蕩不安的情況應利用科學的手段進行專業(yè)的調整優(yōu)化。在數(shù)據(jù)挖掘的指導思想下建立可靠的農產品價格預測模型,精準剖析市場需求,便于把握農產品的價格走向,穩(wěn)定農產品市場。進行數(shù)據(jù)挖掘的第一步就是搜集數(shù)據(jù),有足夠數(shù)量的數(shù)據(jù)樣本可以讓實驗結果更加準確,其次分析影響農產品價格的因素,利用主成分分析法在建立價格預測模型之前對其進行降維處理,最后根據(jù)各個價格預測模型的特性,搭建最合適的模型,提高預測結果的準確度。
[關鍵詞]主成分分析法;價格預測;數(shù)據(jù)挖掘;農產品價格
[中圖分類號]S-9 [文獻標識碼]A
1 研究的背景及意義
1.1 研究背景
隨著世界一體化的發(fā)展進程越來越快,國內外市場關聯(lián)密切,因此國內市場變得越來越復雜,市場的變幻莫測會給人們帶來焦慮不安甚至會影響正常生活。而農業(yè)作為民生之根本,農產品市場的不穩(wěn)定狀態(tài)自然也是值得全球矚目的熱門話題。農產品所具有的特征是很特別的,在生產物流方面有不易于運輸和存儲,周期性很短,季節(jié)性區(qū)域性明顯等特性;從消費者的角度來說農產品具有需求量大、安全性、新鮮度、產品的可替代性等特性;在物價方面具有動蕩性及易受自然災害影響較大的特性。
綜上各種因素導致了農產品市場容易變換較為極端的性狀。這種動蕩不安的市場不僅會影響人們的日常生活甚至會產生惡性的蝴蝶效應。同時隨著各種新興技術的出現(xiàn),迅速推動了農業(yè)現(xiàn)代化建設的進程。通過大數(shù)據(jù)采集、存儲、分析和挖掘技術的研究和應用,充足運用好農產品市場領域中數(shù)目龐大、獲取渠道寬泛、種類繁多的數(shù)據(jù),逐步提高農產品市場取得和使用數(shù)據(jù)資源的能力,完成對農產品市場經濟運行更確切的監(jiān)管、剖析和預測是非常有意義的。
1.2 研究意義
目前我國的經濟發(fā)展已經從高速發(fā)展轉為高質量的發(fā)展,人們的生活品質逐漸提高,但是人民群眾的生活日常始終離不開“衣食住行”,因此農產品的價格自始至終是人民最關注的事情。農產品的價格是市場物價的基礎,正確的科學預測方法可以幫助供應商做出正確的決策,同時也能為人民群眾的利益提供保障。信息時代的快速發(fā)展,我們生活中產生的數(shù)據(jù)種類繁多,數(shù)量巨大,人們已經不僅僅滿足于得到簡單、廉價的數(shù)據(jù)了,從這些復雜的數(shù)據(jù)中提取出對我們有效的信息就顯得舉足輕重。數(shù)據(jù)挖掘的應用領域十分廣泛,將其與農業(yè)相結合,利用短期的預測數(shù)據(jù)可以對市場進行監(jiān)控,穩(wěn)定生產需求,保障人民安居樂業(yè),維持市場秩序穩(wěn)定。
2 數(shù)據(jù)挖掘概述
2.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘是指從海量而復雜的數(shù)據(jù)中利用算法找尋隱蔽于當中有效信息的過程并且數(shù)據(jù)挖掘是采用逐個剖析數(shù)據(jù)然后從大量的數(shù)據(jù)中尋找其規(guī)律的技術。根據(jù)數(shù)據(jù)挖掘的定義我們可以總結出以下幾個要點:數(shù)據(jù)是真實、大量、有噪聲的;發(fā)現(xiàn)的知識是可理解、有意義的;發(fā)現(xiàn)的知識是人們感興趣的(這里的知識一般指的是規(guī)則、概念、規(guī)律以及模式等)。預料、可用和可適用三個表征應該是通過數(shù)據(jù)挖掘所得到的信息所具備的。
通常數(shù)據(jù)挖掘分為有指導的數(shù)據(jù)挖掘和無指導的數(shù)據(jù)挖掘兩種。我們研究農產品的價格預測用到的就是有指導的數(shù)據(jù)挖掘方法,通過利用可用數(shù)據(jù)建立數(shù)學模型為生產者的決策提供有效依據(jù)。一個全面的數(shù)據(jù)挖掘過程主要會包含數(shù)據(jù)選擇、數(shù)據(jù)預處理、挖掘算法以及知識的表達和解釋。
2.2 數(shù)據(jù)挖掘的應用
當下,數(shù)據(jù)已然侵入到了社會的各大范疇,而數(shù)據(jù)挖掘技術也成為各個領域的熱門話題。楊一鳴、潘嶸、潘嘉林等介紹主要的方法:時間序列方法中的基本方法 ARIMA,貝葉斯方法、人工神經網絡、k均值聚類、決策樹、關聯(lián)規(guī)則等。這些方法已經廣泛應用于股票市場預測、生物醫(yī)藥領域、房地產預測等方面,并且產生了不錯的效果。如李冰巖對海量數(shù)據(jù)使用關聯(lián)規(guī)則中的Apriori算法對這些數(shù)據(jù)進行合理分析,從中發(fā)現(xiàn)了隱藏的形式,提煉有意義的知識,輔助電子商務企業(yè)決策者及時制定市場策略,迎合市場需求,預測市場走向。從上述這些例子中可看出數(shù)據(jù)挖掘在這個信息爆炸時代的重要性。
3 數(shù)據(jù)挖掘技術在價格預測中的應用
3.1 研究方法
數(shù)據(jù)挖掘對于價格指數(shù)的預測方法大致可以分為兩部分:定性分析法和定量分析法。定性分析法和定量分析法是相互成就的,它們彼此之間缺一不可。定性分析法在對事物進行判斷時會帶有個人主觀意識,因此它只能得出大致的結論,結論并不一定客觀。定量分析是在已有信息的基礎上對數(shù)據(jù)進行進一步的客觀分析,常用的定量分析有兩種:因素回歸法和時間序列分析法。定性分析是定量分析的前提,定性分析為一系列的分析工作提供基礎、確定方向,缺少定性分析那么接下來的定量分析將會毫無意義。
3.2主成分的提取
在預測農產品價格研究中我們需要進行數(shù)據(jù)建模,根據(jù)大量的不同維度的數(shù)據(jù),利用數(shù)學函數(shù)將它們輸入和輸出之間的映射關系描述出來,而主成分的提取是為模型的建立奠定基礎。
首先我們需要了解影響農產品價格的因素,通常農產品價格會受到很多自然因素和社會因素的影響,例如:農產品的進、出口量,國家的政策經濟發(fā)展,天氣及病蟲害等,這些因素相互之間都具備著一定的關聯(lián)性。因此在對其進行建模之前我們需要對數(shù)據(jù)進行預處理從而得到影響價格的主成分,利用主成分分析法可以對模型進行降維處理,避免過多復雜的數(shù)據(jù)會致使模型產生過擬合。
3.3 價格預測模型
在對數(shù)據(jù)進行預處理之后,需要選取適當?shù)哪P蛯ζ溥M行價格預測。價格預測理論模型大致分為以下三種:灰色預測模型、馬爾科夫模型以及神經網絡模型。
3.3.1 灰色預測模型?;疑A測模型是根據(jù)小規(guī)模的、殘缺的信息,建立數(shù)學模型并做出戰(zhàn)網的一種預測方法?;疑A測是對灰色系統(tǒng)做出的預測,它對時間序列短、信息不完全的系統(tǒng)進行建模分析,具有獨特的功效。由于灰色預測模型所需要的樣本數(shù)據(jù)小,演算便利,建模精準度高,因此它是小樣本預測的高效工具。
3.3.2 馬爾科夫模型。馬爾科夫過程馬爾科夫模型又稱之為馬爾科夫鏈,通常我們把時間和狀態(tài)都是離散的馬爾科夫過程定義為馬爾科夫鏈。
3.3.3 神經網絡模型。神經網絡作為數(shù)據(jù)挖掘的一個重要組成部分,它的存在能便利的解決非線性和多變量的問題,這是利用一般數(shù)學模型很難解決的問題。并且在進行建模的時候只需要對其設置合理的參數(shù),給予模型足夠的訓練樣本,它就能通過強大的自學習能力找到輸入和輸出之間的關系,得到我們所需要的結果。
影響農產品價格的因素關聯(lián)復雜,神經網絡是最適合解決這種非線性問題的,同時為了提高預測結果的精準程度,可以使用多種神經網絡方法對預測效果進行對比實驗,得出最準確的結論。
4 結語
數(shù)據(jù)挖掘現(xiàn)在作為熱門技術,已經滲透到了很多領域,而我國作為農業(yè)大國,農業(yè)的收入與國家的收入一脈相連,我們更加需要科學的方法來將農業(yè)可持續(xù)健康的發(fā)展下去。農產品價格的預測不僅能監(jiān)測市場情況,維護市場健康有序的發(fā)展,同時也可以幫助生產者做出科學的決策。在科技強國的背景下,只有將農業(yè)與科技相結合,我國的農業(yè)才能欣欣向榮,人民才能安居樂業(yè)。
[參考文獻]
[1] 陳金賽.基于神經網絡的預測分析及其應用研究[D].杭州:浙江工商大學,2012.
[2] 許洋.前饋型神經網絡算法優(yōu)化分析[J].硅谷,2014,7(13):66.
[3] 解建強.基于BP神經網絡的贛南臍橙價格預測研究[D].武漢:華中農業(yè)大學,2017.
[4] 靳占新,徐中一.大數(shù)據(jù)背景下物資價格預測方法[J].中國電力企業(yè)管理,2018(12):3-4.