其一,產(chǎn)品設計數(shù)據(jù),這類數(shù)據(jù)的典型特點是以文件為主,非結(jié)構(gòu)化,共享要求比較高,保存時間也比較長;其二,企業(yè)生產(chǎn)環(huán)節(jié)的業(yè)務數(shù)據(jù),其特點是以數(shù)據(jù)庫等結(jié)構(gòu)化數(shù)據(jù)為主,這些數(shù)據(jù)的重要性不言而喻,它們不僅表現(xiàn)企業(yè)目前運行的狀況,而且為企業(yè)進一步發(fā)展決策提供有價值的分析;其三,生產(chǎn)監(jiān)控數(shù)據(jù),其特點是數(shù)據(jù)量非常大,對存儲空間以及I/O吞吐要求高。
1、大數(shù)據(jù)是什么?
采集記錄足夠多的數(shù)據(jù),使工作更加針對化和精準化,這是大數(shù)據(jù)嗎?這不是大數(shù)據(jù)而只是數(shù)據(jù)化。什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對以往的刑事案件做了統(tǒng)計,通過算法得出了第二天的高概率犯罪地點,然后有針對性的派警察去該處巡邏,從而使得當?shù)氐姆缸铿F(xiàn)象下降20%,這是大數(shù)據(jù)。再比如,經(jīng)濟學家都認為股票無法預測,而一位劍橋大學畢業(yè)的博士搞了個公司,對有史以來幾乎所有的證券交易的數(shù)據(jù)進行記錄,然后通過算法進行分析,
他對什么國家政策、公司業(yè)績、行業(yè)走向等等一眼都不看,100%地排除主觀意志的,只根據(jù)計算結(jié)果來進行投資,最后賺了大錢。這是大數(shù)據(jù),大數(shù)據(jù)的精髓并不在于數(shù)據(jù)的精準和數(shù)量,而在于對內(nèi)在規(guī)律的挖掘和對未來趨勢的預測。其思路是:一個結(jié)果是有很多原因的,原因作用的強度可能是隨機的,我們對其中作用的機理并不清楚,
我們難以找出規(guī)律性,但知道規(guī)律性就蘊含在結(jié)果數(shù)據(jù)之中,如果我們能建設合適的模型,寫出好的算法,就有可能把這個規(guī)律性提煉出來,從而能科學地發(fā)現(xiàn)真相和預測未來。今天上午在貴州省大數(shù)據(jù)中心看到了大數(shù)據(jù)應用的事例,金潤建設和鵬潤達這兩家企業(yè)分別投標200多次,一次也沒中過,依然積極地投。投標是要成本的,這兩家公司那里來的動力?通過大數(shù)據(jù)的知識挖掘技術,發(fā)現(xiàn)了它們總是陪著固定的一家公司一同招標,最后總是那家公司中標,
2、大數(shù)據(jù)是怎么回事兒?
大數(shù)據(jù)細分應用領域需求與市場分析制造業(yè)需求市場一、行業(yè)信息化建設現(xiàn)狀當前,我國工業(yè)正處于轉(zhuǎn)型升級的攻堅時期,國家工信部印發(fā)《信息化和工業(yè)化深度融合專項行動計劃(2013-2018年)》,積極推動信息化和工業(yè)化深度融合,國家工信部先后認定16個兩化融合試點城市,各地都取得了顯著的成果。上海作為首批8個國家級兩化融合試驗區(qū)之一,連續(xù)5年保持全國領先水平,
圖表:2016年中國制造行業(yè)信息化投資規(guī)模統(tǒng)計數(shù)據(jù)來源:中研普華2013年,中國制造業(yè)信息化投資達620億元,略有增長,同比增長率為0.8%。2015年,中國制造業(yè)信息化投資規(guī)模達到655億元,同比增長3.4%,但是中國制造業(yè)中不同行業(yè)、不同規(guī)模的企業(yè),信息化建設狀況差距很大。石化、鋼鐵、汽車等行業(yè)集中度高企業(yè)的信息化建設較好,一些企業(yè)已基本具備了與國際同行接近的信息化水平;而紡織、輕工等行業(yè),信息化建設水平較低,
隨著信息技術的發(fā)展以及信息化普及水平的提高,數(shù)字技術、網(wǎng)絡技術和智能技術日益滲透融入到產(chǎn)品研發(fā)、設計、制造的全過程,推動產(chǎn)品生產(chǎn)過程的重大變革。世界工業(yè)化發(fā)展正在面臨著新的變革,發(fā)達國家中德國戰(zhàn)略性地提出“工業(yè)4.0”,美國著力打造“工業(yè)互聯(lián)網(wǎng)”,新的動態(tài)變化都將影響全球制造業(yè)版圖,我國制造業(yè)亟待轉(zhuǎn)型升級,
二、行業(yè)數(shù)據(jù)量及其特點制造業(yè)的存儲數(shù)據(jù)一般被分為以下幾種類型:其一,產(chǎn)品設計數(shù)據(jù),這類數(shù)據(jù)的典型特點是以文件為主,非結(jié)構(gòu)化,共享要求比較高,保存時間也比較長;其二,企業(yè)生產(chǎn)環(huán)節(jié)的業(yè)務數(shù)據(jù),其特點是以數(shù)據(jù)庫等結(jié)構(gòu)化數(shù)據(jù)為主,這些數(shù)據(jù)的重要性不言而喻,它們不僅表現(xiàn)企業(yè)目前運行的狀況,而且為企業(yè)進一步發(fā)展決策提供有價值的分析;其三,生產(chǎn)監(jiān)控數(shù)據(jù),其特點是數(shù)據(jù)量非常大,對存儲空間以及I/O吞吐要求高。
制造企業(yè)中,企業(yè)對數(shù)據(jù)的記錄多停留于兩種形態(tài):1、傳統(tǒng)的紙筆記錄;2、Excel電子表格記錄,這些操作起來看似簡單的數(shù)據(jù)管理方式,在浪費人力物力的同時,還為企業(yè)生產(chǎn)及質(zhì)量監(jiān)控埋下了巨大的隱患。而真正挖掘數(shù)據(jù)背后的價值,更是無從談起,三、行業(yè)大數(shù)據(jù)應用需求分析在制造業(yè)的應用中,產(chǎn)、供、銷一體化為基本核心外,還有延伸的客戶關系管理、供應商信息管理等外延系統(tǒng),各種海量數(shù)據(jù)庫同時交叉運行,并行服務,用戶訪問量大,頻度高,系統(tǒng)負荷重,而且需要保證數(shù)據(jù)處理的高實時性,這樣信息化才能有效地服務于生產(chǎn)和運營。