首頁 > 優(yōu)秀范文 > 數(shù)據(jù)分析論文
時(shí)間:2023-06-05 08:44:29
序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗(yàn),特別為您篩選了11篇數(shù)據(jù)分析論文范文。如果您需要更多原創(chuàng)資料,歡迎隨時(shí)與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識(shí)!
1.1數(shù)據(jù)采集系統(tǒng)
大數(shù)據(jù)時(shí)代,大數(shù)據(jù)有著來源復(fù)雜、體量巨大、價(jià)值潛伏等特點(diǎn),這使得大數(shù)據(jù)分析必然要依托計(jì)算機(jī)技術(shù)予以實(shí)現(xiàn).因此從兩個(gè)方向上加強(qiáng)數(shù)據(jù)采集統(tǒng)建設(shè),一是側(cè)重于數(shù)據(jù)的處理與表示,強(qiáng)調(diào)采集、存取、加工和可視化數(shù)據(jù)的方法;二是研究數(shù)據(jù)的統(tǒng)計(jì)規(guī)律,側(cè)重于對(duì)微觀數(shù)據(jù)本質(zhì)特征的提取和模式發(fā)現(xiàn),在兩個(gè)方向上的協(xié)同、均衡推進(jìn),以此來保障大數(shù)據(jù)平臺(tái)應(yīng)用的穩(wěn)健成長(zhǎng)和可持續(xù)發(fā)展.廣電的網(wǎng)絡(luò)和用戶是其核心資產(chǎn),而其中流動(dòng)的數(shù)據(jù)(包括用戶基礎(chǔ)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)管/日志數(shù)據(jù)、用戶位置數(shù)據(jù)、終端信息等)是核心數(shù)據(jù)資產(chǎn).對(duì)于廣電運(yùn)營(yíng)商來說,最有價(jià)值的數(shù)據(jù)來自基礎(chǔ)網(wǎng)絡(luò),對(duì)于基礎(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的挖掘和分析是運(yùn)營(yíng)商大數(shù)據(jù)挖掘的最重要方向.因此其數(shù)據(jù)采集的目標(biāo)包括機(jī)頂盒數(shù)據(jù)、CRM數(shù)據(jù)、帳務(wù)數(shù)據(jù)、客服數(shù)據(jù)、運(yùn)維數(shù)據(jù)、媒資數(shù)據(jù)、GIS數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)和其他手工錄入、表格數(shù)據(jù).采集頻率要求可以實(shí)現(xiàn)實(shí)時(shí)采集和定時(shí)批量采集.采集這類數(shù)據(jù)帶來一個(gè)問題就是各類數(shù)據(jù)雜亂無章,會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量問題越來越嚴(yán)重,通過引進(jìn)實(shí)時(shí)質(zhì)量監(jiān)控和清洗技術(shù),建設(shè)強(qiáng)大的分布式計(jì)算和集群能力,提高數(shù)據(jù)監(jiān)控和數(shù)據(jù)采集性能,利用分布式處理技術(shù),實(shí)現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)清洗以及相應(yīng)的數(shù)據(jù)質(zhì)量檢查工作,保證采集到高質(zhì)量的數(shù)據(jù),將廣電大數(shù)據(jù)中心建設(shè)成一個(gè)覆蓋廣電系統(tǒng)全部數(shù)據(jù)的存儲(chǔ)中心,具備采集各類結(jié)構(gòu)化、非結(jié)構(gòu)化海量數(shù)據(jù)的處理能力.
1.2數(shù)據(jù)分析中心
廣電企業(yè)每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù),需要對(duì)這些數(shù)據(jù)歸集、提煉,廣電企業(yè)大數(shù)據(jù)平臺(tái)建設(shè)的意義在于有效掌握規(guī)模龐大的數(shù)據(jù)信息,對(duì)這些數(shù)據(jù)信息進(jìn)行智能處理,從中分析和挖掘出有價(jià)值的信息.在廣電大數(shù)據(jù)分析中需要對(duì)直播節(jié)目分析、互動(dòng)業(yè)務(wù)分析、互聯(lián)網(wǎng)流量分析、互聯(lián)網(wǎng)內(nèi)容分析、廣電客戶分析、市場(chǎng)收益分析、智能內(nèi)容推送和廣告分析等,通過這類數(shù)據(jù)分析,能夠?qū)崟r(shí)了解廣電運(yùn)營(yíng)商的經(jīng)營(yíng)狀況,提供決策支持.因此采用兩種方式分析方法對(duì)收集到的數(shù)據(jù)進(jìn)行分析處理.一是采用在線分析方法技術(shù),使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的.這些信息是從原始數(shù)據(jù)直接轉(zhuǎn)換過來的,他們以用戶容易理解的方式反映企業(yè)的真實(shí)情況.在線分析策略是將關(guān)系型的或普通的數(shù)據(jù)進(jìn)行多維數(shù)據(jù)存貯,以便于進(jìn)行分析,從而達(dá)到在線分析處理的目的.這種多維數(shù)據(jù)存儲(chǔ)可以被看作一個(gè)超立方體,沿著各個(gè)維方向存貯數(shù)據(jù),它允許分析人員沿事物的軸線方便地分析數(shù)據(jù),分析形式一般有切片和切塊以及下鉆、挖掘等操作.二是數(shù)據(jù)挖掘是從海量、不完全的、有噪聲的數(shù)據(jù)中挖據(jù)出隱含的、未知的、用戶可能感興趣的和對(duì)決策有潛在價(jià)值的知識(shí)和規(guī)則.這些規(guī)則蘊(yùn)含了數(shù)據(jù)庫(kù)中一組對(duì)象之間的特定關(guān)系,揭示出一些有用的信息,可以為經(jīng)營(yíng)決策、市場(chǎng)策劃和金融預(yù)測(cè)等方面提供依據(jù).
1.3數(shù)據(jù)應(yīng)用中心
在大數(shù)據(jù)分析平臺(tái)應(yīng)用過程中,數(shù)據(jù)本身并不是數(shù)據(jù)分析和數(shù)據(jù)挖掘的重點(diǎn),重點(diǎn)在于如何應(yīng)用這些技術(shù)去解決企業(yè)在運(yùn)營(yíng)中實(shí)際的商業(yè)問題.通過對(duì)數(shù)據(jù)分析和挖掘,了解企業(yè)運(yùn)行過程存在問題,預(yù)判企業(yè)中各類業(yè)務(wù)發(fā)展走向.對(duì)數(shù)據(jù)分析與挖掘結(jié)果來說主要有兩個(gè)方面,一是將分析結(jié)果給客戶使用,另一個(gè)是將分析結(jié)果提供給內(nèi)部用戶使用,因此在大數(shù)據(jù)分析平臺(tái)設(shè)計(jì)中,將數(shù)據(jù)應(yīng)用劃分為三個(gè)應(yīng)用中心:
1)推薦中心
推薦中心面向收視、寬帶使用用戶,通過分析使用用戶的收視、互聯(lián)網(wǎng)、消費(fèi)等行為,將使用用戶分群,總結(jié)群體特征,向不同群體推薦個(gè)性化的電視節(jié)目、廣告和增值應(yīng)用服務(wù).從而提升用戶的使用體驗(yàn),提升用戶的滿意度和粘度.
2)決策中心
決策中心面向廣電企業(yè)內(nèi)部決策者、管理者、經(jīng)營(yíng)分析人員,通過對(duì)企業(yè)經(jīng)營(yíng)數(shù)據(jù)的KPI、運(yùn)營(yíng)監(jiān)控、經(jīng)營(yíng)盤點(diǎn),使企業(yè)決策者掌握企業(yè)運(yùn)營(yíng)狀況及發(fā)展趨勢(shì);智能報(bào)告協(xié)助分析人員自動(dòng)定位經(jīng)營(yíng)中的問題;即席查詢?cè)陬A(yù)定義的語義層基礎(chǔ)上,實(shí)現(xiàn)靈活的自定義查詢;通過主題分析滿足各部門、崗位的多維度分析需求;通過專題分析就某一具體問題進(jìn)行深入挖掘,輔助專業(yè)分析人員的工作;統(tǒng)計(jì)報(bào)表滿足各部門常規(guī)統(tǒng)計(jì)需求.
3)服務(wù)中心
服務(wù)中心面向廣電的合作伙伴,比如:電視臺(tái)、廣告商、服務(wù)和內(nèi)容提供商、相關(guān)政府職能部門等.通過對(duì)使用用戶收視行為的實(shí)時(shí)分析,將電視欄目實(shí)時(shí)收視率提供給電視臺(tái),電視臺(tái)根據(jù)收視率進(jìn)行在線的問卷調(diào)查,提高電視臺(tái)的影響力,幫助其增強(qiáng)欄目的評(píng)價(jià)體系.為廣告商提供精準(zhǔn)的廣告投放策略,實(shí)時(shí)準(zhǔn)確的廣告投放評(píng)估,幫助廣告商提升廣告到達(dá)率、準(zhǔn)確度和營(yíng)銷效果.為服務(wù)和內(nèi)容提供商的電影、電視和增值應(yīng)用等產(chǎn)品提升收視率和使用頻率,并進(jìn)行評(píng)估,為其提供受眾喜好特征,幫助其推出有針對(duì)性的產(chǎn)品.通過用戶收視數(shù)據(jù)、節(jié)目反饋等信息,將相關(guān)輿情向相關(guān)政府部門匯報(bào).
1.4系統(tǒng)管理
系統(tǒng)管理是大數(shù)據(jù)分析平臺(tái)一個(gè)輔助功能模塊,主要是為了系統(tǒng)管理員對(duì)大數(shù)據(jù)平臺(tái)進(jìn)行有效的監(jiān)控和管理,提升大數(shù)據(jù)分析平臺(tái)性能使用,包含有如下幾個(gè)模塊:權(quán)限管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、調(diào)度管理、系統(tǒng)監(jiān)控等.
2數(shù)據(jù)應(yīng)用分析
移動(dòng)互聯(lián)網(wǎng)的發(fā)展為傳統(tǒng)行業(yè)帶來了新的思考,如何在互聯(lián)網(wǎng)時(shí)代更好地實(shí)現(xiàn)以客戶為中心的服務(wù)理念,借助大數(shù)據(jù)分析平臺(tái)、海量的客戶非結(jié)構(gòu)化的行為數(shù)據(jù)和傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),可以有效提升廣電個(gè)性化、人性化的服務(wù)水平.大數(shù)據(jù)分析平臺(tái)通過整合廣電網(wǎng)絡(luò)中多個(gè)數(shù)據(jù)源,并按照主題進(jìn)行劃分,在定義主題的過程中,提供廣電業(yè)務(wù)概念的規(guī)范定義.?dāng)?shù)據(jù)模型不偏重于面向某個(gè)應(yīng)用,而是站在企業(yè)角度統(tǒng)攬全局,提供可擴(kuò)展的模型設(shè)計(jì),偏范式化的設(shè)計(jì)使平臺(tái)在最大程度上保持一致和靈活擴(kuò)展性.依托某廣電網(wǎng)絡(luò)公司業(yè)務(wù)開展情況,搭建數(shù)據(jù)分析平臺(tái),具有如圖2所示的主題結(jié)構(gòu),共計(jì)8大類53小類,從廣電網(wǎng)絡(luò)運(yùn)營(yíng)的各個(gè)方面進(jìn)行了數(shù)據(jù)分析.
2.1直播節(jié)目分析主題
直播電視節(jié)目作為廣電運(yùn)營(yíng)模式中一直沿用的產(chǎn)品類型,對(duì)于廣電用戶的影響和廣電運(yùn)營(yíng)商運(yùn)營(yíng)模式起著至關(guān)重要的作用.實(shí)時(shí)直播節(jié)目分析,用戶可以實(shí)時(shí)查看每個(gè)時(shí)間點(diǎn)上每個(gè)節(jié)目收視率,以此為據(jù)來指導(dǎo)產(chǎn)品定制、節(jié)目選擇、用戶推廣等方面的商業(yè)應(yīng)用,對(duì)直播節(jié)目的多維度分析,運(yùn)營(yíng)商可深入分析直播節(jié)目收視特性及受眾影響規(guī)律,以指導(dǎo)運(yùn)營(yíng)優(yōu)化,提高節(jié)目的收視率和營(yíng)收.
2.2多媒體業(yè)務(wù)分析主題
廣電行業(yè)的雙向網(wǎng)絡(luò)改造不僅將視頻點(diǎn)播、通信及娛樂業(yè)務(wù)成為可能,同時(shí)配備增值業(yè)務(wù),如廣告、支付、股票、游戲、付費(fèi)節(jié)目等服務(wù).可以明顯看到哪類業(yè)務(wù)最受歡迎,哪類業(yè)務(wù)的增長(zhǎng)趨勢(shì)良好,哪類業(yè)務(wù)應(yīng)用下滑得較快,哪類業(yè)務(wù)不受用戶歡迎,從這樣的分析結(jié)果中,可以為廣電網(wǎng)絡(luò)以后的業(yè)務(wù)引進(jìn)中提供指導(dǎo),避免引進(jìn)的業(yè)務(wù)不受用戶歡迎,同時(shí)也可以預(yù)見性的引進(jìn)一些代表將來趨勢(shì)性的業(yè)務(wù),提前做好業(yè)務(wù)儲(chǔ)備工作.互動(dòng)業(yè)務(wù)的互動(dòng)特性為廣電運(yùn)營(yíng)商增加客戶粘度、制定產(chǎn)品投放策略、獲取最大化收益及市場(chǎng)價(jià)值提供了前所未有的空間,通過對(duì)互動(dòng)業(yè)務(wù)的應(yīng)用分析,可以分析出用戶的行為趨勢(shì).利用這樣的分析結(jié)果改善廣電業(yè)務(wù)引進(jìn),提高用戶的粘度和ARPU值.
2.3互聯(lián)網(wǎng)應(yīng)用分析主題
廣電作為政府宣傳的喉舌,一個(gè)主要的特點(diǎn)就是可管可控,相對(duì)此而言,互聯(lián)網(wǎng)網(wǎng)絡(luò)一個(gè)重要特點(diǎn)就是用戶各類行為的不可控性.在三網(wǎng)融合的新環(huán)境下,廣電網(wǎng)絡(luò)一個(gè)重大改變就是引進(jìn)了互聯(lián)網(wǎng)業(yè)務(wù),同時(shí)通過多屏互動(dòng)技術(shù)使廣電終端類型日益復(fù)雜,如何對(duì)廣電網(wǎng)絡(luò)引進(jìn)的互聯(lián)網(wǎng)業(yè)務(wù)和終端進(jìn)行有效的管控,成為擺在廣電網(wǎng)絡(luò)運(yùn)營(yíng)商面前一個(gè)重要課題.運(yùn)營(yíng)商可以清晰地看到用戶在討論什么、在看什么,以此來分析用戶將來可能采取的行為趨勢(shì),進(jìn)而來引導(dǎo)用戶輿論與行為,實(shí)現(xiàn)對(duì)廣電網(wǎng)絡(luò)的可管可控的最終目的.同時(shí)廣電網(wǎng)絡(luò)也可以利用互聯(lián)網(wǎng)數(shù)據(jù)從如下兩方面做了分析,運(yùn)營(yíng)流量及應(yīng)用優(yōu)化,節(jié)省網(wǎng)絡(luò)帶寬,減少運(yùn)營(yíng)費(fèi),同時(shí)用以提高用戶體驗(yàn)度,增加用戶粘性;充分利用線上、線下同步運(yùn)營(yíng)模式,深入挖掘線上討論內(nèi)容,為線下運(yùn)營(yíng)提供指導(dǎo).
2.4廣電客戶分析主題
在三網(wǎng)融合的環(huán)境下,廣電網(wǎng)絡(luò)在逐漸擺脫事業(yè)單位模式下經(jīng)營(yíng)模式,向“市場(chǎng)驅(qū)動(dòng)”、“客戶驅(qū)動(dòng)”經(jīng)營(yíng)模式的轉(zhuǎn)變,“以客戶為中心”的理念和策略不可或缺,而廣電網(wǎng)絡(luò)擁有的客戶群和常規(guī)用戶分析的客戶群體有著本質(zhì)區(qū)別,以往分析往往針對(duì)個(gè)體用戶進(jìn)行分析,廣電網(wǎng)絡(luò)面向的用戶通常是以家庭為單位的,這給廣電網(wǎng)絡(luò)用戶行為分析帶來不可預(yù)料的困難.通過針對(duì)用戶群體不同年齡、不同時(shí)間段的收視行為和上網(wǎng)行為分析,可以區(qū)分某一時(shí)間段內(nèi)該家庭用戶內(nèi)個(gè)人的行為,可以清晰看到各類用戶在各個(gè)階段的變化情況,以及這個(gè)變化給廣電網(wǎng)絡(luò)運(yùn)營(yíng)帶來的變化.從用戶信息出發(fā),以用戶應(yīng)用行為為主線,深入挖掘用戶關(guān)系,為廣電用戶關(guān)系管理提供有效基礎(chǔ)數(shù)據(jù),提高用戶滿意度、忠誠(chéng)度,提高廣電網(wǎng)絡(luò)市場(chǎng)運(yùn)作的主動(dòng)性.
2.5市場(chǎng)收益分析主題
三網(wǎng)融合后,廣電網(wǎng)絡(luò)作為一個(gè)市場(chǎng)主體,需要適應(yīng)日趨激烈的市場(chǎng)競(jìng)爭(zhēng)環(huán)境,提升廣電運(yùn)營(yíng)商的企業(yè)核心競(jìng)爭(zhēng)力,應(yīng)充分利用業(yè)務(wù)支撐系統(tǒng)產(chǎn)生的大量寶貴的數(shù)據(jù)資源,建立廣電企業(yè)收益分析系統(tǒng),實(shí)現(xiàn)對(duì)收益數(shù)據(jù)的智能化加工和處理,為市場(chǎng)運(yùn)營(yíng)工作提供及時(shí)、準(zhǔn)確、科學(xué)的決策依據(jù).利用先進(jìn)的OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù),幫助企業(yè)的經(jīng)營(yíng)決策層了解企業(yè)經(jīng)營(yíng)的現(xiàn)狀,發(fā)現(xiàn)企業(yè)運(yùn)營(yíng)的優(yōu)勢(shì)和劣勢(shì),預(yù)測(cè)未來趨勢(shì);幫助細(xì)分市場(chǎng)和客戶,指導(dǎo)營(yíng)銷、客服部門進(jìn)行有針對(duì)性的營(yíng)銷和高效的客戶關(guān)系管理;對(duì)決策的執(zhí)行情況和結(jié)果進(jìn)行客觀準(zhǔn)確的評(píng)估,深受用戶的青睞.如圖7所示的收益分析結(jié)果,可以清晰看出企業(yè)各類業(yè)務(wù)在營(yíng)收中所占比例,可以明確了解哪類業(yè)務(wù)是企業(yè)的優(yōu)質(zhì)業(yè)務(wù),哪類業(yè)務(wù)需要進(jìn)一步加強(qiáng)開拓市場(chǎng),同時(shí)也可以預(yù)測(cè)哪類業(yè)務(wù)會(huì)有更大的推廣空間,為企業(yè)持續(xù)開展業(yè)務(wù)提供指導(dǎo).
2.6智能內(nèi)容推送主題
深層次挖掘用戶潛在的需求,以用戶的需求為導(dǎo)向,向用戶推送有針對(duì)性的內(nèi)容.廣電運(yùn)營(yíng)商通過對(duì)用戶差異性的運(yùn)營(yíng)策略,激發(fā)用戶參與的熱情,讓用戶有持續(xù)的良好體驗(yàn),提升對(duì)用戶的吸引力和黏著度.信息精準(zhǔn)、智能推送的關(guān)鍵在于把握住用戶的行為習(xí)慣,同時(shí)讓每一個(gè)用戶都可以按自己需求方便、快捷地調(diào)整、歸類相關(guān)信息.大數(shù)據(jù)分析平臺(tái)基于用戶行為收集分析系統(tǒng),挖掘出用戶潛在需求,充分了解了用戶的真實(shí)意愿,將有助于廣電運(yùn)營(yíng)商建立以客戶為中心的服務(wù)理念,提升社會(huì)影響力.
2視頻監(jiān)控在煙草行業(yè)的發(fā)展及應(yīng)用現(xiàn)狀
(1)煙田監(jiān)控:實(shí)現(xiàn)對(duì)煙田、育苗大棚內(nèi)實(shí)時(shí)監(jiān)控;
(2)煙葉收購(gòu)站監(jiān)控:實(shí)現(xiàn)對(duì)煙草所有站點(diǎn)煙葉收購(gòu)全流程監(jiān)控視頻調(diào)看、查詢、巡視、控制的功能;
(3)生產(chǎn)及公用設(shè)施區(qū)監(jiān)控:主要用于監(jiān)控車間內(nèi)重要設(shè)備、生產(chǎn)線運(yùn)行、物流線路及環(huán)境狀況,以及動(dòng)力中心車間內(nèi)空調(diào)、鍋爐等重要設(shè)備的運(yùn)行及環(huán)境狀況,防止災(zāi)害和事故的發(fā)生。
(4)煙草物流配送中心監(jiān)控:對(duì)物流配送中心進(jìn)行實(shí)時(shí)監(jiān)控;
3視頻大數(shù)據(jù)分析的技術(shù)需求
隨著視頻監(jiān)控在煙草行業(yè)的大規(guī)模應(yīng)用,視頻數(shù)據(jù)量的增加,每天產(chǎn)生的數(shù)據(jù)量都是以TB(1000GB)級(jí)別計(jì)算的,若是利用傳統(tǒng)的技術(shù)手段對(duì)每天的視頻進(jìn)行檢索和分析,則需要數(shù)小時(shí)的時(shí)間才能夠完成,工作量及工作難度可想而知;而對(duì)于更高級(jí)別的視頻數(shù)據(jù),如PB(1000TB)級(jí)別的視頻數(shù)據(jù)進(jìn)行分析和檢索時(shí)間那就是很多天了。視頻檢索與分析的效率低下,也是目前視頻數(shù)據(jù)利用效率及數(shù)據(jù)價(jià)值低下的首要原因。為此,如何提高視頻數(shù)據(jù)分析與檢索的效率,如何針對(duì)PB(1000TB)級(jí)別甚至EB(1000PB)級(jí)別的海量數(shù)據(jù)進(jìn)行分析與檢索,提升視頻監(jiān)控?cái)?shù)據(jù)價(jià)值,成為了當(dāng)前用戶的首要需求,也成為了當(dāng)前視頻大數(shù)據(jù)分析技術(shù)的難點(diǎn)及關(guān)鍵點(diǎn)之一。同時(shí),在對(duì)視頻進(jìn)行檢索與分析的過程中,需要考慮檢索結(jié)果的準(zhǔn)確性。由于視頻圖像信息為非結(jié)構(gòu)化數(shù)據(jù),如何合理有效地對(duì)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行檢索分析,優(yōu)化計(jì)算機(jī)圖像識(shí)別算法,是提高視頻大數(shù)據(jù)分析準(zhǔn)確性關(guān)鍵所在。再者,當(dāng)完成視頻檢索與分析后,如何做好視頻數(shù)據(jù)與非視屏數(shù)據(jù)的整合與關(guān)聯(lián)工作,是后期視頻數(shù)據(jù)應(yīng)用時(shí)重點(diǎn)考慮的內(nèi)容。
4視頻大數(shù)據(jù)在煙草行業(yè)的應(yīng)用思考
時(shí)下,煙田監(jiān)控、煙葉收購(gòu)站監(jiān)控、生產(chǎn)及公用設(shè)施區(qū)監(jiān)控、煙草物流配送中心監(jiān)控等的視頻監(jiān)控?cái)?shù)據(jù)較多僅僅用作安防視頻使用,還未涉及到與煙草業(yè)務(wù)的關(guān)聯(lián);隨著視頻監(jiān)控建設(shè)的完善及視頻大數(shù)據(jù)技術(shù)發(fā)展,各類監(jiān)控視頻數(shù)據(jù)量的增加,考慮到投資回報(bào)比,是否可以通過視頻大數(shù)據(jù)分析,將煙草業(yè)務(wù)與視頻監(jiān)控相關(guān)聯(lián),在海量的視頻監(jiān)控?cái)?shù)據(jù)中提取有益于煙草行業(yè)發(fā)展的變革或新技術(shù)呢?
4.1安防業(yè)務(wù)
基于傳統(tǒng)視頻監(jiān)控,安防業(yè)務(wù)是傳統(tǒng)業(yè)務(wù)之一,通過大數(shù)據(jù)分析,有效快捷的提取安防所需要的視頻片段。同時(shí)基于視頻行為告警策略,及時(shí)告警。
4.2安全生產(chǎn)
結(jié)合視頻大數(shù)據(jù)分析,將以往多次生產(chǎn)事故監(jiān)控視頻整合,通過對(duì)多次生產(chǎn)安全事故的分析,總結(jié)出更為安全可靠的生產(chǎn)規(guī)則;再則通過視頻監(jiān)控與生產(chǎn)行為的結(jié)合,制定安全生產(chǎn)標(biāo)準(zhǔn),通過聲音報(bào)警或警示燈報(bào)警等技術(shù),在不符合標(biāo)準(zhǔn)視頻監(jiān)控預(yù)定義的安全規(guī)則情況時(shí),能夠及時(shí)報(bào)警。通過視頻監(jiān)控分析,提升生產(chǎn)的安全性。如采用彩色網(wǎng)絡(luò)快球攝像機(jī)和彩色固定網(wǎng)絡(luò)槍式攝像機(jī),彩色網(wǎng)絡(luò)快球攝像機(jī)的預(yù)制位設(shè)置應(yīng)優(yōu)先,根據(jù)視頻大數(shù)據(jù)分析后,系統(tǒng)可提供不同故障區(qū)域或設(shè)備的故障信號(hào),各工藝段或設(shè)備的操作運(yùn)行信號(hào),通過系統(tǒng)集成與生產(chǎn)監(jiān)控實(shí)現(xiàn)聯(lián)動(dòng),平常攝像機(jī)對(duì)正在操作或運(yùn)行設(shè)備進(jìn)行監(jiān)控,一旦某個(gè)故障點(diǎn)報(bào)警,攝像機(jī)立刻自動(dòng)轉(zhuǎn)動(dòng)到報(bào)警點(diǎn),監(jiān)控中心的NVR主機(jī)開始錄像等。
4.3效率生產(chǎn)
結(jié)合視頻大數(shù)據(jù)分析,通過分析各個(gè)不同煙站或煙廠中的同一種生產(chǎn)行為,結(jié)合對(duì)海量數(shù)據(jù)進(jìn)行智能分析,提取出價(jià)值數(shù)據(jù)片段,形成元數(shù)據(jù)信息庫(kù),再通過人為加工后期數(shù)據(jù),總結(jié)形成效率生產(chǎn)有用的價(jià)值信息,提供生產(chǎn)借鑒,提高生產(chǎn)效率。
4.4創(chuàng)新生產(chǎn)
通過視頻大數(shù)據(jù)分析,將以往的視頻通過軌跡分析,得出以往生產(chǎn)過程中各類生產(chǎn)動(dòng)作中不必要或者多余的部分,簡(jiǎn)化或者優(yōu)化生產(chǎn)規(guī)則;通過對(duì)給類生產(chǎn)行為的總結(jié),提出合理的建議,為生產(chǎn)提出創(chuàng)新性意見或建議,提高生產(chǎn)率。
這一現(xiàn)象并非小問題:出口量增幅遠(yuǎn)大于出口額是汽車大部分瞄準(zhǔn)低端市場(chǎng)低價(jià)出口統(tǒng)計(jì)上的表現(xiàn)。據(jù)海關(guān)統(tǒng)計(jì)分析顯示,2005年我國(guó)整車出口企業(yè)共有1025家,其中出口量在10輛以下的就有600家,出口僅1輛的有185家,近900家企業(yè)的出口額僅占全國(guó)整車出口額約10%。隨著中國(guó)低價(jià)汽車及零部件的出口,他國(guó)逐漸采取反傾銷和關(guān)稅壁壘措施來應(yīng)對(duì)。
二、汽車出口價(jià)格低廉成因分析
低價(jià)的原因自然包括了中國(guó)的勞動(dòng)力水平相對(duì)較低,但在全球化背景下,專業(yè)化分工日趨明顯,許多品牌汽車也選擇在勞動(dòng)力成本相對(duì)低的環(huán)境下生產(chǎn),但同樣高價(jià)出售。這說明,低價(jià)不僅是勞動(dòng)力成本低導(dǎo)致。
汽車出口低價(jià)的另一原因是中國(guó)相對(duì)缺乏自主品牌。從經(jīng)濟(jì)學(xué)的角度看,同質(zhì)產(chǎn)品的價(jià)格需求彈性大,顧客對(duì)價(jià)格的變動(dòng)極敏感。生產(chǎn)同質(zhì)產(chǎn)品的廠商為使利潤(rùn)最大化采取降價(jià)的方案,最終基本只能得到正常利潤(rùn),無法獲得超額利潤(rùn)。目前中國(guó)汽車市場(chǎng)自主品牌還屈指可數(shù),且大部分局限于模仿水平,真正進(jìn)行自主創(chuàng)新開發(fā)出顧客很難找到替代品的汽車的情況還很少。汽車大量的同質(zhì)化使得廠商選擇打價(jià)格戰(zhàn)。
著重于模仿而非創(chuàng)新也使中國(guó)汽車出口面臨知識(shí)產(chǎn)權(quán)糾紛不斷。美國(guó)、歐盟、日本在與我國(guó)的經(jīng)貿(mào)談判中重點(diǎn)關(guān)注的問題之一即是汽車產(chǎn)業(yè)知識(shí)產(chǎn)權(quán),而國(guó)內(nèi)汽車企業(yè)在知識(shí)產(chǎn)權(quán)的擁有數(shù)量和質(zhì)量上與外資、中外合資汽車企業(yè)相比都遠(yuǎn)處下風(fēng)。一方面,不少跨國(guó)汽車公司通過合資的方式進(jìn)行品牌擴(kuò)張,并積極通過商標(biāo)注冊(cè)維護(hù)自己的品牌;另一方面,大部分中國(guó)汽車廠商也把精力放在模仿而非創(chuàng)新上,很多沒有清晰的發(fā)展自主品牌的意識(shí)。
出口秩序混亂,一些汽車廠商不規(guī)范生產(chǎn),是出口低價(jià)的另一原因。一些廠商出口翻新車、報(bào)廢車,或者用廢棄零件生產(chǎn)的汽車,這類汽車要價(jià)低廉,但質(zhì)量一般沒有保障,更不必說銷售及售后服務(wù),這造成了不好的影響。面對(duì)難以鑒別優(yōu)劣的汽車市場(chǎng),消費(fèi)者一般也不會(huì)出高價(jià)去購(gòu)買可能面臨質(zhì)量風(fēng)險(xiǎn)的汽車。中國(guó)低質(zhì)汽車在海外市場(chǎng)的大量出現(xiàn)將會(huì)對(duì)中國(guó)整體的汽車出口都帶來負(fù)面影響。
可見中國(guó)汽車出口量增幅遠(yuǎn)大于出口額增幅折射出了包括缺乏自主品牌,出口秩序混亂,生產(chǎn)不規(guī)范等不少問題,這些問題又進(jìn)一步引發(fā)反傾銷、知識(shí)產(chǎn)權(quán)糾紛,對(duì)中國(guó)汽車出口產(chǎn)生了重大影響。
三、促進(jìn)我國(guó)汽車出口由數(shù)量型增長(zhǎng)向質(zhì)量型增長(zhǎng)轉(zhuǎn)變的思路
為促進(jìn)中國(guó)汽車出口持續(xù)穩(wěn)定快速發(fā)展,應(yīng)主要把握以下幾個(gè)方面:
1.把握好技術(shù)引進(jìn)與自主創(chuàng)新之間的關(guān)系,推動(dòng)技術(shù)與質(zhì)量的升級(jí)
中國(guó)一直以來采取“市場(chǎng)換技術(shù)”的戰(zhàn)略,但并未發(fā)揮很好的效果。比如在加工貿(mào)易方面,大部分情況中方只賺取一些加工費(fèi),并未得到技術(shù)外溢的收益。即使在技術(shù)引進(jìn)過程中,我國(guó)企業(yè)也普遍存在“大錢搞引進(jìn),小錢搞改革,沒錢搞消化”的問題。引進(jìn)技術(shù)不能引進(jìn)核心技術(shù),沒有消化吸收和自主創(chuàng)新很可能出現(xiàn)的結(jié)果是大部分廠商制造出同質(zhì)產(chǎn)品,極易導(dǎo)致價(jià)格戰(zhàn)的出現(xiàn),不利于廠家戰(zhàn)略發(fā)展。
目前自主創(chuàng)新已成為全社會(huì)的共識(shí),國(guó)家正通過一系列政策鼓勵(lì)與扶持汽車企業(yè)進(jìn)行自主創(chuàng)新,我國(guó)汽車企業(yè)應(yīng)該充分利用各種有利的政策堅(jiān)定地進(jìn)行自主創(chuàng)新,推動(dòng)自身的發(fā)展。
2.加深知識(shí)產(chǎn)權(quán)認(rèn)識(shí),著重自主品牌打造
我國(guó)大多數(shù)汽車企業(yè)中并未把知識(shí)產(chǎn)權(quán)工作納入經(jīng)營(yíng)管理的范疇,真正將知識(shí)產(chǎn)權(quán)與技術(shù)創(chuàng)新有機(jī)結(jié)合的并不多。知識(shí)產(chǎn)權(quán)意識(shí)不強(qiáng)使得部分企業(yè)出現(xiàn)要么不尊重他人知識(shí)產(chǎn)權(quán)從而引起糾紛,要么在合作中放棄了知識(shí)產(chǎn)權(quán)的權(quán)利要求,使企業(yè)蒙受巨大損失。
強(qiáng)化企業(yè)的知識(shí)產(chǎn)權(quán)意識(shí),不單單是要尊重他人的知識(shí)產(chǎn)權(quán),同時(shí)也需要主張自己的知識(shí)產(chǎn)權(quán)權(quán)利要求,加強(qiáng)對(duì)知識(shí)產(chǎn)權(quán)的管理。正確且充分的知識(shí)產(chǎn)權(quán)的認(rèn)識(shí)將為自主品牌的打造提供有利的環(huán)境,為企業(yè)的長(zhǎng)遠(yuǎn)發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。
3.加大監(jiān)管力度,規(guī)范出口秩序,要求企業(yè)保質(zhì)保量生產(chǎn)銷售
商務(wù)部等政府主管部門以及相關(guān)部門應(yīng)采取積極有效的措施對(duì)中國(guó)汽車出口進(jìn)行引導(dǎo)和推動(dòng),以改善中國(guó)汽車出口環(huán)境,為高質(zhì)量汽車的出口搭建平臺(tái),加強(qiáng)相應(yīng)的服務(wù)并提高效率,規(guī)范汽車出口的秩序,并且通過廣大企業(yè)和行業(yè)組織等中介機(jī)構(gòu)的努力,以實(shí)現(xiàn)汽車出口的持續(xù)穩(wěn)定快速的發(fā)展。
參考文獻(xiàn):
[1]汪瑩:我國(guó)汽車出口市場(chǎng)研究[J].汽車工業(yè)研究,2007
[2]笪莉萍:我汽車零件出口屢遭反傾銷[N].上海青年報(bào),2006年8月30日
[3]劉彬彬:汽車產(chǎn)業(yè)知識(shí)產(chǎn)權(quán)問題引起關(guān)注[N].中國(guó)工業(yè)報(bào),2006年9月22日
野外人工模擬降雨試驗(yàn)要在前期土壤水分不飽和的狀態(tài)下進(jìn)行,因此每次模擬降雨試驗(yàn)只能在同一徑流小區(qū)進(jìn)行一次降雨過程。為獲取更多的野外模擬降雨產(chǎn)匯流及水土流失對(duì)比數(shù)據(jù),計(jì)劃在每個(gè)項(xiàng)目區(qū)的典型坡度———5°~8°、8°~15°、15°~25°分別建設(shè)坡地徑流小區(qū)。徑流小區(qū)的布設(shè)與等高線垂直,根據(jù)相關(guān)規(guī)范和實(shí)際條件,徑流小區(qū)投影面積一般為60m2,即20m(順坡投影長(zhǎng)度)×3m(寬與等高線平行)。云縣石佛山坡耕地水土流失綜合治理試點(diǎn)工程水土保持監(jiān)測(cè)項(xiàng)目于2010年12月初完成8°、12°、15°三塊坡地小區(qū)的建設(shè),2011年6月下旬第一次模擬降雨試驗(yàn)后,為方便對(duì)比分析,根據(jù)工程進(jìn)展情況在12°坡地小區(qū)旁增設(shè)一塊梯地小區(qū)。
1.2人工模擬降雨系統(tǒng)
此次人工模擬降雨試驗(yàn)采用西安理工大學(xué)研制的人工模擬降雨試驗(yàn)系統(tǒng)(圖1)。它基于工控組態(tài)軟件,應(yīng)用現(xiàn)有的人工模擬降雨試驗(yàn)裝置,將試驗(yàn)過程的常用設(shè)備和工控軟件結(jié)合在一起,增加了自動(dòng)控制環(huán)節(jié),通過對(duì)控制系統(tǒng)進(jìn)行改造,解決了手動(dòng)調(diào)節(jié)雨強(qiáng)不方便的問題,實(shí)現(xiàn)了對(duì)不同時(shí)段、不同雨強(qiáng)、不同分布的人工模擬降雨系統(tǒng)的手動(dòng)和自動(dòng)雙控制,采用監(jiān)控組態(tài)系統(tǒng)更好地滿足了人工模擬降雨試驗(yàn)的需求。該人工模擬降雨系統(tǒng)可建于自然坡面上,高6m,降雨試驗(yàn)區(qū)長(zhǎng)20m、寬3m,有效降雨面積60m2。降雨系統(tǒng)布設(shè)在降雨裝置支架上,噴頭選用與天然降雨雨滴譜最為接近的X型下噴式噴頭,由4組不同噴嘴孔徑組合而成。為兼顧模擬降雨的均勻性與搭建支架的經(jīng)濟(jì)性和安全性,將系統(tǒng)在野外難以架設(shè)的固定式方鋼支架改為鋼管腳手架。頂寬超出徑流小區(qū)寬度方向兩邊各0.3m,頂端橫桿按照水管和噴頭分布架設(shè),壓力控制裝置設(shè)4個(gè)出水管,每管對(duì)應(yīng)同一噴嘴孔徑的噴頭,共設(shè)置4組24個(gè)不同噴嘴孔徑噴頭,支架內(nèi)部無任何遮擋。壓力控制裝置可自動(dòng)、手動(dòng)控制出水管的全開、全關(guān)或部分開啟。本系統(tǒng)可模擬降雨強(qiáng)度變化范圍4~200mm/h,降雨雨強(qiáng)最小分辨值1.3mm/h,降雨強(qiáng)度控制精度0.66mm/h,降雨均勻度>0.95。系統(tǒng)采用先進(jìn)的閉環(huán)自動(dòng)控制理論和技術(shù),是一種應(yīng)用交流變頻調(diào)速器控制的人工模擬降雨自動(dòng)控制設(shè)備,以降雨過程的最終實(shí)際降雨參數(shù)控制和驅(qū)動(dòng)系統(tǒng)的各個(gè)降雨部件,克服了從水源到噴頭之間諸多環(huán)節(jié)對(duì)降雨的隨機(jī)影響。實(shí)驗(yàn)室測(cè)試結(jié)果表明,該設(shè)備的主要性能指標(biāo)優(yōu)于國(guó)內(nèi)外其他人工模擬降雨系統(tǒng),是進(jìn)行土壤產(chǎn)匯流和侵蝕規(guī)律研究的重要試驗(yàn)設(shè)備。
1.3人工模擬降雨雨強(qiáng)
石佛山小流域位于云南省臨滄市云縣幸福鎮(zhèn)幸福村水土保持監(jiān)測(cè)項(xiàng)目區(qū)。模擬降雨設(shè)計(jì)頻率及雨強(qiáng)參照幸福雨量站。該站距項(xiàng)目區(qū)直線距離2km,1983年建站,有1983—2010年共28年的完整降雨資料,降雨資料質(zhì)量可靠,能滿足設(shè)計(jì)暴雨頻率分析要求。通過幸福雨量站1h短歷時(shí)暴雨頻率計(jì)算,石佛山小流域100年一遇1h降雨量為84.8mm,50年一遇1h降雨量為77.0mm,30年一遇1h降雨量為72.1mm。人
工模擬降雨采用100年一遇1h降雨過程。
2人工模擬降雨監(jiān)測(cè)結(jié)果
2.1JDZ02型自記雨量器記錄結(jié)果
人工模擬降雨試驗(yàn)于2011年1月開始,至2012年9月結(jié)束,跨2年歷時(shí)40天,試驗(yàn)時(shí)間分別為枯水期兩次(第一次、第三次)、主汛期兩次(第二次、第四次)。在不同坡度的徑流小區(qū)分別進(jìn)行15場(chǎng)次的人工模擬降雨試驗(yàn)。
2.2普通雨量器監(jiān)測(cè)結(jié)果
徑流小區(qū)人工模擬降雨面降雨量采用普通雨量器監(jiān)測(cè),用算術(shù)平均法計(jì)算平均面降雨量。用普通雨量器觀測(cè)的15場(chǎng)次人工模擬降雨面降雨量計(jì)算結(jié)果見表3。
2.3人工模擬降雨產(chǎn)流產(chǎn)沙量監(jiān)測(cè)
人工模擬降雨雨強(qiáng)采用100年一遇1h降雨雨強(qiáng)。在模擬降雨試驗(yàn)前采用移動(dòng)墑情監(jiān)測(cè)儀和稱重法在各小區(qū)距地表10、20、30cm土層剖面處取土樣分別測(cè)定前期土壤含水率,并取平均值。產(chǎn)流產(chǎn)沙量的監(jiān)測(cè)是在有徑流產(chǎn)生時(shí),每5min取1個(gè)水樣,采用加權(quán)平均法計(jì)算平均含沙量,并用容積法記錄產(chǎn)流量。監(jiān)測(cè)結(jié)果。
3試驗(yàn)結(jié)果分析
3.1人工模擬降雨試驗(yàn)降雨監(jiān)測(cè)結(jié)果分析
云南省人工模擬降雨試驗(yàn)是全國(guó)第一次大規(guī)模使用人工模擬降雨系統(tǒng)在野外研究土壤產(chǎn)匯流和侵蝕規(guī)律的試驗(yàn)。實(shí)驗(yàn)室內(nèi)的環(huán)境與野外環(huán)境差距較大,在野外試驗(yàn)雖然是按100年一遇的標(biāo)準(zhǔn)進(jìn)行人工降雨,但是由于受風(fēng)速、風(fēng)向影響較大,加之降雨雨滴與實(shí)際還有一定差距,所以部分降雨隨風(fēng)飄落到小區(qū)之外,落到小區(qū)地面的降雨標(biāo)準(zhǔn)也因此降低??紤]到上述情況,試驗(yàn)都選在無風(fēng)或輕微風(fēng)和微風(fēng)的環(huán)境下進(jìn)行。將徑流小區(qū)內(nèi)安裝的JDZ02型自記雨量器記錄的降雨雨強(qiáng)與設(shè)計(jì)降雨雨強(qiáng)進(jìn)行相關(guān)性分析,相關(guān)系數(shù)都在0.6以上,說明人工模擬降雨過程與設(shè)計(jì)降雨過程之間存在強(qiáng)相關(guān)。根據(jù)統(tǒng)計(jì)學(xué)原理,使用Brown-Forsythe檢驗(yàn)法檢驗(yàn)設(shè)計(jì)降雨過程與12場(chǎng)次JDZ02型自記雨量器記錄降雨過程的差異性,在顯著性水平α=0.05下檢驗(yàn)結(jié)果為各組之間差異不顯著。對(duì)比設(shè)計(jì)雨量與JDZ02型自記雨量器記錄結(jié)果,有7場(chǎng)次降雨接近或超過設(shè)計(jì)雨強(qiáng),說明在徑流小區(qū)局部,人工模擬降雨雨強(qiáng)是達(dá)到設(shè)計(jì)要求的。對(duì)徑流小區(qū)12場(chǎng)次面降雨量監(jiān)測(cè)結(jié)果進(jìn)行分析,小區(qū)內(nèi)模擬降雨重現(xiàn)期達(dá)到10年一遇以上的有7場(chǎng),以下的有5場(chǎng),最高重現(xiàn)期為13年一遇,最低為2年一遇。小區(qū)內(nèi)降雨極不均勻,單個(gè)普通雨量器收集的降雨量有的大于設(shè)計(jì)雨強(qiáng),有的小于設(shè)計(jì)雨強(qiáng),特別是小區(qū)兩側(cè)降雨量與設(shè)計(jì)雨量誤差最大,達(dá)到82.5mm。受風(fēng)速、風(fēng)向、試驗(yàn)支架架設(shè)高度和植被的影響,用加權(quán)平均法計(jì)算出徑流小區(qū)內(nèi)21只普通雨量器的實(shí)測(cè)面平均雨量均小于設(shè)計(jì)雨量,相對(duì)誤差在-62.7%~-27.0%之間,未達(dá)到設(shè)計(jì)要求。
3.2徑流小區(qū)產(chǎn)流產(chǎn)沙情況分析
(1)8°徑流小區(qū)。由表4知,第一次模擬降雨試驗(yàn),坡地小區(qū)土壤含水率接近飽和、植被覆蓋率為0,降雨4min后開始產(chǎn)流,歷時(shí)1h,產(chǎn)流量1.402m3,產(chǎn)沙量15.6kg。第二次試驗(yàn)在主汛期進(jìn)行,土壤含水率接近飽和,小區(qū)內(nèi)種植玉米,植被覆蓋率為100%,降雨2min后開始產(chǎn)流,歷時(shí)62min,產(chǎn)流2145m3,產(chǎn)沙量10.2kg。第三次試驗(yàn),小區(qū)土壤含水率12.16%,植被為雜草和伐倒的玉米植株,植被覆蓋率為70%,降雨9min后開始產(chǎn)流,歷時(shí)40min,產(chǎn)流量0.064m3,產(chǎn)沙量0.015kg。該次模擬降雨面平均雨量為44.1mm,僅占設(shè)計(jì)雨量的48.5%,加之前期土壤含水率低,因此產(chǎn)流量和產(chǎn)沙量都較小。第四次試驗(yàn),小區(qū)內(nèi)種植的玉米已進(jìn)入成熟期,植株較高,植被覆蓋率為100%。試驗(yàn)時(shí)為減小風(fēng)力對(duì)人工模擬降雨的影響,將降雨架高度由6m減至4m。降雨27min后開始產(chǎn)流,歷時(shí)12min,產(chǎn)流量0.082m3,產(chǎn)沙量0.082kg。該次降雨面平均雨量為59.9mm,占到設(shè)計(jì)雨量的70.6%,但是由于小區(qū)前期土壤含水率低,僅為9.04%,故產(chǎn)流量和產(chǎn)沙量都較小。
(2)12°徑流小區(qū)。第一次試驗(yàn),由于模擬降雨面平均雨量小(31.6mm),雖然前期土壤含水率高達(dá)1503%,但該次降雨條件下該小區(qū)未產(chǎn)流。第二次試驗(yàn),小區(qū)前期土壤含水率已接近飽和,植被覆蓋率達(dá)100%,降雨2min后開始產(chǎn)流,歷時(shí)58min,產(chǎn)流量1.513m3,產(chǎn)沙量20.9kg。第三次試驗(yàn),小區(qū)前期土壤含水率11.41%、植被覆蓋率70%,降雨11min后開始產(chǎn)流,歷時(shí)42min,產(chǎn)流量0.156m3,產(chǎn)沙量0.044kg。該次模擬降雨面平均雨量較大,占到設(shè)計(jì)雨量的71.3%,但是由于前期土壤含水率低,故產(chǎn)流量和產(chǎn)沙量都較小。第四次試驗(yàn),小區(qū)植被覆蓋率100%,降雨31min后開始產(chǎn)流,產(chǎn)流時(shí)間5min,產(chǎn)流量0.010m3,產(chǎn)沙量0.004kg。該次模擬降雨面平均雨量達(dá)到50.9mm,占到設(shè)計(jì)雨量的60.0%,但是受土壤含水率僅為10.59%的影響,產(chǎn)流量和產(chǎn)沙量都較小。
(3)15°徑流小區(qū)。由表4可知,第一次試驗(yàn),小區(qū)前期土壤含水率為16.05%、植被覆蓋率為0,降雨30min后開始產(chǎn)流,歷時(shí)10min,產(chǎn)流量0.0165m3,產(chǎn)沙量0.133kg。第二次試驗(yàn),土壤含水率已接近飽和,達(dá)20.65%,小區(qū)植被覆蓋率60%,降雨7min后開始產(chǎn)流,產(chǎn)流53min,產(chǎn)流量0.629m3,產(chǎn)沙量10.6kg。第三次試驗(yàn)在冬季進(jìn)行,小區(qū)植被覆蓋率為80%,由于前期土壤含水率低(10.41%)、面平均雨量偏小(43.3mm),因此該次降雨在該小區(qū)未產(chǎn)流。第四次試驗(yàn),小區(qū)植被覆蓋率100%,人工模擬降雨60min未產(chǎn)流,為檢驗(yàn)產(chǎn)流情況,在12:15將人工模擬降雨裝置閘門全開,以最大降雨強(qiáng)度連續(xù)降雨5min,于降雨64min后開始產(chǎn)流,產(chǎn)流5min,產(chǎn)流量0.022m3,產(chǎn)沙量0.036kg。該次模擬降雨歷時(shí)65min,面平均雨量達(dá)到61.1mm,占到設(shè)計(jì)雨量的72.1%,受前期土壤含水率(10.74%)較低、植被覆蓋率較高影響,該小區(qū)產(chǎn)流量和產(chǎn)沙量都較小。(4)梯地徑流小區(qū)。由表4可知,梯地徑流小區(qū)第一次試驗(yàn)在主汛期進(jìn)行,前期土壤含水率為17.46%,植被覆蓋率為20%,降雨2min后開始產(chǎn)流,產(chǎn)流48min,產(chǎn)流量1.146m3,產(chǎn)沙量1.93kg。第二次試驗(yàn)在冬季進(jìn)行,小區(qū)前期土壤含水率8.09%,植被覆蓋率90%,模擬降雨面平均雨量為58.5mm,由于前期土壤含水率過低,該次降雨在該小區(qū)未產(chǎn)流。第三次試驗(yàn)在9月份進(jìn)行,前期土壤含水率為8.48%,植被覆蓋率為100%,模擬降雨面平均雨量為54.1mm。該次試驗(yàn)該小區(qū)未產(chǎn)流,其主要原因也是梯地小區(qū)前期土壤含水率過低。
4結(jié)語
世界多數(shù)大國(guó)在近一百多年來在供電上采取的模式是集發(fā)電、輸電、配電為一身的壟斷模式。國(guó)家在電力供應(yīng)上大多數(shù)或全部由國(guó)家壟斷經(jīng)營(yíng),廣大電力用戶就是消費(fèi)者。這種壟斷經(jīng)營(yíng)在短時(shí)間內(nèi)使電力工業(yè)聚集了大量的資金,電力工業(yè)持續(xù)發(fā)展,同時(shí)避免了重復(fù)設(shè)施的出現(xiàn),為電網(wǎng)的統(tǒng)一規(guī)劃和建設(shè)提供了有力的支持。
1.2發(fā)電競(jìng)爭(zhēng)
發(fā)電競(jìng)爭(zhēng)模式,競(jìng)爭(zhēng)主要體現(xiàn)在發(fā)電環(huán)節(jié),輸電和配電仍然采取壟斷經(jīng)營(yíng)。在電力經(jīng)營(yíng)過程中對(duì)電力市場(chǎng)進(jìn)行開放,引入發(fā)電企業(yè),在市場(chǎng)中由壟斷企業(yè)對(duì)發(fā)電企業(yè)生產(chǎn)的電力進(jìn)行買斷,然后由壟斷企業(yè)統(tǒng)一賣給電力用戶,這種供電模式的引入加大了市場(chǎng)中電力的供給量。
1.3電力轉(zhuǎn)運(yùn)
電力運(yùn)轉(zhuǎn)模式就是合理的將發(fā)電、輸電、配電三個(gè)過程進(jìn)行分離,每個(gè)發(fā)電廠都獨(dú)立成為一個(gè)企業(yè),各個(gè)發(fā)電廠之間采取公平競(jìng)爭(zhēng)。市場(chǎng)中的用電大戶,可以低價(jià)從電力企業(yè)直接購(gòu)買電力,利用統(tǒng)一電網(wǎng)實(shí)現(xiàn)電力運(yùn)轉(zhuǎn)。在電力運(yùn)轉(zhuǎn)模式中,部分競(jìng)爭(zhēng)市場(chǎng)、壟斷經(jīng)營(yíng)市場(chǎng)和競(jìng)爭(zhēng)市場(chǎng)同時(shí)存在。
1.4配電網(wǎng)開放
配電網(wǎng)開放模式的主要特點(diǎn)是:發(fā)電、輸電、配電三個(gè)環(huán)節(jié)適當(dāng)分離,三個(gè)環(huán)節(jié)都各自成為獨(dú)立的經(jīng)營(yíng)體系,三者之間存在電力買賣關(guān)系。這種經(jīng)營(yíng)模式將發(fā)電、輸電、配電三者打破了傳統(tǒng)的電力運(yùn)營(yíng)管理模式,電力市場(chǎng)形成了多種商家相互競(jìng)爭(zhēng)的形式,這不僅增加了發(fā)電企業(yè)之間的相互競(jìng)爭(zhēng),客戶可以通過自己的需求來選取適當(dāng)?shù)陌l(fā)電商,而且電力消費(fèi)者和生產(chǎn)者之間形成了一種真正的買賣格局,從而為電力顯示商品特性提供了便利條件。
2企業(yè)多維數(shù)據(jù)分析具有的特點(diǎn)
2.1多維性
多維數(shù)據(jù)分析的一個(gè)最重要特點(diǎn)就是多維性。多維性不僅體現(xiàn)了人們?cè)谟^察世界時(shí)的多角度,同時(shí)也體現(xiàn)了多層次觀察。例如,在銷售量數(shù)據(jù)的查看上可以從時(shí)間維入手,同時(shí)還可以從年、季、月等時(shí)間層次上進(jìn)行查看。對(duì)數(shù)據(jù)進(jìn)行分層查看,不僅符合事物的客觀運(yùn)行規(guī)律,而且也能讓用戶全面地掌握數(shù)據(jù)情況。
2.2實(shí)時(shí)性
實(shí)時(shí)性不僅滿足了用戶在時(shí)間上對(duì)信息的需求,而且可以快速查找多維數(shù)據(jù)的分析結(jié)果,同時(shí)實(shí)現(xiàn)了實(shí)時(shí)的接受用戶所反饋的數(shù)據(jù)。
2.3開放性
多維數(shù)據(jù)分析支持多數(shù)據(jù)源和系統(tǒng)平臺(tái)。因此,在實(shí)際工作中,不論數(shù)據(jù)存儲(chǔ)量有多大,存儲(chǔ)在何處,采取何種方式對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),都可以及時(shí)獲取到存儲(chǔ)的數(shù)據(jù),并且可以以多種方式將分析結(jié)果提供給不通過平臺(tái)上的客戶使用。
2.4可分析性
可以從不同的角度對(duì)數(shù)據(jù)的最大值、平均值、最小值、匯總進(jìn)行記錄和處理,將龐大的有用數(shù)據(jù)提供給客戶,此外還具有數(shù)據(jù)分析和數(shù)據(jù)查詢等能力。
2.5安全性
確保信息的安全,避免受到欺詐,對(duì)用戶進(jìn)行分級(jí)管理,數(shù)據(jù)分析過程中,對(duì)于數(shù)據(jù)分析結(jié)果只能提供給相應(yīng)的用戶。如果在實(shí)際工作中,存在多個(gè)用戶共同應(yīng)用同一個(gè)分析時(shí),應(yīng)當(dāng)對(duì)客戶的級(jí)別進(jìn)行合理劃分,依據(jù)客戶所處的安全級(jí)別,允許客戶查看對(duì)應(yīng)層次的信息。
3電力營(yíng)銷多維數(shù)據(jù)分析過程
(1)依據(jù)決策者和企業(yè)業(yè)務(wù)在信息上的需求,對(duì)多維數(shù)據(jù)分析主題進(jìn)行確定,在進(jìn)行多位數(shù)據(jù)分析時(shí),依據(jù)面向主題分析獲取信息,從而實(shí)現(xiàn)為決策者提供信息的目的。
(2)收集數(shù)據(jù),目前供電企業(yè)信息系統(tǒng)收集了電量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)都存儲(chǔ)在各個(gè)供電企業(yè)的信息系統(tǒng)中,為了使其能夠更好的為企業(yè)所用,應(yīng)當(dāng)建立數(shù)據(jù)庫(kù)服務(wù)器,采集供電企業(yè)中數(shù)據(jù)。多維數(shù)據(jù)分析在電力決策的實(shí)際應(yīng)用中,數(shù)據(jù)采集工作需要依據(jù)多維數(shù)據(jù)分析主體進(jìn)行,要對(duì)數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行確認(rèn),并且在構(gòu)建面向分析時(shí)選擇數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)系統(tǒng)中抽取、轉(zhuǎn)換企業(yè)需要的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)是集成的、面向主題的且在實(shí)際運(yùn)行過程中容易因?yàn)闀r(shí)間變化而發(fā)生改變的一個(gè)數(shù)據(jù)集合。數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)為數(shù)據(jù)分析工作而設(shè)計(jì)的,利用數(shù)據(jù)倉(cāng)庫(kù)可以為多維數(shù)據(jù)分析提供更加穩(wěn)定且具有針對(duì)性的數(shù)據(jù),目前許多電氣企業(yè)都構(gòu)建了數(shù)據(jù)服務(wù)器。
(3)多維數(shù)據(jù)模型的建立,多維數(shù)據(jù)分析需要以多維數(shù)據(jù)模型為基礎(chǔ),從哪些角度對(duì)多維數(shù)據(jù)模型進(jìn)行觀察,對(duì)哪些數(shù)據(jù)進(jìn)行分析,可以通過多維數(shù)據(jù)分析決定哪些數(shù)據(jù)需要仔細(xì)分析歷史數(shù)據(jù)結(jié)構(gòu)來獲得,從獲取的數(shù)據(jù)中找到有用的數(shù)據(jù)構(gòu)建成適當(dāng)?shù)亩攘?、維度從而構(gòu)成高效的多維數(shù)據(jù)模型。
(4)設(shè)計(jì)人員依據(jù)現(xiàn)有的多維數(shù)據(jù)模型,選取適當(dāng)?shù)亩攘亢途S度,結(jié)合報(bào)表利用適當(dāng)?shù)慕y(tǒng)計(jì)方法,通過圖表直觀地展現(xiàn)企業(yè)的大量了歷史數(shù)據(jù)。
(5)信息,通過靈活的方式將電力企業(yè)想要的相關(guān)信息直接提供給決策者。
4分析電力影響數(shù)據(jù)主題
在電力營(yíng)銷決策中,每一個(gè)主體都對(duì)應(yīng)一個(gè)具體的分析,表示一種營(yíng)銷決策者在工作中需要掌握的信息。本文在研究上將分析主體分為用戶情況、購(gòu)電情況、電價(jià)情況、電費(fèi)回收、設(shè)備資產(chǎn)情況等,并對(duì)較大的主體進(jìn)行了進(jìn)一步劃分,針對(duì)電力營(yíng)銷的數(shù)據(jù)分析,應(yīng)當(dāng)從宏觀到微觀,從多個(gè)角度對(duì)電氣企業(yè)的數(shù)據(jù)進(jìn)行科學(xué)分析,為電力企業(yè)的各級(jí)領(lǐng)導(dǎo)者提供決策信息。因此,在分析上還需要確定分析層次和分析角度。
2煤礦安全生產(chǎn)大數(shù)據(jù)分析系統(tǒng)
2.1大數(shù)據(jù)分析的概念大數(shù)據(jù)分析
是指數(shù)據(jù)量急劇積累迅速超出主流軟件工具和人類思維處理的極限,大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)比較起來,有四大特征:數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、數(shù)據(jù)價(jià)值密度低(Value)、更新速度快時(shí)效高(Velocity)。大數(shù)據(jù)分析需要全新的數(shù)據(jù)處理理念和分析工具,洞察發(fā)現(xiàn)海量高速增長(zhǎng)信息中潛藏的價(jià)值[4]。從理念上,大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析有三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對(duì)精確,要相關(guān)不要因果。針對(duì)大數(shù)據(jù),既有的技術(shù)架構(gòu)和分析工具已經(jīng)無法滿足要求,需要全新的數(shù)據(jù)分析方法和技術(shù),這其中包括:(1)大數(shù)據(jù)分析可視化方法;(2)大數(shù)據(jù)挖掘算法;(3)預(yù)測(cè)性分析能力;(4)語義處理能力;(5)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理技術(shù)。
2.2大數(shù)據(jù)分析系統(tǒng)的建設(shè)
根據(jù)大數(shù)據(jù)處理和分析的理念,煤礦安全大數(shù)據(jù)分析系統(tǒng)的建設(shè)目標(biāo)包括:數(shù)據(jù)綜合集成、安全知識(shí)集成、三維虛擬可視化展示、煤礦安全動(dòng)態(tài)分析診斷。具體建設(shè)內(nèi)容包括:(1)基于物聯(lián)網(wǎng)/云計(jì)算技術(shù)的煤礦安全綜合數(shù)據(jù)庫(kù)。建設(shè)煤礦安全大數(shù)據(jù)分析診斷系統(tǒng),首先要利用物聯(lián)網(wǎng)和云計(jì)算技術(shù)實(shí)現(xiàn)全面綜合的數(shù)據(jù)集成,將基礎(chǔ)空間和屬性數(shù)據(jù)、在線監(jiān)測(cè)的實(shí)時(shí)性數(shù)據(jù)、專業(yè)業(yè)務(wù)系統(tǒng)的事務(wù)性數(shù)據(jù)綜合集成起來,構(gòu)建煤礦安全綜合數(shù)據(jù)庫(kù)。(2)基于專家系統(tǒng)的煤礦安全專家知識(shí)庫(kù)。針對(duì)知識(shí)集成的目標(biāo),整理規(guī)范規(guī)程體系中的經(jīng)驗(yàn)或者理論知識(shí)(煤礦安全規(guī)程、煤礦作業(yè)規(guī)程、三違行為知識(shí)、隱患界定知識(shí)、評(píng)估模型、設(shè)備操作規(guī)程知識(shí)、工種操作規(guī)程知識(shí)),構(gòu)建煤礦安全動(dòng)態(tài)分析診斷的專家知識(shí)庫(kù)。(3)建設(shè)三維虛擬礦井可視化平臺(tái)。針對(duì)信息和知識(shí)三維虛擬礦井可視化展示分析,主要的建設(shè)內(nèi)容是基于高精度地質(zhì)模型理論研究開發(fā)三維虛擬礦井平臺(tái),實(shí)現(xiàn)地層建模、鉆孔建模、斷層建模、工作面建模和巷道建模等工作。然后,基于三維虛擬礦井平臺(tái),實(shí)現(xiàn)數(shù)據(jù)和知識(shí)可視化、煤礦安全生產(chǎn)活動(dòng)可視化、分析和決策過程可視化。(4)研發(fā)煤礦安全動(dòng)態(tài)分析系統(tǒng)。針對(duì)基于專家知識(shí)庫(kù)的煤礦安全生產(chǎn)分析決策,需要利用煤礦安全綜合數(shù)據(jù)庫(kù)中的基礎(chǔ)數(shù)據(jù)、實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)以及事務(wù)性數(shù)據(jù),根據(jù)煤礦安全專家知識(shí)庫(kù)進(jìn)行煤礦安全生產(chǎn)狀況評(píng)估、推理和演繹,動(dòng)態(tài)分析診斷煤礦安全生產(chǎn)的現(xiàn)狀與趨勢(shì)、預(yù)測(cè)未來,并針對(duì)煤礦應(yīng)急現(xiàn)象做出科學(xué)合理的響應(yīng)對(duì)策。
1.引言
目前發(fā)展大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)上升為國(guó)家戰(zhàn)略,大數(shù)據(jù)的價(jià)值也得到了社會(huì)的廣泛認(rèn)可。眾多研究[1-5]表明,大數(shù)據(jù)不僅為政府治理開辟了新思路,還是企業(yè)創(chuàng)新的重要源泉和高??蒲械闹匾?。大數(shù)據(jù)交易平臺(tái)是整個(gè)大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)與核心,它使得數(shù)據(jù)資源可以在不同組織之間流動(dòng),從而讓單個(gè)組織能夠獲得更多、更全面的數(shù)據(jù)。這樣不僅提高了數(shù)據(jù)資源的利用效率,更重要的是,當(dāng)一個(gè)組織擁有的數(shù)據(jù)資源不斷豐富和立體化,有助于其通過數(shù)據(jù)分析發(fā)現(xiàn)更多的潛在規(guī)律,從而對(duì)內(nèi)提高自身的效率,對(duì)外促進(jìn)整個(gè)社會(huì)的不斷進(jìn)步。
在現(xiàn)有的大數(shù)據(jù)交易平臺(tái)上,數(shù)據(jù)供應(yīng)方和需求方各自供需信息,交易雙方瀏覽這些信息,如果發(fā)現(xiàn)合適的交易對(duì)象,則進(jìn)行大數(shù)據(jù)資源的買賣,交易平臺(tái)只作為信息中介存在。這類大數(shù)據(jù)交易的本質(zhì),其實(shí)是單獨(dú)的大數(shù)據(jù)資源交易,現(xiàn)有平臺(tái)可以統(tǒng)稱為第一代大數(shù)據(jù)交易平臺(tái)。第一代大數(shù)據(jù)交易平臺(tái)在供需平衡、數(shù)據(jù)定價(jià)和時(shí)效性三個(gè)方面都存在較大的不足。本文針對(duì)這些不足進(jìn)行改進(jìn),設(shè)計(jì)了一種全新的第二代大數(shù)據(jù)交易平臺(tái),命名為:融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái),該平臺(tái)將數(shù)據(jù)資源交易與數(shù)據(jù)分析服務(wù)進(jìn)行深度融合,實(shí)現(xiàn)了數(shù)據(jù)與服務(wù)的一體化交易。本研究不僅為當(dāng)下正在建設(shè)的各類大數(shù)據(jù)交易平臺(tái)提供有益的借鑒,也豐富了大數(shù)據(jù)交易的基礎(chǔ)理論體系。
2.相關(guān)研究
目前大數(shù)據(jù)交易的相關(guān)研究中,比較有代表性的有:
(1)大數(shù)據(jù)的財(cái)產(chǎn)屬性和所有權(quán)。王玉林等[6]對(duì)大數(shù)據(jù)的財(cái)產(chǎn)屬性展開研究,認(rèn)為大數(shù)據(jù)的法律屬性會(huì)直接影響大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,而大數(shù)據(jù)交易實(shí)踐本身就反映出大數(shù)據(jù)具有財(cái)產(chǎn)屬性。但大數(shù)據(jù)與傳統(tǒng)的財(cái)產(chǎn)權(quán)客體存在較大不同,它符合信息財(cái)產(chǎn)的特征,是信息財(cái)產(chǎn)權(quán)的客體,應(yīng)受到相關(guān)法律的保護(hù)。齊愛民等[7]從宏觀的角度分析了國(guó)家對(duì)于其主權(quán)范圍內(nèi)數(shù)據(jù)的所有權(quán),剖析了個(gè)人擁有的數(shù)據(jù)權(quán)以及數(shù)據(jù)的財(cái)產(chǎn)權(quán)。
(2)大數(shù)據(jù)的定價(jià)問題。劉朝陽[8]對(duì)大數(shù)據(jù)的定價(jià)問題展開研究,首先分析了大數(shù)據(jù)的基本特征、價(jià)值特征等定價(jià)基礎(chǔ)。接著討論了效用價(jià)格論、成本價(jià)格論等定價(jià)模式。最后分析了大數(shù)據(jù)的定價(jià)策略,并對(duì)大數(shù)據(jù)定價(jià)的雙向不確定問題進(jìn)行了詳細(xì)論述。劉洪玉等[9]認(rèn)為在大數(shù)據(jù)交易過程中,由于缺乏足夠的歷史參考,其數(shù)據(jù)資源的交易價(jià)格很難確定,因此提出一種基于競(jìng)標(biāo)機(jī)制的魯賓斯坦模型,用于大數(shù)據(jù)交易雙方進(jìn)行討價(jià)還價(jià),以求達(dá)成一個(gè)交易的均衡價(jià)格。翟麗麗等[10]從資產(chǎn)的期權(quán)價(jià)值角度來評(píng)估大數(shù)據(jù)資源的價(jià)值,并指出數(shù)據(jù)在不斷變化和更新,加上數(shù)據(jù)的非獨(dú)占性等情況的出現(xiàn),數(shù)據(jù)資產(chǎn)的價(jià)值可能會(huì)下降,最后綜合這些因素構(gòu)建了一個(gè)評(píng)估模型來計(jì)算數(shù)據(jù)資產(chǎn)的價(jià)值。
(3)大數(shù)據(jù)交易的安全與隱私保護(hù)。史宇航[11]認(rèn)為非法的數(shù)據(jù)交易會(huì)對(duì)個(gè)人數(shù)據(jù)等高價(jià)值信息的安全造成影響,對(duì)非法數(shù)據(jù)交易的購(gòu)買方和協(xié)助方都應(yīng)進(jìn)行處罰。提出應(yīng)先明確數(shù)據(jù)的法律屬性,再以數(shù)據(jù)交易所為平臺(tái)進(jìn)行交易,并對(duì)數(shù)據(jù)交易所的法律地位進(jìn)行了分析。殷建立等[12]為應(yīng)對(duì)大數(shù)據(jù)時(shí)代數(shù)據(jù)采集、交易等過程中的安全問題,綜合考慮技術(shù)、政策和管理平臺(tái)等方面的因素,構(gòu)建了一種個(gè)人數(shù)據(jù)溯源管理體系,該體系可在數(shù)據(jù)應(yīng)用時(shí)實(shí)現(xiàn)個(gè)人數(shù)據(jù)的追蹤溯源,從而保護(hù)其個(gè)人隱私。王忠[13]認(rèn)為大數(shù)據(jù)環(huán)境下強(qiáng)大的數(shù)據(jù)需求會(huì)導(dǎo)致個(gè)人數(shù)據(jù)的非法交易,為應(yīng)對(duì)這種情況,應(yīng)該建立個(gè)人數(shù)據(jù)交易許可機(jī)制,通過發(fā)放交易許可證、拍賣授予等措施實(shí)現(xiàn)隱私保護(hù)。
(4)大數(shù)據(jù)交易的發(fā)展現(xiàn)狀與問題。楊琪等[14]認(rèn)為我國(guó)的大數(shù)據(jù)交易還處于行業(yè)發(fā)展的早期,大量數(shù)據(jù)源未被激活,原因是大數(shù)據(jù)產(chǎn)業(yè)價(jià)值鏈的各個(gè)專業(yè)環(huán)節(jié)發(fā)展滯后,并且對(duì)數(shù)據(jù)交易中的安全問題和隱私泄露等有較大的擔(dān)憂。應(yīng)該對(duì)數(shù)據(jù)產(chǎn)品進(jìn)行改造,使其更商品化,并且通過政府開放公共數(shù)據(jù)等措施逐漸消除數(shù)據(jù)流通中的安全顧慮。唐斯斯等[15]首先分析了我國(guó)大數(shù)據(jù)交易的發(fā)展特點(diǎn)、交易類型等現(xiàn)狀,接著指出目前大數(shù)據(jù)交易存在法律法規(guī)相對(duì)滯后、行業(yè)標(biāo)準(zhǔn)不完善、交易平臺(tái)定位不明確、數(shù)據(jù)質(zhì)量不高等問題,最后提出應(yīng)加快相關(guān)法律和標(biāo)準(zhǔn)建設(shè),并推動(dòng)數(shù)據(jù)開放,加強(qiáng)交易方式的創(chuàng)新。
除了上述四個(gè)主要研究方向以外,李國(guó)杰等[16]從理論的角度分析了大數(shù)據(jù)研究在行業(yè)應(yīng)用和科學(xué)研究方面的重要作用,這從客觀上反映了大數(shù)據(jù)流通的必要性。涂永前等[17]認(rèn)為大數(shù)據(jù)時(shí)代企業(yè)管理和運(yùn)用數(shù)據(jù)資源的相關(guān)成本會(huì)成為企業(yè)的主要交易成本,這會(huì)改變企業(yè)的組織結(jié)構(gòu),并導(dǎo)致企業(yè)邊界的變化,企業(yè)會(huì)進(jìn)行多方向的擴(kuò)張,這為促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)法律的制定提供了理論支持??偟膩砜矗捎诖髷?shù)據(jù)交易本身屬于較新的領(lǐng)域,因此相關(guān)研究總體上較少,已有研究也大多集中在上述幾個(gè)研究方向上。實(shí)際上,大數(shù)據(jù)交易平臺(tái)是實(shí)現(xiàn)大數(shù)據(jù)交易的重要載體,是大數(shù)據(jù)資源流通轉(zhuǎn)換的主要節(jié)點(diǎn),交易平臺(tái)本身需要隨著整個(gè)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,不斷的改進(jìn)和升級(jí),而現(xiàn)有研究中恰恰缺少對(duì)大數(shù)據(jù)交易平臺(tái)本身進(jìn)行創(chuàng)新的研究。由此,本文針對(duì)現(xiàn)有大數(shù)據(jù)交易平臺(tái)的不足,結(jié)合實(shí)際設(shè)計(jì)了一種全新的融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái),為實(shí)踐和科研提供借鑒和參考。
3.現(xiàn)有大數(shù)據(jù)交易平臺(tái)的不足
大數(shù)據(jù)本身作為一種新興事物,當(dāng)把它作為一種商品進(jìn)行交易時(shí),其交易平臺(tái)的設(shè)計(jì)很自然會(huì)參照傳統(tǒng)的商品交易模式,即:交易雙方先供求信息,再經(jīng)過討價(jià)還價(jià),達(dá)到一個(gè)均衡的價(jià)格則成交,賣方將大數(shù)據(jù)資源經(jīng)過脫敏處理后,交付給買方。目前無論是政府主導(dǎo)的大數(shù)據(jù)交易所,還是企業(yè)或者高校創(chuàng)建的大數(shù)據(jù)交易平臺(tái),都是采用類似的交易模式,這也是第一代大數(shù)據(jù)交易平臺(tái)的突出特點(diǎn)。實(shí)際上大數(shù)據(jù)與傳統(tǒng)商品有很大的區(qū)別,照搬傳統(tǒng)商品的交易模式會(huì)出現(xiàn)很多問題。本文將從供需平衡、數(shù)據(jù)定價(jià)和時(shí)效性三個(gè)方面分析現(xiàn)有大數(shù)據(jù)交易平臺(tái)的不足。
3.1 數(shù)據(jù)供需的錯(cuò)配
現(xiàn)有大數(shù)據(jù)交易平臺(tái)的第一點(diǎn)不足就是數(shù)據(jù)供需的錯(cuò)配,即:供應(yīng)方提供的數(shù)據(jù)資源往往不是需求方所需要的,而需求方需要的數(shù)據(jù)在交易平臺(tái)上找不到,即使有相近的數(shù)據(jù)資源,也存在很大的數(shù)據(jù)缺失或冗余,買回去也無法使用。對(duì)數(shù)據(jù)供應(yīng)方來說,由于無法準(zhǔn)確預(yù)知數(shù)據(jù)買方多樣性的需求,它只能從自身角度出發(fā),將可以公開的、并且自認(rèn)為有價(jià)值的數(shù)據(jù)資源放到平臺(tái)上待售。對(duì)需求各異的買方來說,供應(yīng)方提供的標(biāo)準(zhǔn)數(shù)據(jù)很難與自己的應(yīng)用方向精準(zhǔn)匹配,這也是目前大數(shù)據(jù)交易還不夠活躍的原因。當(dāng)然,當(dāng)供需雙方建立初步聯(lián)系以后,供應(yīng)方甚至可以為需求方個(gè)性化定制大數(shù)據(jù)資源,但即使這樣,供需錯(cuò)配的問題仍然無法解決,原因就在于單個(gè)的數(shù)據(jù)供應(yīng)方無法提供多維的數(shù)據(jù)資源,只有多維的數(shù)據(jù)資源才具有較高的分析價(jià)值。
3.2 大數(shù)據(jù)資源定價(jià)困難
大數(shù)據(jù)資源定價(jià)困難是現(xiàn)有大數(shù)據(jù)交易平臺(tái)的第二點(diǎn)不足。大數(shù)據(jù)資源和普通商品不同,普通商品可以直接消費(fèi)或者作為再加工的原材料,其價(jià)值都可以通過最終的消費(fèi)品價(jià)格得到體現(xiàn)。而大數(shù)據(jù)本身的價(jià)值無法直接衡量,需求方購(gòu)買它的目的是作為數(shù)據(jù)分析的信息源,但是否能發(fā)現(xiàn)潛在的規(guī)律還未可知。因此無法在購(gòu)買前,準(zhǔn)確判斷出待售數(shù)據(jù)資源的價(jià)值大小。此外,需求方在不確定某大數(shù)據(jù)資源是否能真正能給組織帶來收益情況下,很難給出一個(gè)較高的價(jià)格,這在客觀上會(huì)影響數(shù)據(jù)供應(yīng)方的交易積極性,加大了供需雙方達(dá)成交易的難度。
3.3 數(shù)據(jù)的時(shí)效性不強(qiáng)
現(xiàn)有大數(shù)據(jù)交易平臺(tái)的第三點(diǎn)不足,就是數(shù)據(jù)資源的時(shí)效性不強(qiáng)。目前很多大數(shù)據(jù)交易平臺(tái)上待售的數(shù)據(jù)資源都以歷史數(shù)據(jù)為主,這是因?yàn)閿?shù)據(jù)資源在交易前需要經(jīng)歷脫敏處理,將涉及政府信息安全、企業(yè)商業(yè)機(jī)密和個(gè)人隱私等敏感信息進(jìn)行變換和替代。此外,供應(yīng)方還需要對(duì)原始數(shù)據(jù)進(jìn)行初步的清洗,整理成一定的數(shù)據(jù)格式集中存貯和交付,方便需求方進(jìn)行數(shù)據(jù)分析。由于一般的數(shù)據(jù)供應(yīng)方并不具備對(duì)大數(shù)據(jù)進(jìn)行實(shí)時(shí)脫敏和清洗的能力,只能將采集到的數(shù)據(jù)資源,經(jīng)過一段時(shí)間的離線處理后,再放到交易平臺(tái)上,所以只能供應(yīng)歷史數(shù)據(jù)。隨著社會(huì)節(jié)奏的不斷加快,歷史數(shù)據(jù)很可能并不能反映當(dāng)下的真實(shí)情況,越來越多的數(shù)據(jù)分析都需要用到實(shí)時(shí)數(shù)據(jù)作為信息源,這是未來大數(shù)據(jù)交易必須克服的一個(gè)短板。
4.融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)設(shè)計(jì)
本文提出將數(shù)據(jù)分析服務(wù)融合到目前的大數(shù)據(jù)交易中,以此來克服現(xiàn)有交易平臺(tái)的不足,本節(jié)將首先對(duì)數(shù)據(jù)分析服務(wù)進(jìn)行概念界定,再依次介紹平臺(tái)設(shè)計(jì)的總體思路和核心模塊的設(shè)計(jì),具體如下。
4.1 數(shù)據(jù)分析服務(wù)的概念界定
數(shù)據(jù)分析是指運(yùn)用各類數(shù)據(jù)處理模型和信息技術(shù)手段,對(duì)數(shù)據(jù)資源進(jìn)行深度的挖掘,從而發(fā)現(xiàn)其中蘊(yùn)含的規(guī)律,作為管理決策的依據(jù)。數(shù)據(jù)分析本身是一種能力,如果一個(gè)組織將其數(shù)據(jù)分析能力提供給其他組織或個(gè)人,并收取一定的費(fèi)用,這就是數(shù)據(jù)分析服務(wù)。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)資源不僅體量巨大而且種類多,對(duì)數(shù)據(jù)分析能力的要求不斷提高。在這種情況下,只有少數(shù)組織具備獨(dú)立處理大數(shù)據(jù)的能力,其他的組織比如大量的中小企業(yè),都需要從組織外部尋求專業(yè)的數(shù)據(jù)分析服務(wù),來滿足自身的需要。因此,數(shù)據(jù)分析服務(wù)和大數(shù)據(jù)資源一樣存在巨大的市場(chǎng)需求。
4.2 平臺(tái)設(shè)計(jì)的總體思路
本文將提出的融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái),定位為第二代大數(shù)據(jù)交易平臺(tái),它將大數(shù)據(jù)資源交易與數(shù)據(jù)分析服務(wù)兩者進(jìn)行深度融合,在交易平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)與服務(wù)的一體化交易。大數(shù)據(jù)交易平臺(tái)的角色也從原來的數(shù)據(jù)資源買賣的信息中介,轉(zhuǎn)變?yōu)榇髷?shù)據(jù)綜合服務(wù)商。在融合后的大數(shù)據(jù)交易平臺(tái)上,數(shù)據(jù)需求方不再提交數(shù)據(jù)資源的需求信息,而是直接提出自己的應(yīng)用方向和想要得到的結(jié)果,交易平臺(tái)再根據(jù)需求方的應(yīng)用方向,反向匹配數(shù)據(jù)資源和數(shù)據(jù)分析服務(wù)。這個(gè)匹配的過程不是單一的數(shù)據(jù)集或服務(wù)的查找,而是對(duì)全平臺(tái)的數(shù)據(jù)資源進(jìn)行有效整合,形成高價(jià)值的多維數(shù)據(jù),再結(jié)合復(fù)合型的數(shù)據(jù)分析技術(shù),得到最終的分析結(jié)果,最后將分析結(jié)果與基礎(chǔ)數(shù)據(jù)一同交付給需求方。交付基礎(chǔ)數(shù)據(jù)的目的,一是方便需求方進(jìn)行分析結(jié)果的對(duì)照,為決策提供更精準(zhǔn)的參考。二是需求方可以根據(jù)基礎(chǔ)數(shù)據(jù)進(jìn)行衍生挖掘,進(jìn)一步提高數(shù)據(jù)的利用效率。平臺(tái)設(shè)計(jì)的總體思路繪制成圖1。
圖1 平臺(tái)設(shè)計(jì)的總體思路
4.3 核心模塊的設(shè)計(jì)
融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)共劃分為四大模塊,具體如圖2所示。
圖2 融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)的主要模塊
系統(tǒng)管理模塊具體又分為用戶管理、系統(tǒng)維護(hù)和安全管理。安全管理是系統(tǒng)管理模塊的重點(diǎn),主要包含三個(gè)方面的功能:第一,負(fù)責(zé)整個(gè)交易平臺(tái)的系統(tǒng)安全,通過對(duì)交易平臺(tái)進(jìn)行實(shí)時(shí)監(jiān)控,阻止外部的非法入侵行為,保障平臺(tái)的正常運(yùn)行。第二,對(duì)數(shù)據(jù)供應(yīng)方提交的數(shù)據(jù)資源進(jìn)行審核,如果發(fā)現(xiàn)是非法數(shù)據(jù),則阻止其交易,并及時(shí)將有關(guān)情況反饋給相關(guān)的政府監(jiān)管部門,由它們進(jìn)行調(diào)查處理。第三,檢查所有數(shù)據(jù)是否經(jīng)過脫敏處理。如果發(fā)現(xiàn)部分?jǐn)?shù)據(jù)存在未脫敏或者脫敏不合格的情況,交易平臺(tái)將負(fù)責(zé)對(duì)該數(shù)據(jù)資源進(jìn)行脫敏處理,從而保護(hù)數(shù)據(jù)中的隱私不被泄露。
大數(shù)據(jù)資源池模塊、數(shù)據(jù)分析服務(wù)模塊和協(xié)同模塊是交易平臺(tái)的三大核心模塊,是數(shù)據(jù)與服務(wù)兩者融合并實(shí)現(xiàn)一體化交易的關(guān)鍵,本文接下來將對(duì)這三個(gè)核心模塊的功能進(jìn)行詳細(xì)設(shè)計(jì)。
4.3.1 大數(shù)據(jù)資源池模塊
大數(shù)據(jù)資源池模塊主要包含三個(gè)方面的功能:數(shù)據(jù)資源格式的整理、數(shù)據(jù)的多維度整合、大數(shù)據(jù)資源的云存貯。具體如下。
(1)數(shù)據(jù)資源格式的整理。由于大數(shù)據(jù)交易平臺(tái)上的數(shù)據(jù)資源來自不同的數(shù)據(jù)供應(yīng)方,因此其數(shù)據(jù)資源的格式會(huì)有較大的差異。如果不經(jīng)過格式整理就直接進(jìn)行數(shù)據(jù)分析,很可能會(huì)因部分?jǐn)?shù)據(jù)無法準(zhǔn)確讀取,而影響數(shù)據(jù)處理的效率,嚴(yán)重者還會(huì)導(dǎo)致數(shù)據(jù)分析中斷。數(shù)據(jù)資源格式整理的主要任務(wù)是將同一類型數(shù)據(jù)的格式進(jìn)行統(tǒng)一,對(duì)部分缺失的數(shù)據(jù)屬性進(jìn)行補(bǔ)充,對(duì)錯(cuò)誤的數(shù)據(jù)格式進(jìn)行修正。
(2)數(shù)據(jù)的多維度整合。在上文3.1中提到供需錯(cuò)配的一個(gè)重要原因,就是單個(gè)數(shù)據(jù)供應(yīng)方無法提供高價(jià)值的多維數(shù)據(jù)。所謂多維數(shù)據(jù)是包含用戶或者行業(yè)多個(gè)背景和情境的大數(shù)據(jù)資源,這些多維數(shù)據(jù)使用戶或行業(yè)多個(gè)側(cè)面的信息產(chǎn)生了關(guān)聯(lián),有利于發(fā)現(xiàn)深層次的潛在規(guī)律。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)應(yīng)該作為數(shù)據(jù)整合的主體,將單個(gè)數(shù)據(jù)供應(yīng)方提供的零散的數(shù)據(jù)資源,進(jìn)行多維度的整合,當(dāng)缺少某一個(gè)維度的數(shù)據(jù)時(shí),再向相應(yīng)的數(shù)據(jù)供應(yīng)方進(jìn)行定向的采集,最后得到相對(duì)完整的多維數(shù)據(jù),具有很高的分析價(jià)值。
(3)大數(shù)據(jù)資源的云存貯。大數(shù)據(jù)資源經(jīng)過格式整理和多維度整合以后,已經(jīng)可以作為數(shù)據(jù)分析服務(wù)的信息源。下一步就是將這些數(shù)據(jù)資源進(jìn)行統(tǒng)一的云存貯,以便數(shù)據(jù)分析服務(wù)調(diào)用。以往部分大數(shù)據(jù)資源由于體量巨大或?qū)崟r(shí)更新的需要,無法上傳到交易平臺(tái)上,或者只提供部分調(diào)用接口。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)通過建立云存貯中心,將整合后的多維數(shù)據(jù)進(jìn)行統(tǒng)一存放和調(diào)用,有助于提高數(shù)據(jù)資源的存取效率。
4.3.2 數(shù)據(jù)分析服務(wù)模塊
數(shù)據(jù)分析服務(wù)模塊首先根據(jù)數(shù)據(jù)需求方的應(yīng)用方向,匹配出合適的多維數(shù)據(jù)資源,再選擇相應(yīng)的數(shù)據(jù)分析模型分配所需的計(jì)算能力,最后將得到的分析結(jié)果反饋給需求方。本文將數(shù)據(jù)分析服務(wù)劃分為三個(gè)大類:基礎(chǔ)性分析服務(wù)、高級(jí)分析服務(wù)、深度定制的分析服務(wù)。具體如下。
(1)基礎(chǔ)性分析服務(wù)。基礎(chǔ)性分析服務(wù)是指那些常規(guī)的數(shù)據(jù)統(tǒng)計(jì),比如:總體中不同對(duì)象的占比分析,基于不同屬性的關(guān)聯(lián)分析或相關(guān)性分析等。這些分析服務(wù)耗時(shí)較短,分析技術(shù)較為簡(jiǎn)單,只要數(shù)據(jù)資源本身完備,就可以迅速得到結(jié)果?;A(chǔ)性分析服務(wù)由大數(shù)據(jù)交易平臺(tái)本身來提供,可以面對(duì)不同的需求方,實(shí)現(xiàn)快速交付。
(2)高級(jí)分析服務(wù)。高級(jí)分析服務(wù)是指那些較為復(fù)雜的數(shù)據(jù)分析服務(wù),比如:精準(zhǔn)的趨勢(shì)預(yù)測(cè)、全面的用戶興趣畫像、非結(jié)構(gòu)化的信息挖掘等。這些分析服務(wù)需要大量專業(yè)的數(shù)據(jù)處理技術(shù),比如:興趣建模、視頻分析,音頻分析、深度語義分析等,必須由大數(shù)據(jù)交易平臺(tái)對(duì)接第三方的數(shù)據(jù)分析服務(wù)商,由它們來提供高級(jí)分析服務(wù)。大數(shù)據(jù)交易平臺(tái)在同一數(shù)據(jù)分析領(lǐng)域,應(yīng)引入多家數(shù)據(jù)分析服務(wù)商,通過動(dòng)態(tài)的競(jìng)爭(zhēng),來保證服務(wù)的質(zhì)量。
(3)深度定制的分析服務(wù)。大數(shù)據(jù)分析目前還處在快速發(fā)展階段,很多前瞻性的技術(shù)還在試驗(yàn)當(dāng)中,應(yīng)該說數(shù)據(jù)分析技術(shù)的發(fā)展相對(duì)于旺盛的現(xiàn)實(shí)需求來說是滯后的。當(dāng)需要用的某一數(shù)據(jù)分析技術(shù),在目前的市場(chǎng)上還找不到現(xiàn)成的提供方時(shí),就需要大數(shù)據(jù)交易平臺(tái)為其進(jìn)行深度的定制,交易平臺(tái)通過多方位的研發(fā)能力評(píng)估,尋找合適的技術(shù)主體來進(jìn)行專門的技術(shù)攻關(guān)。
4.3.3 協(xié)同模塊
協(xié)同模塊主要包含兩個(gè)方面的功能:數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同、交易各方的管理協(xié)同。具體如下。
(1)數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同。在面臨較為復(fù)雜的數(shù)據(jù)分析任務(wù)時(shí),可能需要用到多個(gè)領(lǐng)域的數(shù)據(jù)分析技術(shù),這時(shí)單個(gè)的數(shù)據(jù)分析服務(wù)商可能無法獨(dú)立完成。因?yàn)椴煌男袠I(yè)領(lǐng)域,都有其行業(yè)技術(shù)的獨(dú)特性,需要長(zhǎng)時(shí)間的專業(yè)積累。在這種情況下,就需要多個(gè)數(shù)據(jù)分析服務(wù)商相互合作才能完成。數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同,就是通過一定的技術(shù)標(biāo)準(zhǔn)和操作規(guī)范,讓多個(gè)數(shù)據(jù)分析技術(shù)提供方,能夠在完成同一任務(wù)時(shí),在技術(shù)上不沖突,能夠相互并行的完成對(duì)數(shù)據(jù)資源的處理,按時(shí)按質(zhì)的交付最終的分析結(jié)果。
(2)交易各方的管理協(xié)同。在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)上,交易的參與者一共有四類,分別是數(shù)據(jù)資源的供應(yīng)方、數(shù)據(jù)分析服務(wù)商、需求方和交易平臺(tái)自身。數(shù)據(jù)需求方在提交自己的應(yīng)用方向和預(yù)期結(jié)果的同時(shí),提交自己的交易預(yù)算。交易平臺(tái)根據(jù)需求方提交的應(yīng)用方向和預(yù)期結(jié)果,對(duì)數(shù)據(jù)資源和數(shù)據(jù)分析服務(wù)進(jìn)行反向的選擇。如果數(shù)據(jù)分析任務(wù)中只用到了基礎(chǔ)性分析服務(wù),則整個(gè)交易為平臺(tái)方、需求方、數(shù)據(jù)資源供應(yīng)方的三方交易。如果某數(shù)據(jù)分析任務(wù),平臺(tái)自身無法完成,需要用到第三方的數(shù)據(jù)分析服務(wù)商,則整個(gè)交易包含了全部四類參與者,是一個(gè)四方交易。交易的基本原則是實(shí)現(xiàn)參與各方的利益共享。交易各方的具體利益分配如圖3所示。
圖3 交易各方的利益分配
需求方希望在獲得預(yù)期結(jié)果的同時(shí),其支付的成本在可接受的范圍內(nèi)。交易平臺(tái)在對(duì)數(shù)據(jù)和服務(wù)進(jìn)行反向匹配后,會(huì)出現(xiàn)兩種不同的情況:第一種情況是在原交易預(yù)算下,可以達(dá)到需求方預(yù)期的結(jié)果,則可成交。第二種情況是,原交易預(yù)算較低,在該預(yù)算下無法達(dá)到需求方要求的結(jié)果,這時(shí)交易平臺(tái)會(huì)和需求方溝通,提出新的報(bào)價(jià),需求方經(jīng)過考慮后,與平臺(tái)進(jìn)行討價(jià)還價(jià),它們?cè)趦r(jià)格上達(dá)成一致時(shí)才能完成交易。由于交易數(shù)據(jù)是整合后的多維數(shù)據(jù),因此原始數(shù)據(jù)資源供應(yīng)方的收益,由平臺(tái)從總交易價(jià)中支付,具體的支付方式可分為平臺(tái)一次性買斷或按次數(shù)支付。同一數(shù)據(jù)資源對(duì)于不同的需求者來說,其價(jià)值是不一樣的,融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)根據(jù)最終的一體化交易成交價(jià),反向?qū)?shù)據(jù)資源進(jìn)行定價(jià),相對(duì)于現(xiàn)有的大數(shù)據(jù)交易平臺(tái)來說,是一種進(jìn)步。交易平臺(tái)的深度參與,會(huì)使數(shù)據(jù)交易的頻率加快,原始數(shù)據(jù)資源供應(yīng)方會(huì)獲得更多的收益。數(shù)據(jù)分析服務(wù)商根據(jù)具體的數(shù)據(jù)分析任務(wù),直接參與由平臺(tái)發(fā)起的競(jìng)價(jià),達(dá)成交易后由平臺(tái)支付。交易平臺(tái)本身的收益則是需求方支付額減去其他各方收益的差價(jià)。
5.融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)的優(yōu)勢(shì)
本文3.1到3.3中指出現(xiàn)有大數(shù)據(jù)交易平臺(tái)存在數(shù)據(jù)供需錯(cuò)配、大數(shù)據(jù)資源定價(jià)困難、數(shù)據(jù)的時(shí)效性不強(qiáng)三大不足。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)作為改進(jìn)后的第二代大數(shù)據(jù)交易平臺(tái),可以很好地克服上述三點(diǎn)不足。除了這三個(gè)方面的優(yōu)勢(shì)以外,由于融合后可實(shí)現(xiàn)數(shù)據(jù)與服務(wù)的一體化交易,這將擴(kuò)大交易對(duì)象的覆蓋范圍,提升交易的活力,具體如下。
5.1 直接面向應(yīng)用,從根本上避免了數(shù)據(jù)供需的錯(cuò)配
在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)上,需求方對(duì)交易平臺(tái)直接提出應(yīng)用方向和預(yù)期結(jié)果。交易平臺(tái)對(duì)全平臺(tái)的數(shù)據(jù)進(jìn)行多維度整合,如果缺失某個(gè)維度的數(shù)據(jù),可以進(jìn)行定向的采集和補(bǔ)充,最后形成高價(jià)值的多維數(shù)據(jù)。這些多維數(shù)據(jù)才是真正具有分析價(jià)值的數(shù)據(jù)資源,這是單個(gè)數(shù)據(jù)供應(yīng)方無法提供的。在得到多維數(shù)據(jù)后,結(jié)合平臺(tái)自身和第三方數(shù)據(jù)服務(wù)商的分析能力,得到最終的分析結(jié)果。交易平臺(tái)最后交付給需求方的是數(shù)據(jù)分析結(jié)果和基礎(chǔ)數(shù)據(jù),這種直接面向最終應(yīng)用的大數(shù)據(jù)交易方式,從根本上避免了數(shù)據(jù)供需的錯(cuò)配。
5.2 融合后定價(jià)更有根據(jù)
在現(xiàn)有的大數(shù)據(jù)平臺(tái)上,數(shù)據(jù)需求方是將數(shù)據(jù)資源買回去以后自己分析,而在購(gòu)買數(shù)據(jù)資源之前,不能預(yù)知數(shù)據(jù)分析效果的好壞,因此無法進(jìn)行有效的價(jià)值判斷,這是定價(jià)困難的關(guān)鍵點(diǎn)。在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)上,需求方不再直接對(duì)數(shù)據(jù)資源付費(fèi),而是對(duì)最終的數(shù)據(jù)分析結(jié)果付費(fèi),并且數(shù)據(jù)分析結(jié)果是根據(jù)需求方的要求反向定制的,是符合需求方利益的。需求方可以通過評(píng)估預(yù)期結(jié)果對(duì)自身的重要性或收益的改進(jìn)程度,給出適當(dāng)?shù)慕灰最A(yù)算。交易平臺(tái)以該預(yù)算為參照,對(duì)數(shù)據(jù)和服務(wù)進(jìn)行選擇,若出現(xiàn)原預(yù)算約束下無法實(shí)現(xiàn)預(yù)期結(jié)果的情況,交易平臺(tái)再與需求方進(jìn)行溝通,雙方討價(jià)還價(jià)后達(dá)成交易。這樣相對(duì)于現(xiàn)有的大數(shù)據(jù)交易平臺(tái)來說,融合后定價(jià)更有依據(jù)。
5.3 融合后可提供實(shí)時(shí)數(shù)據(jù)
在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)上,數(shù)據(jù)資源采用云存貯的模式,由平臺(tái)進(jìn)行統(tǒng)一管理,這提高了數(shù)據(jù)資源的安全性。在數(shù)據(jù)安全有保障的前提下,由交易平臺(tái)出面和數(shù)據(jù)資源供應(yīng)方進(jìn)行實(shí)時(shí)數(shù)據(jù)的對(duì)接,將實(shí)時(shí)數(shù)據(jù)納入大數(shù)據(jù)資源池中。對(duì)于單個(gè)的數(shù)據(jù)資源供應(yīng)方來說,實(shí)時(shí)的數(shù)據(jù)脫敏難度太大。但大數(shù)據(jù)交易平臺(tái)不一樣,它可以利用規(guī)模優(yōu)勢(shì),組建強(qiáng)大的計(jì)算能力,對(duì)大數(shù)據(jù)資源進(jìn)行實(shí)時(shí)的脫敏和清洗,極大地提高了數(shù)據(jù)資源的時(shí)效性。
5.4 融合后將擴(kuò)大交易對(duì)象的覆蓋范圍,提升交易的活力
融合后可實(shí)現(xiàn)數(shù)據(jù)和服務(wù)的一體化交易,讓很多自身不具備數(shù)據(jù)分析能力的組織和個(gè)人,也能方便地利用大數(shù)據(jù),特別是大量的中小企業(yè),這將大大增加交易對(duì)象的覆蓋范圍。
交易對(duì)象的增多會(huì)促進(jìn)交易頻率的增長(zhǎng),從而為數(shù)據(jù)資源供應(yīng)方帶來更多的收益,這樣會(huì)提升它們參與交易的積極性,鼓勵(lì)它們供應(yīng)更多的數(shù)據(jù)資源,從而提升交易的活力,整個(gè)大數(shù)據(jù)交易行業(yè)就形成了正向循環(huán)的良好發(fā)展態(tài)勢(shì)。
6結(jié)語
本文對(duì)大數(shù)據(jù)交易平臺(tái)本身進(jìn)行了改進(jìn)與創(chuàng)新,設(shè)計(jì)了一種全新的第二代大數(shù)據(jù)交易平臺(tái),即:融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺(tái)。該交易平臺(tái)可以直接面向需求方的應(yīng)用方向,實(shí)現(xiàn)數(shù)據(jù)和服務(wù)的一體化交易,不僅從根本上避免了數(shù)據(jù)供需的錯(cuò)配,還使大數(shù)據(jù)交易的定價(jià)更有依據(jù),平臺(tái)的深度參也讓提供實(shí)時(shí)數(shù)據(jù)成為可能,這些將從整體上提升大數(shù)據(jù)交易的效率。融合后數(shù)據(jù)和服務(wù)的一體化交易降低了大數(shù)據(jù)應(yīng)用的技術(shù)門檻,鼓勵(lì)更多組織和個(gè)人參與,增加了交易活力。未來筆者將繼續(xù)關(guān)注大數(shù)據(jù)交易平臺(tái)的創(chuàng)新研究,為實(shí)際應(yīng)用和學(xué)術(shù)科研提供更多有益的參考。
參考文獻(xiàn)
[1]趙強(qiáng),單煒.大數(shù)據(jù)政府創(chuàng)新:基于數(shù)據(jù)流的公共價(jià)值創(chuàng)造[J].中國(guó)科技論壇,2014(12):23-27.
[2]徐繼華,馮啟娜,陳貞汝.智慧政府:大數(shù)據(jù)治國(guó)時(shí)代的來臨[M].北京:中信出版社,2014.
[3]李文蓮,夏健明.基于“大數(shù)據(jù)”的商業(yè)模式創(chuàng)新[J].中國(guó)工業(yè)經(jīng)濟(jì),2013(5):83-95.
[4]侯錫林,李天柱,馬佳,等.大數(shù)據(jù)環(huán)境下企業(yè)創(chuàng)新機(jī)會(huì)研究[J].科技進(jìn)步與對(duì)策,2014,31(24):82-86.
[5]張峰,張迪.論大數(shù)據(jù)時(shí)代科研方法新特征及其影響[J].科學(xué)學(xué)研究,2016,34(2):166-170,202.
[6]王玉林,高富平.大數(shù)據(jù)的財(cái)產(chǎn)屬性研究[J]。圖書與情報(bào),2016(1):29-35,43.
[7]齊愛民,盤佳.數(shù)據(jù)權(quán)、數(shù)據(jù)主權(quán)的確立與大數(shù)據(jù)保護(hù)的基本原則[J].蘇州大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2015(1):64-70.
[8]劉朝陽.大數(shù)據(jù)定價(jià)問題分析[J].圖書情報(bào)知識(shí),2016(1):57-64.
[9]劉洪玉,張曉玉,侯錫林.基于討價(jià)還價(jià)博弈模型的大數(shù)據(jù)交易價(jià)格研究[J].中國(guó)冶金教育,2015(6):86-91.
[10]翟麗麗,王佳妮,何曉燕.移動(dòng)云計(jì)算聯(lián)盟企業(yè)數(shù)據(jù)資產(chǎn)評(píng)估方法研究[J].價(jià)格理論與實(shí)踐,2016(2):153-156.
[11]史宇航.個(gè)人數(shù)據(jù)交易的法律規(guī)制[J].情報(bào)理論與實(shí)踐,2016,39(5):34-39.
[12]殷建立,王忠.大數(shù)據(jù)環(huán)境下個(gè)人數(shù)據(jù)溯源管理體系研究[J].情報(bào)科學(xué),2016,34(2):139-143.
[13]王忠.大數(shù)據(jù)時(shí)代個(gè)人數(shù)據(jù)交易許可機(jī)制研究[J].理論月刊,2015(6):131-135.
一、市場(chǎng)調(diào)查
根據(jù)一份市場(chǎng)調(diào)查顯示;賣家本身體現(xiàn)的實(shí)力給人與信任可依賴程度越高,用戶越愿意來購(gòu)買商品。
在我評(píng)論之前,我申明一下,一家之言只代表一個(gè)群體的言論,并不能涵蓋每個(gè)人的想法與判斷,電子商務(wù)的數(shù)據(jù)報(bào)告只能說明趨勢(shì),并不能完全反應(yīng)出每個(gè)顧客真實(shí)的意圖。賣家信譽(yù)-28%。價(jià)格-26%。網(wǎng)站的外觀和感覺-16%。網(wǎng)站易用性-15%。商品打折-4%。快遞和交付等原因-3%。出現(xiàn)在搜索引擎上-2%。
這是一份市場(chǎng)調(diào)查的結(jié)果,數(shù)據(jù)報(bào)告對(duì)實(shí)際商業(yè)產(chǎn)生怎樣的影響,一個(gè)關(guān)鍵問題就是篩選問題的分類方式,他是否獨(dú)立又相互依存,論點(diǎn)論據(jù)之間重合度越低,數(shù)據(jù)報(bào)告能說明的問題越準(zhǔn)確。但在這之前首先是樣本數(shù)據(jù)的獲取與篩選方法,這里就不追溯了。我只是想根據(jù)個(gè)人對(duì)電子商務(wù)的理解,結(jié)合這份報(bào)告說點(diǎn)事,實(shí)際上這一組數(shù)據(jù)比較接近我個(gè)人對(duì)網(wǎng)購(gòu)的理解,首先我們逐條說明這些影響一個(gè)網(wǎng)店的因素:
二、賣家信譽(yù)
之所以被普遍認(rèn)為是最重要的,是因?yàn)槲覀兙W(wǎng)購(gòu)時(shí)并不真實(shí)的接觸到產(chǎn)品,也并不了解向你推銷商品的人是否值得可信,這都是顧客基本的一個(gè)需要認(rèn)知過程,互聯(lián)網(wǎng)上哪里去確認(rèn)?當(dāng)然如果你在一家多賣家的平臺(tái)上,往往都會(huì)有商家信用,評(píng)論等功能,很容易通過別的顧客消費(fèi)情況增加自己對(duì)商家的認(rèn)知。電子商務(wù)為什么要打假信用?這只是順應(yīng)顧客需求,維護(hù)健康秩序所必須做的事情。所以作為賣家不要輕易嘗試作假信用,或者你今天逃過一劫,但說不定你明天網(wǎng)店剛做大的時(shí)候被強(qiáng)行關(guān)閉了。
三、價(jià)格
價(jià)格是一道屏障,在相互比拼中,有人拼得起,有人拼不起,但如何更好的控制價(jià)格,削減顧客成本,不僅為自己贏得更多展示機(jī)會(huì),也會(huì)贏得更多顧客。價(jià)格不會(huì)是越低廉越好,最好的平衡體系沒有,只有一個(gè)方法,如何在綜合上為自己贏得市場(chǎng)??有人習(xí)慣選一些比如3.99美元的價(jià)格,看上去不加拿一分錢顧客潛在心理是這個(gè)人沒賺錢,但值得說的是商品定價(jià)因產(chǎn)品,因地域時(shí)間,顧客等因素制宜,現(xiàn)在的顧客不都是傻子,商品有的是比價(jià)機(jī)會(huì)。也有人選擇款0利潤(rùn)或者賠本的商品推,但在商品里關(guān)聯(lián)組合商品賣,通過吸引用戶購(gòu)買自己的組合商品或者別的商品來拉動(dòng)自己銷售利潤(rùn);還有的人也是利用免費(fèi)贈(zèng)送或者賠本的方式掛商品,但通過物流利潤(rùn)來保證自己不虧本的方式拉動(dòng)店鋪其他產(chǎn)品行銷。
四、網(wǎng)站的外觀與感覺
有的人店鋪半年一年都是淘寶默認(rèn)的最爛的那套模板,也不知道為什么淘寶沒更新還是咋的,我沒賣過商品,還不是很了解那個(gè),但我買東西基本不光顧這樣的店鋪,店主對(duì)店鋪的打理程度決定了我對(duì)店主的看法,因?yàn)樾庞貌皇墙^對(duì)可靠的;產(chǎn)品,服務(wù)好不好,全在你的形象與行為上。
五、網(wǎng)站易用性
你能忍受自己在一個(gè)網(wǎng)站嘩啦了半天結(jié)果沒搞懂應(yīng)該怎么買商品嗎?我一個(gè)朋友,按照我的認(rèn)識(shí)他也是比較理性,屬于心思敏捷的,他說他在XX網(wǎng)站搞了好久,都不知道怎么買東西,所以以后都沒去過;雖然易用的應(yīng)用都還是不能被所有人接受,但簡(jiǎn)單清楚的,沒有歧義的每一步流程總是好的。不過這個(gè)雖然用戶關(guān)注的多,但我覺得但凡有點(diǎn)認(rèn)識(shí)的,認(rèn)識(shí)相應(yīng)語言的人大概都明白很多網(wǎng)購(gòu)系統(tǒng)的操作流程。這里就不說什么了。
六、促銷打折
商品打折也屬于價(jià)格范疇,只是這里細(xì)化成了一個(gè)活動(dòng),活動(dòng)可以是定期的比如每周二,三,四晚上限量搶購(gòu)??;選2款顧客競(jìng)價(jià)啊;前面“價(jià)格”里也提到的0價(jià)格換信用,換軟文之類的?。粎⑴c商盟聯(lián)合促銷??;換季狂甩啊之類的??傊畢⑴c打折的,有資本經(jīng)歷運(yùn)作打折的,只要PV高,顧客肯定不會(huì)少,除非你的商品含有價(jià)格,性能,服務(wù)等水分太大,用什么樣的打折方法,最關(guān)鍵的你是銷售一時(shí)還是為了希望吸引到長(zhǎng)久的顧客而去設(shè)計(jì)。
七、快遞與交付等原因
物流過程中雖然有很多不可控因素導(dǎo)致一些商品容易磨損之類的,但物流懼怕承擔(dān)責(zé)任的態(tài)度決定了自己的發(fā)展框架,假設(shè)一下,你的企業(yè)就在你的心胸里;你心胸只有100㎡大小,即使你鼓足了勁你也最多到120㎡,這樣的容量是沒有辦法和猶如大海寬廣心胸的人比較的。我是沒記住你,但有人記住你了,他下次要走物流,肯定不會(huì)選你,你損失的不只是一個(gè)用戶,而是損失了一個(gè)未來。
八、搜索排名
我沒有看到他們分析提交的數(shù)據(jù)時(shí)基于怎樣的搜索引擎,這個(gè)分類其實(shí)很不準(zhǔn)確,雖然數(shù)字已經(jīng)很少了,我自己買商品在淘寶,有啊上都用他們站內(nèi)的搜索引擎,如果我常用的幾個(gè)排序商品方法篩選數(shù)據(jù)你都沒排列在前三頁,那么即使你離我最近,就住在我隔壁,你服務(wù)態(tài)度最好,商品也不必別人的差;但你離我還是太遠(yuǎn)了,我根本找不到你。
對(duì)我個(gè)人來說,像百度,GOOGLE的網(wǎng)頁搜索這樣的綜合搜索出來的商品,對(duì)我吸引力太小了,綜合搜索出來的商品并不是他信譽(yù)最高,價(jià)格最低,服務(wù)最好就顯示在了綜合搜索引擎上,只因?yàn)樗捻撁娓m合搜索引擎邏輯而已。商品真正追求的東西不在文本上,而在商品與服務(wù)內(nèi)在的東西里。當(dāng)然,在同等條件下,不要錯(cuò)過這樣一個(gè)增加PV與交易機(jī)會(huì)的機(jī)會(huì)。
九、總結(jié)
目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場(chǎng)競(jìng)爭(zhēng)中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會(huì)。現(xiàn)在世界上的主要數(shù)據(jù)庫(kù)廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國(guó)在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢(shì)必會(huì)有更好的商業(yè)機(jī)會(huì)和更光明的前景。
參考文獻(xiàn):
[1]韓家煒.Web挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2001.
[2]陳宏.消費(fèi)者數(shù)據(jù)挖掘系統(tǒng)建立的幾個(gè)問題.
BI商業(yè)智能軟件一般都會(huì)提供若干數(shù)據(jù)整合、數(shù)據(jù)查詢、分析與評(píng)價(jià)、數(shù)據(jù)可視化及數(shù)據(jù)分享的手段,但是在BI項(xiàng)目的構(gòu)建與實(shí)施過程中,如果不按照一定的應(yīng)用組織思路、數(shù)據(jù)分析模式及分析流程使用這些工具或手段,呈現(xiàn)給最終用戶的將是獨(dú)立的工具集和離散的分析內(nèi)容,BI系統(tǒng)的整體應(yīng)用效果將大打折扣。同時(shí),最終用戶也了解數(shù)據(jù)分析模式及數(shù)據(jù)分析流程方面的一些常用理論和方法,以便形成自己的分析內(nèi)容組織思路,從而有效開展數(shù)據(jù)決策分析工作。這方面目前已有多種卓有成效的理論及實(shí)踐體系,本文基于既往經(jīng)歷的典型BI/DW項(xiàng)目實(shí)施經(jīng)驗(yàn)及對(duì)BI軟件規(guī)劃研發(fā)和實(shí)施經(jīng)驗(yàn),給出一種BI系統(tǒng)中的數(shù)據(jù)分析內(nèi)容及分析流程組織思路。
1.整體應(yīng)用模式
在商業(yè)智能項(xiàng)目(DW/BI項(xiàng)目)中,通過梳理和優(yōu)化現(xiàn)有的指標(biāo)、報(bào)表體系和分析體系,同時(shí)整合主要的業(yè)務(wù)系統(tǒng)數(shù)據(jù)(業(yè)務(wù)核心支撐系統(tǒng)、財(cái)務(wù)系統(tǒng)、HR系統(tǒng)、手工維護(hù)的數(shù)據(jù)如行業(yè)數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)等),從而建立面向總部和子公司的業(yè)務(wù)及IT等部門,集中使用、管理和維護(hù)的BI商業(yè)智能系統(tǒng),以強(qiáng)化信息共享、業(yè)務(wù)分析、輔助管理決策工作。
在系統(tǒng)構(gòu)建思路(系統(tǒng)整體應(yīng)用模式)方面,面向數(shù)據(jù)分析的BI商業(yè)智能系統(tǒng)構(gòu)建工作應(yīng)達(dá)到如下目標(biāo):
2.數(shù)據(jù)分析模式
在數(shù)據(jù)分析的原理及模式方面,BI商業(yè)智能系統(tǒng)可采取PDCA管理循環(huán)理論的分析問題的模式,PDCA管理循環(huán)理論起初應(yīng)用于質(zhì)量檢查與保障優(yōu)化領(lǐng)域,后來在精細(xì)化管理及數(shù)據(jù)分析與決策領(lǐng)域卓有成效。
應(yīng)用在商業(yè)智能項(xiàng)目(BI/DW類)中時(shí),PDCA管理循環(huán)理論的P、D、C、A四個(gè)英文字母所代表的意義如下:
1)P(Plan)——計(jì)劃
包括方針和目標(biāo)的確定以及活動(dòng)計(jì)劃的制定,包括業(yè)務(wù)發(fā)展目標(biāo)(goal),中期計(jì)劃(plan),年度、季度及月度預(yù)算等(budget)。
計(jì)劃環(huán)節(jié)的內(nèi)容觸發(fā)了BI商業(yè)智能系統(tǒng)應(yīng)當(dāng)具有導(dǎo)入并集成計(jì)劃與預(yù)算等相關(guān)數(shù)據(jù)的能力這一要求,而計(jì)劃及預(yù)算的制定工作,一般則是通過在專項(xiàng)的計(jì)劃與預(yù)算管理系統(tǒng)中進(jìn)行。也有個(gè)別BI廠商基于自定義的填報(bào)方案為客戶提供計(jì)劃和預(yù)算的下發(fā)與上報(bào)等管理功能。
2)D(DO)——執(zhí)行
執(zhí)行就是具體運(yùn)作,實(shí)現(xiàn)計(jì)劃中的內(nèi)容。在BI商業(yè)智能系統(tǒng)需要對(duì)及時(shí)、準(zhǔn)確的反應(yīng)業(yè)務(wù)的現(xiàn)狀提供必要的、充分的手段,包括圍繞業(yè)務(wù)整體狀況及各個(gè)業(yè)務(wù)面構(gòu)建的Dashboard、報(bào)表、查詢、預(yù)警及其他數(shù)據(jù)分析及可視化手段。
有比較才能明了現(xiàn)狀,有參照才能進(jìn)行比較。因此BI商業(yè)智能系統(tǒng)還應(yīng)該提供來自內(nèi)部、外部的參照體系,比如計(jì)劃數(shù)據(jù)、歷史數(shù)據(jù)、標(biāo)桿數(shù)據(jù)、競(jìng)爭(zhēng)數(shù)據(jù)等,以便對(duì)業(yè)務(wù)現(xiàn)狀的健康程度有足夠的參照依據(jù)。
3)C(Check)——檢查
就是要檢查并總結(jié)執(zhí)行計(jì)劃的結(jié)果,分清哪些對(duì)了,哪些錯(cuò)了,明確效果,找出問題。
在BI商業(yè)智能系統(tǒng)中,應(yīng)提供相應(yīng)的對(duì)比和評(píng)價(jià)手段,如各類計(jì)劃的達(dá)成情況分析、標(biāo)桿分析、綜合績(jī)效評(píng)價(jià)、EVA評(píng)價(jià)等手段,以便對(duì)一個(gè)業(yè)務(wù)周期的效果進(jìn)行分析與評(píng)價(jià)。
該部分的分析粒度應(yīng)有所提高(如沿著時(shí)間、人員等維度),分析的范圍相應(yīng)縮窄,結(jié)合管理及業(yè)務(wù)現(xiàn)狀有針對(duì)性對(duì)總體及關(guān)鍵業(yè)務(wù)環(huán)節(jié)設(shè)立專項(xiàng)檢查與評(píng)價(jià)手段,檢查評(píng)價(jià)的內(nèi)容一般集中在業(yè)務(wù)效率及財(cái)務(wù)表現(xiàn)等方面。
4)A(Action)——處理
對(duì)上文Check環(huán)節(jié)檢查的結(jié)果進(jìn)行處理,管理人員通過仔細(xì)分析內(nèi)在原因之后對(duì)檢車結(jié)果認(rèn)可、否定或調(diào)整改進(jìn)相關(guān)參數(shù)及結(jié)果。并利用有效的結(jié)果針對(duì)性的開展相關(guān)商務(wù)政策及管理措施等。
比如,在既往實(shí)施的多個(gè)經(jīng)銷商網(wǎng)絡(luò)管理商業(yè)智能項(xiàng)目中,Action環(huán)節(jié)落實(shí)為相應(yīng)銷售政策、獎(jiǎng)罰措施及總部向各經(jīng)銷商、商的利潤(rùn)返還計(jì)劃,同時(shí)也落實(shí)為對(duì)下一輪業(yè)務(wù)目標(biāo)計(jì)劃數(shù)據(jù)的調(diào)整。
3.數(shù)據(jù)分析流程
1引言
本課題來源于中央廣播電視大學(xué)教務(wù)管理系統(tǒng)的后續(xù)開發(fā)。隨著中央電大在開放式教育思想指導(dǎo)下的教學(xué)改革的展開,系統(tǒng)業(yè)務(wù)量急劇猛增,原有的教學(xué)管理系統(tǒng)已經(jīng)逐漸的滿足不了應(yīng)用需求。所以新一代教學(xué)管理系統(tǒng)正在開發(fā)中,同時(shí)由于教育業(yè)務(wù)本身的連貫性,導(dǎo)致了新舊系統(tǒng)并行的局面出現(xiàn)。但是由于新舊系統(tǒng)間缺少關(guān)聯(lián)和通信以及必要的規(guī)范,導(dǎo)致信息“孤島”現(xiàn)象嚴(yán)重,而舊系統(tǒng)又恰恰是電大不可放棄的重要投資。同時(shí)由于各個(gè)系統(tǒng)集成度不足,運(yùn)行業(yè)務(wù)的數(shù)據(jù)庫(kù)和應(yīng)用程序也是在不同時(shí)期部署的,它們來自不同的供應(yīng)商,使用各不相同的定制技術(shù)。從而面臨著如何構(gòu)建一個(gè)強(qiáng)壯的、可靠的,將新舊系統(tǒng)中的分散功能組織成可共用的標(biāo)準(zhǔn)服務(wù)來滿足業(yè)務(wù)要求的平臺(tái),成為我們需要研究的難點(diǎn)。
通過實(shí)踐我們可以發(fā)現(xiàn),應(yīng)用程序始終都與數(shù)據(jù)有關(guān),企業(yè)級(jí)的服務(wù)程序更是如此。今天,企業(yè)應(yīng)用程序開發(fā)中有高達(dá)70%的時(shí)間都是用于訪問不同的數(shù)據(jù)。因此,對(duì)企業(yè)信息和數(shù)據(jù)按業(yè)務(wù)邏輯進(jìn)行梳理和抽取,形成企業(yè)數(shù)據(jù)的統(tǒng)一表現(xiàn)實(shí)體,該實(shí)體可以在全企業(yè)范圍內(nèi)得到一致性的使用,是邁向面向服務(wù)的體系架構(gòu)的第一步。因此我們提出了主題數(shù)據(jù)平臺(tái)的概念。
2主題數(shù)據(jù)平臺(tái)結(jié)構(gòu)
主題數(shù)據(jù)平臺(tái)結(jié)構(gòu)見圖1。主題數(shù)據(jù)平臺(tái)由:主題數(shù)據(jù)服務(wù)層、數(shù)據(jù)處理構(gòu)件、數(shù)據(jù)處理管道、適配器構(gòu)件組成。
圖1數(shù)據(jù)主題平臺(tái)的設(shè)計(jì)構(gòu)架
主題數(shù)據(jù)服務(wù)層:是底層接口與上層應(yīng)用的中間層,用于屏蔽底層接口,向上提供統(tǒng)一的服務(wù)。有兩種角色:一種角色是數(shù)據(jù)中轉(zhuǎn)站,用于保存臨時(shí)數(shù)據(jù),并等數(shù)據(jù)傳輸完整之后,進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行分析和處理;另一種角色是主題數(shù)據(jù)服務(wù)層角色,用于保存數(shù)據(jù)處理的最終結(jié)果:主題數(shù)據(jù)。
數(shù)據(jù)處理構(gòu)件:是數(shù)據(jù)處理的基礎(chǔ)構(gòu)件,每一個(gè)數(shù)據(jù)處理構(gòu)件都封裝了一部分相對(duì)獨(dú)立的數(shù)據(jù)處理邏輯,包括刪除不需要的數(shù)據(jù)、補(bǔ)充缺少的數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的四則運(yùn)算、代碼轉(zhuǎn)換和按主題建立新的數(shù)據(jù)結(jié)構(gòu)等功能。
數(shù)據(jù)處理管道:是由多個(gè)數(shù)據(jù)處理構(gòu)件組成,它合理的組合和安排這些數(shù)據(jù)處理構(gòu)件,從而完成復(fù)雜的數(shù)據(jù)處理邏輯。
適配器構(gòu)件:用于實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫(kù)與數(shù)據(jù)處理管道的無縫連接,從而能夠方便的從異構(gòu)數(shù)據(jù)庫(kù)中抽取或插入數(shù)據(jù)。
3基于局域網(wǎng)的主題數(shù)據(jù)平臺(tái)的實(shí)現(xiàn)方案
基于局域網(wǎng)的主題數(shù)據(jù)平臺(tái)的實(shí)現(xiàn)方案見圖2。
圖2基于局域網(wǎng)的數(shù)據(jù)主題平臺(tái)的實(shí)現(xiàn)方案
由于局域網(wǎng)有著:網(wǎng)絡(luò)傳輸速度快、網(wǎng)絡(luò)故障率低、即時(shí)性強(qiáng)、服務(wù)器固定等優(yōu)點(diǎn)。所以我們采用:DTS技術(shù)、Nmake技術(shù)、臨時(shí)庫(kù)等技術(shù)來解決基于局域網(wǎng)的主題數(shù)據(jù)平臺(tái)的實(shí)現(xiàn)問題。
3.1DTS技術(shù)的應(yīng)用
采用DTS技術(shù)可以實(shí)現(xiàn)在局域網(wǎng)中從異構(gòu)的數(shù)據(jù)庫(kù)中提取或插入數(shù)據(jù),并能對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的邏輯操作。它可以把相對(duì)獨(dú)立的數(shù)據(jù)處理邏輯封裝在對(duì)應(yīng)的DTS包中,從而把公用的數(shù)據(jù)處理邏輯從數(shù)據(jù)處理業(yè)務(wù)中提煉了出來,以備復(fù)用。并提供了工作流支持,保證了DTS包中數(shù)據(jù)處理業(yè)務(wù)的事務(wù)性和完整性。
⑴適配器構(gòu)件
適配器構(gòu)件只是一個(gè)數(shù)據(jù)處理通道和異構(gòu)數(shù)據(jù)源的連接器,它負(fù)責(zé)從異構(gòu)數(shù)據(jù)源中抽取或者插入數(shù)據(jù)并將數(shù)據(jù)轉(zhuǎn)移到數(shù)據(jù)處理通道中。每一個(gè)數(shù)據(jù)源對(duì)應(yīng)一個(gè)或多個(gè)適配器構(gòu)件,每個(gè)適配器構(gòu)件包含在對(duì)應(yīng)的DTS包中。整個(gè)DTS包中包含一個(gè)原數(shù)據(jù)源、一個(gè)目標(biāo)數(shù)據(jù)源和一個(gè)數(shù)據(jù)對(duì)應(yīng)轉(zhuǎn)換任務(wù)。將整個(gè)數(shù)據(jù)轉(zhuǎn)換邏輯封裝為一個(gè)構(gòu)件,有利于適配器構(gòu)件的復(fù)用。
⑵數(shù)據(jù)處理構(gòu)件
數(shù)據(jù)處理構(gòu)件封裝了數(shù)據(jù)處理邏輯,這些處理邏輯由數(shù)據(jù)業(yè)務(wù)驅(qū)動(dòng),包括刪除不需要的數(shù)據(jù)、從不同的數(shù)據(jù)來源補(bǔ)齊缺少的數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的四則運(yùn)算、不同信息系統(tǒng)之間的代碼轉(zhuǎn)換等功能。數(shù)據(jù)處理邏輯按其獨(dú)立性和公用性被封裝在不同的DTS包中,增強(qiáng)了數(shù)據(jù)處理構(gòu)件的可變性和復(fù)用性。DTS包提供了驗(yàn)證機(jī)制這既可以保證數(shù)據(jù)處理邏輯的正確性,又可以保證數(shù)據(jù)處理邏輯的事務(wù)性。DTS包內(nèi)包含工作流,可以針對(duì)不同的情況做出不同的處理,極大地提高了數(shù)據(jù)處理構(gòu)件的復(fù)用性,并可對(duì)業(yè)務(wù)性錯(cuò)誤做出必要的處理。
3.2Nmake技術(shù)的應(yīng)用
Microsoft程序維護(hù)實(shí)用工具Nmake是一個(gè)32位基于說明文件中包含的命令生成項(xiàng)目的工具。NMake具有豐富的選項(xiàng),可以完成復(fù)雜的處理操作,并有樹狀文件任務(wù)處理結(jié)構(gòu),并且易于編寫,結(jié)構(gòu)清晰,對(duì)于實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)處理業(yè)務(wù)提供了很大的方便。采用Nmake技術(shù)可以有效的將結(jié)構(gòu)松散的、相對(duì)獨(dú)立的數(shù)據(jù)處理構(gòu)件聚合起來,從而能夠處理復(fù)雜的數(shù)據(jù)處理業(yè)務(wù)。
數(shù)據(jù)處理管道
數(shù)據(jù)處理管道是將數(shù)據(jù)處理構(gòu)件有機(jī)的組合起來并封裝好,對(duì)主題數(shù)據(jù)服務(wù)層提供統(tǒng)一的訪問接口,從而把數(shù)據(jù)服務(wù)邏輯與數(shù)據(jù)處理邏輯分割開來。數(shù)據(jù)處理管道可以極大地提高數(shù)據(jù)處理構(gòu)件的復(fù)用率,并把復(fù)雜的數(shù)據(jù)處理邏輯從數(shù)據(jù)處理構(gòu)件中抽離了出來,當(dāng)數(shù)據(jù)處理業(yè)務(wù)變動(dòng)的時(shí)候不需要修改構(gòu)件只要按著業(yè)務(wù)需求,重新組織構(gòu)件即可解決問題。Nmake可以按著業(yè)務(wù)需求輕松地把數(shù)據(jù)處理構(gòu)件組合起來形成帶有業(yè)務(wù)邏輯關(guān)系的數(shù)據(jù)處理管道,并且Nmake提供了業(yè)務(wù)流功能,針對(duì)不同的業(yè)務(wù)需求可以提供不同的業(yè)務(wù)流支持,從而極大的提高業(yè)務(wù)本身的靈活性。當(dāng)業(yè)務(wù)需求變動(dòng)時(shí),Nmake可以通過重新組合數(shù)據(jù)處理構(gòu)件來完成業(yè)務(wù),而不需修改或者重新編寫數(shù)據(jù)處理構(gòu)件,從而提高數(shù)據(jù)處理構(gòu)件的可復(fù)用性。
4基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺(tái)的解決方案
基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺(tái)面臨的主要問題是如何通過遠(yuǎn)程數(shù)據(jù)傳輸將互聯(lián)網(wǎng)的異地、異構(gòu)的數(shù)據(jù)源中的數(shù)據(jù)傳輸?shù)街黝}數(shù)據(jù)服務(wù)層中。數(shù)據(jù)一旦進(jìn)入主題數(shù)據(jù)平臺(tái)的主題數(shù)據(jù)服務(wù)層,就可以使用和基于局域網(wǎng)的解決方案相同的技術(shù)對(duì)數(shù)據(jù)進(jìn)行整理。通過遠(yuǎn)程數(shù)據(jù)傳輸將互聯(lián)網(wǎng)的異構(gòu)數(shù)據(jù)傳輸?shù)街黝}數(shù)據(jù)服務(wù)層之后的功能與基于局域網(wǎng)的數(shù)據(jù)轉(zhuǎn)換接口的功能相同。
中央廣播電視大學(xué)遠(yuǎn)程開放教育的教務(wù)管理系統(tǒng)是一個(gè)跨越44個(gè)省面向全國(guó)的開放式教育體系結(jié)構(gòu)。該系統(tǒng)包含四級(jí)平臺(tái)、五種角色,由于其獨(dú)特性中央電大教務(wù)管理系統(tǒng)基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺(tái)的搭建有如下4方面需求:
1)中央電大各個(gè)系統(tǒng)之間、中央電大教務(wù)管理系統(tǒng)各級(jí)平臺(tái)之間需要能進(jìn)行靈活的數(shù)據(jù)交換。
2)每次交換數(shù)據(jù)的數(shù)據(jù)量可能達(dá)到GB級(jí)。
3)部分?jǐn)?shù)據(jù)交換有實(shí)時(shí)性要求,在規(guī)定時(shí)間內(nèi)客戶端必須收到響應(yīng),不能因?yàn)閿?shù)據(jù)傳輸而推遲業(yè)務(wù)進(jìn)度。
4)需要在網(wǎng)絡(luò)狀況不穩(wěn)定的情況下完成數(shù)據(jù)交換,因?yàn)橹醒腚姶蠼虅?wù)系統(tǒng)是跨越44個(gè)省的開放式教育系統(tǒng),所以中央電大需要同44所省電大交換數(shù)據(jù),在這種情況下網(wǎng)絡(luò)狀況不可預(yù)知、穩(wěn)定性難以保證,但傳輸仍然需要進(jìn)行。
4.1SOAP協(xié)議與Hessian協(xié)議的比較
目前,Web服務(wù)技術(shù)是解決異構(gòu)平臺(tái)系統(tǒng)的集成及互操作問題的主流技術(shù)[1]。它所基于的XML已經(jīng)是Internet上交換數(shù)據(jù)的實(shí)際標(biāo)準(zhǔn),基于通用的進(jìn)程間通信協(xié)議和網(wǎng)絡(luò)傳輸協(xié)議屏蔽平臺(tái)的差異,可以將各種異構(gòu)環(huán)境下的通信及調(diào)用請(qǐng)求均統(tǒng)一為標(biāo)準(zhǔn)的Web服務(wù)格式[3]。
但是由于SOAP協(xié)議的結(jié)構(gòu)問題會(huì)使封裝的數(shù)據(jù)膨脹數(shù)倍。當(dāng)傳輸數(shù)據(jù)量比較小時(shí),問題不是那么明顯,但是當(dāng)進(jìn)行大數(shù)據(jù)量傳輸時(shí)就會(huì)導(dǎo)致Web服務(wù)的傳輸性能在實(shí)際運(yùn)用中降低了很多。這對(duì)于經(jīng)常有大數(shù)據(jù)量數(shù)據(jù)交換的應(yīng)用系統(tǒng)來說是不適用的。
CauchoTechnology公司制定的HBWSP(HessianBinaryWebServiceProtocol)[2]在這方面的有所突破。Hessian協(xié)議和webservice常用的SOAP協(xié)議類似,也是將協(xié)議報(bào)文封裝在HTTP封包中,通過HTTP信道進(jìn)行傳輸?shù)?。因此Hessian協(xié)議具有與SOAP協(xié)議同樣的優(yōu)點(diǎn),即傳輸不受防火墻的限制(防火墻通常不限制HTTP信道)。Hessian協(xié)議的優(yōu)勢(shì)在于:它把本地格式的數(shù)據(jù)編碼為二進(jìn)制數(shù)據(jù),僅用一個(gè)字符作為結(jié)構(gòu)化標(biāo)記,HBWSP封裝后的數(shù)據(jù)增量明顯小于SOAP封裝后的數(shù)據(jù)增量。并且相對(duì)于SOAP,Hessian協(xié)議的外部數(shù)據(jù)表示有3個(gè)顯著的優(yōu)勢(shì):
1)采用簡(jiǎn)單的結(jié)構(gòu)化標(biāo)記。簡(jiǎn)單的結(jié)構(gòu)化標(biāo)記減少了編碼、解碼操作對(duì)內(nèi)存的占用量。編碼時(shí),只需寫少量的數(shù)據(jù),就可以標(biāo)記結(jié)構(gòu);解碼時(shí),只需讀少量的數(shù)據(jù)就可以確定結(jié)構(gòu)。而且,簡(jiǎn)單的結(jié)構(gòu)化標(biāo)記減少了編碼后的數(shù)據(jù)增量。
2)采用定長(zhǎng)的字節(jié)記錄值。用定長(zhǎng)的字節(jié)記錄值,解碼時(shí),就可以使用位操作從固定長(zhǎng)度的位獲得值。這樣不僅操作簡(jiǎn)單,而且可以獲得較高的性能。
3)采用引用取代重復(fù)遇到的對(duì)象。使用引用取代重復(fù)遇到的對(duì)象可以避免對(duì)重復(fù)對(duì)象的編碼,而且也減少了編碼后的數(shù)據(jù)量。
因此使用Hessian協(xié)議傳輸數(shù)據(jù)量比SOAP協(xié)議要小得多。實(shí)踐證明,傳輸同樣的對(duì)象Hessian協(xié)議傳輸?shù)臄?shù)據(jù)量比SOAP協(xié)議低一個(gè)數(shù)量級(jí)。因此Hessian協(xié)議比SOAP協(xié)議更適用于分布式應(yīng)用系統(tǒng)間大數(shù)據(jù)量的數(shù)據(jù)交換。
4.2Hessian協(xié)議的實(shí)現(xiàn)構(gòu)架
Hessian協(xié)議的實(shí)現(xiàn)構(gòu)架如圖3所示:為了實(shí)現(xiàn)Hessian構(gòu)架,設(shè)計(jì)了下列組件:編碼組件、解碼組件、通信組件、報(bào)告故障組件、組件、調(diào)用服務(wù)過程組件。
圖3Hessian協(xié)議的實(shí)現(xiàn)構(gòu)架
首先客戶端發(fā)出本地請(qǐng)求,組件響應(yīng)請(qǐng)求依據(jù)服務(wù)接口,生成客戶端存根,并調(diào)用編碼組件對(duì)本地請(qǐng)求進(jìn)行基于HessianBinaryWebServiceProtocol標(biāo)準(zhǔn)的二進(jìn)制編碼。然后調(diào)用通信組件將請(qǐng)求發(fā)送給服務(wù)器端。服務(wù)器端通信組件接收到請(qǐng)求后把請(qǐng)求轉(zhuǎn)發(fā)給調(diào)用服務(wù)過程組件,調(diào)用服務(wù)過程組件會(huì)首先調(diào)用解碼組件,得到過程標(biāo)識(shí),將過程標(biāo)識(shí)轉(zhuǎn)給服務(wù)器端存根,并依據(jù)部署文件和客戶端的請(qǐng)求加載服務(wù)過程的實(shí)現(xiàn)類。然后根據(jù)過程標(biāo)識(shí)、過程參數(shù)調(diào)用服務(wù)過程。最后調(diào)用編碼組件將響應(yīng)結(jié)果進(jìn)行編碼并通過通信組件返回給客戶端。
當(dāng)數(shù)據(jù)傳輸、通信發(fā)生錯(cuò)誤的時(shí)候就需要啟用報(bào)告故障組件,它可以以異常的形式,報(bào)告發(fā)送端、接收端、或者網(wǎng)絡(luò)連接發(fā)生的故障,并把錯(cuò)誤記錄以日志的方式記錄下來保存在文件中,以備日后查閱。
4.3實(shí)現(xiàn)結(jié)構(gòu)
針對(duì)教務(wù)管理系統(tǒng)互聯(lián)網(wǎng)傳輸存在的一系列問題,基于互聯(lián)網(wǎng)的主體數(shù)據(jù)平臺(tái)采用基于HBWSP的輕量級(jí)跨平臺(tái)通信技術(shù)實(shí)現(xiàn)數(shù)據(jù)交換,如圖4所示。在客戶端,應(yīng)用服務(wù)器從主題數(shù)據(jù)服務(wù)層中抽取數(shù)據(jù),并按著HBWSP的外部數(shù)據(jù)表示對(duì)本地格式數(shù)據(jù)進(jìn)行編碼。然后通過internet網(wǎng)進(jìn)行傳輸,在服務(wù)器端,數(shù)據(jù)交換的服務(wù)負(fù)責(zé)按照HBWSP的外部數(shù)據(jù)表示對(duì)接收到的數(shù)據(jù)進(jìn)行解碼,然后再對(duì)數(shù)據(jù)進(jìn)行分析、處理后把數(shù)據(jù)插入到服務(wù)器端的主題數(shù)據(jù)服務(wù)層中。
圖4非持久同步方式的數(shù)據(jù)交換解決方案
該解決方案的主要特點(diǎn)包括:
1)采用了HBWSP的二進(jìn)制編碼方式解決了異地、異構(gòu)平臺(tái)系統(tǒng)的通信問題,并使數(shù)據(jù)交互具有了一定的實(shí)時(shí)性。
2)由于HBWSP簡(jiǎn)潔的編碼方式以及編碼、解碼性能高等特點(diǎn)使數(shù)據(jù)交換具有交換GB級(jí)數(shù)據(jù)的能力。
3)采用了HBWSP的二進(jìn)制編碼方式有助于縮短整個(gè)數(shù)據(jù)交換所需要的時(shí)間。其編碼性能高的特點(diǎn),有助于提高編碼速度,減少發(fā)送方編碼本地?cái)?shù)據(jù)的時(shí)間。其解碼性能高的特點(diǎn),可以減少接收方解碼、重構(gòu)本地?cái)?shù)據(jù)的時(shí)間。從而減少了數(shù)據(jù)交換的響應(yīng)時(shí)間。
4)采用了HBWSP的二進(jìn)制編碼方式和數(shù)據(jù)分批傳送技術(shù)有助于充分利用網(wǎng)絡(luò)狀況良好的時(shí)段??梢栽诰W(wǎng)絡(luò)狀況良好的時(shí)段盡可能多的完成數(shù)據(jù)交換。
5)采用了斷點(diǎn)續(xù)傳技術(shù),保證了當(dāng)網(wǎng)絡(luò)斷連或響應(yīng)超時(shí)導(dǎo)致正在進(jìn)行的數(shù)據(jù)交換被中斷,在故障修復(fù)后仍然可以從中斷處開始,繼續(xù)完成上次沒有完成的數(shù)據(jù)交換的能力。斷點(diǎn)的粒度可以調(diào)節(jié),可以是一條數(shù)據(jù),也可以是多條數(shù)據(jù)。
6)采用了事務(wù)保護(hù)機(jī)制,把每批要傳輸?shù)臄?shù)據(jù)定義為一個(gè)事務(wù),本批要傳輸?shù)臄?shù)據(jù)的事務(wù)完整性不依賴于已經(jīng)完成的各批數(shù)據(jù),本批數(shù)據(jù)傳輸發(fā)生錯(cuò)誤也不會(huì)對(duì)已經(jīng)完成的各批數(shù)據(jù)造成影響。采用這種方法,可以在數(shù)據(jù)交換過程被中斷的情況下保證數(shù)據(jù)交換事務(wù)的完整性。
5總結(jié)和展望
本文在SOA理論的基礎(chǔ)上提出了一個(gè)主題數(shù)據(jù)平臺(tái)的概念,力圖把異地、異構(gòu)的數(shù)據(jù)綜合起來,組成一個(gè)強(qiáng)壯的、高可靠性的、可共用的標(biāo)準(zhǔn)數(shù)據(jù)服務(wù)平臺(tái)。從而解決中央電大新舊教學(xué)管理系統(tǒng)數(shù)據(jù)“孤島”的問題。我們?cè)龠M(jìn)一步針對(duì)現(xiàn)實(shí)環(huán)境:局域網(wǎng)和互聯(lián)網(wǎng)兩種情況進(jìn)行了分析,并給出了實(shí)現(xiàn)框架和技術(shù)細(xì)節(jié)。
但是如何在信息暴露的基礎(chǔ)上,對(duì)業(yè)務(wù)應(yīng)用進(jìn)行進(jìn)一步的梳理、劃分、整合,從而封裝成用戶可以隨意組合、使用的標(biāo)準(zhǔn)服務(wù),從而實(shí)現(xiàn)真正的SOA,是需要我們進(jìn)一步研究的內(nèi)容。
參考文獻(xiàn)
二、數(shù)據(jù)挖掘技術(shù)在財(cái)務(wù)分析中的應(yīng)用
財(cái)務(wù)分析的主要目的是改善經(jīng)營(yíng)管理,提高企業(yè)的經(jīng)濟(jì)效益,其主要目的是保證會(huì)計(jì)信息資料的正確可靠性,以保證企業(yè)財(cái)產(chǎn)的安全性、完整性。比如某生態(tài)園林企業(yè)需要投入大量資金完善生產(chǎn)基礎(chǔ)設(shè)施,并保證現(xiàn)場(chǎng)作業(yè)的有序,如有必要還要投資于企業(yè)產(chǎn)品周邊附屬產(chǎn)業(yè)的發(fā)展,因此財(cái)務(wù)決策的重要性不言而喻,而在財(cái)務(wù)決策中應(yīng)用數(shù)據(jù)挖掘技術(shù)十分必要。財(cái)務(wù)分析中應(yīng)用數(shù)據(jù)挖掘的基本流程包括問題識(shí)別、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)開采及結(jié)果表達(dá)與解釋等四個(gè)步驟,圖1可將財(cái)務(wù)分析數(shù)據(jù)挖掘的過程直觀的表達(dá)出來:
(一)問題識(shí)別
典型的財(cái)務(wù)決策包括投資決策、籌資決策、成本決策、銷售決策等,企業(yè)要進(jìn)行財(cái)務(wù)分析前必須識(shí)別決策問題,明確需要達(dá)到的決策目標(biāo)等,再將決策目標(biāo)轉(zhuǎn)換為數(shù)據(jù)挖掘的目標(biāo),最后進(jìn)行準(zhǔn)確的數(shù)據(jù)定義。如企業(yè)需要投資企業(yè)產(chǎn)品周邊附屬產(chǎn)業(yè),則需要利用數(shù)據(jù)挖掘技術(shù)明確以下問題:
(1)企業(yè)經(jīng)營(yíng)中可隨時(shí)支配的資金額度,需要財(cái)務(wù)人員建立數(shù)據(jù)庫(kù)模型,將可用于投資的資金情況準(zhǔn)確、詳細(xì)的計(jì)算出來;
(2)編制投資方案,即與本企業(yè)實(shí)際情況相結(jié)合,考慮具體投資計(jì)劃,并對(duì)投資方案的可操作性進(jìn)行分析,比如上述園林生態(tài)企業(yè)需要投資進(jìn)口園林機(jī)械的項(xiàng)目,就需要在投資前對(duì)該項(xiàng)目的大小做出合理評(píng)估,了解該品牌園林機(jī)械在國(guó)際市場(chǎng)的占有份額、品質(zhì)、成本及銷售價(jià)格等信息;
(3)投資收益分析,投資的主要目的是獲得更高收益,因此在數(shù)據(jù)挖掘過程中,問題識(shí)別時(shí)必須做出可靠的收益預(yù)算。
(二)數(shù)據(jù)準(zhǔn)備
在完成問題識(shí)別后,需要根據(jù)不同的需求、從相關(guān)數(shù)據(jù)庫(kù)信息中選擇適用的數(shù)據(jù)信息,即進(jìn)行數(shù)據(jù)準(zhǔn)備,該過程需要收集大量與企業(yè)財(cái)務(wù)分析相關(guān)的數(shù)據(jù)信息,以保證數(shù)據(jù)挖掘的真實(shí)性、客觀性,比如花卉市場(chǎng)分布信息、裝飾裝潢市場(chǎng)信息、園林設(shè)計(jì)與市場(chǎng)銷售等信息。通常情況下,數(shù)據(jù)準(zhǔn)備又可分為數(shù)據(jù)集成、數(shù)據(jù)選擇及數(shù)據(jù)預(yù)處理等三個(gè)步驟,其中數(shù)據(jù)集成是把多數(shù)據(jù)庫(kù)運(yùn)行環(huán)境中的數(shù)據(jù)進(jìn)行合并處理,去除信息噪聲,剔除虛假數(shù)據(jù);而數(shù)據(jù)選擇則是分辨需要分析的數(shù)據(jù)集合,進(jìn)一步縮小數(shù)據(jù)處理的范圍,提高數(shù)據(jù)質(zhì)量,從而保證數(shù)據(jù)挖掘的有效性;數(shù)據(jù)預(yù)處理的主要目的是解決數(shù)據(jù)挖掘工具局限性的問題。
(三)數(shù)據(jù)挖掘
當(dāng)上述準(zhǔn)備工作完成后即可進(jìn)行深入的數(shù)據(jù)挖掘處理,挖掘過程中需要注意,必須以財(cái)務(wù)分析核心思想為指導(dǎo),明確數(shù)據(jù)挖掘的目的性,數(shù)據(jù)挖掘的主要內(nèi)容包括:選擇合適的挖掘工具、具體的挖掘操作及證實(shí)發(fā)現(xiàn)的知識(shí)等,其中選擇合適的挖掘工具至關(guān)重要,限于篇幅此處對(duì)神經(jīng)網(wǎng)絡(luò)及決策樹兩種方法進(jìn)行簡(jiǎn)單介紹。神經(jīng)網(wǎng)絡(luò)是以自學(xué)習(xí)數(shù)學(xué)模型為基礎(chǔ)的,利用該方法可以很容易的解決具有上百個(gè)參數(shù)的問題,為高復(fù)雜度的問題提供一種相對(duì)簡(jiǎn)單的方法;視經(jīng)網(wǎng)絡(luò)既可以表現(xiàn)為有指導(dǎo)的學(xué)習(xí),也可以是無指導(dǎo)聚類,不過輸入神經(jīng)網(wǎng)絡(luò)中的值均為數(shù)值型的。實(shí)際應(yīng)用中通常采用該方法進(jìn)行財(cái)務(wù)預(yù)警分析。決策樹法是現(xiàn)階段應(yīng)用最廣泛的歸納推理算法之一,其提供了一種展示在何種條件下會(huì)獲得對(duì)應(yīng)值的規(guī)則的方法,是一種簡(jiǎn)單的知識(shí)表示方法,在數(shù)據(jù)挖掘過程中,決策樹法主要用于數(shù)據(jù)挖掘的分類。
(四)結(jié)果表達(dá)
結(jié)果表達(dá)即是在處理數(shù)據(jù)庫(kù)信息的基礎(chǔ)上客觀的表達(dá)出數(shù)據(jù)挖掘的結(jié)果,以為企業(yè)財(cái)務(wù)分析提供可靠依據(jù)??梢哉f結(jié)果表達(dá)是數(shù)據(jù)挖掘的成果展示,其所表達(dá)的是最有價(jià)值的信息,如結(jié)果表達(dá)所提供的信息達(dá)不到?jīng)Q策的要求,則可重復(fù)挖掘過程,直至決策者滿意為止。