商業(yè)智能的bi時代范文

時間:2023-10-30 17:32:52

導語:如何才能寫好一篇商業(yè)智能的bi時代,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

商業(yè)智能的bi時代

篇1

商業(yè)智能(bi)從誕生之日起就帶著貴族氣息,因為高高在上,讓很多人對BI望而卻步。如何讓商業(yè)智能走向大眾化,讓用戶可以如同使用PC一樣,把商業(yè)智能當作每個人的工具,一直是業(yè)界內(nèi)熱議和爭論的問題。

傳統(tǒng)的觀點認為,商業(yè)智能軟件是決策輔助系統(tǒng)、是“老板工程”,屬于少數(shù)高管和專業(yè)分析人員。這部分人員,僅占組織的15%左右。近年來,隨著商務智能軟件的快速發(fā)展,其用戶界面變得前所未有的簡單,非專業(yè)人士都可以輕松使用。因此,不少軟件供應商都表示,它們的商務智能解決方案可以把大眾化的比例提高到組織的60%左右。

從15%到60%,是一個跨越性的飛躍,但離“大眾化”還是有差距的。何謂“大眾化”?“大眾化”意味著商務智能將不是少部分專業(yè)人士的專利,而是貼近大眾生活的、人皆可用的、人人可以理解的工具和手段。通過它,可以將復雜深奧的信息內(nèi)容以一種平民大眾的渠道表達、展現(xiàn)、詮釋給最普通的用戶。

在商業(yè)智能大眾化的大潮中,筆者找出了其中的佼佼者和讀者分享。

2009年1月12日,海地發(fā)生了大地震,災難發(fā)生后,關于震情和救援的報道占據(jù)了各大報紙和網(wǎng)站的首頁。作為美國新聞界的領頭羊和風向標的《紐約時報》是如何設計它的報道呢?

地震前后同一個地點的衛(wèi)星地貌照片被重疊放在了同一個窗口內(nèi),窗口內(nèi)部有一個類似窗簾的分屏箭頭,通過拉動它,你看到了同一個地點地震前后的變化。拉動分屏箭頭的同時,還會自動浮現(xiàn)出相關的文字說明。

通過這種對比,可以看到地表遭受的巨大破壞和當?shù)貫拿駸o家可歸的慘狀:原來的公共綠地上,現(xiàn)在遍布災民的帳篷。和兩張地圖簡單地放到一起相比,這種信息表達方式增強了對比效果,使對比更加直觀、一目了然。

再看看另外一個小例子:已經(jīng)持續(xù)一年多的美國經(jīng)濟危機讓不少人都丟了工作,誰失業(yè)了?誰還將失業(yè)?這是一個人人都關心的民生話題。《紐約時報》對此做出的數(shù)據(jù)分析令人耳目一新、印象深刻,商業(yè)智能大眾化的路線可謂走得爐火純青。

所有不同人群的失業(yè)情況都囊括在一張圖表當中。圖的上方是“種族”、“性別”、“年齡”、“教育水平”等4個維度的查詢定義選項,四下選擇點擊之后,你就看到了你所關心群體的失業(yè)率變化曲線,這條曲線在眾多的曲線當中變成了藍色。你可以清楚地和代表整體的基準曲線對比。更絕的是,每次點擊之后,曲線上上下下的躍動和重疊使讀者輕松得獲得了和其它群體的失業(yè)率對比的印象。此外,移動你的鼠標,每條曲線都會出現(xiàn)小段文字說明。

(有興趣的讀者,可以點擊鏈接到網(wǎng)站親自體驗。記住,這是大眾化的商業(yè)智能,即使不懂英語,我也保證你能明白它在說什么!)

商業(yè)智能的應用注重信息的分析和整合,一個好的商業(yè)智能產(chǎn)品能夠把復雜的信息內(nèi)容視覺化、圖象化、文字化,幫助用戶看到不同事物之間的關系、差異以及發(fā)展的趨勢和走向。如果僅僅是把兩張照片并列在一起,信息并沒有整合,沒有增值,只是1+1=2,那就不是商務智能。在這兩個例子中,《紐約時報》通過對信息內(nèi)容獨具匠心的整合,把零散的信息融合為新的知識,產(chǎn)生了1+1>2的效果,給商務智能如何走向大眾化提供了很好的啟發(fā)。

商業(yè)智能原來高高在上,由技術和分析人員一手把控的局面將一去不復返。商業(yè)智能在企業(yè)中的應用會越來越重視實用化,企業(yè)中高層管理人員甚至關鍵的業(yè)務人員通過BI的應用,將獲得更有效的業(yè)務洞察力,并能夠利用這種理解能力的提升來改進業(yè)務績效。他們逐步傾向更多地介入企業(yè)BI應用的擴展,同時,BI技術的發(fā)展也使這種大眾化的應用成為了可能。

由于各種原因,大部分中國企業(yè)在商務智能的應用方面還舉步不前,甚至舉棋不定,離大眾化還有很長的路要走。但我們要看到,以構建IT運營平臺為中心的時代即將過去,世界已經(jīng)跨進了以信息分析和挖掘為中心的智能時代。這個大潮,浩浩蕩蕩,就在我們眼前。

鏈接

2009年后商業(yè)智能(BI)的五大預測

12月18日,在荷蘭舉行的Gartner商業(yè)智能(BI)高峰論壇上,專家們討論了商業(yè)智能所面臨的機遇與挑戰(zhàn)。Gartner公開了對BI在2009至201 2年期間的發(fā)展的五大預測。

預測1;2012年后,全球前5000強企業(yè)中超過35%的企業(yè)將無法隨其業(yè)務與市場上的重大變化而作出敏銳的決策。

預測2到2012年,商務部門將控制至少40%的BI投資預算。

預測3:到2010年,20%的組織將通過軟件即服務的業(yè)務模式(SaaS)獲得具行業(yè)特色的分析應用軟件。這種模式將成為BI投資組合的標配。

篇2

隨著云計算和云存儲的推廣,可以收集和利用越來越多的數(shù)據(jù)。為了高效地處理和有效地利用各種形式的海量數(shù)據(jù),以數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、聯(lián)機分析處理等為核心的商業(yè)智能(BusinessIntelli-gence,BI)技術應運而生。商業(yè)智能這一概念由加特納•格魯派于1989年提出,可將商業(yè)智能理解為一種能夠?qū)C構現(xiàn)有的數(shù)據(jù)轉化為知識,幫助機構通過基于事實和電腦化系統(tǒng),做出科學業(yè)務決策的工具。商業(yè)智能技術已成功地應用于銀行、電信、保險、制造業(yè)和零售業(yè)等行業(yè)。[6]從全球范圍來看,商業(yè)智能已經(jīng)成為最具有前景的信息化領域。通過調(diào)查了解世界各地的高等教育部門采用商業(yè)智能技術的狀況發(fā)現(xiàn),高等教育已明顯落后于其它行業(yè)。然而,DaveWells在文獻中指出,越來越多的高校正在關注商業(yè)智能應用這一主題,高等教育在技術方面已經(jīng)到了應用商業(yè)智能的時候了。[7]例如,北美高等教育界較早關注商業(yè)智能應用的重要性,美國部分高校已經(jīng)采用或正開始采用商業(yè)智能技術,對學校的教育數(shù)據(jù)進行整合分析,為學校的科學決策與管理提供信息支持。如賓州州立大學、密執(zhí)根大學均于2005年提出建設BI項目的倡議,弗羅里達州立大學、華盛頓大學分別于2007年、2008年開始利用BI項目分析學校整合數(shù)據(jù)進行決策支持,普渡大學于2008-2014年期間建設學校新的協(xié)同集成系統(tǒng),印第安納大學2009年提出BI建設路線圖,斯坦福大學商業(yè)智能中心2009年提交的BI架構及方案獲批準、2010年正式啟動項目建設,加州大學(總部)建設StatFinder系統(tǒng),伊利諾斯大學建立學校決策支持數(shù)據(jù)倉庫,亞利桑那州立大學為支持科學決策建設了儀表盤(dashboard)等。在歐洲、亞洲等地區(qū)的高等教育體系中,商業(yè)智能技術的應用才剛剛起步。我國少數(shù)高校也開始邁出了建設BI系統(tǒng)的步伐,如中山大學2010年開始提出學校BI系統(tǒng)建設倡議,現(xiàn)已初步完成BI系統(tǒng)的數(shù)據(jù)倉庫建設,上海交通大學2011年推出BI項目的子系統(tǒng)———財務管理駕駛艙系統(tǒng),復旦大學為學校師生在校生命周期實現(xiàn)管理信息化“全覆蓋”,中國人民大學推出綜合數(shù)據(jù)填報、數(shù)據(jù)存儲、數(shù)據(jù)管理和數(shù)據(jù)展示等四大功能的數(shù)據(jù)平臺,浙江大學為優(yōu)化資源配置建設共享數(shù)據(jù)中心進行數(shù)據(jù)集成,上海財經(jīng)大學建設校務決策支持系統(tǒng),常熟理工學院建立高校決策支持系統(tǒng)等等。同時,基于商業(yè)智能技術產(chǎn)出的數(shù)據(jù),也形成一批對高等教育和高校自身進行深入分析的研究報告。如美國教育研究的主要組織院校研究學會,年會報告除了涵蓋數(shù)據(jù)管理、數(shù)據(jù)倉庫等關于計算機技術本身的報告之外,關于評估、資源、學生、合作和分析的報告,較多地來自于商業(yè)智能系統(tǒng)數(shù)據(jù)的研究結果。[8]

二、數(shù)據(jù)驅(qū)動的高校教育管理智能平臺架構

在海量教育數(shù)據(jù)亟待有效利用的驅(qū)動下,為提高高校管理效益,將商業(yè)智能技術應用到高校教育管理中,對高校產(chǎn)生的大量數(shù)據(jù)用數(shù)據(jù)挖掘等商業(yè)智能技術進行分析研究與處理,可以幫助高校決策者做出對學校發(fā)展更為有利的科學決策。其關鍵是建立綜合層面上的、能反映高校整體教育教學管理的信息集成系統(tǒng)平臺(下文簡稱高校BI系統(tǒng)平臺)。高校BI系統(tǒng)平臺體系架構由數(shù)據(jù)源、數(shù)據(jù)存儲與管理層、數(shù)據(jù)分析層和用戶接口層組成,如圖1所示。

(一)數(shù)據(jù)源

數(shù)據(jù)源是整個系統(tǒng)的基礎,包括高校各類業(yè)務管理信息系統(tǒng)的內(nèi)部數(shù)據(jù)和其他外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)包括存放于操作型數(shù)據(jù)庫中的各種業(yè)務數(shù)據(jù)和辦公自動化系統(tǒng)包含的各類文檔數(shù)據(jù),如學校財務處、人事處、教務處、科研處、設備處等部門數(shù)據(jù)庫中業(yè)務數(shù)據(jù);外部信息包括各類教育信息、外部統(tǒng)計和調(diào)研數(shù)據(jù)及文檔等。

(二)數(shù)據(jù)存儲與管理

數(shù)據(jù)存儲與管理層是整個系統(tǒng)的核心,包括ETL管理工具、公共數(shù)據(jù)集、元數(shù)據(jù)、數(shù)據(jù)倉庫和數(shù)據(jù)集市。高校BI系統(tǒng)平臺建設采用數(shù)據(jù)驅(qū)動設計方法,從學校原有的各個部門的業(yè)務處理系統(tǒng)和外部數(shù)據(jù)源中經(jīng)過ETL提取數(shù)據(jù),并根據(jù)常見的分析和統(tǒng)計主題,建設校級數(shù)據(jù)倉庫以及人才培養(yǎng)、師資隊伍、科學研究、辦學資源、交流合作等主題的數(shù)據(jù)集市。

(三)數(shù)據(jù)查詢與分析

高校決策者常常希望從不同的角度審視教育數(shù)據(jù),比如從時間、區(qū)域、學科、教學或科研成果、課程建設、學生層次、交流合作、辦學資源等維度全面了解學校的教育質(zhì)量和狀態(tài)。高校BI系統(tǒng)平臺的數(shù)據(jù)分析層利用商業(yè)智能技術為高校管理主要提供固定報表、即席查詢、統(tǒng)計分析、多維分析、預警功能、預測分析、數(shù)據(jù)挖掘建模分析及優(yōu)化分析等,根據(jù)學?,F(xiàn)有學生、教師、資源、科研和人才培養(yǎng)等狀況,有助于高校決策者全面地對學校資源配置進行調(diào)控、對學校整體辦學信息的內(nèi)部結構進行調(diào)整等,做出對學校發(fā)展更為有利的科學決策。

(四)用戶接口

用戶接口層根據(jù)高校用戶訪問需求和角色訪問授權機制,提供強大的多用戶數(shù)據(jù)查詢操作,并以儀表盤或表格、直方圖、餅圖等直觀方式將查詢結果或決策信息呈現(xiàn)給用戶。

三、應用案例

下面以高校BI系統(tǒng)平臺中的調(diào)研數(shù)據(jù)為商業(yè)智能技術應用案例,利用回歸方法對大學生學習成果進行數(shù)據(jù)挖掘分析。

(一)數(shù)據(jù)來源

案例分析的數(shù)據(jù)來源于高校BI系統(tǒng)平臺中“中山大學學生學習狀況調(diào)查”項目于2012在中山大學全校范圍內(nèi)開展的在線調(diào)研數(shù)據(jù)。[13]調(diào)查覆蓋全校36個學院(系),調(diào)查總體約為3.3萬名本科生。讓學生在無壓力的情況下答題,共回收問卷7051份,回收率約為21.2%,與國際上通用的問卷回收率相當。案例分析聚焦于本科樣本,全部回收的問卷根據(jù)答題時長、問卷質(zhì)量標準等原則,篩選出有效問卷數(shù)據(jù)6673份,有效率為94.6%。本研究從學生學習經(jīng)歷角度,在“生源-學習-成果”的邏輯框架中,考察分析學校因素和學生因素對于學生學習成果的影響機制。調(diào)查把學生學習經(jīng)歷和成果分解為生源情況、學校學習資源供給、學生與學校的融合、學生學習投入、學生成果、學校成果6大維度,各維度下題目的內(nèi)部一致性均達到0.9以上,具有較高的信度。

(二)數(shù)據(jù)分析

逐步回歸提供了一種識別與學生學習成果相關的具體經(jīng)歷的方法,對于學生學習狀況調(diào)查中的227項進行相似項合并,用向前和向后逐步回歸確定與學習成果相關的項目,對殘差圖和診斷法的徹底審查,最后確定17個獨立變量出現(xiàn)在多元回歸模型中(如表2所示),其中,相關系數(shù)R為0.994,校正判定系數(shù)R2為0.988,因變量變化中有98.8%左右的信息可以由預測變量解釋,說明模型的擬合優(yōu)度較好;Durbin-Watson為1.937,接近最佳理想值,如表1所示。表2顯示的是回歸系數(shù)的相關統(tǒng)計量,可以看出,這17個獨立變量的顯著性概率Sig.都小于0.05,說明其系數(shù)顯著不為0,這17個變量均與學生學習成果顯著相關。分析表2中的數(shù)據(jù)可以看出,學生學習經(jīng)歷中的學校學習資源提供、學生學習投入和校園文化及學校成果等四大維度的17個變量均為影響學生學習成果的重要預測變量,包括課程作業(yè)評價、專業(yè)學習經(jīng)歷評價、學術規(guī)范指導、平等文化、多元能力的培養(yǎng)氛圍等學校因素變量,以及朋輩交流情況、自主學習情況、活動參與情況、課外閱讀情況、論文寫作情況、討論關注的內(nèi)容情況、師生交流、課業(yè)活動及個人閑暇活動時間分配等學生因素變量。同時,在校經(jīng)歷滿意度、綜合滿意度和能力培養(yǎng)滿意度等融合學校因素和學生因素的學校成果也對學生學習成果具有一定的影響。通過標準系數(shù)可以看出,朋輩交流情況、自主學習情況和討論關注的內(nèi)容情況分別是第一、第二和第三重要的預測變量,而性別、年級、所在校區(qū)等人口學變量并未出現(xiàn)在該回歸分析模型中,對學生學習成果的影響不顯著。進一步分析朋輩交流情況和自主學習情況調(diào)查指標應答概況,如表3所示,“有時”、“時常”或“頻繁”進行朋輩交流的比例為63.7%~97.7%,自主學習的比例為52.5%~92.9%,朋輩交流和自主學習的平均比例相當高(81.8%)?!坝袝r”、“時?!被颉邦l繁”地進行朋輩交流方面的主要比例情況為:“與家庭背景(社會、經(jīng)濟的)不同的同學交流”為97.7%、“與興趣不同的同學交流”為95.6%、“在與同學的談話中得到啟發(fā),改變自己的想法”為94.4%、“與世界觀、價值觀不同的同學交流”為93%、“與不同專業(yè)的同學交流”為92.6%、“同學與你談話后,表示受到了你的啟發(fā)”為90.8%。“有時”、“時?!被颉邦l繁”地進行自主學習的主要比例情況為:“利用圖書館、網(wǎng)絡等資源豐富自己的學識”為92.9%、“根據(jù)課程安排,做課堂展示”為91.3%、“努力掌握對自己而言較難的課程內(nèi)容”為91.3%、“隨著學習經(jīng)歷的豐富不斷整合、梳理自己的知識系統(tǒng)”為88.4%,“因課程設置和教師的要求具有挑戰(zhàn)性而更加努力地學習”為85.9%。上述情形符合VincentTinto在研究大學生退學問題時提出的理論模型:學生取得較好的學習成果,依賴于他們在學習經(jīng)歷中能否將自身的經(jīng)驗和目標與學校系統(tǒng)內(nèi)部的學術系統(tǒng)和社交系統(tǒng)相融合。[10]學術系統(tǒng)代表學生個人的課業(yè)表現(xiàn)、智力發(fā)展、學業(yè)成就等綜合表現(xiàn),如表2中自主學習情況、活動參與情況、課外閱讀情況、論文寫作情況、討論關注的內(nèi)容情況及課業(yè)活動等屬于學術系統(tǒng)的范疇。社交系統(tǒng)代表學生在校內(nèi)的同伴關系、師生關系、社交行為等綜合表現(xiàn),如朋輩交流情況、師生交流及個人閑暇活動時間分配等屬于社交系統(tǒng)的范疇。學生在其學習經(jīng)歷中,有效地利用學習資源和校園文化氛圍、將學術系統(tǒng)和社交系統(tǒng)進行整合,可以從學業(yè)和人際關系上自我提升,從而提高學習成果。

四、小結

篇3

【關鍵詞】智能系統(tǒng) 傳統(tǒng)軟件

1 前言

商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,幫助企業(yè)做出明智的業(yè)務經(jīng)營決策的工具,是對商業(yè)信息的搜集、管理和分析的過程,目的是使企業(yè)的各級決策者獲得知識或洞察力,促使他們做出對企業(yè)更有利的決策。所獲取的數(shù)據(jù)一般由來自企業(yè)內(nèi)部的財務、業(yè)務、人力數(shù)據(jù)以及來自企業(yè)所處行業(yè)和競爭對手的外部數(shù)據(jù)組成。而實現(xiàn)這一工具則依賴于目前正在飛速發(fā)展的數(shù)據(jù)倉庫,數(shù)據(jù)分析,數(shù)據(jù)展現(xiàn)等方面的前沿技術。筆者所負責的某數(shù)據(jù)分析平臺項目屬于一個典型的商業(yè)智能項目,該項目是為契合公司轉型和市場轉型的內(nèi)外部要求,解決總分機構在計劃下達、預算管理、資源配置、考核激勵等方面的困擾,而決定建設的數(shù)據(jù)基礎工具,通過搭建分支機構經(jīng)營管理指標體系模型,建設透明、多維、全面的分析指標展示平臺。通過項目幾年的建設,筆者對于商業(yè)智能系統(tǒng)的建設也有了一些淺見與讀者分享。

2 智能系統(tǒng)數(shù)據(jù)的獲取、整合和分析及差異性

首先,從需求分析層面看,商業(yè)智能系統(tǒng)需求分析的側重點是數(shù)據(jù)的獲取、整合和分析,一般意義的IT系統(tǒng),比如銀行或電信核心業(yè)務系統(tǒng)的需求分析往往關注的是工作流程的實現(xiàn)和業(yè)務邏輯的控制,二者需求的側重點有很大的不同。對于BI開發(fā)人員來說,一般不會面對復雜的流程和邏輯,只要將數(shù)據(jù)源梳理清楚,將數(shù)據(jù)質(zhì)量做到符合要求,將分析結果展現(xiàn)到位就可以完成任務,任務看似簡單,但數(shù)據(jù)分析的結果是否真的符合業(yè)務需求,很多時候卻不像業(yè)務流程那樣能夠準確的把握,這其中核心的問題就是在客戶提供的需求說明的背后往往隱含著很多沒有明示的管理策略和業(yè)務邏輯,這些背景知識和管理訴求往往需要深厚的業(yè)務經(jīng)驗才能準確領會,并且還要能夠準確、簡明、扼要的表述出來。比如說,曾經(jīng)在項目中有一個重要需求,要設計一套數(shù)據(jù)指標定期展示給產(chǎn)品線和分支機構,需求表述的很簡單,就是提取數(shù)據(jù)并定期更新展示。但是后來在需求落地的過程中,發(fā)現(xiàn)用戶群是一個矩陣型的管理結構,每個分支機構都有產(chǎn)品線部門設置,總公司也有專門的對口產(chǎn)品線管理部門來監(jiān)控這些指標的變化,條中有塊,塊中有條。由于各個分支結構面對的市場狀況不同,對于前端業(yè)務開拓人員的績效激勵和工作組織模式也不同,因此總公司對于其考核的要求也不同,存在很多個性化和差異化的需求實現(xiàn),然而在提交需求說明的時候,由于需求方的人員表述能力較差,很多個性化和差異化的東西都沒有一一體現(xiàn),為后續(xù)的設計開發(fā)帶來了不少問題。面對這樣的需求,在開發(fā)前時必須充分考慮的建設這一指標體系的背后的管理意義,理解為什么分支機構存在差異化的需求以及如何滿足,管理層如何看待這個問題,期待通過這一功能的實現(xiàn)達到怎樣的目標等等,類似于管理咨詢顧問一樣的業(yè)務訪談和需求挖掘的過程是必不可少的步驟,只有準確的理解用戶的管理意圖才能為為后續(xù)合理的設計做好鋪墊和準備。

其次,由于在需求層面的差異,導致在具體技術實施的層面上,一個BI項目的技術側重點和一般意義的IT業(yè)務系統(tǒng)也很不一樣。在BI項目中,往往數(shù)據(jù)倉庫技術、統(tǒng)計分析軟件、數(shù)據(jù)可視化工具等成型的商業(yè)套裝軟件產(chǎn)品大行其道,同時因為在業(yè)務流程控制層面的需求比較弱,因此技術框架和功能模塊的設計也不需要過多額外的開發(fā),可以用比較成熟穩(wěn)定的技術框架稍作改造直接應用,因此工作的重點就會集中在以下三個方面:一是如何多快好省的使用和操作好現(xiàn)成的軟件工具,將其具備的功能與現(xiàn)有需求做好匹配;二是做好數(shù)據(jù)模型的分析和開發(fā),明確分析維度和分析目標之間的邏輯關系,設計內(nèi)容盡量的全面、擴展方便的數(shù)據(jù)結構;三是強化用戶界面(UI)和用戶體驗(UE)設計,讓用戶能方便快捷的獲取或者理解數(shù)據(jù)。由上面的分析可以進一步得到結論,一個商業(yè)智能系統(tǒng)的開發(fā)需要的關鍵人力資源,一般可以由商業(yè)套裝軟件應用專家、數(shù)據(jù)模型構建專家(一般而言由業(yè)務專家和數(shù)據(jù)分析工程師共同處理)、界面和用戶體驗設計工程師三大類人員構成,而傳統(tǒng)意義的軟件設計工程師和系統(tǒng)架構師在商業(yè)智能項目里面扮演的角色將不如在生產(chǎn)業(yè)務系統(tǒng)里面顯得那么重要,因為在系統(tǒng)架構、流程設計、算法優(yōu)化等等方面沒有突出的設計需求,很多關鍵處理都由套裝軟件自帶的功能處理,屬于軟件應用問題和二次開發(fā),比如如何設置定期數(shù)據(jù)抽取計劃,如何進行數(shù)據(jù)清洗,如何模擬excel的網(wǎng)頁操作,如何模擬回歸分析等等,這些需求和功能都是一般大型套裝軟件必備的功能之一,我們所需要做的就是如何正確有效的應用這些功能。同樣,數(shù)據(jù)模型構建和界面設計等也都屬于非核心的軟件開發(fā)技術范圍,但在商業(yè)智能系統(tǒng)里面卻顯得尤為重要。

最后,就是商業(yè)智能系統(tǒng)的軟件過程模型也有所區(qū)別于一般意義的傳統(tǒng)軟件開發(fā)。軟件開發(fā)的過程模型包括瀑布開發(fā)、迭代開發(fā)和原型開發(fā)等方式方法,瀑布模型是最典型也是最常用的軟件工程方法論,瀑布模型將軟件生命周期劃分為制定計劃、需求分析、軟件設計、程序編寫、軟件測試和運行維護等六個基本活動,并且規(guī)定了它們自上而下、相互銜接的固定次序,如同瀑布流水,逐級下落。但是這種開發(fā)方法特別要求前期的需求嚴謹清晰,因此往往不適合BI系統(tǒng)的開發(fā)。筆者所參與的數(shù)據(jù)分析平臺項目,分析目標由淺入深,數(shù)據(jù)范圍逐漸擴大,數(shù)據(jù)更新頻率也是由年到日逐步縮小粒度,很多新的需求是在應用過程中隨時加入,但用戶又要求短時間內(nèi)在系統(tǒng)上實現(xiàn),理想的瀑布模型很不適合這種需求經(jīng)常變化又比較緊急的情況,而適當?shù)牟捎迷涂焖匍_發(fā)或者迭代螺旋開發(fā)的方式,由簡入繁,循序漸進,是比較合理的工作方式,通過原型系統(tǒng)來進一步理清思路和需求,同時確定軟件開發(fā)的迭代計劃和發(fā)展線路,既能階段性的看到成果,然后不斷的完善和提升項目的質(zhì)量。關于原型開發(fā)模式和螺旋迭代模式,本文不再贅述。

3 總結

總之,商業(yè)智能系統(tǒng)的開發(fā)屬于軟件開發(fā)領域的分支領域,有其自身的特點和工作方法論,特別是與商業(yè)邏輯本身有著天然不可分割的聯(lián)系,要成功實施一套商業(yè)智能系統(tǒng)軟件的開發(fā)和部署,還需要從業(yè)者結合工作實際不斷的思考、探索和總結。

篇4

關鍵詞:計算機學科;學科交叉融合;商業(yè)智能;經(jīng)濟變革

中圖分類號:G647

隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等技術的快速發(fā)展,以及視頻監(jiān)控、智能終端、應用商店的廣泛普及,全球數(shù)據(jù)量出現(xiàn)爆炸式增長,大數(shù)據(jù)時代即將到來,學科之間表現(xiàn)出既高度分化又高度綜合的大趨勢,學科的交叉與融合已成為科學發(fā)展的創(chuàng)新源泉和時代特征。積極推動多學科交叉,滲透與融合為高等學校的學科發(fā)展[3]創(chuàng)造了一個良好的機遇,也是高等學校實現(xiàn)新跨越的必由之路。

商業(yè)智能(business intelligence)簡稱BI是個概括性術語,它包括構架、工具、數(shù)據(jù)庫、分析工具、應用和方法論。所以商務智能的含義意味著對待不同的人有著不同的含義。就是將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,它是將計算機領域研究與經(jīng)濟管理相結合,將大數(shù)據(jù)通過計算機云計算分析與匯總,提取所需的數(shù)據(jù)信息,幫助企業(yè)做出明智的業(yè)務經(jīng)營決策的工具。

數(shù)據(jù)包括來自企業(yè)業(yè)務系統(tǒng)的訂單、庫存、交易賬目、客戶和供應商等,企業(yè)所處行業(yè)和競爭對手的數(shù)據(jù)以及企業(yè)所處的其他外部環(huán)境中的各種數(shù)據(jù)。而商業(yè)智能利用這些龐大的數(shù)據(jù)量進行數(shù)據(jù)挖掘??,輔助企業(yè)進行業(yè)務經(jīng)營決策。為了將數(shù)據(jù)轉化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)工具和數(shù)據(jù)挖掘基于大數(shù)據(jù)的云計算[2]等技術。

1 多學科交叉的研究現(xiàn)狀

21世紀,以計算機網(wǎng)絡信息化經(jīng)濟管理[4]為特征的為特征的信息革命正蓬勃發(fā)展,掀起了數(shù)字化、網(wǎng)絡化、智能化等信息化浪潮,信息革命推動了經(jīng)濟和社會轉型。經(jīng)濟結構由勞動密集型產(chǎn)業(yè)轉向信息技術密集型產(chǎn)業(yè)。這其中以云計算與物聯(lián)網(wǎng)技術為標志代表著新的網(wǎng)絡多學科的大數(shù)據(jù)交叉融合時代的到來,

交叉學科[1]是指不同學科之間相互交叉、融合、滲透而出現(xiàn)的新興學科。交叉學科可以是自然科學與人文社會科學之間的交叉而形成的新興學科,也可以是自然科學和人文社會科學內(nèi)部不同分支學科的交叉而形成的新興學科,還可以是技術科學和人文社會科學內(nèi)部不同分支學科的交叉而形成的新興學科。近代科學發(fā)展特別是科學上的重大發(fā)現(xiàn),國計民生中的重大社會問題的解決等,常常涉及到不同學科之間的相互交叉和相互滲透。

計算機科學作為一門學科在二十世紀最后的三十年間里,取得了大量的成績,從曾被認為僅是一門編程的單一課程擴展到包括從抽象的算法分析、形式化語法等等,到更具體的主題如編程語言、程序設計、軟件和硬件的一門獨立學科。而以計算機科學與許多學科諸如電子工程、數(shù)學、經(jīng)濟學和語言學等等聯(lián)系密切。這些學科之間有明顯的交叉領域,因此產(chǎn)生了許多新的交叉學科:人工智能、電子商務、計算機圖形學等等[3]。

2 計算機學科及商業(yè)智能多學科交叉的意義

2.1 多學科交叉是單科獨立發(fā)展與多科學術對話相結合。商業(yè)智能處于信息化與知識經(jīng)濟的時代,商業(yè)智能技術及相關工具已經(jīng)成為了日益重要的商業(yè)決策支持工具。商業(yè)智能在金融、財務、投資、營銷、客戶關系管理、人力資源管理、物流與供應鏈、質(zhì)量控制等諸多領域均有重要的應用價值;在銀行業(yè)、證券業(yè)、保險業(yè)、通信業(yè)、零售業(yè)、制造業(yè)、運輸業(yè)等行業(yè)已經(jīng)有了廣泛的應用,并且將來在這些行業(yè)中的應用還會進一步的深入和擴展。

2.2 多學科的交叉體現(xiàn)學術寬容與學術規(guī)范,發(fā)揮專家見識與集體智慧。學術研究有多元化的權力,有多學科的觀點,不同學科觀點不同學者要有學術寬容。同時又通過相互解釋與集體研究確立一定的學術規(guī)范。

2.3 信息革命加劇了許多學科日益向縱深、廣闊兩個方向全面展開,既高度分化又高度綜合,許多學科之間相互滲透。其結果必將推進經(jīng)濟的發(fā)展和人類文明的進步。

3 多學科交叉融合是當今科技發(fā)展的主要趨勢

從當今科技發(fā)展看,科學研究在深度和廣度上不斷拓展,研究更加精細和深入,新興科學不斷涌現(xiàn)??茖W的重大突破,以及重大原創(chuàng)性科技成果的產(chǎn)生,是與多學科交叉融合分不開的。因此,多學科交叉融合既是新興學科的生長點和優(yōu)勢學科的發(fā)展點,也是重大科技創(chuàng)新的突破點。

隨著社會科學問題的復雜性不斷被人們所認識,關于當代大科學時代社會科學研究方法論體系也正在新的意義下形成。學科的交叉與融合更加廣泛和深刻,并且日趨向一些傳統(tǒng)的學科領域滲透。在一定意義上,這可以認為是當代社會科學研究方法論發(fā)展的必然趨勢。近年來,集社會科學、數(shù)學、信息科學等形成的人工社會與計算實驗方法應運而生,并在社會科學研究中發(fā)揮了重要作用。計算實驗是社會科學領域研究方法論的重要創(chuàng)新,它以綜合集成方法論為指導,整合系統(tǒng)科學、數(shù)學與信息科學等,通過計算機技術,在計算機上再現(xiàn)社會科學問題的基本情景、微觀主體之間的相互關聯(lián)以及系統(tǒng)宏觀行為的整體“涌現(xiàn)”,并在此基礎上分析社會現(xiàn)象和問題的各種復雜行為和揭示其演化規(guī)律。

以計算機技術為代表的信息技術革命對人類社會產(chǎn)生深遠的影響。知識增長的速度極為驚人,現(xiàn)在提出的大數(shù)據(jù)時代就是典型的代表。BI在其本質(zhì)上就是較高層次的管理信息系統(tǒng),它的功能很大部分是供財經(jīng)管理人員(如企業(yè)的CFO)使用的。隨著對決策功能支持、分析處理綜合性復雜性問題的能力等要求,漸漸出現(xiàn)后期的高級管理人員信息系統(tǒng)和決策支持系統(tǒng),最終出現(xiàn)商業(yè)智能系統(tǒng)。

21世紀是以創(chuàng)新為特征的時代,不同學科間的交叉、融合將更為深刻與廣泛。許多熱門技術的應用都是從多學科的角度,運用多種知識、理論和方法才能夠得到解決。商業(yè)智能的引入正是這種信息時代的客觀要求,因此,以商業(yè)智能為基礎開展多學科交叉領域的教學將會成為的一個重要研究方向。

4 結束語

近年來,科學技術以前所未有的速度向前發(fā)展,自然科學和社會科學各學科之間相互滲透、相互交叉的趨勢日益明顯,無論是未來從事科學研究,還是直接參加社會工作,知識復合型人才都具有相當?shù)膬?yōu)勢。商業(yè)智能已經(jīng)成為最具有前景的信息領域,尤其是基于大數(shù)據(jù)的云計算[2]和數(shù)據(jù)挖掘技術更是極其重要,是當前企業(yè)最為關注的技術熱點。隨著越來越多的企業(yè)對商業(yè)智能價值的肯定,勢必造成對相關人才的極大需求。在當前的就業(yè)形勢巨大壓力之下,培養(yǎng)符合社會要求的人才極為重要。

參考文獻:

[1]管曉霞,鐘書華.高校多學科交叉項目組織與管理的三維結構模型[J].高等教育研究,2011(02).

[2]穆向陽,繆寧,陳明.范偉.云計算環(huán)境下BI對企業(yè)核心競爭力的影響[J].情報科學,2010.

[3]曾勝昌,鄒勇華.計算機專業(yè)學生科技創(chuàng)新能力培養(yǎng)的實踐與探索[J].廣東青年干部學院學報,2010(02).

[4]陳淳,楊征,蘇弟華.對高??茖W研究和學科建設科學發(fā)展的探討[J].科技管理研究,2010(11).

作者簡介:繆寧(1983-),男,講師,PASS Tianjing會員,研究方向:數(shù)據(jù)挖掘、商務智能;沈鳴(1955-).副教授.碩士生導師,研究方向:數(shù)據(jù)統(tǒng)計;魯明(1977-),講師;裴勝利(1977-),講師。

篇5

為了應對移動互聯(lián)網(wǎng)OTT業(yè)務、客戶端APP應用帶來的沖擊,運營商應以‘去電信化’的思維,加強智能管道和綜合平臺的建設和協(xié)同,參與到內(nèi)容和應用的經(jīng)營中,將電信專用網(wǎng)絡與互聯(lián)網(wǎng)相結合,提供豐富的數(shù)據(jù)應用服務。

一、打造智能管道,建設做好流量經(jīng)營

智能管道已逐漸成為運營商與OTT競爭或合作的新能力基礎。面對OTT業(yè)務競爭,運營商可通過建設DPI,PCC,特定網(wǎng)關,API接口等,實現(xiàn)針對OTT業(yè)務基于對流量識別進行差異化流量計費;實現(xiàn)基于QoS控制進行不同業(yè)務的差異化保障;實現(xiàn)短信和計費能力等電信能力的開放。(1)VoIP/IM類OTT會對電信運營商的語音和短信產(chǎn)生替代,因此對此類OTT可采取3G網(wǎng)絡接入限制,QoS管控,分流Wi-Fi等應對策略。(2)社交媒體類OTT所掌控的用戶關系、行為數(shù)據(jù)以及信息高效傳播的屬性,是電信運營商非常重要的客戶服務和業(yè)務推廣的新型渠道,其最直接的潛在價值在于可以幫助電信運營商節(jié)省客戶維系和營銷推廣的成本,對此類OTT可采取以定向流量、用戶數(shù)據(jù)或計費能力開放等應對策略。(3)流媒體類OTT其價值在于所掌控的高質(zhì)量內(nèi)容資源對用戶的高吸引力,對此類OTT可以采用定向流量,QoS差異化保障等應對策略。同時,運營商也可將智能管道能力作為與OTT進行資源置換的合作籌碼,借助OTT的業(yè)務提升自身向用戶提供差異化服務的能力。比如將基于流量識別的定向流量套餐作為OTT業(yè)務分銷的渠道,通過QoS保障提升用戶對OTT的體驗,開放計費能力給OTT提升用戶在線支付的便捷性等。智能管道也是流量經(jīng)營的基礎。在流量經(jīng)營方面,運營商應通過精細化手段提升單位流量價值,基于用戶等級或業(yè)務價值,動態(tài)配置流量資源,形成差異化服務。目前可通過資費政策,引導用戶更多地使用運營商自有業(yè)務。

二、加強綜合平臺建設

IT能力是OTT既有的核心優(yōu)勢,運營商與OTT進行同質(zhì)化業(yè)務競爭,需要通過改造現(xiàn)有BSS、OSS或新建SDP、云計算、BI等來補充IT能力,以達到業(yè)務與需求間實時及精準匹配、海量用戶數(shù)據(jù)的存儲和分析、對第三方應用開發(fā)的支撐和靈活的計費和支付等。

平臺是運營商拓展移動互聯(lián)網(wǎng)的核心,在移動互聯(lián)網(wǎng)時代,運營商與OTT進行同質(zhì)化業(yè)務競爭,除了要做好網(wǎng)絡、業(yè)務管理和計費、客戶服務外,還應建立綜合平臺。通過搭建聚合的內(nèi)容型平臺和開放的能力型平臺,開放網(wǎng)絡通信、內(nèi)容處理、綜合數(shù)據(jù)等能力,創(chuàng)新合作共贏的商業(yè)模式,提供創(chuàng)新應用服務的生成環(huán)境,幫助開發(fā)者推廣、銷售其產(chǎn)品,利用平臺優(yōu)勢獲取利潤;通過改造現(xiàn)有BSS、OSS或新建SDP、云計算、BI等可實現(xiàn)業(yè)務與需求間實時及精準匹配、海量用戶數(shù)據(jù)的存儲和分析、對第三方應用開發(fā)的支撐和靈活的計費和支付。最后,在平臺建設方面,可以建設建一個通用長連接公共平臺供微信、微博等時時在線業(yè)務使用,以避免對其他用戶使用業(yè)務的沖擊。

三、加強與OTT運營商的合作,打造面向OTT價值服務的商業(yè)模式

電信運營商可將OTT視為一種依托電信運營商網(wǎng)絡獲取價值的客戶,通過利用自身資源為其提供價值服務,從而幫助OTT提升其服務價值,并最終作用到用戶使用無線網(wǎng)絡體驗的提升上。整個數(shù)據(jù)流量傳輸過程中的價值會隨著用戶體驗的提升而提高,電信運營商則可以通過提供的價值服務獲取這部分提升的數(shù)據(jù)流量價值。

電信運營商可將將智能管道的定向流量、PCCQoS管控以及API接口作為面向OTT的分銷渠道或體驗提升服務的功能,并對此制定標準化套餐、定制化套餐、競標拍賣等收費體系,通過將“功能”和“收費體系”的組合,形成真正意義上基于智能管道能力的面向OTT的服務體系。

對于消費者而言,雖然微博、微信的呈現(xiàn)方式更多樣,成本更低,但其信息送達存在不確定性。雖然短信費用略高,但正式、直接、可靠的特性使其成為多數(shù)消費者的首選。所以電信運營商還可以與OTT進行優(yōu)勢互補,比如建立微信平臺與短信中心接口,在目標用戶離線狀態(tài)下可通過短信方式將消息送達。

四、業(yè)務創(chuàng)新

篇6

【關鍵詞】工作流引擎云計算業(yè)務流程管理商業(yè)智能

一、引言

工作流技術原理分為Petri 網(wǎng)、有向圖(DGA)或基于規(guī)則描述等[1-3]。通過將工作分解為著色和任務兩部分,按固定規(guī)范來執(zhí)行,它使得工作中固定程序的常規(guī)活動,在IT系統(tǒng)中實現(xiàn)成為可能,并實現(xiàn)全過程監(jiān)控和數(shù)據(jù)分析[4];廣泛應用于項目管理、辦公自動化等領域。

C/S模式的傳統(tǒng)集中式工作流能有效解決一般數(shù)據(jù)分析,如Clementine、SPSS等,但隨著大數(shù)據(jù)時代的來臨、商業(yè)智能(BI)的出現(xiàn),使得用戶更注重數(shù)據(jù)顯性、隱形的聯(lián)系。但隨著數(shù)據(jù)規(guī)模的爆炸式增長、非結構和半結構化數(shù)據(jù)的增多、突發(fā)性自主分析需求的增大,傳統(tǒng)工作流已無法滿足海量數(shù)據(jù)的采集清洗、聯(lián)機分析(OLAP)和數(shù)據(jù)挖掘等大數(shù)據(jù)時代的處理要求[5]。

云計算通過分布式技術,在相對低廉的基礎設施上,提供工作流所需的計算、存儲資源;包括基礎設施服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS)[6]等。

開源的Hadoop事實成為云計算上的平臺基礎,當下Hadoop成長為龐大體系,包括海量數(shù)據(jù)分析、存儲、非結構數(shù)據(jù)收集處理、任務調(diào)度和監(jiān)控等等。如智能商務平臺BC-PDM就基于Hadoop,將ETL、OLAP、數(shù)據(jù)挖掘和報表分析云化,以Web方式向用戶提供分析決策服務[8]。

基于著色Petri網(wǎng)原理,本文提出了面向海量數(shù)據(jù)業(yè)務分析的輕量級云工作流引擎,并在Hadoop平臺中部署實現(xiàn),該引擎運用于某運營商建設工程項目管理系統(tǒng)中。系統(tǒng)中,通過工作流引擎實現(xiàn)項目配置化管理;通過處理單元分配和分布式處理技術,實現(xiàn)流程處理分布式和海量數(shù)據(jù)實時分析。上線狀態(tài)良好,有效支撐運營商內(nèi)控管理和決策分析。

二、工作流引擎構建

2.1工作流引擎構建原理

當用戶請求到達時,工作流引擎立刻創(chuàng)建過程實例,建立過程實例文件保存過程實例的運行信息。同一過程實例中,選擇結構活動實例化1次或0次,循環(huán)結構活動實例化1次或N次,其他活動實例化1次。

同時,引擎將滿足條件的活動實例化,包含活動ID、初始化時間、參與者、應用程序、執(zhí)行狀態(tài)等信息,保存在過程實例文件中并生產(chǎn)用戶工作列表;用戶工作列表分己辦和待辦任務列表兩類,已辦任務列表提供完成任務信息查詢,待辦任務列表提供執(zhí)行工作項。依據(jù)工作流引擎的調(diào)度過程,本文將工作流引擎網(wǎng)劃分為過程實例化模塊、活動實例化模塊和任務分配與執(zhí)行模塊。

2.2工作流活動分解

根據(jù)引擎原理,工作流內(nèi)部數(shù)據(jù)分為五類:包括組織結構、活動實例、過程實例、活動定義和過程定義;據(jù)此定義的工作流引擎數(shù)據(jù)結構如下。(1)活動定義?;顒有畔⒂苫顒铀鶎龠^程、具體活動和執(zhí)行用戶信息構成。包括普通活動、and-join、and-join前驅(qū)活動、and-split、or-join、or-split、or-split結束活動、begin、end九種。(2)過程定義。定義過程中具體的活動列表內(nèi)容,包括活動前驅(qū)活動和后繼活動兩種。(3)過程實例。過程實例包括對象有實例創(chuàng)建者和過程定義的實例化兩種。(4)活動實例?;顒訉嵗娣旁谌蝿樟斜碇?,存放具體活動在過程實例中的任務。(5)組織結構。組織結構中存放用戶著色和分工,分配相應權限從而對應工作列表中的具體活動。

2.3工作流引擎調(diào)度算法

根據(jù)過程定義,工作流引擎控制工作流的流轉并分配參與者相應任務,而后自動調(diào)用程序執(zhí)行;包括過程實例化模塊、活動實例化模塊和任務分配與執(zhí)行模塊三部分,具體活動步驟如下:(1)用戶發(fā)起請求后,過程實例化模塊將所需執(zhí)行的流程實例化加入排隊表;(2)從流程中取出第一個活動并實例化,生成活動實例;(3)進行工作項分配、任務分配和模塊執(zhí)行,從流程實例化排隊表中取出活動分配任務,將工作項存放到用戶工作列表中;(4) 用戶執(zhí)行工作列表中的任務,并將完成活動放入已辦活動列表中;(5)引擎根據(jù)已辦活動從流程實例中獲取下一個活動;如為終止活動則結束;否則轉到(3),執(zhí)行重新實例化活動,直至流程完成或外部中止;具體調(diào)度過程如圖1所示:

三、著色Petri網(wǎng)

3.1著色Petri網(wǎng)原理

20世紀60年代出現(xiàn)了形式化的建模工具Petri網(wǎng),它采用圖形直觀表示并經(jīng)數(shù)學嚴格證明,但也存在以下缺陷:(1)無數(shù)據(jù)概念,數(shù)據(jù)控制必須轉換為網(wǎng)結構,導致模型復雜度的增大;(2)無層次概念,大型模塊無法用子模型來構建。

上述弊端使得Petri網(wǎng)只能為小型系統(tǒng)建模。

1981年,丹麥人Kurt Jensen提出具有層次性的著色Petri網(wǎng)(Colored Petri Net,簡稱CP net或CPN),它用顏色聲明表示托肯的數(shù)據(jù)類型,用函數(shù)表示變遷的激發(fā)和著色標識的關系,將庫所與指定的顏色集綁定,指定庫所存儲的資源類型,具有嚴格的形式化描述方法、直觀圖形表達能力和動態(tài)仿真特性等特點。在并發(fā)系統(tǒng)、通信系統(tǒng)和分布式系統(tǒng)等的建模方面廣泛應用。

CPN可用任意復雜的數(shù)據(jù)類型作為顏色集,其表達能力上的優(yōu)勢,可有效解決如下問題:(1)動態(tài)工作流生成多種狀態(tài)空間,使實際應用結點過多,計算機固化受限問題;(2)運行過程中,從多個可執(zhí)行的活動產(chǎn)生的路徑不確定和著色申請問題;(3)運行過程中,處理多個實例導致的token消耗和混亂問題。

CPN為九元組[9] (∑,P,T,A,N,C,G,E,I),利用token顏色描述對象屬性。其中,p(s)表示與弧s連接的庫所,Var(exp)表示表達式exp變量集合,CMS表示集合C上的多重集,Type(v)表示變量v類型,對應含義見表1。

3.2CPN觸發(fā)分析

m(p)為不同顏色標記的多集合,用于表示庫所中的 token,表示庫所P包含2個顏色為和3個顏色為的令牌,如下方法:

C(m(P))={g,r}=2g+3r(1)

公式(1)表明,每個庫所的顏色集合C(P)定義允許計入的令牌顏色集合,每條弧A的顏色集合包含在C(P)中,而token顏色屬于弧A顏色集合。當觸發(fā)規(guī)則和弧函數(shù)E決定進行轉換時,顏色變換被觸發(fā)。

[A]Pj∈ti且[A]Pk∈ti,如果Ef(pi,ti)≤m(pj)且m(pj)可用,則觸發(fā)ti,產(chǎn)生新標記m如下:

m(pk)=m(pk)+Ef(ti,pk) (2)

m(pj)=m(pj)-Ef(pi,ti)(3)

當且僅當ti的導入庫所pj包含token與弧f(pj,ti)相關的弧函數(shù)Ef(pj,ti)一樣多時,變換ti才被觸發(fā)。觸發(fā)時,ti使用輸入地Ef(pj,ti)指定數(shù)量的顏色token,并存放Ef(ti,pk)指定數(shù)量的token到輸出地pk中。即f(pj,ti)弧函數(shù)指定應從pj回收的特定顏色token數(shù);f(ti,pk)弧函數(shù)指定插入的特定顏色token數(shù)。

四、云平臺實現(xiàn)

4.1云平臺部署

算法分析單元通過工作流形成有序結合,最終在云平臺實現(xiàn)BI應用和分析。云平臺包括三部分:(1)Web客戶端:供用戶使用界面;(2)工作流引擎:基于CPN網(wǎng),實現(xiàn)流程的解析、分發(fā)、執(zhí)行和監(jiān)控;(3)云平臺:基于Hadoop,融合BI經(jīng)營分析算法,提供云存儲和云計算服務;將工作流各個活動節(jié)點封裝在Web服務的節(jié)點中;調(diào)用對應的抽象類型實現(xiàn)對不同對象實例的動態(tài)加載,最終完成整個流程。

當用戶在Web客戶端提出需求后,云平臺中事務的具體活動步驟如下,如圖2所示:

(1)工作流事務需求提交給工作流引擎處理;工作流引擎結合參數(shù)實例化流程,并解析為有向無環(huán)圖(DAG),保存到流程列表中;(2)用戶需求為云事務需求,則通過部署模塊解析調(diào)用相應BI算法,提交到云平臺;(3)云平臺中的Job Tracker安排執(zhí)行Job,并通過MapReduce計算模式在分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)中處理,將最終結果存放到數(shù)據(jù)庫HBase的BigTable表中;(4)反饋給用戶最終結果,完成整個流程。

4.2系統(tǒng)實現(xiàn)

結合CPN,開發(fā)“企業(yè)信息化快速開發(fā)平臺”的輕量級工作流中間件,該中間件可實現(xiàn)圖形化的流程配置和路由控制。流程實例化可根據(jù)參數(shù)和規(guī)則,動態(tài)判定執(zhí)行節(jié)點和執(zhí)行路徑。某運營商項目管理流程圖中,深色部分表示已執(zhí)行節(jié)點,黑色部分表示無需執(zhí)行節(jié)點,其他淺色節(jié)點表示尚需完成流程,如圖3所示。

將工作流中間件、BI分析模塊和0.20.2版本的Hadoopv融合,開發(fā)了某運營商工程項目管理信息云服務系統(tǒng)。系統(tǒng)正式部署運行成功,已通過為期3個月的環(huán)境和壓力測試。

運營商工程項目類型包含5個大類、18個小類,在系統(tǒng)中均通過工作流中間件,實現(xiàn)可視化配置。流程節(jié)點的處理著色和權限與客戶信息分類對應,并融入對上下流程節(jié)點的無縫連接和處理個性化要求(如時限要求),如圖4所示。

系統(tǒng)中,單個工程項目文件最小200MB,最大6GB,平均大小在1.2GB左右;全省每年項目約6000個,文件大小共計約7.2TB??紤]到HDFS分布式存儲和高度容錯機制需求,云平臺所需的存儲空間按3:1擴展,共計24TB。

云平臺環(huán)境中,采用1臺IBM3850作為Web服務器和數(shù)據(jù)庫服務器;1臺IBM3650作為工作流引擎服務器;1臺IBM3650做Hadoop平臺主控服務器;6臺配置為雙路4核Xeon E5405@2GHZ、16G內(nèi)存、4TGB硬盤的利舊服務器作為云平臺子節(jié)點。

在BI分析中,云平臺精細到工作流流程節(jié)點顆粒度,進行各流程環(huán)節(jié)信息統(tǒng)計、分析處理。包括單個項目詳細信息、多緯度項目超時明細、各環(huán)節(jié)部門運作情況、待辦超時明細和對應著色評估,并能按發(fā)起部門、所在區(qū)域統(tǒng)計整體建設情況分析和資金預算使用比。基于Hadoop的云平臺分析,可實時提供經(jīng)營分析數(shù)據(jù),為企業(yè)公平管理和快速決策分析提供有力支撐,如圖5所示。

五、結束語

基于CPN,本文提出一種輕量級的云平臺工作流系統(tǒng),并實現(xiàn)Saas應用。結合并行BI統(tǒng)計分析能力,融合云平臺分布式計算和存儲能力,為運營商建設工程項目管理提供有效項目管理和經(jīng)營分析應用。實際使用表明,系統(tǒng)能夠支持省級多用戶的高并發(fā)量,而且能夠高效地調(diào)用數(shù)據(jù)分析算法,實時展現(xiàn)數(shù)據(jù)分析結果。

云平臺中,下一步深入研究可集中在:①云工作流系統(tǒng)效能的進一步提高;②ODS(企業(yè)數(shù)據(jù)倉庫)的建立和數(shù)據(jù)有效清洗;③包括OLAP、數(shù)據(jù)挖掘和報表分析云化等BI功能的加強。

參考文獻

[1]苑迎春,李小平,王茜. 基于逆向分層的網(wǎng)格工作流調(diào)度算法[J]. 計算機學報,2008,31(2)

[2]梁瑩,徐福緣. 企業(yè)專利資源管理流程本體建模研究[J]. 計算機工程與應用,2010,46(1)

[3]吳紹艷. 工程項目工作流的Petri網(wǎng)表示及模型建立[J]. 計算機工程與應用,2009,45(30)

[4]范玉順. 工作流管理技術基礎[M]. 北京:清華大學出版社,2001

[5]于樂,趙帥,章洋等. 云工作流技術在商業(yè)智能SaaS中的應用[J]. 計算機集成制造系統(tǒng),2013,19(9)

[6]閏歌,于炯,楊興耀. 云計算環(huán)境下科學工作流兩階段任務調(diào)度策略[J]. 計算機應用,2013,33(4)

[7]YU L, ZHENG J, WU B. BC-PDM: data mining, social network analysis and text mining system based on cloud computing[C]. Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, N.Y.,USA:ACM,2012:1496-1499.

[8]JENSEN K. An introduction to the theoretical aspect of colored Petri nets[J]. A decade of concurrency lecture notes in Computer Science,1994,803:230-272.

篇7

HP倡導從IT到B.T.的歷史嬗變(圖為2007惠普亞太區(qū)企業(yè)媒體峰會現(xiàn)場)

5月22日,在新加坡舉行的2007惠普亞太區(qū)企業(yè)媒體峰會的現(xiàn)場,到處都掛滿了巔倒了的“IT”字樣,畫面上員工的身體也一律朝下,在惠普的寓意中,IT時代已然過去,B.T.(Business Technology)時代正在巔覆人們舊有的觀念,而從IT到B.T.的嬗變,正是惠普引導產(chǎn)業(yè)變革的一次重大實踐。

從IT到B.T. 惠普在變

在此次亞太區(qū)論壇上,惠普一再闡述B.T.時代到來的必要性和必然性?;萜战忉屨f,現(xiàn)在IT已經(jīng)不再是單純的技術支撐,而已經(jīng)的的確確變得和業(yè)務一樣重要,它甚至已經(jīng)與業(yè)務融合為一體。在惠普的解釋中,I(Information信息)也就相應地變成B(Business業(yè)務)出現(xiàn)在T(Technology)的前面?;萜諒娬{(diào)說,針對業(yè)界重要的變遷,惠普也已經(jīng)制定出了完整的服務和產(chǎn)品組合,來響應產(chǎn)業(yè)變革的需求。

業(yè)內(nèi)專家分析,惠普所倡導的B.T.理念,是為順應產(chǎn)業(yè)發(fā)展,尤其是客戶需求變化順勢而為的產(chǎn)物,因為從目前來看,惠普TSG(企業(yè)計算及專業(yè)服務集團)所面向的大企業(yè)客戶已減緩了IT信息系統(tǒng)的建設工作,并將業(yè)務重點轉移到對既有系統(tǒng)的重構和優(yōu)化上,惠普的理念正好迎合了這些企業(yè)客戶現(xiàn)階段信息系統(tǒng)建設的特點,此舉更易獲得他們的好感,從而擴大和鞏固惠普在這一傳統(tǒng)市場領域的地位和影響力。

“IT”為業(yè)界約定俗成的全球性產(chǎn)業(yè)稱謂,抹去IT,變更為B.T.非一般廠商所能倡導,惠普如此激情響應B.T.,其醉翁之意不在酒,做大做強TSG業(yè)務才是其根本目的。

國際知名調(diào)研機構Forrest市場研究公司高級副總裁Christopher Mine在演講中表示:“用IT來描述當前企業(yè)中的一個部門已略顯過時。IT主管應與負責企業(yè)運營的高級主管平起平坐,集中精力改善流程,并尋找新的收入來源,通過技術獲得更出色的業(yè)務成效?!盙eorge F. Colony建議IT業(yè)界應該用術語“業(yè)務科技”或“B.T.”來替換“IT”,George F. Colony總結說:“現(xiàn)在業(yè)務就是科技,科技就是業(yè)務?!?/p>

同時惠普也進行了一系列的調(diào)查,結果表明,公司的業(yè)務決策者和技術決策者之間越來越協(xié)調(diào)一致,絕大部分的CEO和CIO都認為,技術對企業(yè)能否取得成功起著至關重要的作用。調(diào)查數(shù)據(jù)還表明,88%的CEO和90%的CIO在技術如何為企業(yè)帶來業(yè)務成效這一問題上觀點基本一致。這表明,在企業(yè)的業(yè)務戰(zhàn)略決策中,CIO的地位正在提升。

現(xiàn)場中,惠普還播放了惠普TSG執(zhí)行副總裁Ann Livermore女士的視頻講演:“毫無疑問信息技術的時代已經(jīng)結束。技術已成為業(yè)務賴以發(fā)展的根本和加速企業(yè)成長的動力之源。進入業(yè)務科技時代后,CIO們可以將業(yè)務成效作為投資效益的衡量標準,如考察投資在管理風險、加速成長和降低成本等方面是否起到了促進作用?!?Livermore表示:“隨著時間的推移,將會有越來越多的CIO參與到戰(zhàn)略規(guī)劃中來?!?/p>

TSG力量是否止于此?

在完成一系列的收購之后,在IT基礎架構的底層解決方案中,惠普變得異常強大,這不得不引發(fā)人們更深一步的猜想:惠普會不會將觸角伸向中間件,甚或商業(yè)應用軟件。如此,惠普將變得“面目猙獰”,而且將使現(xiàn)有的軟件世界格局發(fā)生重大影響。但是業(yè)內(nèi)分析人士認為,惠普的收購之路不會擅越雷池,否則在商用系統(tǒng)市場上更為強大的IBM早就先行一步了,而更有分析人士認為,如果惠普收購之路走得更遠一點,那么就會損害惠普與其上層應用軟件廠商的盟友關系,進而影響盟友對其硬件產(chǎn)品的銷售,從這一點上分析,惠普的收購應該會極有分寸地進行。

從目前惠普的業(yè)務規(guī)劃來來看,惠普TSG所擁有的業(yè)務資產(chǎn)被分為三大塊:AI、BIO、BTO。

在AI方面,已經(jīng)涵蓋大部分惠普產(chǎn)品的組合,這些產(chǎn)品組合為新一代數(shù)據(jù)中心提供了一個平臺,客戶可以優(yōu)化基礎設施、降低成本、最大限度減少風險,并加速成長。

在BIO方面,惠普整套產(chǎn)品組合的核心是業(yè)務智能(BI)和信息生命周期管理(ILM)兩種解決方案。

為加強BIO的力量,惠普不但從外部收購了新的公司,還進一步規(guī)劃了內(nèi)部組織架構,并不斷推出新產(chǎn)品。

記者注意到,惠普剛剛推出HP Neoview ,這是一款24×7全天候運行的新一代數(shù)據(jù)倉庫,另外,惠普還推出了4種商業(yè)智能服務,包括戰(zhàn)略和規(guī)劃、信息集成、信息交付、信息質(zhì)量。除此之外,惠普近日還推出了新一代數(shù)據(jù)倉庫平臺和新的業(yè)務智能(BI)服務,旨在幫助企業(yè)更好地訪問數(shù)據(jù),以做出更加明智的決策,從而降低成本與風險,并加速增長。

在收購方面,惠普去年收購了Knightsbridge Solutions公司,這是一家專注于業(yè)務智能解決方案、擁有700位專家的美國咨詢公司,該項舉措使惠普服務得到了增強。

在內(nèi)部,今年1月,惠普在軟件部門內(nèi)部成立了一個專注于業(yè)務智能的業(yè)務部門。

據(jù)了解,惠普業(yè)務智能團隊乃至整個公司,正致力于整合惠普在基礎設施、軟件與服務等領域的能力,并輔以惠普服務部門對Knightsbridge收購這一業(yè)務智能投資。

在BTO方面,惠普做出了一個驚人的舉動,去年花費45億美元巨資買下了美科利,并借美科利的力量實現(xiàn)了全面的業(yè)務科技優(yōu)化軟件產(chǎn)品組合。自2006年9月完成對美科利公司的收購至今,全球已有成百上千的客戶購買了HP OpenView和美科利產(chǎn)品的組合產(chǎn)品。

通過一系列的收購重組和推新,目前惠普新軟件部門產(chǎn)品組合包含了行業(yè)最全面的IT管理軟件。這些軟件將在為企業(yè)提供劃分業(yè)務需求優(yōu)先級,協(xié)調(diào)IT資源,實現(xiàn)最佳業(yè)務成效,以及確保關鍵任務應用達到要求的性能與質(zhì)量水平,安全、成功地部署基于面向服務的架構的業(yè)務服務等方面,發(fā)揮重要的作用。

篇8

有意思的是,趙宇辰曾經(jīng)供職于LinkedIn,要知道,數(shù)據(jù)科學家的概念最早就是由LinkedIn提出的。

定位為新型移動CRM軟件的銷售易為什么會需要人工智能?是未雨綢繆?還是趕時髦?

AI在企業(yè)級業(yè)務中扮演什么角色?

在今年的全國兩會上,人工智能首次被寫入政府工作報告,這意味著,人工智能技術已經(jīng)上升為國家戰(zhàn)略。

一般大家會認為,AI就是個高端的機器人,或者是個會下棋的AlphaGo。其實,這只是人工智能在應用層面很小的一部分。

我們在淘寶、在亞馬遜上買東西,總會收到各種推薦,而這些推薦總是正中下懷;甚至托福、GRE在線模擬考試中,作文可以“電腦自動判分”;還有跟春天的花一樣燦爛,在朋友圈頻頻刷屏的“微軟識花”……所有這些,都是AI的應用點?!吧窠?jīng)網(wǎng)絡也好,分類器也罷,大家并不會覺得后面是什么算法在驅(qū)動?!壁w宇辰說。

以上的這些,也只是人工智能在消費級領域的一些應用。

在美國,企業(yè)級市場對于數(shù)據(jù)挖掘、機器學習的研究早已如火如荼,正在從BI(商業(yè)智能)向AI方向發(fā)展,美國企業(yè)級服務巨頭們也正在開發(fā)各類基于AI的企業(yè)應用。

IDC最新研究報告顯示,到2018年,55%的企業(yè)以及ISV開發(fā)者都將在產(chǎn)品中嵌入至少一個認知AI或機器學習的功能,在商業(yè)分析工具領域,這一比例將會更高。

對此,銷售易創(chuàng)始人兼CEO史彥澤表示:“新的技術趨勢也給CRM企業(yè)帶來新的機遇和挑戰(zhàn)。未來的CRM不僅僅是幫企業(yè)定義一些工作流或者實現(xiàn)銷售自動化,而且是要往智能化方向發(fā)展,真正為企業(yè)帶來幫助和產(chǎn)生價值。一套承載了公司最核心數(shù)據(jù)的智能化CRM管理系統(tǒng),對未來企業(yè)智能化運營、精準決策和高效管理有著巨大的意義。”

傳統(tǒng)的客戶服務和客戶管理方式都是透過單向客戶信息來進行互動來往的,比如通過知道客戶的聯(lián)系方式,利用郵件、通訊軟件、電話與客戶溝通,但如果之后的商務往來中需更多的使用協(xié)助與效率增進就變得更為困難,這正人工智能在商業(yè)協(xié)作領域的商機所在。

AI能否重構CRM?

Gartner2016年的CRM市場分析報告通過對Salesforce、SAP、Oracle、Microsoft、Adobe 等 CRM 供應商進行數(shù)據(jù)分析,得出了“分析、機器學習和人工智能是CRM未來發(fā)展方向”的結論,認為這將在未來3年內(nèi)徹底改變CRM。

CRM的本質(zhì)是客戶關系管理,最大特點是連接內(nèi)外。過去,傳統(tǒng)CRM定義銷售、市場、客服、自動化,其實是銷售記錄管理。“傳統(tǒng)CRM是將內(nèi)部打通,而在數(shù)字化時代,更重要的是如何把外部的合作伙伴、經(jīng)銷的合作伙伴,以及合作伙伴服務的合作伙伴,甚至把最終用戶給連接起來?!笔窂裳a充道,“當內(nèi)外部全盤聯(lián)通起來以后,這中間就產(chǎn)生了非常大的化學反應和變化?!?/p>

據(jù)史彥澤透露,銷售易會在今年內(nèi)陸續(xù)幾條重要的產(chǎn)品線,從而完成人工智能和大數(shù)據(jù)重構CRM的布局。

銷售易在年初宣布完成2.8億元D論融資時,史彥澤表示,該輪融資資金將用于加強產(chǎn)品和技術方面的能力提升。時隔2個月,趙宇辰的加入可謂是銷售易在這一方向深耕的標志性動作,

篇9

如果2016年以前可以稱之為大數(shù)據(jù)發(fā)展的“上半場”,其核心工作是大數(shù)據(jù)市場的教育,那么從2017年開始,大稻萁進入“下半場”,其核心任務是全面推進大數(shù)據(jù)的應用,特別是行業(yè)應用。和云計算一樣,大數(shù)據(jù)也是企業(yè)業(yè)務轉型升級的一個重要“抓手”。國家的重視與扶持為大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展提供了一個良好的契機,那么大數(shù)據(jù)廠商和企業(yè)用戶又該如何利用好這一契機,加速大數(shù)據(jù)應用的落地呢?

大數(shù)據(jù)是能力,更是一種素養(yǎng)

提到Qlik公司,可能很多人都不會感到陌生。2016年2月,Qlik再次位列GarLrteT商業(yè)智能與分析平臺魔力象限報告的領導者象限,這已經(jīng)是Qlik連續(xù)6年位列領導者象限。用Qlik大中華區(qū)董事總經(jīng)理潘應麟(Aries Poon)的話說,Qlik是商業(yè)智能(BI)領域顛覆性的力量。

大數(shù)據(jù)概念的普及、云計算的應用,以及社交網(wǎng)絡、移動應用在中國的快速興起,促使中國企業(yè)用戶更加關注大數(shù)據(jù)應用,同時也推動了商業(yè)智能在中國的迅猛發(fā)展?!?017年,可視化分析平臺的探索將成為大數(shù)據(jù)應用的重點和熱點之一。每個員工對大數(shù)據(jù)的認知和數(shù)據(jù)素養(yǎng)的提升,將進一步推動企業(yè)的大數(shù)據(jù)實踐?!芭藨氡硎?。

2017年是數(shù)據(jù)化元年,這是Qlik給出的判斷。未來,整個社會是以數(shù)據(jù)為驅(qū)動的,企業(yè)的決策是以數(shù)據(jù)為依據(jù)的。這是數(shù)據(jù)化帶來的最大變化。實現(xiàn)數(shù)據(jù)化需要一個過程,不僅需要“趁手”的大數(shù)據(jù)工具,更需要具有數(shù)據(jù)素養(yǎng)的人。這里說的人既包括那些專業(yè)的大數(shù)據(jù)工程師和科學家,也包括企業(yè)普通的員工。毫無疑問,數(shù)據(jù)化將引領信息化的新風尚。

在數(shù)據(jù)化時代,有哪些新的趨勢、熱點值得關注呢?

在大數(shù)據(jù)剛出現(xiàn)時,很多人認為大數(shù)據(jù)可以取代商業(yè)智能。其實,大數(shù)據(jù)與商業(yè)智能并不矛盾,大數(shù)據(jù)只是一種實現(xiàn)商業(yè)智能的更先進、更有效的手段和方法。

傳統(tǒng)的商業(yè)智能應用通常部署在企業(yè)內(nèi)部,比如部署在企業(yè)本地的數(shù)據(jù)倉庫。Qlik認為,2017年是云計算的一個爆發(fā)點,大量的商業(yè)智能應用將部署在云端,而且混合云的應用方式更受企業(yè)青睞。傳統(tǒng)的商業(yè)智能主要工作是制作讓領導看的各種報告和報表。傳統(tǒng)的商業(yè)智能是管理層專享的。但是隨著大數(shù)據(jù)技術的發(fā)展,以及可視化分析功能的增強,數(shù)據(jù)分析的效率持續(xù)走高,而數(shù)據(jù)分析的成本不斷降低,即使是普通員工也可以做一些力所能及的數(shù)據(jù)分析和挖掘工作?,F(xiàn)代化的商業(yè)智能成了大眾的“福利”。

以前,企業(yè)出于集中管理的需求而采用商業(yè)智能系統(tǒng),看重靈活性與規(guī)?;?,有時可能會為了達到管理的目的而犧牲敏捷性。潘應麟表示,從2017年開始,現(xiàn)代化商業(yè)智能將逐漸取代傳統(tǒng)商業(yè)智能,追求彈性和開放平臺,讓更多的員工受惠。

大數(shù)據(jù)分析再也不是少數(shù)管理層和專家的專利??陀^上,自助式的可視化分析工具的成熟促進了大數(shù)據(jù)應用的“平民化”發(fā)展,讓那些希望自己掌控信息的處理、分析和挖掘的企業(yè)有了更多的主動權和選擇權。以前,企業(yè)為了分析而分析,分析是目的?,F(xiàn)在,分析是面向用戶和需求的,分析的焦點轉向了定制分析應用和應用中的分析。大數(shù)據(jù)工具漸漸變成了一個易于獲取的商品,一些桌面的可視化應用已經(jīng)是免費的。未來,人們將以更低的成本、更快的速度實現(xiàn)可視化的分析,探討數(shù)據(jù),獲得更深入的商業(yè)洞察。

大數(shù)據(jù)是一種能力,更是一種素養(yǎng)。大數(shù)據(jù)的概念剛出現(xiàn)時,很多人理所當然地將大數(shù)據(jù)認定為是“陽春自雪”,是只有大數(shù)據(jù)科學家才玩得轉的技術和應用。但是,當人們發(fā)現(xiàn)大數(shù)據(jù)應用無處不在,給人們的工作和生活帶來翻天覆地的變化時才逐漸認識到,大數(shù)據(jù)不應該被當成一門深奧的學科,只供理論研究,而應該成為每個企業(yè)甚至每個員工的一種能力,或者說應該具備的一種專業(yè)素養(yǎng)。

現(xiàn)在,許多大數(shù)據(jù)企業(yè)得到這樣一種共識――人人都是數(shù)據(jù)科學家,它的意思是,即使你不具備高等數(shù)學、數(shù)據(jù)建模等專業(yè)知識,也可以輕松自如地應用大數(shù)據(jù)的工具、方法,快速獲得想要的分析結果,并以此作為決策的依據(jù)和行動的指南。

企業(yè)要具備數(shù)據(jù)化運營的能力,員工要具備基本的數(shù)據(jù)素養(yǎng)。數(shù)據(jù)化可以解釋為閱讀、操作、分析和討論數(shù)據(jù)的能力。這也是Qlik認為的數(shù)據(jù)素養(yǎng)的基本內(nèi)涵。

“我們嘗試建立一個大數(shù)據(jù)的培養(yǎng)體系,在普遍提升企業(yè)員工的數(shù)據(jù)素養(yǎng)的同時,更多更好地培養(yǎng)大數(shù)據(jù)工程師、大數(shù)據(jù)科學家?!迸藨氡硎荆拔覀兊淖罱K目標是建立一個可信的數(shù)據(jù)化環(huán)境,讓用戶放心地使用數(shù)據(jù)。”

善于發(fā)現(xiàn)大數(shù)據(jù)商機

《規(guī)劃》中提出了大數(shù)據(jù)的七大任務:強化大數(shù)據(jù)技術產(chǎn)品研發(fā),深化工業(yè)大數(shù)據(jù)創(chuàng)新應用,促進行業(yè)大數(shù)據(jù)應用發(fā)展,加快大數(shù)據(jù)產(chǎn)業(yè)主體培育,推進大數(shù)據(jù)標準體系建設,完善大數(shù)據(jù)產(chǎn)業(yè)支撐體系,提升大數(shù)據(jù)安全保障能力。大數(shù)據(jù)的發(fā)展可以從行業(yè)入手,抓住幾個熱點領域,比如工業(yè)大數(shù)據(jù)、政府大數(shù)據(jù)、制造業(yè)大數(shù)據(jù)、安全大數(shù)據(jù)等,率先取得突破。

篇10

第一個例子是二十世紀九十年代啤酒和尿布的例子,講的是沃爾瑪通過分析發(fā)現(xiàn)啤酒和尿布具有關聯(lián)性,然后把兩個貨物放在一起,導致銷量大幅度上升。

第二個例子是近期發(fā)生的一件事。在奧巴馬連任之后,有媒體評論,華盛頓那些基于直覺和經(jīng)驗決策的競選人士的優(yōu)勢正在急劇下降,取而代之的是數(shù)據(jù)分析專家和電腦程序員的工作。一位官員評論說,在政治領域大數(shù)據(jù)的時代已經(jīng)到來。

講到大數(shù)據(jù)的時候,大家經(jīng)常講到這兩個例子,沃爾瑪和奧巴馬的例子同樣是一幫人在做數(shù)據(jù)分析。但是為什么說現(xiàn)在大數(shù)據(jù)的時代已經(jīng)到來呢?上個世紀九十年代時,沃爾瑪?shù)臄?shù)據(jù)量應該也很大,分析應該也是很困難的,但為什么那時沒有被稱為大數(shù)據(jù)時代呢?

數(shù)據(jù)和大數(shù)據(jù)

對這兩個例子我總結了一下,覺得它們之間有一些相同點和不同點。

相同點是都進行了數(shù)據(jù)的分析。不同點是什么?第一個不同是時間上的差別。第一個例子是發(fā)生在上世紀的九十年代,那時互聯(lián)網(wǎng)剛剛興起。另一個例子發(fā)生在上個月,現(xiàn)在已經(jīng)到了互聯(lián)網(wǎng)無處不在的時代。第二個不同的是,沃爾瑪分析的是企業(yè)的銷售數(shù)據(jù),銷售數(shù)據(jù)都是結構化的數(shù)據(jù),所以他是用典型的數(shù)據(jù)分析和挖掘方法來進行分析的。而奧巴馬的團隊重點分析的是互聯(lián)網(wǎng)數(shù)據(jù),這類數(shù)據(jù)不可能都是結構化數(shù)據(jù),當然會有一部分非結構化和半結構化的數(shù)據(jù)。

前者基于關系型數(shù)據(jù)庫的分析方法其實就是數(shù)據(jù)挖掘或BI(商業(yè)智能)。后者則被稱為大數(shù)據(jù)。大家都知道凡是做數(shù)據(jù)挖掘的,一定是從歷史數(shù)據(jù)上進行分析和整理。但是在大數(shù)據(jù)時代,更多地應該是分析實時的信息。

大數(shù)據(jù)的推動力和概念

大數(shù)據(jù)之所以被稱為大數(shù)據(jù),我認為主要是有以下四個方面的推動力。

一是互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及隨處可見的監(jiān)控和遙測設備等產(chǎn)生的大規(guī)模的數(shù)據(jù),這些數(shù)據(jù)源的數(shù)目、種類以及數(shù)據(jù)產(chǎn)生和發(fā)生的速度和頻率都在急劇增長。

第二個推動力是云計算的日益成熟,為大數(shù)據(jù)提供了成熟的環(huán)境和處理能力,推動了數(shù)據(jù)挖掘和商業(yè)智能發(fā)展到大數(shù)據(jù)階段。

第三是非結構化數(shù)據(jù)處理技術的快速發(fā)展。

第四是政治、經(jīng)濟、文化和構建和諧社會的應用需求,推動了大數(shù)據(jù)的發(fā)展。

大數(shù)據(jù)的價值

那么,大數(shù)據(jù)有什么價值呢?首先舉個例子,谷歌曾利用大數(shù)據(jù)技術對全球登革熱趨勢進行過預測,他們得到的預測數(shù)據(jù)和實際的數(shù)據(jù)非常地吻合,這就帶來了一個好處,我們可以通過這一趨勢預測它的發(fā)病時間和周期以及它的振蕩。通過這個例子我們可以看到,大數(shù)據(jù)所帶來的一些價值。我認為,大數(shù)據(jù)的作用體現(xiàn)在以下幾個方面:一是早期的預警;第二是實時的感知;第三是實時的反饋。

大數(shù)據(jù)的挑戰(zhàn)

當然,在大數(shù)據(jù)的發(fā)展過程中,也存在著一些挑戰(zhàn)。