大數據時代的概念與特征范文
時間:2024-01-04 17:40:55
導語:如何才能寫好一篇大數據時代的概念與特征,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
1大數據時代概念的提出
當前,大數據這一詞匯在各行各業(yè)中出現(xiàn)的頻率越來越高,各種媒體中也經常對這大數據這一概念進行推廣,大數據時代逐漸成為了一個社會熱詞,昭示著大數據時代的來臨。
在學界中,大數據的理論思考與實踐探索一直在如火如荼的濟寧這,并與經濟市場,政府機關形成了良好的合作與互相支持的模式。大數據時代的來臨與當前互聯(lián)網時代的建設基礎和發(fā)展迅速的信息技術具有重要聯(lián)系,早在上個世紀末就有了關于大數據時代的理論雛形,對整合所有數據并對數據進行加工,分析,處理提出設想。這一設想的提出與同一時期的“商業(yè)智能”的具有密切的聯(lián)系,所謂商業(yè)智能也是指建立數據倉庫的基礎上挖掘數據的深度含義,分析數據從而挖掘出數據之間的內部聯(lián)系性,從而獲取文化公司所需要的信息,為文化公司的發(fā)展提供決策思路和數據支持。
直到世紀,信息技術的發(fā)展導致各種數據統(tǒng)計工作的便捷與高效性,人們逐漸發(fā)現(xiàn)了進行大規(guī)模數據分析和研究對文化公司在發(fā)展過程中所能起到的作用,互聯(lián)網的覆蓋范圍越來越廣,在各行業(yè)各的應用程度愈來愈高,智能手機的普及都為大數據時代的來臨打下了堅實的基礎,隨后大數據的概念在信息技術行業(yè)中越來越得到認可與重視,大數據的相關理論基礎研究與前景展望也越來越多,為大數據時代構建了理論結構與應用前景。
2012年的達沃斯世界經濟論壇中將大數據作為主題之一進行討論,可以說變相確定了大數據在未來社會發(fā)展進程中的地位,探究了以信息技術為依托的大數據處理分析如何對人類社會的發(fā)展作為貢獻。國內對大數據在未來發(fā)展中將占據的地位和起到的作用也做出了充分的認可,各大企業(yè)與高校對大數據的概念與應用已經開始進行研究與實踐。
2大數據一詞的概念與理解
對大數據時代的理解離不開對大數據的概念的理解。什么是大數據?就當下而言,雖然大數據一詞的出現(xiàn)的頻率極高,許多媒體,部門,論壇都在使用這一詞語,但是對大數據一詞的核心含義的理解卻并不一定充分。當前學界內對數據一詞的定義尚且沒有一個統(tǒng)一的較為得到廣泛認可的定義。對大數據一詞的定義可以分為幾種,例如維基百科上說大數據就是指數量、規(guī)模龐大的數據資料,無法利用常見的軟件工具對其進行高效率收集,處理與分析。還有的的說法認為大數據就是單純指數據量足夠大,遠超常規(guī)水平的數據集合。還有的說法主要是認為大數據進行處理的方式才是大數據一詞的實質,即大數據是通過特殊處理模式能提高企業(yè)對市場形勢的掌控程度,為決策提供指導的數據分析處理方法。
因此來看,大數據的特征應該包含著兩方面,一是大數據處理在技術層面具有先進性,二是大數據在社會性方面具有廣泛性。如上文所述,大數據一詞的出現(xiàn)是信息技術進步的結果。大數據最先出現(xiàn)其是存在與IT界的術語,大數據是一個多項技術合并在一起的概念,是一個具有系統(tǒng)性的體系,包括對數據依托信息技術實現(xiàn)大規(guī)模儲存與聯(lián)網分享的云技術,對數據進行分析處理的分布式處理技術,指紋識別,虹膜識別等對數據進行保密管理的感知技術等等,都應該包括與大數據體系之中。與此同時,大數據還具有社會性。大數據這一概念的出現(xiàn)離不開信息爆炸化的時代特征,大量的信息充斥于社會的每一個角落并呈現(xiàn)著井噴式的增長,每一個人都是數據的創(chuàng)造者與傳遞著,國際化進程的加快使人類社會前所未有的緊密聯(lián)系在一起,在這種時代背景下醞釀出來的大數據概念無法避免的具有人類社會發(fā)展的特征。
在大數據時代,人們的思維模式必須向大數據化的方向靠攏,傳統(tǒng)的思維模式已經不適合時代的發(fā)展。信息技術的進步使我們的思維模式也可以在依托大數據提供的信息作出更準確的決策和判斷。在大數據模式下,高效率的數據收集與處理是我們可以脫離傳統(tǒng)的抽樣調查得出結論的辦法,不用再考慮數據模型是否具有科學性和代表性,也不用考慮抽樣結果是否具有偶然性,因為我們已經可以立足于全面性的數據來對問題進行思考與判斷,同時,對數據的判斷要提高效率,應為判斷的本身也是一個大數據的過程,提高判斷的效率再借以數據統(tǒng)計來提高其準確性。在大數據時代,人們面對數據不需要刨根問底的研究數據出現(xiàn)的原因,而是應該要考慮數據之間的關聯(lián)性,研究數據之間的聯(lián)系,思考關聯(lián)出現(xiàn)的原因而不是單純研究因果關系。
大數據時代對于社會的改變在于,它變革的是人們處理數據的方式與模式,改變的是人認知世界,認知事物的方法,在數據化的信息處理中提供發(fā)現(xiàn)問題,解決問題,創(chuàng)造價值的方法。大數據作為一個新生事物能開創(chuàng)出一個新的時代,不得不說大數據在我們當下的社會發(fā)展進程中是極有價值的。雖然大數據的定義及體系,實踐應用方面還存在許多不足,缺少經驗方面的積累,但是筆者相信隨著時間的推移大數據體系的形成必將越來越完備。我們當下所需要做的就是把握住大數據時代的時代脈搏,必須明確大數據時代的要求:首先,大數據時代必須充分利用信息技術來提高數據的收集與儲存,利用新的數據處理模式發(fā)現(xiàn)數據之間的關聯(lián)新,為決策提高科學性的指導與數據支持。然后,大數據是技術屬性與社會屬性的有機統(tǒng)一,所以在大數據時代中兩方面工作都要雙管齊下,提高技術水平的同時還要注重社會實踐應用,達到改變市場運作模式,各組織的結構的目的。最后,大數據不是一個高高在上的概念性名詞,而是應該作為一種新的思維方式適用于社會的各個方面,包括政府行政,企業(yè)運營和人民生活等等,是新的時代智慧與時代氣息,而不是單純的一種技術或處理數據的手段。
必須要明確大數據時代真正的思想內涵,才能是我國在新時代的發(fā)展過程中不落人后,占據著有力地位,提高國家的信息化程度與綜合實力,對本論文的命題“大數據時代”對企業(yè)人力資源管理工作的影響能做出正確的分析探究。
參考文獻:
篇2
闡述了大數據的概念、特征、相關技術和面臨的挑戰(zhàn),大數據時代實驗室管理提升帶來的新方向,包括實驗室大數據的采集、存儲與處理、分析決策系統(tǒng)等的建立,更加注重保密和法律問題,對實驗室管理新特點也做了分析。
關鍵詞:
大數據;實驗室;管理
海量數據已經使我們進入了大數據時代,數據信息的來源、傳播速度和傳播數量正在影響、改變著人們的思維方式和生活、工作習慣。近年來,基于“大數據”的實驗室管理系統(tǒng)的開發(fā)以及互聯(lián)網的實驗室管理技術正在興起[1,2],那么“大數據”究竟是什么,“大數據”的發(fā)展將會給實驗室的日常管理帶來何種影響或進步,實驗室工作者又將如何面對直至駕馭這種進步,是本文主要討論的問題。
一、“大數據”的概念,特征,相關技術和面臨的挑戰(zhàn)
(一)“大數據”的概念
一般比較公認的“大數據”概念是:數據量大;數據處理迅速;數據類型多樣;數據價值高,密度低。美國互聯(lián)網數據中心(IDC)將大數據定義為:為更經濟地從高頻率的、大容量的、不同結構和類型的數據中獲取價值而設計的新一代架構和技術[3]。另一個對大數據較為抽象的概念是,一種在數據量增長迅速、信息來源繁多龐雜中,實現(xiàn)管理智能的思維形態(tài)[4,5]。
(二)“大數據”特征
簡稱4V特征。為Volume(數據量大)、Variety(種類多)、Value(價值低)、Velocity(高速處理和響應)[6-9]。(1)Volume。指的是由網絡應用、科學研究產生的數據量,及從這些數據衍生出來的數據非常龐大。(2)Va-riety。數據有多種數據源,數據類型多樣,結構復雜。(3)Value。在大量數據中,有價值的不多,即價值密度較低。(4)Velocity。大量的數據要求對數據快速處理,實時分析,從分析結果中解釋并預測事物的發(fā)展。
(三)“大數據”面臨的挑戰(zhàn)
(1)如何將復雜的數據整合成有機合理的結構成為面臨的問題。(2)時效性即對數據處理系統(tǒng)的高速、低耗要求是一個挑戰(zhàn)。(3)涉及隱私保護等安全問題,是數據處理和分析的重要方面。(4)高能耗是大數據發(fā)展的制約瓶頸。(5)大數據分析結果差異化。復雜的分析過程導致差異的分析結果,差異結果在現(xiàn)實生活中不同程度地影響著人們,反而可能制約了獲取知識的能力[10,11]。
二、大數據時代實驗室管理的框架[12-15]
高校實驗室是高校教學、科研和實訓的綜合體。科學,規(guī)范,高效,安全的現(xiàn)代化管理方式,是實驗室管理的發(fā)展方向與目標。大數據技術可將先進的網絡技術與數據庫結合,引入到實驗室管理的理念中,提高實驗室的信息化管理技術。通過對大量數據的有效分析,為管理者提供決策功能。通過各個信息平善建立,有力保障高校教學和科研有序進行。大數據時代,利用大數據技術實現(xiàn)實驗室高效管理要建立和完善以下系統(tǒng)。
(一)建立實驗室大數據的采集系統(tǒng)
主要分為實驗室管理信息系統(tǒng),按角色劃分分為學生,實驗室管理員和系統(tǒng)管理員,數據包含各種預約信息,成績查詢和登記等系統(tǒng),實驗室儀器設備的基本信息,購買、使用、維護、保養(yǎng)、維修、報廢等數據,實驗試劑和耗材的信息,實驗室人員的管理信息,實驗室管理文件信息。采集的數據要盡量使數據全面,完整,從各個方面反映事物的真實性。因此在數據采集階段要合理設計數據的結構和內容。
(二)建立實驗室大數據的存儲和處理系統(tǒng)
在采集數據中要做到采集數據完整性和實效性。完整性指信息的統(tǒng)計不僅有簡單的數據,還可以采用圖片、視頻等數據。實效性是指對采集的數據及時更新,如實驗室易耗品的使用情況、儀器設備的使用狀態(tài)、儀器的預約狀態(tài)等。
(三)實驗室管理中通過對大數據進行分析進而形成決策
以往對實驗室的管理和決策很大程度上依賴于經驗。大數據下管理的決策、預警主要依靠數據的分析。對出現(xiàn)的問題提出后,帶著問題對相關的數據分析,提供給管理者解決的方案。
(四)大數據使用過程中的保密和法律問題
大數據一個巨大的優(yōu)點是數據資源共享,但實驗室內很多數據是只能在有限范圍內分享的,比如最新的科研數據、客戶的送檢結果等。因此實驗室管理中,在充分發(fā)揮大數據優(yōu)勢的同時也要注意信息保密和法律方面的管理。
三、大數據時代實驗室管理的特點
(一)實驗室安全管理職能化
實驗室安全是實現(xiàn)實驗室功能的基礎保證。門禁系統(tǒng)取代門鎖,刷卡出入,視頻監(jiān)控系統(tǒng)可對實驗室進出人員控制和監(jiān)督,并促進實驗人員責任心的建立。遠程實驗室儀器控制和報警系統(tǒng),可幫助技術人員遠程控制實驗儀器的操作和電源開關,及時監(jiān)控實驗室儀器和周圍環(huán)境的安全動態(tài)。
(二)實驗室試劑耗材的管理更加動態(tài)、實時
通過數據庫對試劑耗材的使用情況數據分析,在最短的時間內對試劑耗材進行預定和補充,對未來的實驗所需加以預測分析。同時對試劑耗材的供貨方式,供貨速度,供貨廠家等分析,可對供貨商進行有效控制和監(jiān)督,保證試劑耗材的質量和安全使用。
(三)實驗儀器標準化網絡管理
實驗儀器的唯一條形碼識別管理系統(tǒng),可保證實驗儀器從入庫,使用,維護的全網絡公開、開放。實驗室儀器的預約系統(tǒng)可保證大型儀器管理共享,保證儀器的高效使用。使用全程電子記錄和監(jiān)控,可有效統(tǒng)計和分析儀器的使用率,對今后儀器購買提供有效數據。實驗室準入制度的網絡化學習、考試、準入,不僅保證實驗室儀器者的基本素質,而且對儀器的正常高效運轉提供必要保障。另外,反饋的數據提供進一步的網絡支持。
(四)實驗規(guī)章制度和課程多樣化學習
寫實、生動的動畫模擬,可以將刻板文字化的規(guī)章制度轉化更易接受和領會的方式,加深制度的學習和認識,避免實際中因制度不嚴格執(zhí)行導致的失誤。很多在現(xiàn)實中危險的事故和實驗,可結合大數據的分析和模擬,建立新型的實驗教學課程,讓學生了解不同實驗操作過程可能發(fā)生的危害,讓學生感受和探索,以避免真正危險事故的發(fā)生。
(五)實驗室人員管理升級與升級管理
人員管理可在數據系統(tǒng)中劃分不同角色,分配不同權限,承擔相應義務。實驗室人員的管理是為更好保證實驗室安全高效運轉,實驗技術人員可根據現(xiàn)象分析、統(tǒng)計分析,積極協(xié)助科研人員的技術開發(fā)、儀器升級等工作,并通過數據系統(tǒng)及時了解實驗中亟待解決的問題。
四、結語
我國要建設創(chuàng)新型國家,必須全面實施科教興國與人才強國戰(zhàn)略。人才培養(yǎng)是人才強國的重要基礎。實驗室是人才培養(yǎng)與人才施展才華的基礎條件,提升實驗室管理水平,更好的服務于人才培養(yǎng)與人才發(fā)揮聰明才智,是實驗室管理工作持之以恒的追求。大數據時代無疑為這種追求提供了方向和目標。
作者:張艷艷 韓濤 高秀芝 黃漫青 丁軻 單位:北京農學院食品科學與工程學院
參考文獻:
[1]崔德鳳,張永紅,沈紅.淺談高校重點實驗室信息化平臺建設[J].北京教育,2013,(2):48-49
[2]李密生,忻圣婷,肖欣.基于校園網的實驗教學管理系統(tǒng)的設計[J].實驗室科學,2014,(4):61-66
[3]張意軒,于洋.大數據時代的大媒體[N].人民日報,2013-01-17.
[4]劉智慧,張泉靈.大數據技術研究綜述[J].浙江大學學報,2014,48(6):957-972.
[5]馬建光,姜巍.大數據的概念、特征及其應用[J].國防科技,2013,(4):10-16.
[6]霍夢蘭.大數據時代的問題挑戰(zhàn)與應對策略[J].科技視界,2014,(34):206,311.
[7]王萍麗,吳政,吳英昊.大數據時代軍隊現(xiàn)代遠程教育發(fā)展問題研究[J].繼續(xù)教育,2014,(12):47-49.
[8]吳梅.大數據及其對地礦分析測試工作的啟示———以貴州地質礦產中心實驗室為例[J].價值工程,2014,(17):234-235.
[9]方巍,鄭玉,徐江.大數據:概念、技術及應用研究綜述[J].南京信息工程大學學報,自然科學版,2014,6(5):405-419.
[10]李勇輝.大數據概念辨析及應對措施[J].互聯(lián)網天地,2014,(1):11-13.
[11]王書偉.大數據時代政府部門間信息資源共享策略研究[D].長春:吉林大學,2013.
[12]陳昌興.高校實驗室信息化的云計算策略與方法[J].實驗技術與管理,2014,(1):221-224.
[13]程琳琳,王旭,程延俊等.實驗室信息管理系統(tǒng)(LIMS)在實驗室科學管理中的應用[J].熱帶農業(yè)工程,2014,(1):16-20.
篇3
實際上,大數據的應用遠遠不止于此,各行各業(yè)都能見到它的影子。在其起步階段,互聯(lián)網和電商等與IT技術關聯(lián)度較大的領域最先了解和使用了大數據,隨著大數據逐漸被社會各界認知,越來越多的行業(yè)包括大量傳統(tǒng)行業(yè)在內,都開始了解和應用大數據。大數據對人們的生活究竟產生了怎樣的影響?為此,《經濟》記者專訪了中國商業(yè)聯(lián)合會數據分析專業(yè)委員會會長鄒東生,與他就大數據的相關問題進行了深入探討。
從1.0向2.0時代過渡
鄒東生認為,當前中國正處于大數據1.1時代,是以認知為特征的大數據1.0時代向以應用為特征的大數據2.0時代的過渡階段?!氨M管大數據的概念在21世紀初就傳入中國,但是在2010年前后才開始被中國的社會各界廣泛認知。”鄒東生向記者解釋,“過去的四五年是大數據在中國的普及階段,政府、企業(yè),特別是一些原本做數據建設和信息技術的公司,開始主動認為大數據是一個趨勢。國家前后出臺了很多大數據領域的相關規(guī)劃和推動大數據發(fā)展的政策,一些大數據交易平臺和交易所陸續(xù)成立,越來越多的大數據相關會議也在中國舉辦”??偨Y和展望大數據概念在我國的普及和發(fā)展過程,鄒東生認為主要可以分為3個階段,“第一階段是2010年前后大數據的1.0認知階段,這是社會各界對大數據概念產生初步認知的時期,政府部門和企業(yè)界對大數據的理解千差萬別,各不相同;第二階段就是當前,是大數據1.1階段,是認知大數據向應用大數據的過渡時期;第三階段是不遠的將來大數據2.0應用階段,未來幾年,大數據的相關項目將陸續(xù)落地,產生實用性價值,大數據將進入應用和產生價值的階段?!?/p>
在劃分大數據時代的不同階段和闡釋相應特征的基礎上,鄒東生向《經濟》記者概括了當前我國大數據發(fā)展的主要特征,他認為主要可以從大數據的認知、應用和人才培養(yǎng)角度出發(fā),分為3個方面。第一,從認知大數據的角度出發(fā),企業(yè)開始探索大數據能為自己帶來什么。“最初,人們對大數據的求知欲僅僅停留在‘我希望了解什么是大數據’,而現(xiàn)在,越來越多的企業(yè)希望了解大數據能給自己帶來什么和大數據項目如何落地。”第二,從應用大數據的角度出發(fā),企業(yè)對大數據的關注不僅僅停留在技術層面,更多向分析數據和研究數據發(fā)展?!扒皫啄甏髷祿嚓P會議和活動的主角是技術公司,只要一說大數據,他們就必提一些技術的新名詞,從而導致很多人誤認為大數據就是一種技術。這其實是大數據1.0時代的一種特殊認知。因為在那一階段,很多企業(yè)還沒有構建自己的數據平臺,缺乏數據基礎,企業(yè)開始接觸和應用大數據分析的第一步就是數據化,離不開對于技術的接觸。但是技術僅僅是大數據的底層,不是大數據的核心。未來,隨著技術的逐漸開源,越來越多先進技術門檻的降低,越來越多的人會明白大數據最具價值的部分不是通過數據搭建的技術平臺,不是數據本身的儲存,而是它的分析過程,是通過對數據進行的深層次應用,幫助企業(yè)提高決策決心,降低運營風險。”第三,從人才培養(yǎng)的角度,企業(yè)越來越重視大數據人才的價值。大數據人才即將迎來井噴階段,“以各企業(yè)對數據分析人才的需求為例,前兩年相關的人才需求比較零散,而現(xiàn)在的需求十分旺盛,甚至一天之內就可能出現(xiàn)幾萬個崗位空缺,有些職位也對應著高額的薪水,目前大數據人才仍處于井噴的前期,并未迎來真正的繁榮。未來,越來越多的企業(yè)會認識到自己的核心競爭力應該是人才儲備,而不是技術儲備,越來越多的企業(yè)會將數據分析人才當成自己的標配人才,因為不論是營銷還是企業(yè)管理崗位,都需要數據分析能力。那時才是大數據人才需求和供給的大繁榮階段,大數據人才才能變?yōu)樽钣袃r值的人才?!?/p>
核心價值
進入21世紀以來,互聯(lián)網對人們的生產生活產生了巨大影響,在極大程度上推動了各行各業(yè)的創(chuàng)新和進步,互聯(lián)網自身也在不斷的發(fā)展中改變和獲得突破。時至今日,傳統(tǒng)互聯(lián)網技術在融合了云計算和云存儲等新概念的基礎上,已進入了大數據時代。對于傳統(tǒng)互聯(lián)網和大數據間的差異,鄒東生認為:“傳統(tǒng)的互聯(lián)網是一種服務于各行各業(yè)的工具,致力于為人們帶來直接的便捷,企業(yè)在前期需要進行充分的互聯(lián)網相關技術搭建,但這一過程并不一定能帶來快速和直接的盈利。所以對于互聯(lián)網企業(yè)而言,‘走得早,不一定走得好’。而大數據則不同,在大數據領域,越早使用大數據和相關技術、理念分析處理問題,就能越早獲益?!?/p>
為什么大數據企業(yè)“走得早”,就能“走得好”?鄒東生告訴記者,這是由大數據的核心價值決定的?!按髷祿軌驇椭髽I(yè)進行精準分析,從而提高企業(yè)的決策效率,幫助企業(yè)獲取更多的收益,降低成本。換言之,大數據能夠給企業(yè)帶來看得見、摸得著的收益。”除了幫助企業(yè)精準決策,在解決“數據孤島”問題上,大數據也將發(fā)揮巨大作用。他認為大數據的出現(xiàn)是解決“數據破碎化問題”的鑰匙,“大數據能夠通過構建數據溝通平臺將‘數據孤島’打通,最大程度地使得原本不關聯(lián)的東西相互關聯(lián)”。鄒東生同時強調如果使用不當,大數據技術非但不能解決,甚至可能加劇數據的破碎化,他說:“如果缺乏對大數據分析過程的深度理解和正確認知,搭建平臺前沒有充分的研究,大數據的使用將無法打通數據間的‘孤島’,甚至可能會產生越來越多的數據碎片和信息流失”。
那么,如何挖掘大數據的核心價值?鄒東生為有意向應用大數據的企業(yè)提出了“三步走”的建議。第一步,從企業(yè)自身角度出發(fā),“企業(yè)越早信息化,未來數據分析的‘彈藥’就越充足。企業(yè)首先需要將自己的數據保存起來,在此基礎上,有目的、有計劃地收集外部數據,通過外部數據和內部數據的整合,形成足夠大的數據體量”。第二步,從企業(yè)和大數據平臺間的合作角度出發(fā),“利用數據平臺幫忙整合數據”。第三步,從對大數據分析的角度出發(fā),“在結合行業(yè)和數據特征的基礎上,設計算法,提供科學的量化、引導和分析,使大數據成為幫助企業(yè)更好提高決策效率和降低風險的分析工具”。
篇4
關鍵詞:大數據時代;教師德育勝任力;轉向;培養(yǎng)路徑
隨著教育信息化、“互聯(lián)網+”行動的不斷推進和數字校園建設、“三通兩平臺”工程的精準實施,教育也正式邁入了以網絡為平臺、數據爆炸式增長為標志、云計算為支撐的大數據時代[1]。大數據時代的來臨,對整個教育系統(tǒng)產生了顛覆性的影響,也必將對教師的教育教學與個人發(fā)展帶來新的挑戰(zhàn)[2],對教師的德育勝任力提出新的要求。在大數據時代,海量信息和優(yōu)質教育資源的開放共享削弱了教師傳統(tǒng)意義上的道德權威;網絡化生存中的人機互動更加凸顯出了師生間面對面交流和溝通的重要性;多維多變的價值觀念和學生復雜的價值訴求使得教師的價值引領作用在當下顯得更為沉重[3];慕課和翻轉課堂雖然減輕了教師的教學壓力,但卻對教師在學生的思想引領、價值型塑、人格感化和情感陶冶等方面提出了更高要求……總之,在新形勢下,教師完成立德樹人根本使命的重要性、緊迫性和艱巨性更加突出。教育作為鑲嵌在社會系統(tǒng)中的子系統(tǒng),其發(fā)展必須與時代潮流相適應。這種適應雖然表現(xiàn)在調整課程內容和結構、革新教學模式和方法、應用新興設備和技術等多個方面,但最關鍵的還是在于教師要與時俱進地更新教育觀念,優(yōu)化知識結構,提升專業(yè)水平。教師若想在大數據這股浪潮中游刃有余,就必須以自信的姿態(tài)、主動的精神和切實的行動提升自身的德育能力。那么,在大數據時代,教師德育勝任力的內涵應如何界定?它有哪些特征?教師德育勝任力又需實現(xiàn)哪些轉向?我們該采取哪些措施來培養(yǎng)教師的德育勝任力?這些問題都是當前德育研究亟需解決的重要課題。
一、大數據時代的教師德育勝任力
勝任力研究雖有將近百年歷史,但真正進入教育領域卻始于20世紀70年代末。研究主題聚焦在教育管理者的勝任力培養(yǎng)上,如美國中學校長協(xié)會構建了校長勝任力指標體系,以此來指導校長選聘和職業(yè)發(fā)展工作[4]。在我國,關于教師勝任力研究的最早文獻是2003年的《未來教師勝任力測評:原理和技術》一文,該文認為,“教師勝任力指教師個體所具備的、與實施成功教學有關的一種專業(yè)知識、專業(yè)技能和專業(yè)價值觀”[5]。迄今為止,我國教師勝任力研究已走過15個年頭,并取得了不少有價值的研究成果,學者們從概念界定、模型構建、研究方法、勝任力測評及具體應用等方面進行了較為深入的探討。在整個教師勝任力研究中,雖然有部分學者對教師德育能力、教師德育素養(yǎng)(素質)、教師德育專業(yè)化展開了相關研究,如檀傳寶教授認為,教師的德育素養(yǎng)結構由道德與文化素養(yǎng)、學科專業(yè)素養(yǎng)和教育專業(yè)素養(yǎng)三部分構成[6]。但目前尚未有人提出“教師德育勝任力”這一概念并對其進行研究,更沒有人結合具體的時代背景來闡述教師的德育勝任力。進入大數據時代,傳統(tǒng)的德育環(huán)境不復存在,教育對象在不斷發(fā)生變化,教師德育勝任力的概念也需重新定義。在批判借鑒國內外學界關于勝任力、教師勝任力及教師德育能力(素養(yǎng)、素質)等概念的基礎上,并結合當前時展和社會環(huán)境對教師德育能力提出的特殊要求,我們認為:大數據時代的教師德育勝任力是指大數據時代下每個教師能夠成功實施德育工作需要具備的一系列顯著的個體特征;這些特征主要包括高尚的道德修養(yǎng)、先進的德育理念、豐富的專業(yè)知識、高超的德育能力和良好的數據素養(yǎng)。上述概念具有五個主要特征:一是全員性。由于“沒有離開教育的教學,也沒有離開教學的教育”[7],所以“教師即人師”,每位教師都應承擔起教書育人的使命。二是相對獨立性。雖然教師勝任力、教學勝任力、德育勝任力三者有重疊和交叉,但德育勝任力應該有其自身的獨特性。三是綜合性。教師德育勝任力是由知識、態(tài)度、能力和價值觀等多種因素構成的整體。四是時代性。教師德育勝任力是一個隨時展的動態(tài)概念,不僅傳統(tǒng)的德育素養(yǎng)不可或缺,而且教師還要“加強對時展的了解,與時俱進地進行道德學習,從媒介素養(yǎng)到國際理解,不斷增強自身的價值敏感性和價值選擇力”[3]。五是個性化。教師除了要具備通用的德育勝任力之外,還應彰顯出卡里斯瑪特質,表現(xiàn)出與眾不同的人格魅力。
二、大數據時代教師德育勝任力的轉向
整體而言,大數據進入教育領域,既是一場革命,也是一種挑戰(zhàn);既是一次十分難得的機遇,也是一種無法回避的負擔。大數據在給學校德育的改革創(chuàng)新與轉型發(fā)展帶來福音的同時,也對教師德育勝任力提出了全新挑戰(zhàn),需要所有教師的主動適應與積極作為,但在付諸行動之前,我們有必要弄清楚大數據時代下的教師德育勝任力究竟面臨著何種挑戰(zhàn),需要從哪些方面進行轉向。1.德育思維由經驗式思維轉向數據式思維大數據不僅是一種信息資源和技術工具,更重要的是“一種思維方式,即讓數據開口說話,讓數據成為人類思考問題、做出行為決策的基本出發(fā)點”[8]。思維方式上的變革是置身于大數據時代的教師遭遇到的最大挑戰(zhàn)。這是因為,在教育領域,教師長期以來已經習慣于依靠自身的常識、直覺、經驗或有限理性進行思考和決策,而很少去傾聽身邊數字所發(fā)出的聲音[9]。然而,大數據時代的來臨使得這種經驗式的德育思維難以為繼,教師的德育決策需要基于數據分析而制定。大數據具有的相關性、開放性、個性化和前瞻性思維可以幫助教師采集到有關學生品德發(fā)展的海量數據,通過數據挖掘和關聯(lián)分析,就能夠比較全面而準確地掌握學生的興趣愛好、個性特征、思想動態(tài)、價值取向和行為趨勢等重要信息,教師就可以在此基礎上為學生提供符合其需求的個性化教育服務。顯然,這種數據式的德育思維具有無可比擬的優(yōu)勢,不僅可以為教師的德育工作打開新的思路,而且還能增強學校德育的實效性,因而也對傳統(tǒng)的德育思維造成了巨大沖擊。如今,當教師在德育實踐中遇到棘手的德育難題時,優(yōu)先考慮的應該是嘗試著從數據視角去尋求解決方案,而不是沿襲傳統(tǒng)思維。2.德育重心由集體式教育轉向個性化服務由于師資力量、技術手段和思維習慣等因素的共同影響,當前的學校德育基本上是根據學生的平均水平和總體特征而實施的同質化教育,這使得我國古已有之的因材施教的教育理想始終難以落到實處。然而,有了大數據的支持,教師就能夠觀察和收集到每個學生的品德發(fā)展數據。這些數據為教師讀懂千差萬別的學生打開了一扇窗戶,也將促使德育重心從宏觀的群體教育轉向以學生為中心的個性化服務。在大數據時代,學生道德需求的多元化和個性化趨勢日漸凸顯,教師就應該根據學生不同的品德發(fā)展水平和獨特的學習風格,選擇合適的德育資源組織德育教學及相關活動,其工作重心“從知識傳授逐漸演變?yōu)殚_展教學評估,根據學生學習節(jié)奏、進度和效果,為學生設計個性化的學習計劃和方案,與學生就學習效果、學習方法和學習計劃等進行有效溝通”[10]。此外,學生每一種品德的形成,其知、情、意、行四個要素的發(fā)展方向和水平也不盡一致,這就要求教師能夠根據相關數據識別出學生品德發(fā)展結構中的短板或不足,從而有的放矢地進行教育補救。當然,大數據只是為個性化德育服務提供了條件支持和技術可能,若要真正實現(xiàn),還需要教師付出果敢的努力和行動,不斷提升自身的德育素養(yǎng)。3.專業(yè)能力由傳統(tǒng)素養(yǎng)轉向數據素養(yǎng)大數據雖然為教師能夠勝任德育工作創(chuàng)造了有利條件,但同時也對教師的專業(yè)能力提出了新的要求,即從傳統(tǒng)素養(yǎng)向數據素養(yǎng)轉變。首先,教師要具有強烈的數據意識,能夠敏銳地察覺到海量數據中真正有價值的信息,并能快速而準確地捕捉到這些信息。其次,教師要具備篩選和清洗數據的能力。大數據的海量性和復雜性特征導致了數據的價值密度離散、容錯率增大,如何通過強大的機器算法實現(xiàn)數據的去冗降噪和價值提純,是教師面臨的一大難題。再次,教師要擁有較強的數據解讀和分析能力,能夠挖掘出數據背后的隱藏價值,賦予數據特定背景,使其成為信息,再對信息進行歸納總結,使其升華為教育智慧。譬如,在一次百以內加減運算的數學考試中,甲、乙二人的成績分別為100分和98分,如何看待這一微弱差距,不同的教師會表現(xiàn)出不一樣的行為。數據解讀能力強的教師會結合二人的知識基礎、學習習慣、性格特征等相關數據,客觀而準確地分析其中原因,進而在接下來的教育教學中為乙同學提供精準的個性化服務,如鞏固已學知識或克服粗心毛病。反之,數據解讀能力弱的教師可能會將這一差距僅僅看成是數字間的不同,出現(xiàn)解讀不夠或解讀過度的現(xiàn)象。前者認為二者間沒有本質差別而不問不顧,后者夸大二者間的差距而引發(fā)暈輪效應,這兩種做法都會為乙同學的發(fā)展埋下禍根。最后,教師還要具備對大數據德育應用進行倫理審視的能力,謹防大數據在德育應用中出現(xiàn)侵犯學生隱私、踐踏教育倫理、限制學生自由和阻礙學生發(fā)展等倫理風險。
三、大數據時代教師德育勝任力的培養(yǎng)路徑
篇5
關鍵詞:大數據;BI;發(fā)展
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-7712 (2014) 12-0000-01
近些年大數據(big data)一詞被提及的頻率越來越高。原本只是用來形容海量信息的含義,在信息時代又賦予了它新的含義-新信息時代的風向標。
如今是信息爆炸的時代,數據正在迅速膨脹變大,原本傳統(tǒng)電信金融行業(yè)是信息產生的大戶,隨著互聯(lián)網行業(yè)的異軍突起,立刻成為了大數據軍團中的絕對主力?;ヂ?lián)網公司在日常運營中生成、累積的用戶網絡行為數據。這些數據的規(guī)模是如此龐大,以至于不能用G或T來衡量。
隨著越來越多的行業(yè)對數據越來越重視,帶來了BI的巨大市場商機和快速發(fā)展。隨著大數據的興起,IBM、Oracle、SAP、微軟等廠商像是尋到了新的金礦,開始極力推崇大數據理念。于是眾廠商蜂擁而至,搶奪大數據市場,以SAP的HANA和ORACLE的Exalytitcs為代表。也有部分推BI的廠商還達不到大數據的層次,固守在報表分析的陣地上。
大數據具有4個特征(4V):
(一)數據量大(Volume)
第一個特征是數據量大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
(二)類型繁多(Variety)
第二個特征是數據類型繁多。包括網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。
(三)價值密度低(Value)
第三個特征是數據價值密度相對較低。如隨著物聯(lián)網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數據的價值“提純”,是大數據時代亟待解決的難題。
(四)速度快時效高(Velocity)
第四個特征是處理速度快,時效性要求高。這是大數據區(qū)分于傳統(tǒng)數據挖掘最顯著的特征。
基于大數據以上特性,對于傳統(tǒng)BI來說是一個重大的挑戰(zhàn)和沖擊。
以RTB(實時競價廣告)模式為例,這種面向網民的廣告實時推送方式需呀以毫秒級的速度分析海量數據,進而實現(xiàn)互聯(lián)網廣告的精準推送。RTB模式主要需解決“人的認知”和“價值幾何”,前者需要對每個用戶實施消費行為進行分析,意味著需要解讀萬億量級的數據;后者則需依托復雜算法計算ROI(投資回報率),告訴決策并顯現(xiàn)交易結果,而每筆競價只有50毫秒乃至更少的決策時間。收納并瞬間解構如此龐大的數據,也只有大數據工具才能做到。
傳統(tǒng)BI采集的數據主要來自于ERP、CRM等,具有格式化的數據,而大數據采集的數據種類則多種多樣,既有結構化的數據,更多的是非結構化的數據。這就要求數據處理技術在分析、算法上相對傳統(tǒng)BI來說有極大的改變,已經無法依賴傳統(tǒng)的BI工具。類似RTB這類新興商業(yè)模式不斷涌現(xiàn),對于營銷反應速度提出極高的要求,傳統(tǒng)BI能支持小時級的決策已經很了不起了,無法應對如此幾乎是實時決策分析的要求,處理如此海量的數據分析及計算。數量和速度就是大數據帶給傳統(tǒng)BI的挑戰(zhàn)。
大數據和BI都需要構建數據倉庫、分析系統(tǒng),再進行數據挖掘、實現(xiàn)數據呈現(xiàn),運用機理和技術結構其實是一致的。與BI不同,大數據處理的數據是雜亂的、非結構化的數據,因此大數據有它獨特的數據分析工具,其建模也要比BI復雜得多,數據呈現(xiàn)方式也不僅僅是報表方式。從這方面來看大數據能力要比傳統(tǒng)BI強大得多。幾年前還只有大型網絡公司應用大數據技術,而如今,零售業(yè)、銀行業(yè)、公共事業(yè)、智能社區(qū)等領域,幾乎所有擁有海量數據的企業(yè)都在使用或開始嘗試使用大數據技術,這些技術在部分項目中也起到了關鍵的作用,這些將擠壓傳統(tǒng)BI工具的生存空間。
大數據的出現(xiàn)對BI行業(yè)來說是一個挑戰(zhàn)也是巨大的商機。也正是大數據的出現(xiàn)促進了BI加速發(fā)展,不斷升級。
大數據分析缺乏成熟的實踐經驗,其方式方法與傳統(tǒng)的數據倉庫與BI系統(tǒng)有著一定的區(qū)別。在實施大數據分析項目之前,企業(yè)不僅應該知道使用何種技術,還應該知道在什么時候、什么地方使用。各數據之間有哪些關聯(lián)性?哪個數據是可信的?如何從海量的數據中挖掘出有價值的、易用的客戶信息?
要回答這些問題,企業(yè)需要一個單一、完整、可信的客戶數據視圖,而創(chuàng)建一個單一、完整、可信的客戶數據視圖,數據集成是關鍵。沒有集成的數據,其商業(yè)價值為零。數據集成讓組織機構能夠將傳統(tǒng)的交易數據與全新的交互數據組合起來,從而獲得在其他情況下無法達成的洞察力和價值。
在大數據概念面世之前,商業(yè)智能(BI)幾乎是我們進入‘智慧世界’的不二選擇,然而,價格不菲的數據庫、數據倉庫、ETL等工具共同構筑的高門檻擋住了很多企業(yè)一探究竟的腳步,而數據規(guī)模爆炸式的增長更是加高了這個門檻,讓很多企業(yè)對于獲取‘智慧’的投入成本望而怯步。
盡管隨著技術不斷進步,商業(yè)智能日益平民化,如今基于EXCL表也能在一定程度上實現(xiàn)傳統(tǒng)商業(yè)智能的部分功能。但是商業(yè)智能最經典的架構還是基于數據倉庫為基礎,利用ETL工具進行數據抽取、轉化、建模,然后通過報表等形式展現(xiàn)結果。整個過程每個環(huán)節(jié)都投資不菲且耗時,因此很長時間以來,商業(yè)智能被認為大企業(yè)的專有。相對而言,大數據主要用于互聯(lián)網企業(yè),采用通用硬件設備加上開源軟件實現(xiàn),成本相對低廉得多。入門門檻低,也是大數據能夠迅速興起的重要原因。
隨著互聯(lián)網技術的發(fā)展,未來的大數據時代,一定是各種信息呈現(xiàn)規(guī)模快速增長的狀態(tài),如何更快獲取有用的信息是關鍵,智能分析工具會變得越來越重要,可以凌駕于多個管理系統(tǒng)、數據庫之上,如何通過更靈活、可控的BI工具,真正挖掘出大數據時代的價值,是大數據和BI面臨的共同挑戰(zhàn)。
參考文獻:
篇6
關鍵詞:大數據時代;大數據;統(tǒng)計學;數據分析
引言:
目前階段,在計算機處理技術不斷發(fā)展的背景下,在對規(guī)模較大并且較為復雜的數據進行處理過程中,人們已經逐漸掌握了方法與技能,并且能夠在大規(guī)模的數據中找出具有一定價值的信息,所以,大數據時代已經來臨。在數據時代中,在人文社科與人類自然科學技術等方面都會有較大的發(fā)展,同時也會一定程度上改變人們的生活與工作方式。除此之外,大數據時代也同樣為統(tǒng)計學提供了良好的發(fā)展機會,但也存在一定的挑戰(zhàn)。
一、大數據時代的概念
大數據時代的提出者是麥肯錫,他認為數據已經逐漸進入到各個行業(yè)與各業(yè)務職能的領域中,并且逐漸成為了主要的生產因素[1]。因此,人們在對大規(guī)模數據進行挖掘與應用的過程,也就意味著新的生產率增長的來臨。雖然“大數據”在眾多行業(yè)被廣泛應用,但是,特別是在信息與互聯(lián)網的領域中應用突出。
二、怎樣理解大數據
(一)大數據概念界定與構成
大數據,即由于日常產生的數據量快速增長,使得數據庫無法利用相應的管理工具對其進行管理與收集,最終導致在進行搜索、分析、存取、共享數據時具有較大的困難。
大數據的構成包括四部分,并將其總結為4V,即Volume,Variety,Value,Velocity[2]。第一部分是價值密度低,將視頻作為具體實例來說,實現(xiàn)連續(xù)并且不間斷的監(jiān)控,其中有價值的數據信息只有一兩秒。第二部分是數據體量極大,已經從TB實現(xiàn)了PB的躍升。第三部分是數據類型眾多,主要包括視頻、圖片、網絡日志以及地理信息等。第四部分是處理的速度超快,可以用一秒定律來解釋。
(二)海量數據帶來哪些挑戰(zhàn)
第一,數據存儲。由于大數據的數據規(guī)模是PB級別,所以,存儲的系統(tǒng)也需要進行等級的拓展,并且可以通過磁盤柜或者是增加模塊實現(xiàn)容量的增加。然而,目前階段,數據的增長速度驚人,所以系統(tǒng)資源的消耗也不斷增加,導致系統(tǒng)的運行效率有所下降[3]。因為對海量數據始終停留在分布式的存儲階段,所以,對于爆炸式的數據增長,原有的存儲方案已經無法滿足現(xiàn)有的數據變化需求。
第二,處理技術。由于海量數據的分布性與數據量與以往存在較大的差異,所以,原有的數據管理技術已經處于落后狀態(tài)。
第三,數據安全。在互聯(lián)網規(guī)模逐漸擴大的情況下,數據的應用已經出現(xiàn)指數級別的增長,所以,對于數據安全的保護與監(jiān)控來說具有一定的難度。
(三)大數據相關應用與實踐
第一,體育賽事應用。以2014年的世界杯為例,在充分發(fā)揮記者與編輯敏銳度的基礎上,騰訊也利用對大數據的分析以及云計算等方式來為為其提供移動與社交的數據。與此同時,騰訊與IBM進行合作,并通過文化、賽事與球迷三方面來對世界杯球迷的關注重點進行信息的挖掘,進而實現(xiàn)新欄目的創(chuàng)作,并且在短時間內贏得了廣大球迷的認可與關注。
第二,產品推薦應用。產品推薦的應用比較廣泛,可以對客戶信息、交易歷史、購買過程等數據進行全面的分析,并進行有價值信息的挖掘。同時,針對同一產品的不同客戶訪問信息也可以進行挖掘。最終,通過對客戶行為的分析,來確定消費者的共,這樣就可以更好的為客戶推薦產品。
除此之外,在產品推薦中,可以在對客戶社交行為進行信息挖掘與分析的基礎上來進行社區(qū)的營銷。對客戶微信微博以及社區(qū)活動中的偏好數據進行分析,并為其提供符合客戶興趣愛好的產品。
圖一
三、如何分析大數據
(一)如何挖掘數據中價值
以匹配廣告為具體事例進行分析,主要有兩種數據。第一種是廣告庫,其中包括廣告庫以及廣告的客戶信息[4]。但是這種數據信息比較適合在傳統(tǒng)數據庫中應用。第二種是用戶在觀看廣告后的行為??梢园岩陨蟽煞N數據進行有效的結合,并通過相應的算法來體現(xiàn)價值。在實踐應用過程中,可以充分體會到第二種信息的重要作用。可以為用戶提供其所需的信息,并通過群體智能以及群體行為對之前用戶使用的效果進行分析,最終通過具體的反饋機制,將最優(yōu)質的信息提供給用戶,還可以進行搜索或者是查詢信息。
(二)如何做處理與分析
第一,更新抽樣調查的工作理念。由于大數據時代的數據樣本是以往資料綜合,所以,可以對相關事務的數據信息進行分析,進一步對總體進行了解,還可以更好的了解局部。同時需要解決以下問題:抽樣框架不穩(wěn)定,調查目的設定不合理、樣本量受限[5]。第二,積極改變對于數據精確度的標準。在大數據時代的背景下,數據的來源比較廣泛,并且對數據進行處理的技術也有所提高,所以,可以允許數據存在不準確的情況。大數據時代需要吸收多種數據,但并需要一味的要求數據精準。第三,合理轉變數據關系的分析重點。由于大數據時代的數據規(guī)模比較大,而且結構也十分復雜,變量的關系也比較繁雜。所以,在對數據進行分析的過程中,不應該對因果關系進行仔細的分析,而重要的是對事物相關的關系進行分析。需要轉換思路,對事物關系的形式與目的進行詳細的分析。
四、 大數據對統(tǒng)計學科和統(tǒng)計研究工作的影響
(一) 拓展統(tǒng)計學研究領域
因為大數據時代的到來,所以會對各個領域產生一定的影響,同樣給統(tǒng)計學帶來影響。在統(tǒng)計學中,其主要的研究對象就是其所要認識的客體,是客觀存在事物自身的數量特征與關系。其中,統(tǒng)計學研究對象最主要的特點就是數量性。然而,在傳統(tǒng)的統(tǒng)計學當中,數據主要是試驗與調查的數值。在大數據時代中,統(tǒng)計研究的對象不僅包括以結構數據度量的數量,此外,還可以包括一些無法用數量關系進行衡量的半結構與非結構數據,其中可以包括動畫、圖片、聲音、文本等等[6]。所以,可以說,在大數據時代背景下,統(tǒng)計學的研究對象領域有所擴大。
(二) 對統(tǒng)計計算規(guī)范產生影響
在傳統(tǒng)的統(tǒng)計學當中,一般是使用方差、平均數以及相對數等數據計算規(guī)范來真實反映事物量特征的,同時還可以反映事物量的關系與界限,能夠通過數據計算規(guī)范來計算出具體的數值。但是,半結構與非結構的數據是無法通過傳統(tǒng)數據計算規(guī)范進行計算的[7]。所以,在大數據時代的背景下,傳統(tǒng)的數據計算規(guī)范也同樣遇到了難題。
(三) 對統(tǒng)計研究工作的過程產生影響
1. 數據整理和分析
第一,數據審核。原有的數據審核主要的目的就是對數據準確性和完整性進行嚴格的檢查。但是,在大數據的時代中,對數據的審核就必須要確保數據處理的速度以及預測的準確程度,同時還需要對數處理的規(guī)模進行準確的確定,也就是數據量級別的確定。除此之外,因為大數據自身具有不穩(wěn)定性,并且十分混亂。但是,即使是這樣,大數據也能夠挖掘出信息內部存在的隱蔽關系以及有價值的知識。所以,大數據所反映的研究對象存在準確與不準確兩種,但是,任何一種的數據都具有一定的價值,通常情況下是不需要進行替換或者是刪除的[8]。
第二,數據存儲。在以往的數據存儲中,審核、匯總以及編制的圖表等資料是重點資料,并且需要進行保存起來的。然而,大數據保存最主要的目的就是對存儲的成本進行有效的控制,同時需要根據相應的法規(guī)計劃來確定數據存儲的規(guī)模。
2. 數據積累、開發(fā)與應用
第一,數據積累。傳統(tǒng)統(tǒng)計工作主要是根據所制定的研究目的來對數據進行匯總與分類,并進行保存,這樣可以更好的為后期數據的分析與查詢提供有利的條件。但是,在大數據的積累中,具有價值的信息需要對大數據進行處理后才可以發(fā)現(xiàn)。不容置疑,大數據具有一定的復雜性,所以,在積累的過程中,不可以進行簡單的處理。因為大數據的規(guī)模大,結構也比較復雜,無法實現(xiàn)簡單的分類,而且,在對大數據進行簡單整理時非常容易使其混亂,對其真實性產生影響,可能會丟失具有價值的信息。
第二,數據開發(fā)。大數據時代下的數據流動性極強,所以,其自身的價值有再生性。因此,大數據時代的數據不會貶值,反而會增值。為了能夠對所研究的對象進行更深入的了解,就需要對其整合。
第三,數據應用。對數據的傳統(tǒng)應用主要是為了對現(xiàn)象進行解釋與預測。但是,在大數據時代,數據應用的核心就是在相關關系前提下的預測。
結語
綜上所述,現(xiàn)階段我國社會正處于大數據時代,并且對于社會未來的發(fā)展具有重要的意義。文章對大數據時代的概念與定義以及構成進行了闡述與分析,同時,對大數據的實際應用與實踐進行了探討。針對大數據價值的挖掘與分析處理進行了研究,最后列舉了大數據對統(tǒng)計學科以及統(tǒng)計研究工作的影響,進而對今后大數據的數據分析工作提供了有價值的理論依據,并積極的推動了大數據時代的發(fā)展,進一步促進了社會的進步。(作者單位:中國人民大學)
參考文獻:
[1]朱建平,章貴軍,劉曉葳等.大數據時代下數據分析理念的辨析[J].統(tǒng)計研究,2014,31(2):10-19.
[2]張學敏.大數據時代的數據分析[J].電子世界,2014(16):5-5,6.
[3]李祥歌,王奇奇,郭軼博等.基于大數據時代的數據挖掘及分析[J].電子制作,2015(3):81-81.
[4]劉江娜.大數據時代:為什么數據分析能讓你的企業(yè)脫穎而出[J].環(huán)球市場信息導報,2014(36):92-93.
[5]郭華庚,向禮花.大數據時代網絡信息歸檔的元數據分析[J].貴州師范學院學報,2015,31(3):24-28.
[6]高書國.大數據時代的數據困惑――教育研究的數據困境[J].教育科學研究,2015(1):24-30.
篇7
在高校基礎工作中,高校檔案管理工作是高校工作的其中一項基本工作,做好高校檔案管理工作是對高校的未來發(fā)展非常重要。隨著社會的發(fā)展,高校也在不斷地深化改革中,高校管理工作也必須與時俱進,優(yōu)化改革,充分應用大數據的優(yōu)勢,來優(yōu)化檔案管理工作,提高高校檔案管理工作效率,怎么去適應社會和高校的深化改革,是現(xiàn)在目前高校所面臨的一大課題。綜上所述,大數據對于高校檔案管理工作的創(chuàng)新和改革是十分有必要的。
1.相關基礎理論概述
1.1 大數據的定義
到目前為止,大數據的概念眾說紛紜,至今沒有統(tǒng)一的概念定義,因為大數據對于我們來說是一個非常抽象的概念,在定義問題上,很難有一個統(tǒng)一的答案。在百度上可以查詢到大數據的一個定義即巨量資料,它是指依據目前主流的軟件,規(guī)模巨大的資料在有效時間里,無法做到擷取、管理、處理,并且整理出為大規(guī)模企業(yè)獲取利益的資訊。然而在維基百科中對于大數據的定義就相對簡單一些,大數據是指借助常用軟件工具來獲取、管理、處理數據,所消耗的時間超出了規(guī)定時間的數據集。著名研究機構Gartner公司對大數據有個全新的定義,是指利用全新的處理模式來處理、洞察、優(yōu)化數據,從而達到高增長率、多樣化的信息資訊。這樣就避免了隨機抽樣的捷徑,而是處理所有數據,準確率更大,從而替代了以往傳統(tǒng)的隨機抽樣的思維模式。該書中有三個思維方式的改變,整體分析替代隨機抽樣,精確而又混雜,相關關系替代因果關系,使數據分析更加可信。
1.2 大數據的特征
大數據有四大特征:一是數據量巨大;二是數據類型多;三是價值密度低;四是數據處理快速。以上四種特征是傳統(tǒng)數據處理所不具備的。對大數據快速處理分析是大數據所特有的價值。目前現(xiàn)代社會是一個信息社會,數據是當今社會是否進步的標志,促進互聯(lián)網高速發(fā)展。
2.大數據時代高校檔案管理創(chuàng)新的必要性
檔案管理是現(xiàn)在高校管理中一項非常重要的基礎工作,它可以加強高校內部管理和促進高校健康發(fā)展。在現(xiàn)當今信息化時代,檔案管理工作方式方法就必須借助大數據,提升工作效率。相比傳統(tǒng)檔案管理,高校檔案管理具有工作量大、數據量大的特征?,F(xiàn)如今,高校在檔案管理工作上有很多挑戰(zhàn):數據的多樣化類型和存儲方式的多樣化被統(tǒng)一起來就相對比較困難,所以,以往我國提倡運用“直接鑒定法”面對大的電子格式的文件,在現(xiàn)如今將受到很大的挑戰(zhàn),文件管理者對每一份電子文件都認真閱讀恐怕不太現(xiàn)實。后來檔案管理直接運用宏觀鑒定的方法來鑒定電子文件,首先從總體上把握該文件是否有價值,從而提升工作效率。運用這種方法,先確定該機構是電子文件管理的對象,然后從這個機構中搜尋所需的電子文件,?熱∮屑壑檔牡繾游募?只是?子文件管理的第一步,在信息化大環(huán)境下,收集電子文件應該是很簡單的事情,但是在大量的電子文件中如何快速篩選出對自己有價值的電子文件,卻是一個大的困難。怎么分類這些電子文件?怎么歸檔保存這些電子文件?從哪些電子文件中能夠篩選出油價會的數據?科學地運用大數據技術就可以解決點以上所面臨的問題。大數據轉化器的安裝,可以加快系統(tǒng)數據收集的速度,節(jié)省了大量的時間,大數據軟件可以為搜尋過的數據建立獨自的索引,然后生成可以搜索的鏈接,這樣就可以為檔案工作者提升工作效率。大數據技術還可以進行數據類型的分類、新數據的搜索,進而提高檔案工作人員應對更加復雜的數據處理能力。由上面可知,傳統(tǒng)的高校檔案管理已經跟不上大數據發(fā)展的速度,做好高校檔案管理,為高校檔案管理提供更好的服務,是當下大數據時代高校檔案管理工作的重要課題。
3.大數據時代下檔案管理的創(chuàng)新對策
創(chuàng)新檔案管理可以體現(xiàn)許多知識和技能,可以完善管理機制和開發(fā)檔案新資源,更好地滿足當今社會對知識的需求,很好體現(xiàn)了大數據時代對檔案信息管理的新要求。只有適應高校不同發(fā)展時期的要求、大數據觀、大檔案觀,這樣才能更好地創(chuàng)新和優(yōu)化傳統(tǒng)檔案管理方式。檔案管理的不斷創(chuàng)新,才能加強高校檔案資源的管理,更好地保護好巨大的檔案數據,而且還能夠挖掘出更具有價值的檔案信息,更好地服務好高校檔案管理工作。
3.1 大數據觀
大數據時代預言家維克托對大數據的定義是對所有數據進行分析而不是隨機抽樣數據分析,更具代表性,更具說服力。大數據應用了所有數據,每個數據都是有價值的。大數據作為一個新的概念,大多數人對它還是完全了解,在理解和認識上還是有些偏差,大數據并不是從字面上所說的大,分析的數據也不一定非常多,有時候數百個GB的數據也可以稱為大數據,還是要看它的第三維度即速度或時間維度,這個第三維度具有科學性,優(yōu)化和整合了數據。在當今大數據時代下,數據就是檔案,單個數據沒有什么意義,但是單個數據在集體數據中都有各自特定的價值和作用。檔案部門應該慢慢培養(yǎng)檔案大數據的觀念。
3.2 大檔案觀
對于大檔案觀理念的理解,可以從以下兩個方面來理解。第一,所有數據都有可以入檔,檔案的大門更加寬廣。檔案歸檔的內容更加豐富,涵蓋一切具有保存和利用的價值的信息,特別是互聯(lián)網信息更加快速,及時抓取一切可以抓取的信息。不要忽略一些零碎的信息。第三,檔案普遍。人們傳統(tǒng)的觀念是只有存放在檔案管里的物件才是檔案,但是目前網絡每時每刻都在更新數據,它們涵蓋各個方面,好多都沒有收藏到館里,我們應該改變觀念。充分認識到只要是可以檢索到的信息,都有它存在的價值,遍布在我們日常生活的每一個角落里。
3.3 大服務觀
在大數據時代下,檔案服務越來越受到重視?!盀槊穹铡敝饾u成為檔案管理的核心。檔案部門要轉變以為“守財奴”的角色,時刻堅守國家賦予的責任和黨的利益。在大數據時代大背景下,檔案管理部門的職責不僅僅是從海量數據中挖取核心數據,還可以量化分析出用戶的習慣和興趣愛好,把檔案服務放在核心位置,進而可以向廣大用戶提供更加精準的檔案定制和更優(yōu)質的服務,所以,用戶希望得到的檔案服務是精細化地優(yōu)質數據,隨時就可以享受到“問題――數據――解決方案”全方位服務。全面提升檔案使用者的滿意度。
3.4 大平臺
篇8
關鍵詞:大數據;圖書館;信息服務;數據分析;數據挖掘
中圖分類號:G25 文獻標志碼:A 文章編號:1674-9324(2015)32-0210-02
一、引言
目前,大數據已經獲得各行各業(yè)的青睞,各界人士已開始研究并應用大數據技術,而與大數據密切相關的圖書館的發(fā)展也受到越來越多人的關注。同時,大數據的崛起也驅動著圖書館采取措施進行積極應對。圖書館作為儲存知識、傳播信息和提供服務的資源庫,如何采集各種載體的數據資源,并從中分析、挖掘出讀者行為中隱含的結構化、非結構化數據信息,找出讀者的隱性需求,繼而改善圖書館的服務質量,已成為大數據時代下圖書館提高信息服務質量和改進制度建設的機遇。本文在對大數據的概念和特點認識的基礎上,重點分析了大數據對圖書館的影響、機遇和挑戰(zhàn)。
二、大數據
1.大數據的概念。大數據的概念并沒有一個統(tǒng)一定義,只要是具備數據量龐大和數據形式多樣,并且是非結構化的數據,即為大數據。大數據通常具有以下幾個特點:數據量大(Volume)、種類多(Variety)、速度快(Velocity)的特點。
2.大數據的特點及技術。對于大數據的特點,業(yè)界通常用4個“V”來概括,即Volume、Variety、Value、Velocity。Volume:數據量巨大。經濟的發(fā)展使各種活動及設備產生了越來越大的數據量,已從TB級別躍升到PB級別。Variety:種類繁多。數據的種類不止是結構化的,現(xiàn)已出現(xiàn)了非結構化的數據,如圖書館中讀者的行為信息數據等。Value:價值密度低。價值密度與數據量密切相關,密度的大小與數據量的多少成反比。如何從海量的數據中提取出有價值的數據是數據挖掘的研究重點。Velocity:處理速度快。這是大數據與傳統(tǒng)數據挖掘不同的最顯著的特征。大數據技術主要包括數據分析、數據處理、數據挖掘、數據服務等。
3.圖書館的大數據。圖書館的業(yè)務通常包括圖書的搜集、整理、管理和書刊的利用,具體包括采購、歸類編目、數據安全保障、網絡建設、信息咨詢、圖書和數字化資料借閱、多媒體服務等方面。因此圖書館每天都會產生大量的數據?,F(xiàn)今,隨著圖書資源中類的多樣化及圖書館新服務的開展,圖書館的大數據不只局限于結構化的數據,還包含大量的非結構化數據,例如圖書館與讀者的交互信息、圖書館工作人員的工作動態(tài)以及讀者對圖書館的各種信息行為都會被記錄,因此就形成了圖書館大數據。
三、大數據對圖書館的影響
1.大數據將對圖書館的建設產生影響。為了滿足用戶需求,順應時代的發(fā)展,數字圖書館應運而生,增加了圖書資源的來源,使圖書信息數據量越來越大,原始的圖書館數據管理機制已不能適應海量數據的管理需求,為此,圖書館需要重建良好的數據庫體系和高質量的索引,從而可以提高讀者檢索數據資料的效率,并根據讀者需求,利用大數據技術中的數據分析技術從海量數據中提取出有用數據。因此,圖書館應增加數據分析、數據挖掘等數據分析技術功能,從海量數據中挖掘出有用數據,提高讀者的檢索效率。
2.大數據對圖書館的數據存取能力提出挑戰(zhàn)。“大”是大數據的一個重要特征,此外,大數據具有海量的數據規(guī)模、快速的數據流轉和動態(tài)的數據體系、多樣的數據類型、巨大的數據價值等特征。因此,如何在多樣的或者大量的數據中,迅速獲取信息,并對這些數據進行存儲和管理成為圖書館急需解決的問題。
3.數據挖掘將成為圖書館的重要服務目標。圖書館應該面向各種學科和研究方向中不同層次的用戶,應該為來自各種層面的社會群體提供服務。這也就要求圖書館可以提供更加全面而且個性化的服務,因此,圖書館應該包含各個領域的數據,并從各類數據中分析并挖掘出對讀者有用的、感興趣的數據信息,并且不斷地更新服務類型,以滿足用戶多樣化的需求。數據的搜集、存儲和分析處理將成為圖書館資源建設的重要內容。
四、大數據時代圖書館面臨的機遇和挑戰(zhàn)
1.大數據對圖書館的機遇。大數據具有在多樣的或者大量的數據中,迅速獲取信息的能力。圖書館大數據除了館藏資源,還包括用戶的行為信息,如讀者借取的書目類型、范疇、方向等。圖書館可以利用大數據的相關技術,如數據分析、數據挖掘等技術手段,分析并整合出讀者近期關注的熱點研究方向,為圖書部門決策者提供更加有用的信息,使他們能夠更快、更準確地掌握相關研究領域其他科研人員的研究進展。同時,利用數據分析和數據挖掘技術,對讀者平時的檢索訪問歷史進行搜集、分析和處理,并挖掘出有用信息,從而預測出讀者的各種需求,使圖書館能夠更好地為讀者提供服務。
2.大數據對圖書館的挑戰(zhàn)。大數據給圖書館帶來的挑戰(zhàn)表現(xiàn)在以下幾個方面:(1)圖書館面臨著如何應對大數據的挑戰(zhàn)。大數據具有多樣性,包括非結構化和結構化的數據,其中絕大多數數據是大小、內容、格式、用途完全不同的難以處理的非結構化的數據。圖書館面對大數據的到來,首先應該具有大數據的思維和意識,其次才能判斷圖書館的發(fā)展趨勢和選擇應對策略,最后才談得上技術實現(xiàn)的問題。大數據既不等于數據挖掘也不等于統(tǒng)計分析,但是這些技術和算法都需要大數據的支持。圖書館應正確認識大數據,才能對大數據的到來做好準備。(2)大數據對圖書館的數據整合、處理能力及圖書館的各種技術開發(fā)、服務提出了挑戰(zhàn)。隨著海量數據的出現(xiàn),為了順應時展,圖書館的改進不能僅僅停留在硬件改進的層面上,還要提出一套具體數據的分析、處理和挖掘的方法和體系,以提高全面把握和綜合深入的能力。(3)數據安全、知識產權、商業(yè)利益、公共安全受損的威脅增大。大數據的發(fā)展,信息開放度加大,新的信息采集、數據分析、數據挖掘技術以及海量數據存儲技術和設備將不斷涌現(xiàn),云計算將更加普及,這將對數據的安全構成很大的風險。
五、大數據時代圖書館的應對策略
大數據不僅僅是一項技術,更是思維方式、發(fā)展戰(zhàn)略和商業(yè)模式。以海量的非結構化數據為代表的大量數據的產生是大數據時代的一個重要特點。對海量的、非結構化的數據進行處理,一方面需要大量的計算資源,另一方面需要專門的數據處理技能,它的到來使圖書館面臨著前所未有的機遇和挑戰(zhàn),為此,圖書館不僅要具有大數據的思維和意識,認真分析自身現(xiàn)狀及發(fā)展需求,還要正確認識大數據的來源和發(fā)展方向,以提高圖書館未來的發(fā)展方向,并在大數據的支撐下為讀者提供更好的、人性化的服務。本文將圖書館的應對策略總結如下:大數據的獲取。數據資源的獲取來源包括數字數據、傳統(tǒng)圖書館的館藏資源和讀者行為數據?,F(xiàn)今,數字圖書館已經實現(xiàn)了資源的數字化和對數字資源的獲取,圖書館加強了對讀者行為數據的獲取策略,從而分析出讀者的喜好和需求,提高信息服務質量。(1)大數據的存儲和分析。數據量的急劇增加,對圖書館資源的存儲空間和計算能力提出了巨大的挑戰(zhàn),圖書館需要一些低廉而又高效的存儲和計算設備,而云計算為海量數據存儲和計算帶來了希望,圖書館可利用云計算技術解決這一問題。(2)加強大數據的建設。為了積極應對大數據的到來,圖書館應該提高大數據建設水平,規(guī)劃好一個完整的大數據處理流程。同時,圖書館應該以讀者需求為導向,不斷推出新服務模式,提高圖書館的個性化服務。(3)技術和管理人員培養(yǎng)。高技術人員和管理團隊能夠提高大數據的處理水平,以便更好得為讀者提供服務。因此,圖書館應該為管理人員提供定期的培訓,提高管理人員的專業(yè)水平。
六、結語
大數據時代的到來深刻影響著圖書館的發(fā)展,使傳統(tǒng)圖書館面臨變革,同時也是對圖書館的機遇和挑戰(zhàn)。大數據為圖書館提供了新的視角,不僅能更細致、準確地洞察用戶,而且能更深入地剖析業(yè)務工作,引導圖書館向更人性化、專業(yè)化的層面發(fā)展。即使目前還無法預測大數據在實際工作中將會產生何種具體的效用,但其獨特的魅力和理念將吸引研究者進行更多的探索。
參考文獻:
[1]郝志剛.大數據、云計算與圖書館[J].新世紀圖書館,2014,(6):36-39.
[2]韓翠峰.大數據帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012,(5):37-40.
[3]李恬.大數據理念與圖書館大數據[J].新世紀圖書館,2014,(6):24-27.
[4]周加藝.大數據與圖書館服務創(chuàng)新[J].情報探索,2014,(6):114-116.
篇9
關鍵詞:大數據時代;高職計算機;專業(yè)教育
一、大數據的概念與特點
所謂“大數據”顧名思義也就是指龐大的數據信息量。由于網絡、計算機的信息量較為龐大,同時結構復雜,類型眾多,因此只能用“大”字來對其容量進行形容。對于大數據的特點而言,其數據的增長具備動態(tài)性、持續(xù)性的特征。在互聯(lián)網下數據隨時可能會產生,隨時可能被存儲,這也導致數據的增長具有動態(tài)性。尤其是在網絡環(huán)境下,海量數據瞬時產生,同時還會隨著時間的延長而不斷增長。另外,大數據存在著數據類型多樣的特點,這也決定著大數據的數據類型不存在固定的形式。隨著經濟的發(fā)展,社會的進步,社會中產生了很多數據信息,這些信息的類型并不固定,既具備結構化的特征也具備多樣性、豐富性的特征,在這里也能看出大數據的重要作用。
二、大數據時代下高職計算機專業(yè)教學創(chuàng)新的必要性
由于在大數據時代下計算機的技術得到了不斷的更新,因此高職計算機專業(yè)教學的具體理念也就必須要隨之而更新,只有如此才能在不斷發(fā)展的過程中提升學生的計算機專業(yè)能力。高職院校教師應該充分發(fā)揮教育的引導理念,此外,大數據時代對我國的整體環(huán)境進行了改變,這也要求學生必須要在實際情況中具備創(chuàng)新精神,所以,計算機教師必須要提高服務創(chuàng)新意識,在業(yè)余時間內加強對大數據的了解,提升自身的業(yè)務能力,不斷對傳統(tǒng)計算機的教學模式與具體的內容進行更新,如此才能夠真正培養(yǎng)出能力過硬的計算機專業(yè)人才。由此可見,在大數據時代高職計算機專業(yè)教學創(chuàng)新勢在必行。
三、基于大數據時代下的高職計算機專業(yè)教育改革策略
(一)提升教師專業(yè)能力
想要對高職計算機專業(yè)教育進行改革,就必須要對教師的專業(yè)能力進行提升,如果教師自身的專業(yè)能力都無法滿足教學的需求,那么學生也就很難在學習過程中獲得進步。從高職學校的角度來看,其應該多多開展培訓,同時聘請經驗較為豐富的教師對其他教師進行帶動,進而提升教師的團隊素養(yǎng)。另外,在大數據時代,高職院校計算機專業(yè)課程教學還需要對大數據進行充分的融入,對大數據的教學內容進行增加,對大數據的潛在價值進行挖掘,提升學生學習計算機知識的主動性。具體的說,高職計算機教師應該立足于實際,對大數據的特色進行掌握,并運用大數據創(chuàng)新教學過程,提升對大數據的實踐能力。
(二)運用多元化的教學模式
高職計算機專業(yè)教師應該對多元化的教學模式進行運用,改革計算機專業(yè)教育,因為單一的教學模式可能很難滿足學生的學習需求,在開展教學的過程中,教師首先應該運用案例教學。計算機的教學內容不僅僅包括計算機基礎知識,同時還包含著很多與現(xiàn)實生活聯(lián)系密切的網絡技術,如果能夠多運用案例教學,就可以以學生為教學主體,促進學生計算思維能力的提升。其次,教師應該運用討論法,讓學生在學習計算機知識的過程中互相討論,如此就可以提升學生的思維能力。最后,教師可以適當運用驅動教學法,對大數據的理念在課程中進行引入,使學生可以真正的理解抽象思維的具體價值。
(三)構建大數據網絡教學平臺
對于大數據來說,其在實際情況下具有極為鮮明的時代特征,可以對人類的工作方式進行創(chuàng)新與改革,通過對龐大的數據信息進行處理,無論是在各個領域中的人都能夠因此而受益。此外,大數據的價值具備較大挖掘潛力。從教育角度來看,在教育數據進行挖掘可以完善教學內容,更新教學理念,提升教學效率,因此,高職院校完全可以利用大數據的這一特性,對大數據網絡教學平臺進行構建,以云計算技術為基礎,構建能夠讓學生與教師進行互動、教學的平臺。在所構建的網絡平臺中,無論是教師還是學生都能夠更加自如的運用數據技術,以此來輔助教學,可提升學生的學習效率。由于大數據網絡教學以大數據為核心,因此學生學習的興趣也可以得到激發(fā),另外,平臺的存在還能夠評估學生具體的學習效果,對于教師來說,其可以通過平臺搜集相關的資源,進而分析自身的教學行為,不斷更新教學理念。
篇10
關鍵詞:統(tǒng)計學;教育改革;大數據
一、引言
最早提出大數據時代到來的機構是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數據已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素,人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來”。
大數據是隨著互聯(lián)網技術的廣泛應用帶來的數據量和數據類型激增而衍生出來的一種現(xiàn)象,但大數據一詞不僅指規(guī)模大、種類多的數據集,還包括對這種數據集進行采集、處理與分析以提取有價值信息和直接創(chuàng)造價值的技術構架和技術過程。大數據的第一個特征是數據量巨大。截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數據類型繁多、異構性突出,包括網絡日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數據價值密度較低,數據中存在大量重復性和無價值性信息或噪聲。如何通過強大的計算技術和統(tǒng)計分析等方法迅速完成數據的價值提純,是大數據時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數據區(qū)分于傳統(tǒng)數據挖掘最顯著的特征。
目前,不同的學科領域對大數據概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數據概念體現(xiàn)在數據量的巨大、種類的眾多及產生速度的飛快,同時產生的數據集極有可能包含著各種半結構化和非結構化數據;其次,大數據概念還體現(xiàn)在對數據進行處理的手段和流程方面,由于數據量的龐大和類型復雜,利用常規(guī)的統(tǒng)計軟件已經無法對當今的數據進行及時有效的存儲、分析及處理。因此,所謂的大數據并不是單純指數據流量的巨大,還指其結構的復雜和種類的多樣,在數據處理和分析上需要采用高端計算平臺或高級統(tǒng)計軟件,以及海量數據中存在著可挖掘的潛在的大量價值信息與知識。
近年來,隨著高速計算機的應用、信息技術的快速發(fā)展,特別是云計算技術的發(fā)展,使大數據的存儲和分析技術得到迅速發(fā)展,目前的核心技術有MapReduce、GFS、BigTable、Hadoop,以及數據可視化等。在數據搜集上,可方便地通過在線互聯(lián)網數據庫獲取二手數據或一手實時數據。在數據分析上,傳統(tǒng)統(tǒng)計學方法采取的是基于統(tǒng)計模型的樣本數據分析,而大數據分析技術則是通過高端計算平臺,對大數據中的信息進行挖掘。
統(tǒng)計學作為對數據進行處理和分析的科學,必然受到大數據的影響。在大數據時代,統(tǒng)計學教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數據環(huán)境下我國統(tǒng)計學教育的改革問題(例如[1]-[5]),本文在分析大數據時代特征的前提下,進一步討論我國統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計學教育改革的內容、方法、借鑒和適應時代要求的變革問題。
二、統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)
2013年,教育部對我國統(tǒng)計學專業(yè)設置進行一次新的調整,將原來的既可授予理學學位,也可授予經濟學學位的統(tǒng)計學專業(yè)劃分為統(tǒng)計學、應用統(tǒng)計學和經濟統(tǒng)計學三個本科專業(yè)[6]。根據教育部高等學校統(tǒng)計類專業(yè)教學指導委員會2013年11月公布的數據,當時全國有194所高校開設了統(tǒng)計學專業(yè),156所高校開設了應用統(tǒng)計學專業(yè),164所高校開設了經濟統(tǒng)計學專業(yè)[6]。目前,全國開設這三個統(tǒng)計學專業(yè)的高校個數和在校學生人數與2013年相比都有不少的增加。
面對大數據時代,我們目前的統(tǒng)計學教育無論在培養(yǎng)目標和教學內容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問題。例如,在專業(yè)培養(yǎng)目標和人才培養(yǎng)過程中,我們比較重視課程層面上的評價,比較輕視專業(yè)層面上的整體評價,缺乏對學生綜合能力的反饋機制。
關于教學內容,目前三個統(tǒng)計學專業(yè)在統(tǒng)計理論和應用統(tǒng)計兩個方面有不同的側重。統(tǒng)計理論主要包括:抽樣理論、實驗設計、估汁理論、假設險驗、決策理論、貝葉斯統(tǒng)計、半參數和非參數統(tǒng)計、序貫分析、多元統(tǒng)計分析、時間序列分析、小樣本理論和大樣本理論等。在數據分析中,現(xiàn)今的統(tǒng)計方法基本以結構化數據為主要處理對象,而對非結構化和半結構化數據的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計學課程及內容已不能滿足從事非結構型和半結構型的大數據研究和商業(yè)應用對人才培養(yǎng)的需要,必須進行必要的改革。
對于教育方式,鑒于大數據時代要求,統(tǒng)計分析人員需要具備較高的數學和現(xiàn)代統(tǒng)計學基礎,具有較高的軟件操作能力,掌握一定的大數據收集、整理、分析、處理和挖掘數據的技能。日本學者城田真琴認為:“數據科學家要有計算機科學專業(yè)背景,數學、統(tǒng)計方面的素養(yǎng)和使用數據挖掘軟件的技能,善于利用數據可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應的專業(yè)知識、眼界和視野,具有適應社會發(fā)展和創(chuàng)造價值的能力”?,F(xiàn)今的統(tǒng)計學教育方式還不能很好適應大數據時代數據科學人才培養(yǎng)需要,必須進行必要及時的調整和變革。
對人才培養(yǎng)模式,大數據時代不僅要求培養(yǎng)具有數據處理和分析所需的基本素質與技能,更重視培養(yǎng)從海量數據中發(fā)現(xiàn)和挖掘價值信息、把握市場機遇、創(chuàng)造利潤的潛在能力。面對大數據時代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計技術、數據挖掘方法、計算機信息技術、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計人才的教育模式也需要相應變化,統(tǒng)計學教育只有與時俱進,主動做出全面的調整和變革才能適應新時代知識進步和激烈人才市場競爭的需要,積極迎接大數據時代的挑戰(zhàn)。
大數據時代對統(tǒng)計學教師有更高的要求,統(tǒng)計學教師需要與時俱進,跟上時代步伐。隨著互聯(lián)網、物聯(lián)網、云計算等信息技術的發(fā)展,對數據的分析和處理的技術也隨之要求更高,統(tǒng)計學教師固有的知識體系已不能滿足培養(yǎng)現(xiàn)代統(tǒng)計人才的需要,必須進一步深化和更新原有的統(tǒng)計學理論知識,而且還需要學習掌握計算機技術、互聯(lián)網、數據庫和信息科學等有關知識和技術,同時還要熟悉處理非結構型和半結構型數據的知識和技能,以適應現(xiàn)代統(tǒng)計學教育對教師的知識結構和基本素質的要求。
大數據時代對統(tǒng)計專業(yè)的學生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計理論、統(tǒng)計方法和專業(yè)統(tǒng)計軟件,還要學會如何分析、處理來自互聯(lián)網或各種實際問題中的海量數據,如何利用統(tǒng)計軟件和互聯(lián)網技術進行數據操作,如何借助軟件技術和統(tǒng)計準則判斷數據質量,如何進行模型選擇和評價模型方法的有效性,如何準確清晰地呈現(xiàn)統(tǒng)計分析結果和結論,等等。
2014年11月,美國統(tǒng)計學會了統(tǒng)計學本科專業(yè)指導性教學綱要 [7],該教學綱要對統(tǒng)計學專業(yè)提出四個方面的要求:(1)具有扎實的數學和統(tǒng)計學基礎、強大的統(tǒng)計計算和編程能力,熟練使用統(tǒng)計軟件和數據庫;(2)分析來自現(xiàn)實問題的真實數據,真實數據是統(tǒng)計專業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數據分析結果的能力。美國是統(tǒng)計學教育和人才培養(yǎng)最先進的國家之一,該指導性教學綱要代表著美國統(tǒng)計學專業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對我國統(tǒng)計教育的改革具有重要的參考價值。以該指導性教學綱要為參考依據,對照我國目前的統(tǒng)計學本科專業(yè)教育,無論是在培養(yǎng)目標和課程設置方面,還是在教學內容和教學方法方面,都存在著亟待解決的挑戰(zhàn)性問題。
三、統(tǒng)計學教育的改革
大數據時代的統(tǒng)計學教育不僅是各種統(tǒng)計方法、數據挖掘方法和信息技術手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應用和在實際數據分析中的真實體驗。過去,企業(yè)數據庫價格昂貴,在統(tǒng)計學教育的教學案例或實驗課教學中,很少采用真實和海量的數據庫資源,基本都是采用過時或虛擬的數據。今天,像百度大數據引擎這樣的數據庫的逐步對外開放,將有助于開展“線上大數據統(tǒng)計實驗”教學。為了適應大數據時代要求,有必要利用網絡資源以及各種數據處理軟件,搭建線上大數據分析實驗教學平臺,全面開展大數據統(tǒng)計實驗教學的改革。實際上,借助大數據分析平臺,本科階段的統(tǒng)計學教育就可以融人聯(lián)機分析和數據的可視化教學。其次,要時刻關注大數據分析理論的進展,及時將新理論新方法融入課堂教學內容。
需要指出的是,在大數據時代,經典統(tǒng)計理論和方法并沒有過時,但需要進行改進和進一步發(fā)展。這是因為,網上采集的巨型數據集往往存在大量的重復性和無價值數據信息,使得大數據價值密度降低。在對這些數據進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預處理,將其變成便于進行分析處理的小數據,繼而借助于經典統(tǒng)計方法進行分析和處理。因而在大數據時代仍然需要采用傳統(tǒng)統(tǒng)計學的小樣本理論和方法。所以,即便是在大數據時代,經典統(tǒng)計方法仍然是進行統(tǒng)計分析的基石,其核心地位不可動搖。所以,在大數據時代仍然要強化統(tǒng)計學的基本理論和方法,尤其是在長期發(fā)展和實踐應用中經過驗證的、成熟有效的經典和現(xiàn)代統(tǒng)計方法,在大數據時代仍然沒有過時,但需要結合大數據分析的需要對經典統(tǒng)計方法進行必要的發(fā)展和改進。
大數據科學需要統(tǒng)計學與數學、計算機等學科的結合。亞馬遜大數據科學家John Rauser 認為:“數據科學家是統(tǒng)計學家和計算機工程師的結合體”。為了滿足大數據時代的要求,統(tǒng)計學專業(yè)的課程設置需要進行必要的調整。應根據新時代人才培養(yǎng)的要求,增設與大數據前沿領域發(fā)展相關的課程,如計算機網絡和大數據相關的軟件應用,同時要加大實驗課和社會實踐課的比重,引導學生理解和掌握大數據概念、理論、技術和方法,培養(yǎng)其運用大數據的相關分析工具解決實際問題的能力。對于理論課程,除基本統(tǒng)計理論外,還應開設一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經網絡、數據挖掘、應用隨機過程論等。另外,還應開設與大數據分析相關的關聯(lián)規(guī)則、決策樹、機器學習、支持向量機等課程。
為了培養(yǎng)與時代適應的統(tǒng)計學人才,統(tǒng)計學專業(yè)教師應不斷更新自身的知識結構和價值觀念,改變認識數據、收集數據和分析數據的思維,主動學習和補充互聯(lián)網、現(xiàn)代數據分析技術、數據庫和數據挖掘技術,使自己的知識體系不斷更新和提升,跟上時展的步伐。
在大數據時代,要注意培養(yǎng)學生適應社會的能力。統(tǒng)計專業(yè)人才培養(yǎng)模式應以提高本專業(yè)學生數據分析方面的能力,開闊他們的視野,培養(yǎng)其適應社會的能力。應積極引導學生進入實訓場所動手操作和鍛煉,嘗試以企事業(yè)單位的財政、金融、保險、統(tǒng)計、咨詢和信息公司等部門為主構建專業(yè)性教育實踐基地。鼓勵學生到大數據相關的機構部門、產業(yè)園區(qū)和企業(yè)中去調查研究和實踐。此外,統(tǒng)計專業(yè)應積極同其他專業(yè)進行合作,聯(lián)合培養(yǎng)適應新時代要求的數據分析人才。鑒于大數據對數據分析人員在計算機技術、行業(yè)認知、業(yè)務知識、數據分析工具和方法的要求提高,統(tǒng)計學科應主動與計算機、經濟學、管理學等相關學科合作,培養(yǎng)學生的計算機能力、專業(yè)素質和業(yè)務修養(yǎng)。
“它山之石可以攻玉”,關于統(tǒng)計學專業(yè)的課程設置,可以參考和借鑒美國統(tǒng)計學會公布的統(tǒng)計學本科專業(yè)指導性教學綱要。根據該教學綱要,統(tǒng)計專業(yè)的課程設置應該涵蓋五個模塊[7]:(1)統(tǒng)計方法與統(tǒng)計理論。建立統(tǒng)計模型并對模型的輸出結果進行評價,熟悉統(tǒng)計推斷,能夠從數據分析中得出恰當的結論。(2)數據操作和統(tǒng)計計算。熟練使用一款專業(yè)統(tǒng)計軟件進行探索性數據分析,發(fā)現(xiàn)和清洗數據中的錯誤記錄,具有編程能力和算法思維,可以進行各種數據操作,還應掌握統(tǒng)計計算技術,能夠進行模擬研究。(3)數學基礎。熟練掌握微積分、線性代數、矩陣論、概率論和數理統(tǒng)計的基礎知識。(4)實踐訓練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結論,并且具有團隊合作精神和項目領導能力。(5)特定領域的知識。掌握特定應用領域的知識,并用統(tǒng)計學特有的思維方法來分析和解決特定領域的實際問題。
大數據時代是以數據為中心的時代,統(tǒng)計學專業(yè)的教育改革必須適應這個時代的要求。統(tǒng)計數據分析中軟件應用能力至關重要。在眾多統(tǒng)計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統(tǒng)計建模、統(tǒng)計計算和可視化功能強大,更新迅速,是最新統(tǒng)計方法的主要平臺,非常有利于培養(yǎng)學生的編程能力和知識更新能力,而SAS軟件被很多公司用于數據管理和數據分析,在實際應用領域具有長期而深遠的影響,是數據分析不可或缺的專業(yè)統(tǒng)計軟件。當然,教學中也可以嘗試使用其他專業(yè)統(tǒng)計軟件,例如經濟統(tǒng)計專業(yè)學生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎上,應加強學生統(tǒng)計計算和統(tǒng)計模擬能力的培養(yǎng)。在大數據時代,強調統(tǒng)計計算的重要性是大勢所趨。統(tǒng)計模擬技術是伴隨著高速計算機和信息技術的快速發(fā)展而廣泛應用的現(xiàn)代技術,可用來解決傳統(tǒng)學科領域中無法解決的問題。例如,在計算技術飛速發(fā)展的今天,貝葉斯統(tǒng)計方法過去曾經面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術的統(tǒng)計模擬方法在數據分析中的強大威力正在日益顯現(xiàn)[8]。
參考文獻:
[1] 劉春杰,大數據時代對當代統(tǒng)計學教育的挑戰(zhàn),統(tǒng)計與決策,2015年,第8期。
[2] 孟生旺,袁衛(wèi),大數據時代的統(tǒng)計教育,統(tǒng)計研究,2015年,第32卷4期。
[3] 葛虹,韓偉,大數據時代統(tǒng)計教育變革的SWOT分析與發(fā)展策略,統(tǒng)計與決策,2015年,第4期。
[4] 張海波,黃世祥,統(tǒng)計學專業(yè)學生大數據分析能力的培養(yǎng)方式選擇,統(tǒng)計與決策,2014年,第24期。
[5] 李衛(wèi)東,大數據對統(tǒng)計學科發(fā)展的影響,統(tǒng)計與決策,2014年,第13.期。
[6] 教育部高等學校統(tǒng)計類專業(yè)教學指導委員會.統(tǒng)計學專業(yè)教學單位.http:///category/信息公開/教學單位,2013-11-15.