大數(shù)據(jù)時代讀書心得體會范文1
《大數(shù)據(jù)時代》是英國維克托?邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細(xì)解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計算機運算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。 "小數(shù)據(jù)"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數(shù)據(jù)"時代對精確性不再那么要求苛刻??也無法要求太嚴(yán)格??數(shù)據(jù)的數(shù)量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數(shù)據(jù)時代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。 在我看來,這實際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"
大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時代的價值鏈由三部分構(gòu)成,我把它們簡化為"生產(chǎn)?分析?使用"三個環(huán)節(jié),這對應(yīng)書中的三種類型公司: 第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認(rèn)為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。
對于普通人來說,大數(shù)據(jù)時代最關(guān)心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險。對此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預(yù)測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達(dá)成"個人僅需對行為而非動機負(fù)責(zé)"的共識非常重要。
大數(shù)據(jù)時代的風(fēng)險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨裁。當(dāng)今的法律亦需對大數(shù)據(jù)監(jiān)管進(jìn)行修訂補充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領(lǐng)域會意識到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實用的選擇;但對某些領(lǐng)域,盲目使用大數(shù)據(jù)只會適得其反。
大數(shù)據(jù)時代讀書心得體會范文2
4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時代》的讀書交流活動。通過相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實意義。
首先,最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù) 據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來!薄按髷(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計算、物聯(lián)網(wǎng)之后又IT行業(yè)又一大顛覆性的技術(shù)革命。云計算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計算內(nèi)在的靈魂和必然的升級方向。
其次,進(jìn)入2012年,大數(shù)據(jù)(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進(jìn)入美國白宮的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進(jìn)了投資推薦報告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數(shù)據(jù)對企業(yè)的重要性。正如《紐約時報》2012年2月的一篇專欄中所稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。哈佛大學(xué)社會學(xué)教授加里?金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程!
最后,隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注。著云臺的分析師團隊認(rèn)為,大數(shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作!按髷(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(相當(dāng)于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢,可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實現(xiàn)利益最大化。而我們很多人對大數(shù)據(jù)還很陌生,只是被動的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時代是以云計算為基礎(chǔ)的,所以,要實現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時,可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時代的到來會解放更多的勞動生產(chǎn)力,勢必將會更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現(xiàn)在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當(dāng)及時刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護(hù)自己真實IP地址,提高網(wǎng)絡(luò)安全的可靠性,加強對聯(lián)網(wǎng)信息的管理和保護(hù)。
不論我們情不情愿,大數(shù)據(jù)時代都會到來,現(xiàn)實社會是我們高喊著走向大數(shù)據(jù)時代,其實大數(shù)據(jù)時代已經(jīng)向我們走來,所以與其被動接受,不如主動學(xué)習(xí),從中找到自己的出路,成為大數(shù)據(jù)時代的建設(shè)者和受益者。