大數(shù)據(jù)時代圖書電商的機遇與挑戰(zhàn)
2013-11-26 14:49 來源:中國新聞出版網 責編:陳莎莎
- 摘要:
- 隨著移動互聯(lián)網、物聯(lián)網、云計算等新興技術的發(fā)展,社交媒體、智能終端和視頻監(jiān)控等媒介設施迅速普及,全球數(shù)據(jù)量呈爆炸性增長。據(jù)國際數(shù)據(jù)公司(IDC)統(tǒng)計,僅2011年全球被創(chuàng)建和復制的數(shù)據(jù)量即達1.8ZB,相當于有史以來所有印刷材料數(shù)據(jù)量的近萬倍,而這樣龐大的數(shù)據(jù)量每兩年將翻一番。
【CPP114】訊:隨著移動互聯(lián)網、物聯(lián)網、云計算等新興技術的發(fā)展,社交媒體、智能終端和視頻監(jiān)控等媒介設施迅速普及,全球數(shù)據(jù)量呈爆炸性增長。據(jù)國際數(shù)據(jù)公司(IDC)統(tǒng)計,僅2011年全球被創(chuàng)建和復制的數(shù)據(jù)量即達1.8ZB,相當于有史以來所有印刷材料數(shù)據(jù)量的近萬倍,而這樣龐大的數(shù)據(jù)量每兩年將翻一番。海量數(shù)據(jù)蘊涵著高昂價值,運用新興技術整合數(shù)據(jù)已成為惠普、IBM、微軟、阿里巴巴等國際巨頭戰(zhàn)略轉型的重要規(guī)劃之一。著名咨詢公司麥肯錫2011年發(fā)布名為《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產率的前沿》的研究報告,認為數(shù)據(jù)已經滲透到了每個行業(yè)和業(yè)務職能領域,逐漸成為重要的生產要素,對海量數(shù)據(jù)的運用,預示著新一波生產率增長和消費者盈余浪潮形成。2012年3月,美國政府發(fā)布了“大數(shù)據(jù)研究與開發(fā)計劃”,將之列為繼“信息高速公路計劃”之后的又一重大科技發(fā)展部署。種種現(xiàn)象表明,大數(shù)據(jù)時代已經來臨。
大數(shù)據(jù)時代,任何產業(yè)和企業(yè)組織都面臨著新一輪的機遇和挑戰(zhàn)。由于大數(shù)據(jù)與互聯(lián)網及網民的天然接近性,IT業(yè)和營銷行業(yè)首當其沖。在出版領域,圖書電商是以IT身份而從事營銷業(yè)務的典型代表,如何直面挑戰(zhàn)、乘機求進,不僅事關其自身發(fā)展,也與整個出版業(yè)未來發(fā)展方向息息相關。
大數(shù)據(jù)的定義、特征與內涵
根據(jù)麥肯錫的定義,“大數(shù)據(jù)”是指無法在一定時間內用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內容進行抓取、管理和處理的數(shù)據(jù)集合。之所以“無法”抓取、管理和處理,緣于大數(shù)據(jù)的四個基本特征。其一,數(shù)據(jù)量巨大。數(shù)據(jù)量級已經從GB(千兆字節(jié))和TB(萬億字節(jié))發(fā)展到了PB(千萬億字節(jié))、EB(百億億字節(jié))乃至ZB(十萬億億字節(jié))計量的地步。科學家估算,如果將2013年全球存儲的數(shù)據(jù)刻錄在只讀光盤上,可以堆成五堆,每一堆都伸向月球。其二,數(shù)據(jù)類型多樣。除少量由傳統(tǒng)數(shù)據(jù)庫累積的結構化數(shù)據(jù)之外,還包括各類互聯(lián)網、物聯(lián)網應用所產生的文字、圖片、視頻、圖像與地理位置信息等半結構化和非結構化數(shù)據(jù),后者占比達75%以上。[1]其三,實時快速。數(shù)據(jù)快速產生、增長和流轉,例如即時通訊工具中產生的數(shù)據(jù)流,要求實時存儲和處理,如果事后追溯則價值流失。其四,價值高但密度低。大數(shù)據(jù)包含著大量冗余信息,必須披沙揀金才能有所獲益。例如,社交網站中多數(shù)日常交流信息價值稀薄,但聯(lián)合國的“全球脈動計劃”在巨量日常信息的基礎上,使用自然語言解密軟件對網民進行“情緒分析”,可以預測失業(yè)率、疾病爆發(fā)等現(xiàn)象,有益于經濟和社會發(fā)展。
原本“無法”抓取、管理和處理的數(shù)據(jù)集合,如今得以愈來愈多地運用,這是大數(shù)據(jù)時代的意義所在。因而,“大數(shù)據(jù)”的內涵,不僅止于“龐大的數(shù)據(jù)集合”,而且包含對數(shù)據(jù)的存儲、處理、分享、挖掘、分析等技術與能力。大數(shù)據(jù)技術中,社交網站、物聯(lián)網的應用,使用戶的行為軌跡、情緒變化以至萬事萬物的所處狀態(tài)都可以數(shù)據(jù)化;以Hadoop(能夠對大數(shù)據(jù)進行分布式處理的軟件框架)為代表的非關系型數(shù)據(jù)庫系統(tǒng)使不同行業(yè)、不同類型數(shù)據(jù)之間的聯(lián)系、交換和利用更加便捷;云計算等分布式運算架構技術使快速、低成本分析巨量數(shù)據(jù)成為可能。大數(shù)據(jù)內涵的核心,事實上在于如何應用大數(shù)據(jù)。這正如《駕馭大數(shù)據(jù)》的作者BillFranks(比爾·弗蘭克斯)所說:“重要的不是數(shù)據(jù),而是如何使用數(shù)據(jù);大數(shù)據(jù)的核心是發(fā)現(xiàn)價值。”
大數(shù)據(jù)時代,任何產業(yè)和企業(yè)組織都面臨著新一輪的機遇和挑戰(zhàn)。由于大數(shù)據(jù)與互聯(lián)網及網民的天然接近性,IT業(yè)和營銷行業(yè)首當其沖。在出版領域,圖書電商是以IT身份而從事營銷業(yè)務的典型代表,如何直面挑戰(zhàn)、乘機求進,不僅事關其自身發(fā)展,也與整個出版業(yè)未來發(fā)展方向息息相關。
大數(shù)據(jù)的定義、特征與內涵
根據(jù)麥肯錫的定義,“大數(shù)據(jù)”是指無法在一定時間內用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內容進行抓取、管理和處理的數(shù)據(jù)集合。之所以“無法”抓取、管理和處理,緣于大數(shù)據(jù)的四個基本特征。其一,數(shù)據(jù)量巨大。數(shù)據(jù)量級已經從GB(千兆字節(jié))和TB(萬億字節(jié))發(fā)展到了PB(千萬億字節(jié))、EB(百億億字節(jié))乃至ZB(十萬億億字節(jié))計量的地步。科學家估算,如果將2013年全球存儲的數(shù)據(jù)刻錄在只讀光盤上,可以堆成五堆,每一堆都伸向月球。其二,數(shù)據(jù)類型多樣。除少量由傳統(tǒng)數(shù)據(jù)庫累積的結構化數(shù)據(jù)之外,還包括各類互聯(lián)網、物聯(lián)網應用所產生的文字、圖片、視頻、圖像與地理位置信息等半結構化和非結構化數(shù)據(jù),后者占比達75%以上。[1]其三,實時快速。數(shù)據(jù)快速產生、增長和流轉,例如即時通訊工具中產生的數(shù)據(jù)流,要求實時存儲和處理,如果事后追溯則價值流失。其四,價值高但密度低。大數(shù)據(jù)包含著大量冗余信息,必須披沙揀金才能有所獲益。例如,社交網站中多數(shù)日常交流信息價值稀薄,但聯(lián)合國的“全球脈動計劃”在巨量日常信息的基礎上,使用自然語言解密軟件對網民進行“情緒分析”,可以預測失業(yè)率、疾病爆發(fā)等現(xiàn)象,有益于經濟和社會發(fā)展。
原本“無法”抓取、管理和處理的數(shù)據(jù)集合,如今得以愈來愈多地運用,這是大數(shù)據(jù)時代的意義所在。因而,“大數(shù)據(jù)”的內涵,不僅止于“龐大的數(shù)據(jù)集合”,而且包含對數(shù)據(jù)的存儲、處理、分享、挖掘、分析等技術與能力。大數(shù)據(jù)技術中,社交網站、物聯(lián)網的應用,使用戶的行為軌跡、情緒變化以至萬事萬物的所處狀態(tài)都可以數(shù)據(jù)化;以Hadoop(能夠對大數(shù)據(jù)進行分布式處理的軟件框架)為代表的非關系型數(shù)據(jù)庫系統(tǒng)使不同行業(yè)、不同類型數(shù)據(jù)之間的聯(lián)系、交換和利用更加便捷;云計算等分布式運算架構技術使快速、低成本分析巨量數(shù)據(jù)成為可能。大數(shù)據(jù)內涵的核心,事實上在于如何應用大數(shù)據(jù)。這正如《駕馭大數(shù)據(jù)》的作者BillFranks(比爾·弗蘭克斯)所說:“重要的不是數(shù)據(jù),而是如何使用數(shù)據(jù);大數(shù)據(jù)的核心是發(fā)現(xiàn)價值。”
-
相關新聞:
- ·愛達森制版:電商思維再升級 新裝備力促新格局 2013.11.21
- ·電商火爆給包裝印刷帶來巨大商機 2013.11.21
- ·電商虛假打折涉嫌違法經營 2013.11.17
- ·電商未能全面替代零售商業(yè) 三季度商鋪空置率下降 2013.11.17
- 關于我們|聯(lián)系方式|誠聘英才|幫助中心|意見反饋|版權聲明|媒體秀|渠道代理
- 滬ICP備18018458號-3法律支持:上海市富蘭德林律師事務所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098