看不到未來
跟雲一樣
台灣廠官學...都這樣
不用多久 Big Data 就一堆
但Data 要從哪來??
我覺得
Big Data 的爆發程度
會跟
雲端一樣
台灣有沒有Big Data的商機?
應該要看台灣有沒有Big Data的發展要件,也就是資料量的大小。
除了幾家大型跨國企業為了稅法規定的交易資料保存年限,而導大量資料累積外,就只有政府單位有可累積大量資料,例如國稅局、地政事務所等等。
再來,就是圖書館館藏數位化。
這些也就是台灣能夠構成Big Data的可能對象。
如果把不怎麼Open的Open Data也算進來,台灣能夠稱得上有Big Data建置需求的組織,可能數一數就數完了。
既然需要建置的Big Data不多,應用也就不會有什麼爆發式的成長。
彈藥如此少,爆發起來也實在沒看頭。
大資料
在過去MS的.NET Framework裡有效數值精度最大的資料型別是
decimal
有效數值精度約10的28次方
在.NET 4.0新增的
System.Numerics.BigInteger似乎更大
(需加入參考 System.Numerics.dll)
重點不在 Big Data ,重點在網際網路的網速.上傳下載的網速.
南韓網速快,所以各行各業都進步了,臺灣呢?
還是有一堆人認為要那快的網路要做什麼?
這讓我想到我當兵在成功嶺的時候,當時政府在建十大建設.
其中"高速公路"這項.被反對的人士拿來說.高速公路是用國家的錢來建設給有錢人的.(ps:當時有錢人才能開車),我們一般人都不能使用..這個政府只照顧有錢人...等等..
看是有道理喔!
現在的網路就是 資訊的高速公路.沒有這些資訊如何流通..
所以 雲 Big Data 等等...重點只有一個,就是如果每家每戶最少都 100M/100M 再來談..
不然都是空話.
我的看法:
Big data的商機是有的,從supply chain的角度,儲存,雲端,頻寬..,某些廠商應該可以發現商機.
至於Big data的運用,現階段我比較不看好.目前為止,我還沒聽說過國內有此需求,民間或政府單位皆沒有.要等國外運用實例出來的,國內運用才會看得到.
現在的迷思應該在於,只要扯上「Big Data」「雲」的邊
老闆就會開始點頭說:恩~很好很好!很有想法和規劃!
真的要做的時候老闆就會說:不不,我沒有錢;不不,這個不安全…
然後就結束了一年的規劃,明天再度開啟這個話題!
週,而,復,始囉!
其實我也在找相關big data的business model.在一個企業如此眾多的資料.mail,file server, Database.怎麼樣才能找出關聯性.從一些看似無用的資料能挖掘出有用的資料甚至能聯結外部的資料例如Google or Microsoft bing.我覺得這是對大老闆簡報最中要的部份也才能說服他們拿錢出來投資
要如何定義Big Data的Big呢? 大小不重要, 能持久才是最重要的.
基本上, 資料量的大小不是Big Data的核心, 一般上用資料庫來處理結構性資料, 對於非結構性資料的處理大多使用生產力工具, 如MS-Office, LibreOffice, Email,...等, 傳統上, 處理非結構性資料的最大困難也在於如何合理性的"結構化"非結構性資料, Key/Value技術就是一個可以合理結構化非結構性資料的工具, 為何要結構化非結構性資料? 就是為了資料的持久性, 資料的持久性所代表的核心意義就是, 可以透過持續分析資料, 取得有用的資訊.
這個問題,很有可能也是很多公司IT人員心中的問題。
Data那裏來,何故說Big Data?
有可能,以內部來說:
1.與虚擬化的深度、備份頻繁度、日增量有關。
(虛擬化之後,備份多半以IMAGE為主)
2.如果公司內部資料變動與保存策略有關
3.資料分析(一如上面的大大有提到的Data Mining)
4.自動化的深度。
5.CRM(客戶關係管理)有關
外部來說:
就如上面大大也有提到,或買資料、或在自家撈資料
(或與客戶資料有關、或與自家的ERP有關)...
一如上述也有大大提到,與雲有關或很類似的討論,
看老闆、公司,需要做什麼而定。
其實,不知不覺中,在資料一直成長後,才會瞭解
資料的增量與累積量是可觀的,到時再討論與解決,
就很可能更複雜了。
有可能,Big Data還未談到頻寬,就已經措手不及了
也說不定。
至於外在順寬的問題,是Big Data的另項議題,是與
網路使用者的行為有關,算是電子商務上的應用;這也
才比較會看,電子商務的公司要做多大的規模而定了;
網路速度越快、網路上的商機就有更的想像空間了。
但不是等到那時候,再說;可能要先思考過,才能應變得宜。
至於廠商是否因而賺錢,要看廠商的用心程度與對客戶
的關心程度了。
以上 小看法,請指教。
最近的 百度雲/360雲盤
.... 資料很快就爆了......
37TB ...... 500KB 上傳也要 N年才傳的爆..
Big Data其實背後真正想要探討的應該是BI和Data mining;要從一堆資料中撈取出有利於決策或是發現新藍海的的資訊或是智慧,所以Big Data的Big其實要依需求和環境而定,而不是一個閥值