大數據這名詞在近幾年已經被各大輿論講到不能再講,所有東西都能跟大數據扯上關係,那到底甚麼是大數據。許多人在做調查時,會想用多資料讓樣本能趨近於現實,但其實並不是所有事情都能用大數據解決,其實想解決問題前,應該先了解問題本身,先設想一個答案再去做從大數據中找到能解決問題的方法。
蒐集數據定沒有這麼的容易,如果以填表單來說,每增加一個欄位就會增加將近14%的人會把想把資料填完,或者是直接關掉,因為現在資訊越來越多,使用者對回饋越來越不積極,使得在蒐集數據這方面就有非常大的挑戰。在數據分析中也有一項非常大的陷阱,數據的成效學習中,關聯往往不等於因果,舉例來說,如果有位買家買了手機,就有可能買手機殼,這是屬於因果關係。如果有人常買零食及衛生紙,只能說這是有關聯,不能說兩者是因果關係。
大數據其實不抽象,他有一整套方法讓人們能夠購過數據尋找相關性,最後解決各式各樣的難題。這項思維除了可以解決社會問題外,還可以解決商業問題,在許多文章都指出,商業其實是最廣泛運用大數據領域之一。
現在的人工智慧離不開深度學習,透過大量資料在所有的領域探索,例如圍棋博弈、商業精準行銷、無人自動駕駛等等,人能做的有一天也許會被機器所超越。而人工智慧要實現這樣的發展,解決在在社會中許多高人力成本的問題,除了計算能力和深度學習演算法的演進,大數據是其中的關鍵。