第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...
人本資訊資料探勘?一個我看到學校系統冒出這個名詞,實在覺得太特別就選了。 人本資訊資料探勘:Human Information Data Mining看了英文的...
構成語句最基本為字詞,使用詞嵌入將字詞轉為詞向量後,為了從文本數據得到顯著而有用的資訊,需要的是探索支援自然語言處理的工具與嘗試,例如基於 python 的主題...
上一篇講了兩個數字:1)誰表的文章最多 2) 誰發表的文章被推文數最多?今天要看另外兩個數字: 每個 user 累積推文的數量 文章被推文的數量 同樣的,範...
在Day 6的文章中,我們說到在進行搜尋時,我們首要關心的是查詢的詞與文件間的相似度。我用一個例子作為開端:假如我們有三個檔案,分別叫做doc1, doc2以及...
繼續昨天的list如果list內容全都是數值,就可以使用max()獲取list的最大值,min()獲取list的最小值,sum()可取得list的總和 如果~在...