今天來説說PySpark的for each吧,過去在使用SQL時,總會因為想要使用迴圈但SQL Query又無法使用迴圈而感到很困擾嗎?來看看(或許?)可以拯救...
自然語言處理概念、應用
自然語言處理Natural Language Processing 簡稱NLP
機器對於人類自然語言與文字辨識、分析、理解及生成處理能...
今天我們來介紹ROC曲線ROC曲線主要用來分析不平衡的分類模型。**當ROC曲線越靠近左上方,表示分類的效果越好。**在理想情況下,ROC曲線會位於左上角的對角...
NLP特徵抽取
語意表示的基本概念
如何利用「數據」來適切地表達語言中字句的「涵義」,即所謂的「字句語意表示」(Word Semantic Representa...
在這次的自學過程中,探索了資料分析領域的豐富工具和技術,這個過程不禁豐富知識和技術,也加深了我對數據課學的理解,總結一下這個月的收穫:
學習資源的重要:尋找了...
為什麼會有這樣的資料結構出現:
通常都是在讀Json格式的資料時
遇到這種巢狀(nested)結構時,要怎麼處理呢?
會利用. 或是explode()去展...