AI & Data
本次參賽主要目標就是將股票投資的技術分析程式化,並使用相關演算法與人工智慧技術來解決技術分析的各項課題。 程式碼與資料檔案都在GitHub: https://github.com/yilintung/IronMan2023 。
AI & Data
今天是特殊的一年,大型語言模型如雨後春筍般冒出,其回答問題、邏輯推理、舉一反三的能力也令人嘆為觀止,曾經被人工智能視為障礙的圖靈測試對如今的語言模型來說就像一塊小蛋糕;原本因為進入門檻極高,該技術始終掌握在少數人的手中,然而現在,在LLama系列的大型語言模型開源後,先前許多專門被用來finetune大模型的技術,也開始被使用在了LLama系列的語言模型上,本系列文章將使用單張顯卡,藉由研究baby llama2專案來嘗試從頭訓練自己的語言模型並一步一步把模型參數量加大;並且使用QLORA等等的技術來對現有的大型語言模型做針對性的微調,探索大語言模型的奧秘。
AI & Data
學習了解machine learning and deep learning, 並利用網上多方資源嘗試訓練出屬於自己的語音模型且加以活用
AI & Data
ChatGPT的出現,讓人不只感受到通用人工智慧的可能性,更讓人看見產業革命的曙光。 在接下來的30天裡,我將從基本理論以及重要概念出發,並以實際的聊天機器人開發案例跟大家介紹如何使用 OpenAI API 以及 LangChain,大家一起來學習,如何將對它的驚歎,轉換為實際的應用吧~
AI & Data
如何充分利用OpenAI的API,以創建更為智能和多元化的AI應用。其中一個關鍵是Prompt,提示工程是一種獨特的技術,透過精心設計和優化OpenAI的輸入與輸出,使AI更能準確地理解並回答人類的問題,進而使LLM模型能生成更好的回應。而語義核心則是一種開源的SDK,它讓開發者能夠使用常見的程式語言,如Python或C#,來整合OpenAI以及其他AI服務,例如Azure OpenAI和Hugging Face。更進一步地,開發者可以透過插件和記憶體來擴展AI的技能和靈活性,是一個以面向開發者為主的SDK,適合運用在較複雜的LLM模型整合性應用場景。
AI & Data
這幾年我一直從事以SQL為主的data工作,想改良現有的資料流程,卻不知如何下手。直到認識了dbt,才看到一線曙光。如果你也和過去的我一樣,在data之路感到迷惘,希望本系列文章能對你有幫助。
AI & Data
從 2019 年開始因為身為 PM 很想看產品資料而開始學數據,這個過程相當有趣,打開了另外一個世界!😻 這一系列的文章,我想從以下 3 個視角分享 30 個想法, 1. 個人 2. 團隊與公司 3. 社群 ,希望代表在成為資料實踐者的旅程中,會經歷的階段
AI & Data
資料分析師主要應用的工具是: Tableau, PowerBI, FineReport 這種集成式的軟體。上述的軟體非常強大,就像 Microsoft 的 Office 360 一樣。 然而,我們有時候需要更靈活的工具:我們希望我們的工具可以像 Linux Shell 一樣,有許多小的零組件,一個零組件只做好一件事,比方說: awk, sed, tr, sort, cat, ... ,卻可以靈活地組合起來,而且,容易自動化。 本文就是要介紹「當代的」資料工程與資料分析技術,這套工具與方法論就像是 Linux Shell 一般地靈活、容易自動化、可以提昇數倍的產出。