想像有一個模型,即使沒看過某種動物,也能根據「毛茸茸、有大耳朵、長尾巴」推測它可能是隻小袋鼠。這就是 零樣本學習 (Zero-shot Learning, ZS...
我們IT人有了想法要自己先做些前置作業時,若有些工作協助必定能事半功倍,我們前置作業可能包含:前案檢索、翻譯文件、文句編繪成圖等,今天就介紹能幫助在做專利前案作...
今天來學習一下第一名和第三名包山包海的 ensemble 大法。 🥇1st Solution 第一名的解法不愧是第一名,他們真的花好多 effort 在解這個賽...
在前面二篇的文章裡,範例均是以文字陣列資料做為向量處理的來源資料,而實務上可能面臨更多的來源資料格式,包含:Web pages、PDF、Word、Markdow...
目標 今天是我們的名面上最後一天,我們要探討的是深度學習**深度學習(Deep Learning)**無疑是其中一個最重要的領域。從自動駕駛汽車、語音識別、推...
隨著人工智慧(AI)的快速發展,AI在工作與生活中扮演的角色日益重要。從智能助理到自動化工具,AI的應用已經滲透到多個行業和領域。然而,如何讓AI真正成為人類的...
當我們談到 RAG 應用的時候,除了向量化之外,另一個重點就是向量資料庫,與傳統資料庫不同,向量資料庫是專門為了高維度資料以及相似度搜尋而存在的,目前市場有許多...
我很喜歡今天介紹的第二名的 solution,在研究的時候有一種 「啊哈moment」的快樂。 昨天我們分享將文章轉成 TF-IDF 向量後送進 Logisti...
全球環境問題不斷惡化,如氣候變遷、能源匱乏和污染危機,迫使各界探索創新解決方案。AI技術不僅提升了我們對自然現象的理解,還在資源管理和環境保護中發揮了前所未有的...
標題提到一堆技術名詞...別擔心,今天都會串起來,像一個偵探故事一樣,每種技術都是線索,幫助我們揪出到底誰找 AI 當槍手。👀 前言 昨天我們聊到僅用「錯字率」...
上一篇講了 RAG 應用裡很重要的向量處理,這次要來聊聊怎麼用快閃記憶體來搞定向量資料的儲存以及進行快速檢索的做法。這個示範不使用任何向量資料庫產品,單純以快閃...
自從2023年大型語言模型如ChatGPT火起來後,這些AI不僅能寫出幾乎和人一樣的文章,還開始影響學生的學習方式。雖然這讓寫作業變得簡單了,但也可能讓學生們...
生成式AI除了常聽到文案寫作、翻譯之外,RAG 應該是另一個也很常聽見或看到的應用。RAG 是「檢索增強生成」(Retrieval-Augmented Gene...
在過去兩周的時間裡深入探索了分別由微軟和GitHub開發的強大AI助手:Microsoft Copilot和GitHub Copilot,這段旅程不僅了解了這...
前言 昨天我們介紹了第一名的作法,雖然很精彩,但是他們在前期的兩階段訓練中(可能也是最重要的一部分)耗費了對個人參賽者(非實驗室)來說巨大的算力(八張 H100...
我想大多數開發者都聽過 Azure OpenAI (又稱AOAI),但應該比較少開發者聽過 Azure AI Studio 以及 Azure AI Infere...
第一名由 Numina 和 Hugging Face 的大佬們合作拿下,解決了private test set 中的 29/50 個問題,最終喜提美金 $131...
在開發 LLM(大型語言模型)應用的過程中,有沒有發現有時候執行的結果跟你預期的有點不一樣?你設計的 Prompt(提示語)或是 Plugin function...
結果展示 我透過GPT替我生成幾封垃圾郵件來做測試,並輸入進我們的程式內。 1. Dear valued customer,You have been sele...
我們要如何利用「每次 LLM 的回覆都不一樣」這個現象,來增加產生正確答案的機率呢?今天會帶大家實際應用 self-consistency 到賽題中,並透過設計...
隨著生成式 AI 的爆炸式發展,越來越多的開發者或企業希望可以在地端執行大語言模型(LLM),不僅能確保資料隱私,更能減少對雲端服務的依賴,當然這裡也涉及到企業...
以前,來自世界各地的高中生每年都會參加國際數學奧林匹克競賽(IMO),解決代數、幾何和數論等領域的六個極具挑戰性的問題。今年4月,一項全新的競賽——AI數學奧...
如何確保它們在各種應用中能夠兼顧透明性、公平性、隱私保護及倫理要求至關重要,無論是在醫療、金融還是自動駕駛等高風險行業,AI 系統的每一個決策都必須經得起審查。...
上一篇打破迷思示範如何連接 Hugging Face,這一次換成 Google AI 也大丈夫滴。眾所皆知目前除了 OpenAI(Azure OpenAI)...
前言 昨天介紹了一些相關的東西,也把一些基礎的部分完成了,今天就要進入最後的重點,也就是訓練及預測了,廢話不多說,直接來看看程式碼吧~ 訓練功能 這邊主要功能是...
今天會在分析眾多優秀解法後,從本次賽題的經驗,總結建立一個 RAG 系統最重要的幾個要點。 📢 作者有話要說:(10/5更新)我在 Day 20 補充第五名的多...
昨天我們介紹了如何透過 @vscode 詢問使用 Visual Studio Code 中的各種問題,以及使用 @terminal 自然語言生成命令來加速日常...
許多開發者在聽到 Semantic Kernel 是 Microsoft 開源的時後,會自然聯想到是不是只能搭配 OpenAI 或 Azure OpenAI,再...
之前我們談到了聯邦學習如何通過分散式訓練來保護用戶的數據隱私,讓不同設備在不共享原始數據的情況下協同學習。而今天,我們將更進一步,探索聯邦學習在更複雜場景中的應...
我們非常幸運,身處在 AI 技術迅速崛起的時代,見證了許多令人驚嘆的創新與科技的快速發展。同時,隨之而來的也是對未來工作的焦慮——許多人擔心隨著科技進步,自己是...