iT邦幫忙

搜尋引擎相關文章
共有 44 則文章
鐵人賽 AI & Data DAY 18

技術 Day 18: 透過搜尋結果評估搜尋引擎的效果(二)

昨天說到使用三種統計方法來評估搜尋引擎,分別是準確率、精確率以及召回率。今天我們要接著說到幾個搜尋引擎的衡量指標。 第一個方法稱為Precision@k,它衡量...

鐵人賽 AI & Data DAY 17

技術 Day 17: 透過搜尋結果評估搜尋引擎的效果(一)

今明兩天要來說說,我們可以如何判斷和評估一個搜尋引擎的效果。 先從三個在統計學和機器學習領域基礎而重要的評估方式說起:準確率(Accuracy)、精確率(Pre...

鐵人賽 AI & Data DAY 16

技術 Day 16: Google搜尋時怎麼預測你的心?關於完成與擴展查詢

日常生活中,當我們在用搜尋引擎查詢時應該都經常受一個功能的輔助: 預測查詢,或稱為完成查詢,顧名思義,這功能用於輔助使用者完成他們的查詢。 完成查詢除了能輔助...

鐵人賽 AI & Data DAY 15

技術 Day 15: 神奇的法杖 - 提高效率的WAND演算法

今天我們要介紹用來提升查詢效率的WAND演算法。 在這個演算法中我們會為每一個字詞記錄一個數值,這個數值稱為maximum contribution。一個字詞的...

鐵人賽 AI & Data DAY 14

技術 Day 14: 怎麼提高搜尋速度呢?關於效率搜尋

搜尋的速度是影響使用者對一個搜尋引擎體驗的一個因素,對於活在2019的你來說,很難想像在Google Search時你要等兩秒(不包含網路封包傳送的時間)才能等...

鐵人賽 AI & Data DAY 13

技術 Day 13: 可是資料是不斷增加的啊!關於動態索引建構

這幾天我們都在「靜態」的情況下建構倒排索引,文集中的文件數不變、空間使用不會有太大變化,也沒有及時新增或修改。即便如此,要建構這樣的靜態索引還是可能會出現一些難...

鐵人賽 AI & Data DAY 12

技術 Day 12: 親手寫個檢索系統吧(三)索引壓縮

今天我們要來實作倒排索引的空間壓縮。這裡我們會利用昨天文中介紹的VByte壓縮法壓縮倒排索引中的文件ID doc_ids 以及文件-詞頻列表 doc_term_...

鐵人賽 AI & Data DAY 11

技術 Day 11: Google要如何儲存成千上萬個網站的位置?關於索引壓縮

如同我們前幾天所寫的倒排索引,多數搜尋引擎為了查詢的效率,會將索引儲存在記憶體當中。如此,需要足夠的記憶體才能夠將所有索引儲存起來。如果我們能夠從索引的資料型態...

鐵人賽 AI & Data DAY 10

技術 Day 10: TF-IDF 文件加權與實作

在搜尋技術中TF-IDF是個很基礎而重要的統計方式。什麼是TF-IDF呢?而又為什麼需要TF-IDF? TF-IDF的全名是Term Frequency - I...

鐵人賽 AI & Data DAY 9

技術 Day 9: 親手寫個檢索系統吧(二)倒排索引

1. 預處理 今天的實作我們會使用華爾街日報的的文件集,我有預先將文件集切割成只有兩萬份文件的集合,這份文件集能夠從以下的code中下載。在今天的實作中,我們會...

鐵人賽 AI & Data DAY 8

技術 Day 8: 認識文件矩陣以及索引的建立

在Day 6的文章中,我們說到在進行搜尋時,我們首要關心的是查詢的詞與文件間的相似度。我用一個例子作為開端:假如我們有三個檔案,分別叫做doc1, doc2以及...

鐵人賽 AI & Data DAY 7

技術 Day 7: 親手寫個檢索系統吧(ㄧ)文件預處理

語言是由文字組合出來的。作為一個人類,我們能夠將一篇文章分割成好幾個部分來閱讀和理解,為了讓電腦理解一篇文章,它也必須能夠這麼做。 第一步就在於文字的預處理和正...

鐵人賽 AI & Data DAY 6

技術 Day 6: 原來Google這樣Search!關於資訊檢索

什麼是資訊檢索呢?大家最清楚的例子莫過於網路搜尋引擎了。當你在Google Search上輸入一段你想查詢的字,作為一個使用者通常會跟搜尋引擎有以下的互動: (...

鐵人賽 AI & Data DAY 1

達標好文 技術 Day 1: 自然語言處理簡介

明明整個網路中有成千上萬的資料,為什麼Google能在一秒內告訴我答案?搜尋引擎以及各網站的搜尋功能到底是怎麼運作的?為什麼我在搜尋列輸入一大串字之後,搜尋引擎...

技術 GOOGLE 搜尋

如題所示 請問大大 圖中框框內分類連結是怎麼做出來的

技術 從電子報到網站與 Facebook , 如何規畫"網路動線"

首先說明一下, "網路動線"的想法, 是有關資料傳遞的規劃, 透過網路這種新型態的媒體, 形成一種概念上的動線. 首先要觀察的, 就是網路媒...

技術 2013年網頁設計最新優化搜尋引擎技巧

如果您正在尋找啟動一個新的網站,部落格或優化您當前的網站,你必須至少了解一些基本的搜尋引擎優化。了解如何優化你的網站,將有助於更快的排名在搜尋引擎中,這是非常...

鐵人賽 IT技術 DAY 24
雲端發展之見解 系列 第 24

技術 今日分享「126網盤-網盤|永久空間最大的網盤」

為什麼選擇126網盤? 1 永久免費普通用戶永不收費 2 永久保存非違法文件,將永存於世 3 超大容量存儲空間不限大小 4 超大附件單文件大小隨等級而增加 5...

技術 一次用二家搜尋引擎找資料,Google+Bing

剛剛發現,IT邦沒有人貼過這個網站 分享給邦友玩玩 目前最大的搜尋網站,應該就是Google、Bing,沒錯吧....(blekko發展中) (啥,你都用Yah...

鐵人賽 IT人生鐵人 DAY 23
科技是否符合直覺? 系列 第 23

技術 三分鐘SEO(搜尋引擎優化)

怎麼讓網站被檢索到最速版 1.註冊一個跟內容關鍵字完全相關的網域名稱 2.用HTML格式撰寫網頁,每頁HTML內加入標題、描述、關鍵字 <title&gt...

鐵人賽 IT人生鐵人 DAY 4

技術 IT人之「心」、「靈」與「魂」-4:魔法空白之必要存在

人生,不是要你汲汲營營,不是要你暈頭轉向的忙忙碌碌...... 一天24小時,你如何安排你的時間?工作、生活、睡眠、娛樂、進修、旅遊…… ,各自在這24小時的時...

鐵人賽 IT人生鐵人 DAY 3

技術 IT人之「心」、「靈」與「魂」-3:生命合作之相互尊重

人與動物,動物與植物,老闆與員工,業務與客戶…… ,不管相對之間是如何的相似或相異,彼此都應該相互尊重著彼此的存在與價值...... 天地萬物,沒有任何一個可以...

技術 兩個有特色的搜尋引擎

兩個值得試試新的搜尋引擎, 看看要不要加到自己的 OpenSearch 裡。 Spezify: http://spezify.com/ 介面很炫,以 flas...

技術 百度的英文翻譯實在太中肯

中肯到不行 現在知道百度的專業及中肯中立, 才是在大陸搜索引擎戰勝 Google 的原因阿... 參考資料 : http://www.test104.com/...

鐵人賽 DAY 27
網路趴趴走 系列 第 27

技術 網路趴趴走-27:「特惠王」讓你的每一分錢都擁有最高的投資報酬

讓生日過得更幸福..... 讓自己的每一分錢都發揮最大的效用..... 怎麼辦到的?答案就在「特惠王」。 廠商在行銷活動中,經常會提供許多的好康、免費或優惠,站...

鐵人賽 DAY 13
網路趴趴走 系列 第 13

技術 網路趴趴走-13:超過十萬首免費音效素材的「soundsnap」

有趣、巧妙、獨特又適合的音效素材要到哪裡找呢?別一個頭兩個大了,「soundsnap」輕鬆解決你的難題,讓你笑逐顏開。 「soundsnap」,一個擁有超過十萬...

鐵人賽 DAY 12
網路趴趴走 系列 第 12

技術 網路趴趴走-12:高畫質且擁有合法授權之攝影作品的「everystockphoto」

超完美、高畫質、撼動人心的照片,難不成都要自己親自拍攝?逛一趟「everystockphoto」吧!鐵定讓你驚呼連連,愛不釋手。 自 2006 年開始提供服務的...

鐵人賽 DAY 11
網路趴趴走 系列 第 11

技術 網路趴趴走-11:讓網頁更生動、活潑的「MAGGIE的網頁素材」

困擾找不到適合的素材讓網頁、部落格或個人作品更加有趣嗎?「MAGGIE的網頁素材」,絕對讓你滿載而歸! 總共分成十六大項的「MAGGIE的網頁素材」,含括有背景...

鐵人賽 DAY 7
網路趴趴走 系列 第 7

技術 網路趴趴走-7:「UrMap你的地圖網」,讓你變成當地達人

迷路!?不!「UrMap你的地圖網」,讓你從此再也不迷路啦! 要到一個地方旅遊或洽辦事情時,大家一定有過曾經迷路和四處兜兜轉轉的經驗吧?!不用怕,有了「UrMa...

鐵人賽 DAY 16
IT人之前世今生 系列 第 16

技術 IT人之前世今生-神奇大補丸(7)

身為一個IT人.. 就是要有IT魂... 對於一個資訊人員來說... 資料的收集匯整.. 是很重要的一件事.. 因此搜尋引擎的存在就變的格外重要.. 早期的搜尋...