iT邦幫忙

搜尋引擎相關文章
共有 55 則文章
鐵人賽 Software Development DAY 18

技術 [Day 18] Auto Complete and Highlight - 搜尋引擎,到了鐵人賽就拿出 Meilisearch |【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 今天的主題為 features Highli...

鐵人賽 Software Development DAY 17

技術 [Day 17] Search - 搜尋引擎,到了鐵人賽就拿出 Meilisearch |【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 今天要說明 search 部分的實作。Sea...

鐵人賽 Software Development DAY 16

技術 [Day 16] Indexes, Schema, and Settings - 搜尋引擎,到了鐵人賽就拿出 Meilisearch |【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 在上一篇 Day 15 我們提到如何使用我們...

鐵人賽 Software Development DAY 6

技術 [Day 06] 實作技術架構 - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

Github, Over Engineering 今天便是前言的最後一篇了,在進入到接下來的實作前,我們要來討論一下整體搜尋引擎的架構,以及我們用到了哪些的技術...

鐵人賽 Software Development DAY 5

技術 [Day 05] 什麼是搜尋引擎 IV - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

[Day 05] 什麼是搜尋引擎 IV - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】 Github, Over Engineering 在昨天...

鐵人賽 Software Development DAY 4

技術 [Day 04] 什麼是搜尋引擎 III - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

Github, Over Engineering 今天我們將進入簡單的實作環節,在本地端 (localhost),使用 Meilisearch 架設一個簡單的搜...

鐵人賽 Software Development DAY 3

技術 [Day 03] 什麼是搜尋引擎 II - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

Github, Over Engineering 昨天,我們介紹將透過網路爬蟲取得網頁的html,再經過資料前處理,得到了許多如同下面範例中的json, 這樣的...

鐵人賽 Modern Web DAY 2

技術 HTML裡的meta tag這些你用得到的功能!加強SEO搜尋靠它

上一篇講了語意化能夠增加素搜尋引擎辨識網頁中的區塊,這裡來介紹讓SEO能夠搜尋到你的方法!meta是元資訊(meta data),HTML< head &...

鐵人賽 Software Development DAY 1

技術 [Day 01] 簡介 - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

Github, Over Engineering 前言 在幾次閒談與偶然之中,被拉入伙,開始了這個說做就做的 project。 搜尋引擎,是一個已經融入我們日常...

技術 想知道目標客群喜歡什麼?何不從搜尋意圖下手!

面對面實體銷售,我們能從聊天問答、肢體行為初步了解客戶需求,但──在網路世界,如果你想知道客戶喜歡什麼,你的網站卻還沒有針對搜索意圖優化頁面?那麼你很有可能正在...

技術 搜尋引擎優化入門篇:你不能不知道的響應式網頁設計

隨著行動瀏覽成為搜尋引擎主流,響應式網頁設計也越來越重要,甚至能說在這幾年,假設你的網頁沒有響應式設計,或是響應式網頁設計不良,那你的網頁流量可謂十分不妙。 然...

鐵人賽 AI & Data DAY 18

技術 Day 18: 透過搜尋結果評估搜尋引擎的效果(二)

昨天說到使用三種統計方法來評估搜尋引擎,分別是準確率、精確率以及召回率。今天我們要接著說到幾個搜尋引擎的衡量指標。 第一個方法稱為Precision@k,它衡量...

鐵人賽 AI & Data DAY 17

技術 Day 17: 透過搜尋結果評估搜尋引擎的效果(一)

今明兩天要來說說,我們可以如何判斷和評估一個搜尋引擎的效果。 先從三個在統計學和機器學習領域基礎而重要的評估方式說起:準確率(Accuracy)、精確率(Pre...

鐵人賽 AI & Data DAY 16

技術 Day 16: Google搜尋時怎麼預測你的心?關於完成與擴展查詢

日常生活中,當我們在用搜尋引擎查詢時應該都經常受一個功能的輔助: 預測查詢,或稱為完成查詢,顧名思義,這功能用於輔助使用者完成他們的查詢。 完成查詢除了能輔助...

鐵人賽 AI & Data DAY 15

達標好文 技術 Day 15: 神奇的法杖 - 提高效率的WAND演算法

今天我們要介紹用來提升查詢效率的WAND演算法。 在這個演算法中我們會為每一個字詞記錄一個數值,這個數值稱為maximum contribution。一個字詞的...

鐵人賽 AI & Data DAY 14

技術 Day 14: 怎麼提高搜尋速度呢?關於效率搜尋

搜尋的速度是影響使用者對一個搜尋引擎體驗的一個因素,對於活在2019的你來說,很難想像在Google Search時你要等兩秒(不包含網路封包傳送的時間)才能等...

鐵人賽 AI & Data DAY 13

技術 Day 13: 可是資料是不斷增加的啊!關於動態索引建構

這幾天我們都在「靜態」的情況下建構倒排索引,文集中的文件數不變、空間使用不會有太大變化,也沒有及時新增或修改。即便如此,要建構這樣的靜態索引還是可能會出現一些難...

鐵人賽 AI & Data DAY 12

技術 Day 12: 親手寫個檢索系統吧(三)索引壓縮

今天我們要來實作倒排索引的空間壓縮。這裡我們會利用昨天文中介紹的VByte壓縮法壓縮倒排索引中的文件ID doc_ids 以及文件-詞頻列表 doc_term_...

鐵人賽 AI & Data DAY 11

技術 Day 11: Google要如何儲存成千上萬個網站的位置?關於索引壓縮

如同我們前幾天所寫的倒排索引,多數搜尋引擎為了查詢的效率,會將索引儲存在記憶體當中。如此,需要足夠的記憶體才能夠將所有索引儲存起來。如果我們能夠從索引的資料型態...

鐵人賽 AI & Data DAY 10

達標好文 技術 Day 10: TF-IDF 文件加權與實作

在搜尋技術中TF-IDF是個很基礎而重要的統計方式。什麼是TF-IDF呢?而又為什麼需要TF-IDF? TF-IDF的全名是Term Frequency - I...

鐵人賽 AI & Data DAY 9

達標好文 技術 Day 9: 親手寫個檢索系統吧(二)倒排索引

1. 預處理 今天的實作我們會使用華爾街日報的的文件集,我有預先將文件集切割成只有兩萬份文件的集合,這份文件集能夠從以下的code中下載。在今天的實作中,我們會...

鐵人賽 AI & Data DAY 8

技術 Day 8: 認識文件矩陣以及索引的建立

在Day 6的文章中,我們說到在進行搜尋時,我們首要關心的是查詢的詞與文件間的相似度。我用一個例子作為開端:假如我們有三個檔案,分別叫做doc1, doc2以及...

鐵人賽 AI & Data DAY 7

技術 Day 7: 親手寫個檢索系統吧(ㄧ)文件預處理

語言是由文字組合出來的。作為一個人類,我們能夠將一篇文章分割成好幾個部分來閱讀和理解,為了讓電腦理解一篇文章,它也必須能夠這麼做。 第一步就在於文字的預處理和正...

鐵人賽 AI & Data DAY 6

技術 Day 6: 原來Google這樣Search!關於資訊檢索

什麼是資訊檢索呢?大家最清楚的例子莫過於網路搜尋引擎了。當你在Google Search上輸入一段你想查詢的字,作為一個使用者通常會跟搜尋引擎有以下的互動: (...

鐵人賽 AI & Data DAY 1

達標好文 技術 Day 1: 自然語言處理簡介

明明整個網路中有成千上萬的資料,為什麼Google能在一秒內告訴我答案?搜尋引擎以及各網站的搜尋功能到底是怎麼運作的?為什麼我在搜尋列輸入一大串字之後,搜尋引擎...

技術 GOOGLE 搜尋

如題所示請問大大圖中框框內分類連結是怎麼做出來的

技術 從電子報到網站與 Facebook , 如何規畫"網路動線"

首先說明一下, "網路動線"的想法, 是有關資料傳遞的規劃, 透過網路這種新型態的媒體, 形成一種概念上的動線. 首先要觀察的, 就是網路媒...

技術 2013年網頁設計最新優化搜尋引擎技巧

如果您正在尋找啟動一個新的網站,部落格或優化您當前的網站,你必須至少了解一些基本的搜尋引擎優化。了解如何優化你的網站,將有助於更快的排名在搜尋引擎中,這是非常...

鐵人賽 IT技術 DAY 24
雲端發展之見解 系列 第 24

技術 今日分享「126網盤-網盤|永久空間最大的網盤」

為什麼選擇126網盤? 1 永久免費普通用戶永不收費 2 永久保存非違法文件,將永存於世 3 超大容量存儲空間不限大小 4 超大附件單文件大小隨等級而增加 5...

技術 一次用二家搜尋引擎找資料,Google+Bing

剛剛發現,IT邦沒有人貼過這個網站 分享給邦友玩玩 目前最大的搜尋網站,應該就是Google、Bing,沒錯吧....(blekko發展中) (啥,你都用Yah...