iT邦幫忙

2023 iThome 鐵人賽

DAY 15
1
AI & Data

實用Modern Data Stack:資料架構案例分析與分享系列 第 15

Snowflake vs Databricks:雲資料平台的生死冤家 Part 2

  • 分享至 

  • xImage
  •  

兩大資料巨頭的正面交鋒

如上篇所提到的,雖然Snowflake和Databricks是兩家雲端資料倉庫的領導者,但他們有著截然不同的文化。Databricks由學者創立,更加注重工程和產品,而Snowflake則由商務人士創立,更加注重銷售和客戶。

現在,在各自領域取得成功並建立了截然不同的文化之後,Snowflake和Databricks開始正面交鋒。Databricks正在努力通過其核心資料湖(Data Lake)與人工智能(AI)產品提供資料倉庫的功能和性能,而Snowflake則正在努力添加資料科學研發、上線以及非結構化資料處理功能。

除了產品同時開發以外,兩家公司也在各個平台上進行公關戰,特別是(在資料工程這個小圈圈內比較出名)的2021~22的基準大戰(Benchmark Wars)。Databricks聲稱其SQL lakehouse平台在數據倉儲工作負載(TPC-DS)上也比Snowflake提供卓越的性能和價格性能,而後者則公開否認。2022年11月2日,Databricks分享了一份巴塞羅那超級計算中心(Barcelona Supercomputing Center)進行的TPC-DS第三方基準測試,表明其SQL lakehouse的性能比同等規模的Snowflake設置(耗時8397秒)快2.7倍。然而,大約十天后,Snowflake發表了一篇博客文章,稱該聲明缺乏誠信,與其內部基準測試和客戶體驗完全不一致。相反,它聲稱自己以3760秒的速度運行相同的基準測試。該公司甚至要求用戶自己測試。

另外,也有一些比較幼稚的表現,譬如說:


上一篇
Snowflake vs Databricks:雲資料平台的生死冤家 Part 1
下一篇
Snowflake vs Databricks:雲資料平台的生死冤家 Part 3
系列文
實用Modern Data Stack:資料架構案例分析與分享30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言