iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 26
0

不管是資料探勘還是機器學習,訓練資料都相當重要。今天來分享一些以前別人分享的資源。

很多...有蠻多我沒用過得

列表

先列出所有資源,方便查詢:

課程使用的GitHub倉庫

這次課程使用的GitHub倉庫,多數使用的是training-data-analyst/courses/machine_learning/deepdive/ 底下的jupyter notebook。

UIC dataset

UIC資料集可能是最早公開的資料集之一。

ImageNet

ImageNet曾經是每年舉辦的比賽(好像停賽了?)。裡面有豐富經標記的圖像,用於影響辨識的研究。

Mozilla Common Voice

Mozilla Common Voice是前幾年,邀請自願者蒐集的聲音資料庫。

scikit-learn dataset

scikit-learn也包含一些經典的資料集。

PyTorch TORCHVISION

PyTorch也是知名的機器學習工具,也有一些資料集可以使用。

Tensorflow Dataset

這次重點的Tensorflow,也又另外一個package包含眾多資料集。

安裝Tensorflow Dataset

pip install -q tensorflow tensorflow-datasets matplotlib
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf

import tensorflow_datasets as tfds

Kaggle

Kaggle不定期會舉行一些比賽,平台上也有不少開放資料集。


上一篇
稍微玩玩Tensorflow Playground
下一篇
jupyter notebook中multiprocessing無法執行?未解,純嘗試經驗分享
系列文
又LAG的ML學習筆記32
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言