iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
AI & Data

從無到有,爬蟲-分析-預測建模,把實務面常見問題逐一釐清 系列

1.選一主題,定義問題,拆解問題,是否需要建模?
2.從爬取公開資料,設計try-catch到資料清理,手把手教學
3.從EDA中獲得啟發,挑選適當模型來預測

參賽天數 15 天 | 共 18 篇文章 | 4 人訂閱 訂閱系列文 RSS系列文 團隊大腦已超載
DAY 1

股價預測篇-爬蟲part1(金融類)

前置作業 - 安裝 Anaconda 參考:http://lidodo.astro.ncu.edu.tw/2019WCamp/Anaconda%20instal...

2022-09-16 ‧ 由 sam32564 分享
DAY 2

股價預測篇-爬蟲part2(金融類)

前言:網站是由許多網頁所構成,裡面有很多文字、圖片、超連結、表格等等,因此,爬網前確認資料存放的網頁及網址的組成,以下本次爬蟲說明。 目標網站:Goodinf...

2022-09-17 ‧ 由 sam32564 分享
DAY 3

股價預測篇-爬蟲part3(金融類)

接續上一篇[股價預測篇-爬蟲part2(金融類)],這篇教大家如何設定使用者代理,爬到所需的數據(收盤價)。 反爬蟲機制(設定使用者代理) 1.開啟上篇的url...

2022-09-18 ‧ 由 sam32564 分享
DAY 4

股價預測篇-分析part1(金融類)

台積電於民國83年9月5日(1994/9/5)在台灣證券交易所掛牌上市,分析一下截至今日股價表現,繼續上一篇[股價預測篇-爬蟲part2(金融類)]的dataf...

2022-09-19 ‧ 由 sam32564 分享
DAY 5

股價預測篇-分析part2(金融類)

接續股價預測篇-分析part1(金融類),本篇主要利用時間序列模型及深度學習模型來進行預測 LSTM import numpy as np import pan...

2022-09-20 ‧ 由 sam32564 分享
DAY 6

股價預測篇-分析part3(金融類)

股價分析常見的三個面向: 基本面的股價分析 基本面分析是一種深入研究公司的財務狀況和外部因素以衡量其股票價值的方法。基本面分析通常使用各種比率來確定股票的價值和...

2022-09-21 ‧ 由 sam32564 分享
DAY 7

股價預測篇-分析part4(金融類)

模型開始前,基本上要知道如何驗證? 我們會用到均方根誤差,均方根偏差 root mean squared error常用於衡量模型預測值或估計量與觀測值之間差異...

2022-09-22 ‧ 由 sam32564 分享
DAY 8

股價預測篇-爬蟲part4(金融類)

本篇將帶大家爬取每日收盤價,有更細緻資料可以預測到每日的股價 import requests from io import StringIO import pa...

2022-09-23 ‧ 由 sam32564 分享
DAY 9

股價預測篇-建模part1(金融篇)

該篇將資料集切割成兩分,訓練集及測試集目標變數:y 先整好的股價做標準化,數值範圍介於0-1 from sklearn.preprocessing import...

2022-09-24 ‧ 由 sam32564 分享
DAY 10

股價預測篇-建模part2(金融篇)

匯入所需的套件模組 from tensorflow.keras.models import Sequential from tensorflow.keras.l...

2022-09-25 ‧ 由 sam32564 分享