資料科學-用Sikit Learn做資料預測
504 字約 2 分鐘閱讀
資料科學python

前言-會做到什麼功能
- 利用鳶尾花資料集,利用花萼與花瓣的長寬來預測這是什麼物種
- 利用各種資訊判斷房價
下載資料
鳶尾花是長這樣的

透過kaggle下載鳶尾花資料
python
import kagglehub
# Download latest version
path = kagglehub.dataset_download("uciml/iris")
print("Path to dataset files:", path)
#列出下載了什麼檔案
import os
os.listdir(path)
透過路徑,看下載的檔案
python
import pandas as pd
df = pd.read_csv(os.path.join(path,'Iris.csv'))
df.head()
可以看看有幾種種類的鳶尾花
python
df['Species'].unique()
資料處理
品種以數字來呈現會更好在後續做處理,於是先來做個轉換
python
df['Species'].map({'Iris-setosa':0,'Iris-versicolor':1,'Iris-virginica':2})
探索式分析
先用視覺化圖表感覺之間的關係,以plotly來繪圖
版權聲明
文章標題:資料科學-用Sikit Learn做資料預測
文章作者:阿盧老師
文章連結:https://codinglu.tw/blog/streamlit-database-gpt-chatbot
授權條款:本文採用 CC BY-NC 4.0 授權。轉載請標明出處。