๋จธ์ ๋ฌ๋ ๊ณต๋ถ๋ฅผ ํ๋ฉด์ scikit-learn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๊ฒ ๋์๋ค.
์ค๋์ ๊ทธ ์์์๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํด์ฃผ๋ ๋ชจ๋์ธ train_test_split์ ๋ํด์ ์์๋ณด๊ณ ์ ํ๋ค.
import
from sklearn.model_selection import train_test_split
option
x_train, x_test, y_train, y_test = train_test_split(x_data, y_data)
์์ ๊ฐ์ด ์์ฑํ๋ฉด ๋๋ค์ผ๋ก train data์ test data๋ฅผ ๋ถ๋ฆฌํด์ค๋ค.
train_test_split(x,y, test_size = 0.3, train_size = 0.7)
์์ ๊ฐ์ด ๋ฐ์ดํฐ์ ๋น์จ์ ์กฐ์ ํ ์๋ ์๋ค. (test 30% / train 70%)
train_test_split(x,y, shuffle=False)
shuffle = False์ด๋ฉด ๋๋ค ์์ด ์์ฐจ์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ค.
'๐ Programming > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python] ์ ๋ ฌํจ์ sort(), sorted() ํ์ฉ (0) | 2022.02.06 |
---|---|
[Python] ์ํ๋ฒณ ๋๋ ์ซ์ ํ์ธ (isalpha , isdigit) (0) | 2022.02.05 |
[Python] input ๋์ sys.stdin.readline() ์ฐ์ (0) | 2022.01.30 |
[๋จธ์ ๋ฌ๋] scikit-learn (์ฌ์ดํท๋ฐ) (0) | 2021.10.19 |
[Python] web scraping (0) | 2020.09.25 |