앞서 데이터프로세싱이 완료 됐다면
Regression은 이제 시작이다
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
fit은 인공 지능을 학습 시키는것이다
X와 Y의 훈련용 데이터를 입력하여 학습을 시킬 수 있다
regressor.coef_
array([9504.98248109])
regressor.intercept_
25375.305271282858
coef 는 기울기
intercept 는 절편 이라는 뜻이며
일차함수의 공식은
y = ax + b로 알려지는데
a가 coef
b가 intercept다
즉,
y =9504.98248109x + 25375.305271282858
이라는 예측값의 공식을 컴퓨터가 찾아냈으며
저 공식을 X에 대입한다면 y 를 찾아낼 수 있다는 의미다
학습이 끝나면 이 인공지능이 얼마나 똑똑한지 테스트를 해봐야 한다
따라서 테스트용 데이터인 X_test로 테스트한다
그리고 그 예측값과 y_test와 대조해보자
y_pred = regressor.predict(X_test)
예측하다 라는 뜻을 가진 predict( )를 사용하여
파라미터 안에 X_test로 테스트를 하고
그 결과를 y_pred라는 이름으로 저장하자
'Python > MachineLearning' 카테고리의 다른 글
Regression 3) New 데이터의 예측값은? (1) | 2024.04.13 |
---|---|
Regression 2) Error, MSE, RMSE (0) | 2024.04.13 |
Regression - Data Preprocessing (3) - StandardScaler(), MinMaxScaler(), train_test_split() (0) | 2024.04.13 |
Regression - Data Preprocessing (2) 문자열의 데이터처리( Label Encoding, One Hot Encoding) (0) | 2024.04.13 |
Regression - Data Preprocessing (1) - Nan처리, X와y의 데이터 분류 (0) | 2024.04.12 |