Regression - Data Preprocessing (3) - StandardScaler(), MinMaxScaler(), train_test_split()
4. 데이터 표준화 - 피쳐스케일링 앞의 데이터를 무시하고도 나이의 최소값~최대값은 아무리 좋게 봐줘도 0~150을 넘길수가 없는 반면 연봉의 최소값~최대값의 크기는 데이터의 수치로만해도 40k~90k 인데 값을 어느정도 표준화,정규화 시켜줄 필요가 있다 그래야 정확히 학습이 되기 때문 피쳐스케일링 할때에는 X용과 Y용으로 따로 따로 준비한다 하지만 이 경우에서의 Y는 0과 1이 전부이기때문에 따로 할 필요는 없다 4 - 1. 표준화 X_scaler = StandardScaler() X_scaler.fit_transform(X) array([[ 1. , -0.57735027, -0.57735027, 0.69985807, 0.58989097], [-1. , -0.57735027, 1.73205081, -1..
2024. 4. 13.