Regression 3) New 데이터의 예측값은?
2024.04.13 - [MachineLearning] - Regression 2) Error, MSE, RMSE 새로운 데이터가 들어왔을때의 예측값 데이터의 내용은 다르지만앞부분은 넘어가고 본편으로 넘어가겠다 「 운영비는 15만 달러, 마케팅비용 40만 달러, 연구개발비 13만 달러 ,회사위치는 florida 에 있다면 예상 수익은?」 이 데이터의 콜럼 순서는연구개발비, 운영비, 마케팅비용, 회사위치였지만 원 핫 인코딩으로 인해 회사지역 맨 앞으로 오게되며회사지역 또한 ['California', 'Florida', 'New York'] 로 0, 1 , 0 이 되고 그렇기에 이렇게 입력이 되게 된다 new_data = np.array([..
2024. 4. 13.
Regression - Data Preprocessing (3) - StandardScaler(), MinMaxScaler(), train_test_split()
4. 데이터 표준화 - 피쳐스케일링 앞의 데이터를 무시하고도 나이의 최소값~최대값은 아무리 좋게 봐줘도 0~150을 넘길수가 없는 반면 연봉의 최소값~최대값의 크기는 데이터의 수치로만해도 40k~90k 인데 값을 어느정도 표준화,정규화 시켜줄 필요가 있다 그래야 정확히 학습이 되기 때문 피쳐스케일링 할때에는 X용과 Y용으로 따로 따로 준비한다 하지만 이 경우에서의 Y는 0과 1이 전부이기때문에 따로 할 필요는 없다 4 - 1. 표준화 X_scaler = StandardScaler() X_scaler.fit_transform(X) array([[ 1. , -0.57735027, -0.57735027, 0.69985807, 0.58989097], [-1. , -0.57735027, 1.73205081, -1..
2024. 4. 13.