딥러닝 - New 데이터의 예측법

일반적인 머신러닝때와 별 다를것 없다

일단 컬럼 순서대로 본 뒤에 컬럼 순서대로 입력 해준다

new_data = [[ 600, 'France', 'Male', 40, 3, 60000, 2, 1, 1, 50000 ]]

이때 리스트에 리스트를 넣어줘 바로 2차원배열로 만들어주면 편하다

pd.DataFrame(new_data)

그 뒤에 데이터프레임으로 만들어주고

df_new_data.columns= ( 'CreditScore','Geography','Gender','Age','Tenure','Balance','NumOfProducts','HasCrCard','IsActiveMember','EstimatedSalary' )

컬럼들을 입력해주자

이때 처음부터 딕셔너리 형태로 만들어주었다면 이 과정은 생략된다

그 다음 순서에 의해서 성별을 레이블 인코딩 해주고

df_new_data['Gender']= label_encoder.transform(df_new_data['Gender'])

국가를 원 핫 인코딩 해줌과 동시에

더미변수트랩을 상정하여 컬럼 하나를 삭제해준다

df_new_data = ct.transform(df_new_data)
df_new_data = pd.DataFrame(df_new_data).drop(0,axis=1).values

그렇게해서 이제 피쳐스케일링만 해주면 되겠다

df_new_data = scaler.transform(df_new_data)

이렇게 피쳐스케일링이 끝났으니 이제 데이터 전 처리는 끝났다

바로 테스트에 들어가자

이전에 쓰던 모델에 predict를 넣어 예측하고

0과 1뿐인 데이터로 만들기 위해

0.5 보다 큰 숫자를 True로 나오게 한 뒤

int로 바꿔주어 0.5이하는 0으로

0.5 초과는 1로 만들어 확인한다

딥러닝 - 이미지 분류 2) 모델 생성 및 확인 (0)	2024.04.18
딥러닝 - 이미지 분류 1) Data Preprocessing (0)	2024.04.18
딥러닝 - 조건 성립 정지법 callbacks.EarlyStopping (0)	2024.04.17
딥러닝 - GridSearch 그리드서치 (베스트 모델 찾기) (0)	2024.04.17
ANN - 개념정리 (0)	2024.04.16

han's story