일반적인 머신러닝때와 별 다를것 없다
일단 컬럼 순서대로 본 뒤에 컬럼 순서대로 입력 해준다
new_data = [[ 600, 'France', 'Male', 40, 3, 60000, 2, 1, 1, 50000 ]]
이때 리스트에 리스트를 넣어줘 바로 2차원배열로 만들어주면 편하다
pd.DataFrame(new_data)
그 뒤에 데이터프레임으로 만들어주고
df_new_data.columns= ( 'CreditScore','Geography','Gender','Age','Tenure','Balance','NumOfProducts','HasCrCard','IsActiveMember','EstimatedSalary' )
컬럼들을 입력해주자
이때 처음부터 딕셔너리 형태로 만들어주었다면 이 과정은 생략된다
그 다음 순서에 의해서 성별을 레이블 인코딩 해주고
df_new_data['Gender']= label_encoder.transform(df_new_data['Gender'])
국가를 원 핫 인코딩 해줌과 동시에
더미변수트랩을 상정하여 컬럼 하나를 삭제해준다
df_new_data = ct.transform(df_new_data)
df_new_data = pd.DataFrame(df_new_data).drop(0,axis=1).values
그렇게해서 이제 피쳐스케일링만 해주면 되겠다
df_new_data = scaler.transform(df_new_data)
이렇게 피쳐스케일링이 끝났으니 이제 데이터 전 처리는 끝났다
바로 테스트에 들어가자
이전에 쓰던 모델에 predict를 넣어 예측하고
0과 1뿐인 데이터로 만들기 위해
0.5 보다 큰 숫자를 True로 나오게 한 뒤
int로 바꿔주어 0.5이하는 0으로
0.5 초과는 1로 만들어 확인한다
'Python > DeepLearning' 카테고리의 다른 글
딥러닝 - 이미지 분류 2) 모델 생성 및 확인 (0) | 2024.04.18 |
---|---|
딥러닝 - 이미지 분류 1) Data Preprocessing (0) | 2024.04.18 |
딥러닝 - 조건 성립 정지법 callbacks.EarlyStopping (0) | 2024.04.17 |
딥러닝 - GridSearch 그리드서치 (베스트 모델 찾기) (0) | 2024.04.17 |
ANN - 개념정리 (0) | 2024.04.16 |