본문 바로가기
Python/DeepLearning

딥러닝 - New 데이터의 예측법

by 하니__ 2024. 4. 17.

 

 

 

 

 

일반적인 머신러닝때와 별 다를것 없다

 

 

 

 

일단 컬럼 순서대로 본 뒤에 컬럼 순서대로 입력 해준다

 

new_data = [[ 600, 'France', 'Male', 40, 3, 60000, 2, 1, 1, 50000 ]]

 

이때 리스트에 리스트를 넣어줘 바로 2차원배열로 만들어주면 편하다

pd.DataFrame(new_data)

그 뒤에 데이터프레임으로 만들어주고

 

df_new_data.columns= ( 'CreditScore','Geography','Gender','Age','Tenure','Balance','NumOfProducts','HasCrCard','IsActiveMember','EstimatedSalary' )

 

컬럼들을 입력해주자

 

이때 처음부터 딕셔너리 형태로 만들어주었다면 이 과정은 생략된다

 

 

 

그 다음 순서에 의해서 성별을 레이블 인코딩 해주고

df_new_data['Gender']= label_encoder.transform(df_new_data['Gender'])

 

 

 

 

국가를 원 핫 인코딩 해줌과 동시에

더미변수트랩을 상정하여 컬럼 하나를 삭제해준다

 

df_new_data = ct.transform(df_new_data)
df_new_data = pd.DataFrame(df_new_data).drop(0,axis=1).values

 

 

 

 

그렇게해서 이제 피쳐스케일링만 해주면 되겠다

 

 

 

 

df_new_data = scaler.transform(df_new_data)

 

 

 

이렇게 피쳐스케일링이 끝났으니 이제 데이터 전 처리는 끝났다

 

바로 테스트에 들어가자

 

 

 

이전에 쓰던 모델에 predict를 넣어 예측하고 

 

0과 1뿐인 데이터로 만들기 위해

 

0.5 보다 큰 숫자를 True로 나오게 한 뒤

 

 

int로 바꿔주어 0.5이하는 0으로

0.5 초과는 1로 만들어 확인한다