전체보기239 Time Series Data - 날짜, 시간 datetime chicago_df['Date'].head() chicago_df['Date'] = pd.to_datetime(chicago_df['Date'], format ='%m/%d/%Y %H:%M:%S %p') pd.to_datetime()으로 위의 문자열 형식인 Date콜럼을 datetime형식으로 바꿔준다format은 지금 적혀 있는 숫자들이 월/일/연도 시간:분:초 AM/PM인것을 컴퓨터에게 알려주고컴퓨터가 알아듣는 방식으로(datetime 형식으로) 바꾸라는 의미다 이렇게 바꿔줌으로써 할 수 있는 것들이 많아진다 chicago_df['Date'].head() 그렇게 해서 바꿔진게 이런 모습이고 이런 모습을 ISO 포맷이라고 하며국제적으로 널리 사용되는 날짜 및 시간 표현 방법이다 이 밖에도 이.. 2024. 4. 19. Time Series Data forecasting Prophet install : pip install prophet 페이스북(현 메타)에서 만든 라이브러리 주로 일별, 월별, 연별 등 시간과 관련하여 예측 하는것으로 많이 쓰인다 from prophet import Prophet avocado_prophet_df = df[['Date', 'AveragePrice']] avocado_prophet_df avocado_prophet_df.columns=['ds','y'] avocado_prophet_df ds 컬럼은 일반적으로 날짜나 시간 정보(date 또는 timestamp)를 의미하고 y 컬럼은 종속 변수(target 또는 label)를 나타내는 경우가 많다 그 이전에 프로펫(Prophet) 라이브러리와 같은 타임시리즈 예측 라이브러리에서 일반적으로 사용되는 명명 규.. 2024. 4. 19. Fine Tuning 파인 튜닝은 트랜스퍼 러닝 후에 하는 방법이며 트랜스퍼 러닝 후 조금 더 개선이 가능한지 해보는 방법 학습된 모델 그 상태에서 추가로 학습을 시키되 좋은 모델의 일부분을 우리 데이터로 학습 가능토록 변경한 후에 학습시키는 방법 model.summary() 현재 학습 가능한 데이터는 우리가 추가한 데이터들 뿐 1. 베이스 모델 전체 레이어를 학습 가능 상태로 변경 base_model.trainable = True model.summary() 이전의 False로 막아둔걸 True로 돌려준다 훈련 가능 파라미터의 데이터갯수가 거의 전체인걸 확인 할 수 있다 2. 베이스 모델의 전체 레이어 수를 확인 len(base_model.layers) 154 베이스 모델의 레이어 갯수는 총 154개 3. 레이어수를 확인했.. 2024. 4. 19. Transfer Learning - 전이학습 (학습된 모델 가져와 응용하기) 트랜스퍼 러닝 학습이 잘 된 모델을 가져와서 우리의 문제에 맞게 활용하는것, 학습이 잘 된 모델의 베이스 모델만 가져온다(헤드 모델은 빼고) IMG_SHAPE = (128, 128, 3)base_model = tf.keras.applications.MobileNetV2(input_shape = IMG_SHAPE, include_top=False, weights='imagenet') MobileNetV2 모델을 로드하고 초기화하여 파라미터 안에 새로운 정보를 입력받는다 input_shape 은 모델의 입력 이미지의 크기를 지정하며 미리 128x128 사이즈의 컬러이미지라고 변수지정을 해줬다 include_top 은 상단 레이어를 포함할지의 여부를 묻는 것인데 False 로 선택하면 모델의 기본적인 피처 추.. 2024. 4. 19. 딥러닝 - ImageDataGenerator import tensorflow as tf from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras.models import Sequential from keras.layers import Conv2D,MaxPooling2D from keras.layers import Flatten,Dense ImageDataGenerator는 이미지 데이터를 전처리하거나 증식할 때 사용하는 도구로서 회전, 이동, 확대, 축소, 뒤집기 등 다양한 변형을 사용하여 훈련 데이터의 다양성을 높여 모델의 일반화 성능을 향상시킬 수 있다 또한 픽셀 값의 스케일링, 정규화, 이미지 크기 조정도 가능하다 flow_from_dire.. 2024. 4. 18. Python - Zipfile !wget --no-check-certificate \ https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \ -O /tmp/cats_and_dogs_filtered.zip import zipfile Zip 파일의 압축을 풀기 위해 Python 라이브러리 중 zipfile 모듈을 임포트 해준다 file = zipfile.ZipFile('/tmp/cats_and_dogs_filtered.zip') 우선 해당 압축파일을 file이란 이름으로 변수지정해준 뒤 file.extractall('/tmp') .extractall( ) 을 사용하여 압축을 풀어준다 파라미터안에 경로를 지정하여 그곳에 압축을 풀 수 있다 2024. 4. 18. 이전 1 ··· 23 24 25 26 27 28 29 ··· 40 다음