Project/p3. Streamlit media area
미디어 성지순례 포인트 찾기 - 데이터 가공
하니__
2024. 12. 9. 21:40
스트림릿을 이용하여 웹페이지를 개발하고
AWS EC2를 이용하여 배포해보자
우선 데이터셋은
문화 빅 데이터 플랫폼 에 있는 [ 미디어콘텐츠 영상 내 유명지 데이터 ] 를 사용하였으며
우선 컬럼의 이름을 보기 편하게 고쳐주었고
나에게 필요없다 생각되는 데이터들을 지웠다
카테고리컬 데이터도 보기 쉽게 바꿔주자
주소의 경우 뒤죽박죽 저장 되어 있어 단체로 한번씩 수정해주는 작업을 거쳤다
ex) '서울특별시 은평구', '서울 은평구' 같은
이슈 부분에서 한번 더 다루겠지만
이 부분에서 정말 잘못 저장되어있는 데이터가 너무 많았다
예를 들면
'서울특별시 마포구' 라는 지역이 있다고 할때
'서울 마포구', '서울특별시 마포구', '서울 특별시 마포구'
라고 적혀있는등 다시 수정하는 경우가 있었다
그리고
위도경도의 경우에도
주소는 한 곳인데 위도경도가 제각각 다르게 적혀있는 데이터도 있어서
다시 알맞게 수정해주는 일이 필요했다