본문 바로가기

Python90

Matplotlib - hist 히스토그램 2 . subplot( ) .figure( figsize= ( , ) ) 하나의 화면에 여러개의 plot을 그려 보자 .subplot() plt.subplot(1,2,1) plt.hist( data=df, x='speed', rwidth=0.8 ) plt.subplot(1,2,2) plt.hist( data=df, x='speed', rwidth=0.8, bins = my_bins ) plt.show() subplot() 을 이용하여 그리게 되고 파라미터안의 숫자들은 총 행의 갯수, 총 열의 갯수, 그래프 번호를 의미한다 즉, 위의 파라미터는 1행 2열의 1번과 2번 그래프를 의미 즉 이런 모습의 2개의 그래프가 된다 물론 이렇게만 있게되면 무엇을 설명하는 그래프인지 알 수 없으니 가공을 해보자 .figure( figsize= ( 가로, 세로) ) plt.figure( fig.. 2024. 4. 9.
Matplotlib - Bar 그래프 .countplot( ) .color_palette( )[ ] .value_count( ).index 이러한 포켓몬 7세대까지의 데이터들이 있다고 할 때에 세대별 포켓몬의 마릿수는 어떻게 분포 되어 있는지 막대그래프 형태로 알아보자 우선 이전 까지의 방법으로는 value_count( )와 groupby( )[ ].count( ) 를 이용하여 수치화된 데이터로 알아 볼 수 있었다 seaborn의 .countplot( ) 사용 import seaborn as sb 우선 seaborn 라이브러리를 사용하기위해 임포트를 해주고 타이핑을 줄이기 위해 sb로 줄여보자 sb.countplot(data=df , x= 'generation_id') plt.show() 그 후 .countplot( ) 을 이용해 막대형 그래프를 만들자 하지만 뭔가 정신없고 여러모로 손을 봐줘야 할 것같다 막대 색상 설정 .color_pal.. 2024. 4. 9.
Matplotlib - hist 히스토그램 1 .hist( ) rwidth= bins= 히스토그램은 구간을 설정하여 해당 구간에 데이터가 몇개인지 확인이 가능하다 그렇기에 데이터의 분포를 알 수 있다 히스토그램은 구간이 있는데 이 구간을 bin 이라고 하고 구간이 여러개라서 보통 복수형으로 bins 라고 한다 히스토그램은 똑같은 데이터를 가지고도 bin을 어떻게 설정하느냐에 따라 차트 모양이 달라져 해석을 달리 할 수 있다 가령 이런 숫자들의 데이터가 있다고 하면 이런식으로 구간을 6으로 묶은 그래프와 3으로 묶은 그래프에는 크게 보면 별 차이가 없지만 우측 그래프의 0~3구간과 15~18구간이 생각보다 비어있는것을 좌측 그래프에서는 알지 못 한다 이번엔 전의 포켓몬 데이터로 'speed' 콜럼을 통하여 데이터들이 어떻게 분포 되어있나 확인해보자 .hist( ) import matplotl.. 2024. 4. 9.
Matplotlib - 기초, 직선형 그래프, 저장 .plot( x, y) .savefig( ) Matplotlib 매트 플롯 라이브러리는 Numpy라이브러리를 활용한 수치화된 데이터들을 산포형, 직선형, 곡선형, 막대형, 원형 등등의 그래프로 시각화 시켜주는 객체 지향 API이다 보다 쉽게 다른 이에게 이해시키기 쉽게끔 만들어준다 기본적으로 matplotlib.pyplot을 import해줘야 한다 그리고 자주 쓰는데 길이가 긴 만큼 plt로 줄여 쓴다 .plot( x, y) 기본적으로 plt.plot(x축 , y축)으로 그리며 메모리에 적혀있는 자잘한 메세지를 지우기위해 plt.show() 를 해준다 .savefig( ) 그리고 plt.savefig('저장할 이름.확장자')를 적어주면 같은 경로에 저장이 된다 이때 확장자는 jpg건 png건 적어주는대로 저장이 된다 ref: https://matp.. 2024. 4. 9.
Pandas - 정렬한 Series 를 DataFrame으로 .to_frame( ) 정렬한것은 Series로 나오게 된다 이것을 to._frame() 을 입력하여 DataFrame으로 변환하자 2024. 4. 9.
Pandas - 데이터프레임 내 리스트 포함 .isin( ) 데이터프레임에 내가 찾는 리스트들이 있는지 확인하고 가져오는 법 하나하나 찾을 필요 없이 리스트를 메모리에 올리고 .isin( ) 으로 괄호안에 리스트를 넣어 데이터프레임에 리스트가 포함된 것들을 모두 찾도록 하자 다음은 데이터 엑세스 끗 2024. 4. 9.