본문 바로가기

Python/Matplotlib6

Matplotlib - Pie 차트(원 형 그래프) .autopct startangle wedgeprops = { 'width' : } 보통 데이터를 퍼센테이지로 시각화 하는경우 많이 사용 (ex: 대통령 선거 득표율) 포켓몬 세대별 포켓몬 객체수를 pie차트를 이용하여 나타내보자 df['generation_id'].value_counts() generation_id 5 156 1 151 3 135 4 107 2 100 7 86 6 72 Name: count, dtype: int64 df2 = df['generation_id'].value_counts() plt.pie(df2) plt.show() 우선은 원하는 데이터프레임을 가공하여 저장하고 기본형인 .pie( )로 파라미터 안에 넣어 불러내자 나오긴 나왔는데 도대체 무슨 데이터인지 무엇을 나타내는지 알 수가 없다 가공을 시작 하자 plt.pie(df2, labels= df2.index.. 2024. 4. 9.
Matplotlib - 상관관계 .scatter( ) .corr( ) .regplot( ) .pairplot( ) 두 컬럼간의 관계를 차트로 나타내는 법 관계란? 보통 3가지 비례관계, 반비례관계, 아무 관계 없음 = 상관관계 두 컬럼간의 관계 => 배기량(displ)과 연비(comb)의 관계를 그래프로 확인 plt.scatter(data=df, x='displ', y='comb') plt.show() .scatter( )의 기본형태를 불러오자 data = 읽어올 데이터프레임, x축, y축을 설정해주면 이런 모양이 나오는데 좀 부족하다 plt.scatter(data=df, x='displ', y='comb') plt.title('Displ vs Comb') plt.xlabel('Displacement') plt.ylabel('Combined Fuel Eff (mpg)') plt.show() title( )로 그래프의.. 2024. 4. 9.
Matplotlib - hist 히스토그램 2 . subplot( ) .figure( figsize= ( , ) ) 하나의 화면에 여러개의 plot을 그려 보자 .subplot() plt.subplot(1,2,1) plt.hist( data=df, x='speed', rwidth=0.8 ) plt.subplot(1,2,2) plt.hist( data=df, x='speed', rwidth=0.8, bins = my_bins ) plt.show() subplot() 을 이용하여 그리게 되고 파라미터안의 숫자들은 총 행의 갯수, 총 열의 갯수, 그래프 번호를 의미한다 즉, 위의 파라미터는 1행 2열의 1번과 2번 그래프를 의미 즉 이런 모습의 2개의 그래프가 된다 물론 이렇게만 있게되면 무엇을 설명하는 그래프인지 알 수 없으니 가공을 해보자 .figure( figsize= ( 가로, 세로) ) plt.figure( fig.. 2024. 4. 9.
Matplotlib - Bar 그래프 .countplot( ) .color_palette( )[ ] .value_count( ).index 이러한 포켓몬 7세대까지의 데이터들이 있다고 할 때에 세대별 포켓몬의 마릿수는 어떻게 분포 되어 있는지 막대그래프 형태로 알아보자 우선 이전 까지의 방법으로는 value_count( )와 groupby( )[ ].count( ) 를 이용하여 수치화된 데이터로 알아 볼 수 있었다 seaborn의 .countplot( ) 사용 import seaborn as sb 우선 seaborn 라이브러리를 사용하기위해 임포트를 해주고 타이핑을 줄이기 위해 sb로 줄여보자 sb.countplot(data=df , x= 'generation_id') plt.show() 그 후 .countplot( ) 을 이용해 막대형 그래프를 만들자 하지만 뭔가 정신없고 여러모로 손을 봐줘야 할 것같다 막대 색상 설정 .color_pal.. 2024. 4. 9.
Matplotlib - hist 히스토그램 1 .hist( ) rwidth= bins= 히스토그램은 구간을 설정하여 해당 구간에 데이터가 몇개인지 확인이 가능하다 그렇기에 데이터의 분포를 알 수 있다 히스토그램은 구간이 있는데 이 구간을 bin 이라고 하고 구간이 여러개라서 보통 복수형으로 bins 라고 한다 히스토그램은 똑같은 데이터를 가지고도 bin을 어떻게 설정하느냐에 따라 차트 모양이 달라져 해석을 달리 할 수 있다 가령 이런 숫자들의 데이터가 있다고 하면 이런식으로 구간을 6으로 묶은 그래프와 3으로 묶은 그래프에는 크게 보면 별 차이가 없지만 우측 그래프의 0~3구간과 15~18구간이 생각보다 비어있는것을 좌측 그래프에서는 알지 못 한다 이번엔 전의 포켓몬 데이터로 'speed' 콜럼을 통하여 데이터들이 어떻게 분포 되어있나 확인해보자 .hist( ) import matplotl.. 2024. 4. 9.
Matplotlib - 기초, 직선형 그래프, 저장 .plot( x, y) .savefig( ) Matplotlib 매트 플롯 라이브러리는 Numpy라이브러리를 활용한 수치화된 데이터들을 산포형, 직선형, 곡선형, 막대형, 원형 등등의 그래프로 시각화 시켜주는 객체 지향 API이다 보다 쉽게 다른 이에게 이해시키기 쉽게끔 만들어준다 기본적으로 matplotlib.pyplot을 import해줘야 한다 그리고 자주 쓰는데 길이가 긴 만큼 plt로 줄여 쓴다 .plot( x, y) 기본적으로 plt.plot(x축 , y축)으로 그리며 메모리에 적혀있는 자잘한 메세지를 지우기위해 plt.show() 를 해준다 .savefig( ) 그리고 plt.savefig('저장할 이름.확장자')를 적어주면 같은 경로에 저장이 된다 이때 확장자는 jpg건 png건 적어주는대로 저장이 된다 ref: https://matp.. 2024. 4. 9.