본문 바로가기
Python/PANDAS

Pandas - 카테고리컬 데이터 1 - unique( )

by 하니__ 2024. 4. 5.
Categorical Data 중복이 발생하는 데이터

 

이 데이터 프레임을 보게 되면

여러곳에서 중복값이 보이게 된다

해당 데이터를 카테고리컬 데이터 라고 한다

 

.unique( ) 중복값 제거

 

 

중복값을 제거 하고 남은 값의 갯수를 알아보고 싶을때는

.unique().size 를 해도 나오지만

.nunique() 를 입력하면 바로 나온다

 

 

 

 

 

Pandas - 카테고리컬 데이터 2 - .groupby( ) .agg( ) .count( )

카테고리컬 데이터의 경우 데이터분석시 데이터별로 묶어서 데이터를 분석 할 수 있다 중복되는 데이터끼리는 묶을 수 없을까? Column1의 중복으로 묶어 Column2의 총합 .groupby( )[ ].sum( ) .groupby( )은

hani08.tistory.com