Python/PANDAS15 Pandas - NaN NaN NaN 은 해당 항목에 값이 없다는 뜻. (Not a Number) 데이터가 비어있음, 입력을 안 한 상태 .isna( ) 비어있는 데이터 즉, NaN이 있는지 찾는 법은 .isna( ) 이며 .sum( ) 을 뒤에 붙여 콜럼별로 몇개가 있는지 괄호안에 axis=1 을 넣어 행별로 몇개가 있는지 그리고 .sum().sum() 으로 행 열 전체에 모두 몇개있는지 알아볼 수 있다 .notna() 로 NaN이 없는것(데이터가 정상적으로 있는 것)을 찾는것도 가능하다 NaN 처리법 1. 삭제하기 .dropna() NaN이 있는 행 전체가 삭제된다(주의) 2. 특정 값으로 채우기 .fiilna( ) Fill Na NaN을 Fill 채우자 라는 의미이다 .fiina( )를 이용하여 NaN을 다른 문자열, 숫.. 2024. 4. 5. Pandas - 기초, Series PANDAS 는 파이썬의 데이터 분석라이브러리 이며 PANelDAtaS의 약자이고 패널이란 그룹이라는 뜻을 가지고 있어 패널데이터는 즉 여러 개체들을 시간을 두고 추적하여 얻는 데이터를 말한다 pandas 안에 numpy가 있는 구조 데이터 스트럭쳐 pd.Series( ) 는 1차원 배열 생성 0 1 2 3 은 인덱스 // 30 6 yes no 는 values 이자 실제 data 인덱스도 변경이 가능하다 .index .shape .size .ndim .dtype 기본적으로 pd.Sereies(data=변수1, index=변수2)로 생성 가능하며 index는 생략하여도 생성하는데 지장없다 (나중에 index를 수정도 가능하다) 그렇게 만들어진 것을 DataFrame 의 하위개념인 시리즈라 부르며 .inde.. 2024. 4. 5. Pandas - 데이터 엑세스 방법 데이터 엑세스 방법은 총 3가지 이러한 데이터 프레임이 존재 한다고 할 때 # 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용 기존의 배웠던 방법과 크게 다르지 않다 변수[ ] 여기서 괄호 안에 컬럼의 이름을 집어 넣으면 된다 2개 이상일때는 리스트로 묶어주면 된다 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 (1) .loc[ , ] 로 가져오는 방법 이 방법은, 사람용인 인덱스와 컬럼으로 데이터를 엑세스 하는 방법 .loc[ ] 는 Location 로케이션의 줄임말이며 인간이 보기 편하게 만든 인덱스와 컬럼을 불러 내는 방법이다 [ '행' , '열' ] 의 개념으로 인식하자 마찬가지로 2개 이상의 것을 가져와야 할때는 리스트로 묶어 주자 슬라이싱 방법 또한 가능하다 .. 2024. 4. 5. 이전 1 2 3 다음