본문 바로가기

전체보기239

Pandas - NaN NaN NaN 은 해당 항목에 값이 없다는 뜻. (Not a Number) 데이터가 비어있음, 입력을 안 한 상태 .isna( ) 비어있는 데이터 즉, NaN이 있는지 찾는 법은 .isna( ) 이며 .sum( ) 을 뒤에 붙여 콜럼별로 몇개가 있는지 괄호안에 axis=1 을 넣어 행별로 몇개가 있는지 그리고 .sum().sum() 으로 행 열 전체에 모두 몇개있는지 알아볼 수 있다 .notna() 로 NaN이 없는것(데이터가 정상적으로 있는 것)을 찾는것도 가능하다 NaN 처리법 1. 삭제하기 .dropna() NaN이 있는 행 전체가 삭제된다(주의) 2. 특정 값으로 채우기 .fiilna( ) Fill Na NaN을 Fill 채우자 라는 의미이다 .fiina( )를 이용하여 NaN을 다른 문자열, 숫.. 2024. 4. 5.
Pandas - 기초, Series PANDAS 는 파이썬의 데이터 분석라이브러리 이며 PANelDAtaS의 약자이고 패널이란 그룹이라는 뜻을 가지고 있어 패널데이터는 즉 여러 개체들을 시간을 두고 추적하여 얻는 데이터를 말한다 pandas 안에 numpy가 있는 구조 데이터 스트럭쳐 pd.Series( ) 는 1차원 배열 생성 0 1 2 3 은 인덱스 // 30 6 yes no 는 values 이자 실제 data 인덱스도 변경이 가능하다 .index .shape .size .ndim .dtype 기본적으로 pd.Sereies(data=변수1, index=변수2)로 생성 가능하며 index는 생략하여도 생성하는데 지장없다 (나중에 index를 수정도 가능하다) 그렇게 만들어진 것을 DataFrame 의 하위개념인 시리즈라 부르며 .inde.. 2024. 4. 5.
Pandas - 데이터 엑세스 방법 데이터 엑세스 방법은 총 3가지 이러한 데이터 프레임이 존재 한다고 할 때 # 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용 기존의 배웠던 방법과 크게 다르지 않다 변수[ ] 여기서 괄호 안에 컬럼의 이름을 집어 넣으면 된다 2개 이상일때는 리스트로 묶어주면 된다 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 (1) .loc[ , ] 로 가져오는 방법 이 방법은, 사람용인 인덱스와 컬럼으로 데이터를 엑세스 하는 방법 .loc[ ] 는 Location 로케이션의 줄임말이며 인간이 보기 편하게 만든 인덱스와 컬럼을 불러 내는 방법이다 [ '행' , '열' ] 의 개념으로 인식하자 마찬가지로 2개 이상의 것을 가져와야 할때는 리스트로 묶어 주자 슬라이싱 방법 또한 가능하다 .. 2024. 4. 5.
Python 함수 - 기초 예제 기초 함수 함수 생성에는 함수 호출부터 시작한다 def print_coin() : print('비트코인') def 함수로 print_coin() == print("비트코인") 이라고 지정해준 셈이다 그 후 print_coin()을 호출하면 위에서 def로 함수라고 지정되었기때문에 print("비트코인") 이 호출된다 반복문 이용 for 반복문 중 range를 이용하여 100번(화면에 보이기위해 10번으로 수정) 그리고 def로 지정한 print_coin으로 출력시켜준다 그리고 그 반복문을 또다시 def로 감싸주어 10번씩 호출되는 def함수를 만들수 있다 def의 성질 위부터 차례대로 A가 출력되고 def함수는 메모리에 저장시키는 용도이기때문에 넘어간다 그리고 C가 출력되고 def함수의 message().. 2024. 4. 5.
Python 함수 - 기초 사용 이유 일반적으로 사용하기 이전에 왜 사용 하는것일까? 만약 1000줄이 되는 코드가 있다고 하자 그런 코드를 엄청 자주 써야 한다고 할때 생각만 해도 지저분하고 복잡하고 시간도 오래 걸리게 된다 그렇다면 그런 그 코드를 간결하게 사용 할 수 있다면? 그런 생각으로 만들어진게 함수다 자주 사용하는 코드를 1줄로 '간결하게', '깔끔하게', '재사용'하기 위해 기초 define 정의하다 라는 말에서 def 를 따와서 def 변수명 을 적어주어서 함수를 생성하고 그 아래에 코드들을 적어 함수에 저장해두었다가 나중에 해당 함수가 언급될때 마다 호출 되어진다 그래서 평소에는 메모리에 저장되어 눈에 띄지않고 정의되어진 함수가 호출 될때만 나타난다 ( )괄호 안을 parmeters(arguments) 매개변수(.. 2024. 4. 4.
반복문 - 기초 예제 반복문 리스트로 10,20,30을 만든 뒤 for a in b 반복문의 기초는 b에 a가 한번씩 들어가며 데이터를 갖고 오는 방법이다 for 반복문 이용하여 순서대로 나오게 할 수 있다 프린트에 추가하여 반복한다 역순으로 반복 반복문 - 거꾸로 출력하는 법 [ : ] 처음부터 끝까지 [ 처음 : 끝 ] [ : : -1] 끝부터 처음까지 [ 처음: ~: 끝 부터] .reverse() 를 이용하여 먼저 역순으로 만든 다음 출력하는 방법도 있다 조건문 응용 반복문으로 우선 불러오고 조건문인 if를 추가하여 0보다 작은 수만 출력한다 반복문과 조건문의 결합 우선 for문으로 가져오고 조건문으로 20보다 작은수 3의배수를 모두 만족 하는 수를 찾기위해 20 > 변수 and 변수를 %3==0 (3으로 나누었을때 나.. 2024. 4. 4.