본문 바로가기

Python90

Pandas - CRUD DataFrame 기초 좌측 bold체 : 행, 인덱스 => 기존에는 0123등 컴퓨터가 읽기 편했지만 인간이 편히 사용할 수 있게 가능해졌다 상단 bold체 : 열, 컬럼(column) 안쪽의 데이터 : values - 데이터의 갯수는 인덱스의 갯수 데이터 생성하기 .Series( ) .DataFrame( ) series ( ) 는 데이터프레임의 하위개념으로 1차원 배열을 의미하며 넘파이보다는 상위개념이다 .DataFrame( ) 은 2개 이상의 시리즈가 모여 만들어지는 컴퓨터로 정보를 정리하고 저장하는 도구이자행과 열로 이루어진 배열로 이루어지고 있다 데이터 불러오기 데이터를 불러오기에 앞서 흔히 사용되는 데이터의 저장방법은 .csv로 저장하고 읽고 있다 CSV 는 무엇? CSV 파일명의 뜻은 CSV.. 2024. 4. 5.
Pandas - NaN NaN NaN 은 해당 항목에 값이 없다는 뜻. (Not a Number) 데이터가 비어있음, 입력을 안 한 상태 .isna( ) 비어있는 데이터 즉, NaN이 있는지 찾는 법은 .isna( ) 이며 .sum( ) 을 뒤에 붙여 콜럼별로 몇개가 있는지 괄호안에 axis=1 을 넣어 행별로 몇개가 있는지 그리고 .sum().sum() 으로 행 열 전체에 모두 몇개있는지 알아볼 수 있다 .notna() 로 NaN이 없는것(데이터가 정상적으로 있는 것)을 찾는것도 가능하다 NaN 처리법 1. 삭제하기 .dropna() NaN이 있는 행 전체가 삭제된다(주의) 2. 특정 값으로 채우기 .fiilna( ) Fill Na NaN을 Fill 채우자 라는 의미이다 .fiina( )를 이용하여 NaN을 다른 문자열, 숫.. 2024. 4. 5.
Pandas - 기초, Series PANDAS 는 파이썬의 데이터 분석라이브러리 이며 PANelDAtaS의 약자이고 패널이란 그룹이라는 뜻을 가지고 있어 패널데이터는 즉 여러 개체들을 시간을 두고 추적하여 얻는 데이터를 말한다 pandas 안에 numpy가 있는 구조 데이터 스트럭쳐 pd.Series( ) 는 1차원 배열 생성 0 1 2 3 은 인덱스 // 30 6 yes no 는 values 이자 실제 data 인덱스도 변경이 가능하다 .index .shape .size .ndim .dtype 기본적으로 pd.Sereies(data=변수1, index=변수2)로 생성 가능하며 index는 생략하여도 생성하는데 지장없다 (나중에 index를 수정도 가능하다) 그렇게 만들어진 것을 DataFrame 의 하위개념인 시리즈라 부르며 .inde.. 2024. 4. 5.
Pandas - 데이터 엑세스 방법 데이터 엑세스 방법은 총 3가지 이러한 데이터 프레임이 존재 한다고 할 때 # 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용 기존의 배웠던 방법과 크게 다르지 않다 변수[ ] 여기서 괄호 안에 컬럼의 이름을 집어 넣으면 된다 2개 이상일때는 리스트로 묶어주면 된다 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 (1) .loc[ , ] 로 가져오는 방법 이 방법은, 사람용인 인덱스와 컬럼으로 데이터를 엑세스 하는 방법 .loc[ ] 는 Location 로케이션의 줄임말이며 인간이 보기 편하게 만든 인덱스와 컬럼을 불러 내는 방법이다 [ '행' , '열' ] 의 개념으로 인식하자 마찬가지로 2개 이상의 것을 가져와야 할때는 리스트로 묶어 주자 슬라이싱 방법 또한 가능하다 .. 2024. 4. 5.
Python 함수 - 기초 예제 기초 함수 함수 생성에는 함수 호출부터 시작한다 def print_coin() : print('비트코인') def 함수로 print_coin() == print("비트코인") 이라고 지정해준 셈이다 그 후 print_coin()을 호출하면 위에서 def로 함수라고 지정되었기때문에 print("비트코인") 이 호출된다 반복문 이용 for 반복문 중 range를 이용하여 100번(화면에 보이기위해 10번으로 수정) 그리고 def로 지정한 print_coin으로 출력시켜준다 그리고 그 반복문을 또다시 def로 감싸주어 10번씩 호출되는 def함수를 만들수 있다 def의 성질 위부터 차례대로 A가 출력되고 def함수는 메모리에 저장시키는 용도이기때문에 넘어간다 그리고 C가 출력되고 def함수의 message().. 2024. 4. 5.
Python 함수 - 기초 사용 이유 일반적으로 사용하기 이전에 왜 사용 하는것일까? 만약 1000줄이 되는 코드가 있다고 하자 그런 코드를 엄청 자주 써야 한다고 할때 생각만 해도 지저분하고 복잡하고 시간도 오래 걸리게 된다 그렇다면 그런 그 코드를 간결하게 사용 할 수 있다면? 그런 생각으로 만들어진게 함수다 자주 사용하는 코드를 1줄로 '간결하게', '깔끔하게', '재사용'하기 위해 기초 define 정의하다 라는 말에서 def 를 따와서 def 변수명 을 적어주어서 함수를 생성하고 그 아래에 코드들을 적어 함수에 저장해두었다가 나중에 해당 함수가 언급될때 마다 호출 되어진다 그래서 평소에는 메모리에 저장되어 눈에 띄지않고 정의되어진 함수가 호출 될때만 나타난다 ( )괄호 안을 parmeters(arguments) 매개변수(.. 2024. 4. 4.