판다스는 여러번 봐도 항상 헷갈리네요.
특히, 기본적인 부분에서 많이 헷갈려서 구글링이 없으면 기본적인 코드도 작성할 수가 없네요.
이번 포스트는 가장 기본적인 데이이터프레임을 만드는 3가지 방법을 기록해 보겠습니다.
데이터프레임은
- 딕셔너리로 데이터프레임을 생성
- 리스트로 데이터프레임을 생성
- 리스트와 딕셔너리로 데이터프레임을 생성
이렇게 3가지 방법으로 생성할 수 있습니다.(아마 더 있겠지만, 저는 잘 모르겠습니다.)
우선 첫번째 방법(딕셔너리)으로 데이터프레임을 만들어 보겠습니다.
판다스 라이브러리를 불러옵니다.
pd.DataFrame 함수로 {'col' : [컬럼에 있는 데이터 리스트]} 이런 형식으로 만듭니다. index=[리스트] 형태로 넣어주고, 설정을 안해도 자동으로 순차적으로 인덱스가 숫자로 매겨집니다.
ㅍ
두번째 (List)방법입니다.
우선 List를 (이중으로) 만들고, 컬럼명도 리스트로 만들어서 'cols' 변수에 담습니다.
그리고 pd.DataFrame(data=list, colums=cols) 이렇게 사용하면 됩니다.
마지막 세번째(리스트와 딕셔너리로) 방법입니다.
딕셔너리를 리스트에 저장해서 data라는 변수에 담습니다.
그리고 pd.DataFrame(data=data) 이렇게만 적으면 됩니다.
제가 비전공자이고, 비관련 직군에서 본업을 하고 있지만, 프로그램밍은 취미로 하기에 너무나 재미있는 것 같습니다.
더욱이 판다스는 상당히 매력적인 라이브러리 입니다.
728x90
반응형
'파이썬(Python) > 파이썬 기초' 카테고리의 다른 글
파이썬 - 문장에서 특정 문자 포함 여부(포함개수) 확인 방법 (0) | 2021.06.20 |
---|---|
python pandas - 판다스 기본(컬럼 순서 바꾸기) (0) | 2021.06.07 |
python pandas - 판다스 기본(컬럼을 인덱스로, 인덱스를 컬럼으로 변경하는 방법 ) (0) | 2021.06.01 |
python pandas - 판다스 기본(특정 문자(숫자) 제외한 데이터만 가져오기 ) (0) | 2021.05.31 |
python pandas - 판다스 기본(to_numeric 에러 해결방법) (0) | 2021.05.30 |
댓글