pandas란?
원래 데이터 사이엔스에서는 파이썬보다 R이 훨씬 인기가 많았습니다.
R은 애초에 통계를 위해 만들어진 언어이기 때문에 데이터 분석에 파이썬보다 적합했습니다.
그러다가 개발자들이 R의 장점을 파이썬으로 베껴오기 시작했습니다.
R에서 데이터를 보관, 분석 시 가장 핵심적 역할을 한 게 DataFrame인데,
파이썬의 pandas 그 DataFrame을 사용할 수 있게 해놓은 라이브러리입니다.
pandas는 numpy를 이용해서 만들어졌으므로 numpy의 기능들은 pandas에 기본적으로 있다고 보면 되고,
거기에 추가로 데이터 분석, 정리, 외부 데이터 읽고 쓰기 등 편리한 기능들이 추가된 것이 pandas입니다.
pandas로 DataFrame 만들어보기
pandas로 데이터 읽어들이기
'DATA > 데이터 사이언스' 카테고리의 다른 글
[데이터 사이언스] 데이터 만들기 (0) | 2022.01.03 |
---|---|
[데이터 사이언스] 데이터 퀄리티 높이기 (0) | 2022.01.03 |
[데이터 사이언스] 데이터 분석과 시각화 (0) | 2022.01.03 |
[데이터 사이언스] DataFrame 다루기 (0) | 2022.01.03 |
[데이터 사이언스] 데이터 사이언스란? (2) | 2022.01.03 |