분류 전체보기
[데이터 사이언스] 데이터 분석과 시각화
시각화와 그래프 이번에는 데이터를 시각화해보겠습니다. 시각화가 중요한 이유는 크게 두가지가 있는데요, 첫번째로, 시각화는 데이터를 분석하는 데에 도움을 줍니다. 두번째로, 시각화는 리포팅에 도움을 줍니다. 이제 가장 기본적인 그래프 몇 가지를 살펴보도록 하겠습니다. 선 그래프 막대 그래프 파이 그래프 히스토그램 박스 플롯 산점도 seaborn 시각화 seaborn이라는 라이브러리를 이용해서 그래프를 그릴 수 있는데, seaborn을 사용하면 더 많은 그래프를, 더 멋지게 그려낼 수 있습니다. 그렇게 되면 같은 데이터로부터 더 좋은 insight를 얻게 될 수도 있습니다. KDE Plot LM Plot 카테고리별 시각화 상관 계수 시각화 EDA EDA(Exploratory Data Analysis)는 주어..
[데이터 사이언스] DataFrame 다루기
DataFrame 인덱싱 데이터 변형하기 DataFrame에 값 쓰기 DataFrame에 값 추가/삭제 index/column 설정하기 큰 데이터 다루기 큰 DataFrame 살펴보기 큰 Series 살펴보기
[데이터 사이언스] 데이터 사이언스란?
데이터 사이언스란? 데이터 과학이란, 데이터 마이닝과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는 데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야입니다. 데이터 사이언스에 대한 오해 데이터 사이언스에서 가장 중요한 건 인공지능, 딥러닝이다. 데이터를 모으는 과정, 데이터를 옮기고 저장하는 과정, 데이터를 정리하는 과정, 데이터 분석, 데이터에 대한 다양한 테스트나 시도가 있는 후에야 인공지능은 이뤄질 수 있습니다. 그런데 미디어에서 요즘 너무 딥러닝, 인공지능만 강조하다 보니 인공지능 외 선행되어야 할 과정들이 등한시되고있습니다. 인공지능이 있기 전의 과정에서는 적은 노력으로 많은 가치를 얻을 수도 있습니다. 그렇지만 인공지능의 과정에서는 노력,..