데이터시각화·EDA

[데이터 시각화] 실습(1)

데이터요리사 2020. 10. 26. 10:03

안녕하세요. 데이터 요리사, 루나입니다.

파이썬 데이터 시각화 패키지 Seaborn의 사용법을 익히고,

데이터에 따라 다양한 시각화 방법을 적용하는 실습을 진행합니다.

 

 

1  사전 준비
#seaborn 패키지 불러오기
import seaborn as sns 

#그래프 그리기
sns.barplot(data=flights, x="year", y="passengers")

 

2 Seaborn의 내장 데이터셋(tips 데이터)를 활용한 시각화 연습

1) 데이터 준비

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

tips = sns.load_dataset("tips")

 

2) tips 데이터 확인해보기

더보기

tips.head()

 

3) tips 데이터 셋을 활용하여 다양한 plot을 그려보고, 다음 문제 해결을 위한 효과적인 방법 선택하기

# relplot # scatterplot # lineplot
# lmplot # regplot # residplot
# displot # kdeplot # rugplot
# catplot # stripplot # swarmplot # boxplot # violinplot # boxenplot # pointplot # barplot # countplot
  • total_bill의 분포 파악하기
  • total_bill과 tip과의 관계 파악하기
  • day에 따른 total_bill은 어떻게 달라지는지 파악하기

 

3 Seaborn의 내장 데이터셋(flights 데이터)를 활용한 시각화 연습

1) 데이터 준비

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

flights = sns.load_dataset('flights')

 

2) flights 데이터 확인해보기

더보기

flights.head()

 

3) flights 데이터 셋을 활용하여 다양한 plot을 그려보고, 다음 문제 해결을 위한 효과적인 방법 선택하기

# relplot # scatterplot # lineplot
# lmplot # regplot # residplot
# displot # kdeplot # rugplot
# catplot # stripplot # swarmplot # boxplot # violinplot # boxenplot # pointplot # barplot # countplot
# heatmap # clustermap
  • year에 따른 passengers의 수는 어떻게 달라지는지 파악하기
  • month에 따른 passengers의 수는 어떻게 달라지는지 파악하기
  • passengers의 수 분포 확인하기
  • year와 month에 따라 passengers의 수가 어떻게 달라지는지 하나의 시각화 방법으로 확인하기

 

 

 

 

 

함께 보면 좋은 글

 

 

 

 


※ 이 글의 내용을 상업적으로 무단 활용, 편집하는 것은 금지하고 있습니다. 강의, 출판 등 상업적 이용이 필요하신 경우, 문의 바랍니다.

728x90