안녕하세요. 데이터 요리사, 루나입니다.
이번 시간에는 월별, 일별, 시간별 흐름에 따라 발생하는 데이터의 흐름을 쉽게 파악하는데 도움을 주는
'선 그래프(Line Graph, Line Plot)'에 대해서 살펴보겠습니다.
1 | 개념 잡기 |
- 데이터가 끊임없이 변화하는 추이를 선으로 표현하여, 연속적인 데이터 변화를 확인하는데 용이
- 변수의 변화, 트렌드, 변화율 정보가 중요한 경우 사용
- 점 : 하나의 점은 X-Y축 좌표의 위치로 표시
- 선분 : 점를 연결하는 선으로 점 간의 변화 추이를 보여줌
2 | 예제로 이해하기! |
첫번째로 살펴볼 데이터는 2017년~2018년 인기 음원 5곡이 얼마나 많이 스트리밍 되었는지 스트리밍 수를 나타낸 데이터입니다. NaN이라고 표시된 부분은 데이터가 비어있다는 것을 의미합니다. 아마 해당 음원이 출시되기 전 시점인것 같아요.
이 데이터를 선 그래프로 표시하면 다음과 같습니다. 5개의 음원이 각각 다른 색, 다른 모양으로 표시가 되었네요. 우측 상단에 범례로 선의 색과 모양이 어떤 음원을 나타내는지 표시하고 있습니다. x축은 날짜, y축은 일자별 스트리밍 수를 표시하고 있어요.
보라색으로 표시된 Unforgettable이라는 음원이 가장 늦게 출시가 되었고, 모든 음원이 출시된 이후 스트리밍 수가 증가하다가 서서히 감소하는 추이를 보이고 있습니다. 주황색으로 표시된 Despacito라는 곡은 2017는 4월 무렵 대박이 났네요.
이처럼 선 그래프는 각 데이터가 시간의 흐름에 따라서 어떤 변화를 보이는지 쉽게 파악할 수 있는 장점이 있습니다.
두번째 데이터는 판매량 데이터의 시각화 사례입니다.
아래 그래프는 평균 학용품 품목(SCHOOL AND OFFICE SUPPLIES)에 대한 판매량을 나타낸 그래프입니다. 시간의 추이에 따른 변화를 분석해서 미래를 예측하는 시계열분석 방법을 사용해서, 7월 3주 이후의 판매량을 예측했습니다. 연한 파란색으로 표시된 그래프가 실제 판매량, 진한 파란색과 빨간색이 예측 판매량입니다. 실제값과 예측값 사이에 약간의 값의 차이는 나타나지만 비슷한 추이가 보여지고 있습니다.
세번째 데이터는 월별 항공기 탑승객의 수를 나타낸 데이터입니다.
첫번째 컬럼은 연도, 두번째 컬럼은 월, 세번째 컬럼은 승객 정보를 담고 있습니다. 이 데이터를 사용해서 연도별 탑승객의 수가 어떻게 변화하는지 선 그래프를 그려보았습니다.
x축은 연도, y축은 탑승객 수를 나타낸 선 그래프입니다. 매년 탑승객의 수가 증가하는 추이를 보이고 있습니다. 그런데 이전 그래프에서는 보지 못했던 연한 푸른색의 배경이 함께 그려졌네요. 앞에서 살펴본 음원 스트리밍 데이터와 비교해보면서 이 데이터가 가지고 있는 차이점을 찾아보세요.
음원스트리밍 데이터의 경우, x축(일자)별 y축(스트리밍 수)의 값이 하나씩 존재했기 때문에 하나의 점으로 표시할 수 있었지만, 항공기 탑승객 데이터의 경우 x축(연도)별 y축(탑승객 수)의 값이 여러개 존재하기 때문에 하나의 점으로 표시할 수 가 없습니다. 그래서 각 연도별 탑승객 수를 대표할 수 있는 값(일반적으로 평균값)을 하나 지정하여 y축의 값으로 표시하고, y축이 나타낼 수 있는 값의 범위를 그림자처럼 함께 표시하는 것을 확인할 수 있습니다.
3 | 정리하며 마무리 |
지금까지 선 그래프(Line Graph)에 대해서 알아보았습니다.
선 그래프는 일상적으로 흔하게 접할 수 있는 그래프인 만큼 누구나 이해하기 쉬운 장점을 가지고 있습니다. 시간의 변화에 따른 데이터의 추이를 파악하고 싶을 때 선 그래프를 활용해보세요!
함께 보면 좋은 글 |
- 이 글에 사용한 이미지는 Kaggle 데이터를 활용한 데이터 시각화 결과입니다.
- 이 글의 내용을 상업적으로 무단 활용, 편집하는 것은 금지하고 있습니다.
- 강의, 출판 등 상업적 이용이 필요하신 경우, 문의바랍니다.
'데이터시각화·EDA' 카테고리의 다른 글
[예제로 개념잡기] 산점도(Scatter plot) (0) | 2021.08.13 |
---|---|
[예제로 개념잡기] 히스토그램 (0) | 2021.08.13 |
[데이터 시각화] 실습(2) - 샘플답안 (0) | 2021.08.13 |
탐색적 데이터 분석(EDA, Exploratory Data Analysis)이란? (0) | 2021.01.26 |
[데이터 시각화] 실습(1) - 샘플답안 (0) | 2020.11.23 |