Matplotlib는 파이썬에서 데이터 시각화를 위한 가장 널리 사용되는 라이브러리 중 하나이다.
다양한 종류의 그래프와 차트를 쉽게 생성할 수 있으며, 데이터를 시각적으로 표현하는 데 매우 유용하다.
주로 pyplot 모듈을 사용하여 시각화를 수행한다.
pyplot은 MATLAB과 유사한 형태의 명령형 스타일 인터페이스를 제공한다.
주요 기능으로는
선 그래프, 막대 그래프, 산점도, 히스토그램, 파이 차트, 박스 플롯 등 다양한 그래프 종류 제공
그래프의 스타일, 색상, 레이블, 제목 등을 쉽게 설정 가능
데이터 시각화와 관련된 다양한 커스터마이징 옵션 제공
등이 있다.
선 그래프는 데이터 포인트를 선으로 연결한 그래프로, 시간의 흐름에 따른 데이터 변화를 시각화할 때 주로 사용한다. 주로 시간 시계열 데이터나 연속된 데이터를 표현하는 데 유용하다.
사용 함수 및 메소드:
plt.plot(x, y, ...): 선 그래프를 생성한다.
x: x축 데이터 리스트 또는 배열
y: y축 데이터 리스트 또는 배열
marker: 데이터 포인트의 마커 스타일 설정 (예: 'o', 'x', '^' 등)
color: 선의 색상 설정 (예: 'blue', 'red', '#FF5733' 등)
linestyle: 선 스타일 설정 (예: '-', '--', '-.', ':' 등)
기타 스타일 파라미터 (예: linewidth 등)
산점도는 두 변수 간의 관계를 시각화하는 데 사용된다. 각 데이터 포인트는 하나의 점으로 표현된다. 데이터의 분포나 두 변수 간의 상관관계를 볼 때 유용하다.
사용 함수 및 메소드:
plt.scatter(x, y, ...): 산점도를 생성한다.
x: x축 데이터 리스트 또는 배열
y: y축 데이터 리스트 또는 배열
color: 데이터 포인트의 색상 설정 (예: 'blue', 'red', '#FF5733' 등)
marker: 데이터 포인트의 마커 스타일 설정 (예: 'o', 'x', '^' 등)
s: 데이터 포인트의 크기 설정
기타 스타일 파라미터
막대 그래프는 범주형 데이터를 시각화하는 데 사용된다. 각 막대는 데이터 값을 나타낸다. 비교할 수 있는 여러 항목의 값을 보여줄 때 유용하다.
사용 함수 및 메소드:
plt.bar(x, height, ...): 막대 그래프를 생성한다.
x: x축 데이터 리스트 또는 배열 (범주형 데이터)
height: 막대의 높이를 나타내는 데이터 리스트 또는 배열
color: 막대의 색상 설정 (예: 'blue', 'red', '#FF5733' 등)
edgecolor: 막대의 테두리 색상 설정
width: 막대의 너비 설정
기타 스타일 파라미터
히스토그램은 데이터의 분포를 시각화하는 데 사용된다. 데이터의 빈도를 막대로 나타낸다. 데이터의 분포 형태와 데이터가 어떻게 분포되어 있는지 확인할 때 유용하다.
사용 함수 및 메소드:
plt.hist(x, bins, ...): 히스토그램을 생성한다.
x: 데이터 리스트 또는 배열
bins: 막대의 개수 또는 빈의 경계를 지정하는 리스트 또는 배열
color: 막대의 색상 설정
edgecolor: 막대의 테두리 색상 설정
alpha: 막대의 투명도 설정 (0.0에서 1.0 사이 값)
기타 스타일 파라미터
파이 차트는 데이터의 비율을 시각화하는 데 사용된다. 각 조각은 데이터의 부분을 나타낸다. 전체 대비 각 부분의 비율을 보여줄 때 유용하다.
사용 함수 및 메소드:
plt.pie(x, ...): 파이 차트를 생성한다.
x: 각 파이 조각의 크기를 나타내는 데이터 리스트 또는 배열
labels: 각 조각의 레이블을 나타내는 리스트 또는 배열
autopct: 각 조각의 비율을 표시하는 형식 (예: '%1.1f%%')
startangle: 파이 차트의 시작 각도 설정
colors: 파이 조각의 색상 설정
기타 스타일 파라미터
박스 플롯은 데이터의 분포를 시각화하는 데 사용된다. 중앙값, 사분위수, 이상치를 보여준다. 데이터의 분포와 이상치를 파악할 때 유용하다.
사용 함수 및 메소드:
plt.boxplot(x, ...): 박스 플롯을 생성한다.
x: 데이터 리스트 또는 배열
notch: 박스의 모양을 노치로 설정할지 여부 (True 또는 False)
vert: 박스 플롯의 방향 설정 (수직: True, 수평: False)
patch_artist: 박스를 채우는 스타일 설정 (True 또는 False)
기타 스타일 파라미터
plt.xlabel('label'): x축 레이블 설정
plt.ylabel('label'): y축 레이블 설정
plt.title('title'): 그래프 제목 설정
plt.grid(True): 그리드 설정
plt.show(): 그래프를 화면에 표시
matshow 함수는 행렬 데이터를 색상을 사용하여 시각화하는 데 사용됩니다. 이 함수는 행렬의 값을 색상으로 표현하여 직관적으로 데이터를 이해할 수 있게 합니다.
사용 함수 및 메소드:
plt.matshow(A, ...): 행렬 데이터를 시각화합니다.
A: 시각화할 행렬 데이터 (2D 배열)
cmap: 색상 맵을 설정합니다. 기본적으로는 'viridis'를 사용합니다. 다른 예로는 'hot', 'cool', 'gray' 등이 있습니다.
aspect: 그래프의 가로 세로 비율을 설정합니다. ('auto', 'equal' 등)
기타 스타일 파라미터
plt.colorbar(): 색상 막대를 추가하여 값의 범위를 나타냅니다.
plt.show(): 그래프를 화면에 표시합니다.