CSV 파일을 읽어 데이터프레임으로 변환하는 데 사용된다.
불러온 파일을 표시할 때 행이나 열 같은 요소를 얼마나 표시할 것인지 등을 설정한다.
데이터프레임의 형식, 행과 열의 개수, 데이터 타입 등의 요약 정보를 텍스트로 보여준다.
park_id: 공원 고유번호
theme: 공원 테마
rollercoaster_type: 롤러코스터 유형
custom_design: 맞춤 설계
excitement: 흥미
excitement_rating: 흥미 평가
intensity: 격렬함
intensity_rating: 격렬함 평가
nausea: 메스꺼움
nausea_rating: 메스꺼움 정도
max_speed: 최고 속도
avg_speed: 평균 속도
ride_time: 탑승 시간
ride_length: 노선 길이
max_pos_gs: 최고 중력 가속도
max_neg_gs: 최소 중력 가속도
max_lateral_gs: 최대 측면 중력 가속도
total_air_time: 총 공중 시간
drops: 낙하 횟수
highest_drop_height: 최고 낙하 높이
inversions: 반전 횟수
데이터프레임의 크기(행, 열)를 출력한다.
데이터프레임의 기초 통계를 출력한다.
데이터프레임을 특정 열을 기준으로 정렬한다.
by: 정렬 기준이 될 열 이름 또는 열 이름의 리스트.
axis: 0이면 인덱스(행)를 기준으로 정렬, 1이면 열을 기준으로 정렬 (기본값: 0).
ascending: True이면 오름차순, False이면 내림차순 (기본값: True).
시리즈의 각 고유값의 빈도를 계산한다.
좌측은 계산한 빈도값을 막대그래프 형태로 나타낸 것이다.
Series의 고유값을 반환한다.
Series의 고유값의 개수를 반환한다.
dropna: NaN 값을 무시할지 여부를 지정한다. 기본값은 True이다.
새로운 Figure 객체를 생성하고, 그에 대한 다양한 속성을 설정할 수 있다.
주요 파라미터
figsize: Figure의 크기를 (가로, 세로) 인치 단위로 지정한다. (기본값: (6.4, 4.8))
dpi: Figure의 해상도를 지정한다. (기본값: 100)
facecolor: Figure의 배경색을 지정한다. (기본값: 'w')
edgecolor: Figure의 테두리 색을 지정한다. (기본값: 'w')
frameon: Figure의 테두리를 그릴지 여부를 지정한다. (기본값: True)
tight_layout: 레이아웃을 자동으로 조정할지 여부를 지정한다. (기본값: None)
constrained_layout: 레이아웃을 자동으로 조정할지 여부를 지정한다. (기본값: None)
데이터프레임에서 열 간의 상관 계수를 계산하는 데 사용된다.
상관 계수는 두 변수 간의 선형 관계의 강도와 방향을 나타내며, 값은 -1에서 1 사이의 값을 가진다.
1에 가까울수록 강한 양의 상관 관계를, -1에 가까울수록 강한 음의 상관 관계를 나타내며, 0에 가까울수록 상관 관계가 거의 없음을 의미한다.
주요 파라미터
method: 상관 계수를 계산하는 방법을 지정한다. 기본값은 'pearson'이다.
'pearson': 피어슨 상관 계수, 기본 옵션이다.
'kendall': 켄달의 타우 상관 계수.
'spearman': 스피어만의 랭크 상관 계수.
numeric_only: True로 설정하면 숫자형 데이터에 대해서만 상관 계수를 계산한다.
이 그래프는 'excitement' 변수와 다른 변수들 간의 상관 관계를 막대 그래프로 시각화한 것이다.
각 막대는 'excitement' 변수와 다른 변수 간의 상관 계수를 나타낸다.
이 그래프는 'excitement' 변수와 다른 변수들 간의 상관 관계를 내림차순으로 정렬하여 막대 그래프로 시각화한 것이다.
상관 계수가 큰 변수부터 작은 변수 순으로 정렬되어 있어, 어떤 변수가 'excitement'와 가장 강한 양의 상관 관계를 가지는지 쉽게 확인할 수 있다.
상관 계수가 그래프 위에 텍스트로 표시되어 있다.
예를 들어, 'ride_length'와 'excitement'의 상관 계수는 0.56으로, 강한 양의 상관 관계를 나타낸다.
음의 상관 관계를 나타내는 변수도 있으며, 예를 들어 'custom_design'과 'excitement'의 상관 계수는 -0.30이다.