수치 계산을 위해 설계된 라이브러리로, 다차원 배열 객체와 다양한 수학 함수를 제공한다.
주요 데이터 구조: ndarray
고속의 배열 연산 및 선형 대수, 푸리에 변환, 난수 생성 등의 기능을 제공한다.
데이터 조작과 분석을 위해 설계된 고성능 데이터 구조와 데이터 분석 도구를 제공한다.
주요 데이터 구조: Series와 DataFrame
데이터 조작, 필터링, 집계, 변환 등의 기능을 제공한다.
Series는 일차원 배열 형태의 데이터 구조로, 인덱스를 가진다.
동일한 데이터 타입의 값을 저장한다.
DataFrame은 Pandas 라이브러리에서 제공하는 이차원 테이블 형태의 데이터 구조로, 행과 열을 가진다.
서로 다른 데이터 타입의 값을 저장할 수 있으며, 엑셀 스프레드시트와 유사한 형식으로 데이터를 저장하고 조작할 수 있다.
첫 번째 인수는 2차원 리스트로, 각 내포된 리스트가 DataFrame의 한 행을 나타낸다.
[[44, 80, 180, 'John'], [35, 50, 160, 'Mary'], [7, 30, 130, 'smith']]
이 리스트는 총 3개의 행(row)과 4개의 열(column)을 포함한다.
index 인수는 각 행의 레이블을 지정한다.
index=['papa', 'mama', 'son']
여기서는 papa, mama, son이 각 행의 이름이다.
columns 인수는 각 열의 레이블을 지정한다.
columns=['age', 'weight', 'height', 'name']
여기서는 age, weight, height, name이 각 열의 이름이다.