[Pandas 데이터 분석] Chapter 3 - 데이터 살펴보기(1)

Notice

Recent Posts

Recent Comments

Tags more

Archives

관리 메뉴

sliver__

CS/Pandas

sliver__ 2022. 2. 23. 15:14

728x90

[데이터 내용 미리보기]

#앞부분 미리보기
DataFrame 객체.head(n)

#뒷부분 미리보기
DataFrame 객체.tail(n)

#default : 5개

[데이터 요약 정보 확인하기]

#(행, 열)
DataFrame 객체.shape

DataFrame 객체.info()

DataFrame 객체.describe()

#모든 열에 대한 정보 출력
DataFrame 객체.describe(include='all')

DataFrame 객체.count()

각 열의 고유값 개수
- 고유값이 행 인덱스, 고유값의 개수가 데이터 값이 되는 시리지 객체가 만들어진다.
- dropna = True 옵션을 설정하면 데이터 값 중에서 NaN을 제외하고 개수를 계산한다.
- dropna 디폴트는 false로 NaN 개수도 포함한다.

DataFrame 객체["열 이름"].value_counts()

[통계 함수 적용]

평균값
- mean() 메소드 : 산술 데이터를 갖는 모든 열의 평균값을 각각 계산하여 시리즈 객체로 반환
- 특정 열을 선택하여 평균값을 계산할 수도 있다.

#모든 열의 평균값
DataFrame 객체.mean(numeric_only=True)
#numeric_only는 숫자에 대해서만 표현할 것인지 나타내는 flag

#특정 열의 평균값
DataFrame 객체["열 이름"].mean()

중간값
- median() 메소드 : 산술 데이터를 갖는 모든 열의 중간값을 계산하여 시리즈로 반환.
- 특정 열을 선택하여 중간 값을 계산할 수도 있다.

#모든 열의 중간 값
DataFrame 객체.median(numeric_only=True)

#특정 열의 중간 값
DataFrame 객체["열 이름"].median()

DataFrame 객체.max()
DataFrame 객체["열 이름"].max()

DataFrame 객체.min()
DataFrame 객체["열 이름"].min()

DataFrame 객체.std(numeric_only=True)
DataFrame 객체["열 이름"].std()

상관계수
- corr() : 두 열간의 상관계수를 계산한다.
- 산술 데이터를 갖는 모든 열에 대하여 2개씩 서로 짝을 짓고, 각각의 경우에 대하여 상관 계수를 선택한다.

DataFrame 객체.corr()
DataFrame 객체[열 이름의 리스트].corr()

출처 : 파이썬 머신러닝 판다스 데이터 분석

728x90

[Pandas 데이터 분석] Chapter 5 - 데이터 사전 처리 (0)	2022.02.26
[Pandas 데이터 분석] Chapter 3 - 데이터 살펴보기(2) (0)	2022.02.23
[Pandas 데이터 분석] Chapter 2 - 데이터 입출력 (0)	2022.02.21
[Pandas 데이터 분석] Chapter 1 - 판다스 입문(2) (0)	2022.02.16
[Pandas 데이터 분석] Chapter 1 - 판다스 입문(1) (0)	2022.02.14

'CS/Pandas' Related Articles

Comments