sliver__

[Pandas 기초] DataFrame(데이터프레임) 본문

CS/Pandas

[Pandas 기초] DataFrame(데이터프레임)

sliver__ 2022. 3. 5. 14:07
728x90

[데이터프레임]

  • 2차원 배열이다.
  • 데이터프레임의 열은 각각 시리즈 객체이다.

  • 데이터프레임은 행과 열을 나타내기 위해 두 종류의 주소를 사용한다.
    • 행 인덱스
    • 열 이름

 


  • 딕셔너리 -> 데이터프레임
#딕셔너리 -> 데이터프레임 변환
pandas.DataFrame(딕셔너리 객체)

 

  • 행 인덱스/ 열 이름 설정
#행 인덱스/열 이름 설정
pandas.DataFrame(2차원 배열, index = 행 인덱스 배열, columns = 열 이름 배열)

 

  • 행 인덱스 / 열 이름 변경
#행 인덱스 변경
DataFrame 객체.index = 새로운 행 인덱스 배열
DataFrame 객체.columns = 새로운 열 이름 배열

 

  • 원하는 인덱스 변경
#행 인덱스 변경
DataFrame 객체.rename(index = {'기존 인덱스 : 새 인덱스',...})

#열 이름 변경
DataFrame 객체.rename(columns = {'기존 인덱스 : 새 인덱스',...})

 

 

  • 행/열 삭제
#행 삭제
DataFrame 객체.drop(행 인덱스 또는 배열, axis=0)

#열 삭제
DataFrame 객체.drop(열 이름 또는 배열, axis=1)

 

  • 행 선택
구분 loc iloc
탐색 대상 인덱스 이름(index label) 정수형 위치 인덱스(integer position)
범위 지정 기능(범위의 끝 포함)
['a':'c'] -> 'a','b','c'
기능(범위의 끝 제외)
[3:7] -> 3,4,5,6
사용 예시 df.loc[[리스트]] 
df.loc[시작:끝]
df.iloc[[리스트]] 
df.iloc[시작:끝

 

  • 열 선택ㅇㅇ
# 열 1개 선택
DataFrame 객체["열 이름"] 
DataFrame 객체.열 이름

# 여러 열 선택
DataFrame 객체 [[리스트]]

 

  • 범위 슬라이싱
DataFrame 객체.iloc[시작 인덱스 : 끝 인덱스 : 슬라이싱 간격]

 

  • 원소 선택
#인덱스 이름
DataFrame 객체.loc[행 인덱스 ,열 이름]

#정수 위치 인덱스
DataFrame 객체.iloc[행 번호, 열 번호]

#리스트 접근
DataFrame 객체.loc [[리스트], [리스트]]
DataFrame 객체.iloc[[리스트], [리스트]]

 

  • 열 추가
DataFrame 객체['추가하려는 열 이름'] = 데이터 값

 

  • 행 추가
DataFrame.loc['새로운 행'] = 데이터

 

  • 행 / 열 바꾸기
#행, 열 객체
DataFrame 객체.transpose() 또는 DataFrame.T
728x90
Comments