pandas

[pandas] Data Frame 컬럼, 인덱스, 내용 정보 보기

전감자(◔◡◔) 2022. 10. 2. 15:07

Data Frame 을 통해 확인 할 수 있는 정보는 크게 3가지 이다. 

행( 인덱스 ), 열(컬럼), 그리고 내용(레코드)

'''
  DataFrame 정보보기
  1. 컬럼 정보
    - df.columns
    - df.keys()
  2. 인덱스 정보
    - df.index

  3. 내용 보기
'''

 

dict_value={"c1":[4,5,6],
            "c2":[14,35,26],
            "c3":[43,50,61]}

df=pd.DataFrame(dict_value)
print(df,type(df))#<class 'pandas.core.frame.DataFrame'>
'''
   c1  c2  c3
0   4  14  43
1   5  35  50
2   6  26  61
'''

 

먼저, 위와 같은 DataFrame 이 존재한다고 가정하자. 

 

1.  컬럼 정보 확인하기 

print("1. 컬럼 정보(컬럼 라벨 정보)")
print(df.columns, list(df.columns))
print(df.keys(), list(df.keys()))  

df.colums 와 딕셔너리의 keys() 로 Data Frame 의 컬럼 정보를 리스트의 형태로 받아볼 수 있다.

===>

 

이때 columns 에 ()가 없는 이유는  class  의 property 이기 때문이다. 

 

#Index(['c1', 'c2', 'c3'], dtype='object') ['c1', 'c2', 'c3']

 

2.  인덱스 정보 확인하기

 

print("2. 인덱스 정보(행 라벨 정보")
print(df.index) 

df.index 로 Data Frame 의 인덱스 정보를 리스트의 형태로 받아볼 수 있다.

===> 

 

index 도 마찬가지로 property 여서 괄호가 없다.

RangeIndex(start=0, stop=3, step=1) [0, 1, 2]

 

3. 내용 확인하기 

print("3. 내용보기")
print(df.values, type(df.values))  # <class 'numpy.ndarray'>
print(df.to_numpy())  # 권장함

===>

 

 

values 와 to_numpy() 함수를 이용하여 Data Frame 의 내용을 확인 할 수 있는데

이들은 keys 와 index 와 다르게 내용을 ndarray 로 반환하는 것을 확인할 수 있다

 

그리고 values 보다 to_numpy 함수를 사용하는 것을 권장한다. 

 

'''
[[ 4 14 43]
 [ 5 35 50]
 [ 6 26 61]] <class 'numpy.ndarray'>
[[ 4 14 43]
 [ 5 35 50]
 [ 6 26 61]]
'''