본문 바로가기
Big Data/DataAnalysis & Manipulate

DataFrame 인덱싱

by Wikinist 2023. 8. 8.

DataFrame 인덱싱에서 일반적인 인덱싱과 팬시 인덱싱(fancy indexing)의 차이를 비교해드릴게요. 아래 예시를 통해 설명하겠습니다.

가상의 DataFrame을 생성하고 예시를 들겠습니다:

import pandas as pd

data = {'A': [1, 2, 3, 4, 5],
        'B': [10, 20, 30, 40, 50],
        'C': [100, 200, 300, 400, 500]}

df = pd.DataFrame(data, index=['one', 'two', 'three', 'four', 'five'])


일반적인 인덱싱

result_standard = df['A']

result_standard는 다음과 같이 'A' 열의 모든 값을 포함한 Series가 됩니다:

one      1
two      2
three    3
four     4
five     5
Name: A, dtype: int64

팬시 인덱싱

indices = ['one', 'three', 'five']
result_fancy = df.loc[indices, ['A', 'C']]
result_fancy는 선택한 인덱스와 열에 해당하는 부분 DataFrame이 됩니다:

css
Copy code
       A    C
one    1  100
three  3  300
five   5  500

요약하자면, 일반적인 인덱싱은 단일 열 또는 행을 선택하고, 팬시 인덱싱은 여러 개의 행과 열을 선택하는 데 사용됩니다. 팬시 인덱싱은 정수 또는 불리언 값을 사용하여 인덱스를 지정할 수 있습니다. 따라서 팬시 인덱싱을 사용하면 특정 조건에 따라 행과 열을 선택하는 데 유용합니다.

해당 게시글은 ChatGPT의 도움을 받아 작성되었습니다.

'Big Data > DataAnalysis & Manipulate' 카테고리의 다른 글

Tukey 이상치 검출  (0) 2023.08.09
numpy histogram()  (0) 2023.08.08
pandas와 numpy의 var()과 ddof  (0) 2023.08.08
vectorize, apply, map  (0) 2023.08.08
df.describe()  (0) 2023.08.07