DataFrame 인덱싱에서 일반적인 인덱싱과 팬시 인덱싱(fancy indexing)의 차이를 비교해드릴게요. 아래 예시를 통해 설명하겠습니다.
가상의 DataFrame을 생성하고 예시를 들겠습니다:
import pandas as pd
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data, index=['one', 'two', 'three', 'four', 'five'])
일반적인 인덱싱
result_standard = df['A']
result_standard는 다음과 같이 'A' 열의 모든 값을 포함한 Series가 됩니다:
one 1
two 2
three 3
four 4
five 5
Name: A, dtype: int64
팬시 인덱싱
indices = ['one', 'three', 'five']
result_fancy = df.loc[indices, ['A', 'C']]
result_fancy는 선택한 인덱스와 열에 해당하는 부분 DataFrame이 됩니다:
css
Copy code
A C
one 1 100
three 3 300
five 5 500
요약하자면, 일반적인 인덱싱은 단일 열 또는 행을 선택하고, 팬시 인덱싱은 여러 개의 행과 열을 선택하는 데 사용됩니다. 팬시 인덱싱은 정수 또는 불리언 값을 사용하여 인덱스를 지정할 수 있습니다. 따라서 팬시 인덱싱을 사용하면 특정 조건에 따라 행과 열을 선택하는 데 유용합니다.
해당 게시글은 ChatGPT의 도움을 받아 작성되었습니다.
'Big Data > DataAnalysis & Manipulate' 카테고리의 다른 글
Tukey 이상치 검출 (0) | 2023.08.09 |
---|---|
numpy histogram() (0) | 2023.08.08 |
pandas와 numpy의 var()과 ddof (0) | 2023.08.08 |
vectorize, apply, map (0) | 2023.08.08 |
df.describe() (0) | 2023.08.07 |