DataFrame 인덱싱
DataFrame 인덱싱에서 일반적인 인덱싱과 팬시 인덱싱(fancy indexing)의 차이를 비교해드릴게요. 아래 예시를 통해 설명하겠습니다. 가상의 DataFrame을 생성하고 예시를 들겠습니다: import pandas as pd data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50], 'C': [100, 200, 300, 400, 500]} df = pd.DataFrame(data, index=['one', 'two', 'three', 'four', 'five']) 일반적인 인덱싱 result_standard = df['A'] result_standard는 다음과 같이 'A' 열의 모든 값을 포함한 Series가 됩니다: one 1 two 2 thre..
2023. 8. 8.
4분위수(Quartiles)
4분위수(Quartiles) 4분위수(Quartiles)는 데이터를 일정한 구간으로 나누는데 사용되는 통계적 개념입니다. 데이터셋을 정렬하면 첫 번째 분위수(Q1), 두 번째 분위수(Q2, 중앙값), 세 번째 분위수(Q3)로 나뉩니다. 이를 이용하여 데이터의 분포를 파악하고 이상치(outlier)를 탐지하는데 활용됩니다. 첫 번째 분위수(Q1, 25% 백분위수, 1st quartile): 데이터를 작은 값에서 큰 값으로 정렬했을 때, 전체 데이터의 25% 지점에 위치한 값입니다. 이 값은 데이터의 하위 25% 범위를 의미하며, 데이터의 하위 25%가 이 값보다 작거나 같습니다. 두 번째 분위수(Q2, 50% 백분위수, Median, 2nd quartile): 데이터를 작은 값에서 큰 값으로 정렬했을 때,..
2023. 8. 7.