기술통계(Descriptive Statistics)와 추측통계(Inferential Statistics)는 통계학의 두 가지 주요 분야입니다. 각각 데이터의 특성을 요약하고 설명하는 역할과 미래의 불확실성을 예측하거나 결론을 도출하는 역할을 합니다.
1. 기술통계(Descriptive Statistics)
기술통계는 주어진 데이터 집합의 특성을 요약하고 설명하는 통계적 방법을 의미합니다. 주어진 데이터의 중심 경향(평균, 중앙값, 최빈값 등)과 분산(표준편차, 범위 등)을 파악하여 데이터의 전반적인 특성을 이해하는 데 사용됩니다. 기술통계는 데이터를 직관적으로 이해하고 요약함으로써 데이터의 기본적인 패턴과 특징을 파악하는 데 도움을 줍니다.
주요 기술통계 개념
평균(Mean): 모든 값의 합을 개수로 나눈 값으로, 데이터의 중심 경향을 나타냅니다.
중앙값(Median): 데이터를 크기 순서대로 정렬했을 때 가운데 값으로, 데이터의 중심 경향을 나타냅니다.
최빈값(Mode): 가장 자주 나타나는 값으로, 데이터의 빈도를 나타냅니다.
표준편차(Standard Deviation): 데이터의 분산 정도를 나타내는 값으로, 데이터의 퍼짐 정도를 나타냅니다.
2. 추측통계(Inferential Statistics)
추측통계는 표본 데이터를 기반으로 모집단 전체에 대한 결론을 도출하고 미래의 불확실성을 예측하는 통계적 방법을 의미합니다. 모집단 전체 데이터에 접근할 수 없을 때, 표본을 사용하여 모집단에 대한 추론을 수행합니다. 추측통계는 가설 검정, 신뢰구간 등을 통해 데이터의 불확실성을 다루고, 결과를 통계적으로 유의미한 결론으로 일반화하는 데 사용됩니다.
주요 추측통계 개념
가설 검정(Hypothesis Testing): 표본 데이터를 사용하여 모집단에 대한 가설을 평가하고 검정하는 프로세스입니다.
신뢰구간(Confidence Interval): 표본을 사용하여 모수(모집단의 특성)에 대한 구간 추정치를 계산하는 방법입니다.
회귀 분석(Regression Analysis): 변수들 간의 관계를 분석하여 한 변수가 다른 변수에 미치는 영향을 추정합니다.
표본추출 및 표본분포: 모집단에서 표본을 추출하여 통계적 추론을 수행하는 기초적인 개념입니다.
기술통계는 데이터의 특성을 요약하고 설명하는 데 사용되며, 추측통계는 표본 데이터를 기반으로 모집단에 대한 추론과 결론을 도출하는 데 사용됩니다.
해당 게시글은 ChatGPT의 도움을 받아 작성되었습니다.
'Big Data > Math' 카테고리의 다른 글
통계에서의 정규화 (0) | 2023.08.08 |
---|---|
4분위수(Quartiles) (0) | 2023.08.07 |
연속형 / 이산형 변수 (0) | 2023.08.07 |
불편 표준편차 & 불편 분산 (0) | 2023.08.07 |
모수와 통계량 (0) | 2023.08.07 |