본문 바로가기

정규화3

다중 선형 회귀와 절차 다중 선형 회귀 다중 선형 회귀는 하나의 종속 변수(Y)와 둘 이상의 독립 변수(X1, X2, ..., Xn) 간의 선형 관계를 모델링하는 통계적 기법입니다. 다중 선형 회귀는 종속 변수와 독립 변수 간의 선형 관계를 활용하여 종속 변수의 예측 또는 설명을 위해 사용됩니다. 일반적으로 다중 선형 회귀의 모델 형태는 다음과 같습니다: 다중 선형 회귀 분석은 주어진 독립 변수들의 값과 종속 변수 사이의 관계를 통계적으로 모델링하는 것입니다. 회귀 계수 β1,β2,...,βn는 각 독립 변수들이 종속 변수에 미치는 영향을 나타냅니다. 이러한 회귀 계수들을 추정하기 위해 최소 제곱법(Least Squares Method)을 사용하여 모델을 훈련시킵니다. 최소 제곱법은 실제 값과 모델 예측 값 사이의 잔차(오차).. 2023. 8. 29.
통계에서의 정규화 통계에서의 "정규화"는 다양한 의미를 가지고 있는데, 주로 두 가지 주요 의미로 사용됩니다. 첫 번째로는 데이터를 표준화하거나 스케일링하여 분석을 용이하게 만드는 과정을 의미하며, 두 번째로는 확률 분포를 따르는 데이터를 변환하여 정규분포(가우시안 분포)를 따르도록 하는 과정을 의미합니다. 데이터 스케일링 및 표준화 데이터 정규화의 첫 번째 의미는 데이터의 범위를 조절하여 분석을 쉽게 할 수 있도록 만드는 과정을 의미합니다. 주로 다음과 같은 방법들로 이루어집니다. Min-Max Scaling (최소-최대 스케일링): 데이터의 최소값을 0, 최대값을 1로 매핑하여 데이터를 0과 1 사이의 범위로 스케일링합니다. 공식은 다음과 같습니다: ​ Z-Score Scaling (Z-점수 표준화): z-score를.. 2023. 8. 8.
정규화(Normalization) 정규화(Normalization)는 관계형 데이터베이스에서 데이터를 구조화하는 프로세스로서, 중복을 최소화하고 데이터의 일관성과 무결성을 보장하기 위해 데이터를 여러 개의 테이블로 분할하는 작업을 말합니다. 정규화는 데이터의 논리적 설계 단계에서 주로 이루어지며, 데이터베이스의 성능과 유지보수를 향상시키는 데 도움이 됩니다. 여러 개의 정규화 레벨이 존재하며, 보통 1차 정규화부터 5차 정규화까지 있습니다. 높은 정규화 레벨은 데이터의 중복을 최소화하고 데이터의 일관성을 보장하는 대신, 데이터를 검색하는데 더 많은 조인 작업이 필요할 수 있습니다. 정규화 레벨은 프로젝트의 요구사항과 성능을 고려하여 결정해야 합니다. 1차 정규화 (1NF) 테이블의 모든 속성이 원자값(Atomic Value)을 가지도록 .. 2023. 7. 24.