❌❌절대 안 됩니다❌❌ 어느 데이터가 test 데이터로 갈지 모르기 때문에 train데이터와 test데이터를 분리 후 정규화 작업을 해줘야 합니다.
1. 규칙을 만들 때 미래의 데이터에 영향이 가면 안 됩니다. 2. 미래의 데이터에 따라 규칙이 변하면 안 됩니다.
가변수 한 것도 정규화하기!!!!
정규화 이전 값 확인
# 정규화 이전 값 확인
scaler.inverse_transform(x_train)
🤔표준화와 정규화가 뭐가 다른가요?
표준화(Standardization)와 정규화(Normalization)는 데이터 전처리 과정에서 사용되는 방법들 중 하나입니다. 이 두 방법은 데이터의 스케일을 조정하는 것이 목적입니다.
표준화는 데이터의 평균과 표준편차를 이용하여 데이터를 변환하는 방법입니다. 표준화를 통해 데이터의 평균은 0, 표준편차는 1이 되도록 스케일링됩니다. 표준화는 이상치(outlier)가 있는 데이터에 대해서도 적용하기 쉽습니다. 예를 들어, 나이와 소득 데이터가 있을 때, 표준화를 통해 나이와 소득 데이터를 동일한 스케일로 변환할 수 있습니다.
정규화는 데이터의 최솟값과 최댓값을 이용하여 데이터를 변환하는 방법입니다. 정규화를 통해 데이터의 최솟값은 0, 최댓값은 1이 되도록 스케일링됩니다. 정규화는 데이터의 분포가 균등하게 분포되어 있는 경우에 사용하기 적합합니다. 예를 들어, 이미지 데이터에서 각 픽셀의 값을 0~255 범위에서 0~1 범위로 정규화할 수 있습니다.
따라서, 표준화와 정규화의 차이점은 데이터를 스케일링하는 방식에 있습니다. 표준화는 평균과 표준편차를 이용하여 스케일링하며, 정규화는 최솟값과 최댓값을 이용하여 스케일링합니다.