KT서부산지사(근처에 맛집이 많아서 행복했습니다)
첫 대면 미프를 하러갑니다
1일차
진심이 느껴지는 메일(내용과 메일주소는 지웠습니다!)
저희는 파인애플 대리님께 이번에 계단 오르기 데이터를 추출해서 메일을 회신해야 했습니다!
실제 대리님께서 캠에 깜짝 등장하셔서 이번 프로젝트에 대해 설명해주셨습니다
(저희를 위해 과몰입해주시는 담당자님...)
os 모듈 함수 불러오기
import os
현재 디렉토리 위치 확인
os.getcwd()
하위 dir 폴더 내 파일 확인
os.listdir('./dir')
고유한한 값(범주)별 비율 확인(범주 비율 = 개별 범주 개수 / 전체 범주의 수 )
Df['columns'].value_counts(normalize=True)
데이터프레임의 기초 정보(컬럼명, 데이터 개수, 데이터 타입)
# 너무 길면 info()에서 잘려서 나옴
# 다음과 같은 파라미터를 적어주면 전체 column이 출력됨
data.info(verbose=True, null_counts=True)
2일차
f1_score 평균 나타내기
# 매크로 평균을 나타냄
f1_score(y_val, cvc_pred, average = 'macro')
🤔중요도 상위 95개의 Features 선별 학습에서 x_train만 상위 95에 대해 자르고, y_train의 개수는 그대로인데 학습할 때 에러가 나지않는 이유가 궁금합니다!
DataFrame_Top_50 = DataFrame['기준열'][:95]
상위 95개라는 의미는 상위 95개의 컬럼을 남긴다는 의미이며 행수와는 상관이 없습니다.
🤔loc 헷갈려요
DataFrame.loc[i]
- loc 함수를 사용하여 DataFrame의 인덱스 i에 해당하는 '행'에 결과값을 저장.
DataFrame[i]
- DataFrame의 열 이름 i에 해당하는 '열'에 결과값 저장.
DataFrame[[i]]
- DataFrame의 인덱스와 열 이름으로 이루어진 행렬 표기법을 사용하여, 'i'에 해당하는 열에 결과값을 저장.
2번과 동일한 방식이지만 '[[i]]'와 같이 두개의 대괄호가 사용 되어 열을 하나의 DataFrame으로 저장합니다.
GirdSearchCV 실행하면서 결과 표시
⭐verbose = 2
gs_xgb_model = GridSearchCV(estimator=xgb_model, param_grid=params, cv = 3, verbose=2)
3일차
마지막 날은 드디어 대망의 S대리님께 메일을 보내는 날입니다!
다들 정말 보내는건지 홈페이지에 제출하는건지 헷갈려했는데 정말 메일 전송하는게 맞았습니다
넵~!
이렇게 회신까지 마치면 이번 미니 프로젝트는 끝이 났습니다!
💙회고
첫 대면이었는데 저희 조는 모든 팀원분들이 다 오셨고, 분위기도 엄청 화기애애했습니다.😊💕💕💕
특히나 근처에 맛집이 많았어서 11시부터 팀원들과 점심 메뉴 고르는 시간이 엄청 행복했습니다
근처에서 일을 하셨던 에이블러님께서 이렇게 저희를 위해서 맛집을 정리해서 공유해주셔서 더더욱 행복했어요