IT/SQL
-
6.11. 6장 16강 입력 양식 최적화하기 1절. 오류율 집계하기 페이지 이용 시 오류가 발생할 수 있고, 이에 사용자가 대처할 수 있도록 오류 정보를 같은 URL에 재출력하거나 새로운 창을 띄워 알립니다. 그 방식의 적절함을 판단하기 위해 오류율을 집계합니다 16-1. 확인 화면에서의 오류율 집계하기 코드 SELECT count(*) AS confirm_count , sum(CASE WHEN status = 'error' THEN 1 ELSE 0 END ) AS error_count --error면 1, 아니면 0, 합계하면 오류 횟수 , avg(CASE WHEN status = 'error' THEN 1.0 ELSE 0.0 END ) AS error_rate -- 위의 값을 평균내면 오류율 , su..
[데이터 분석을 위한 SQL 레시피] 6장 16강 입력 양식 최적화하기6.11. 6장 16강 입력 양식 최적화하기 1절. 오류율 집계하기 페이지 이용 시 오류가 발생할 수 있고, 이에 사용자가 대처할 수 있도록 오류 정보를 같은 URL에 재출력하거나 새로운 창을 띄워 알립니다. 그 방식의 적절함을 판단하기 위해 오류율을 집계합니다 16-1. 확인 화면에서의 오류율 집계하기 코드 SELECT count(*) AS confirm_count , sum(CASE WHEN status = 'error' THEN 1 ELSE 0 END ) AS error_count --error면 1, 아니면 0, 합계하면 오류 횟수 , avg(CASE WHEN status = 'error' THEN 1.0 ELSE 0.0 END ) AS error_rate -- 위의 값을 평균내면 오류율 , su..
2023.06.19 -
1절. 입구 페이지와 출구 페이지 파악하기 💡 입구 페이지 = 사이트에 방문했을 때 처음 접근한 페이지 접근 분석 도구에 따라서는 랜딩 페이지라고도 부름. 출구 페이지 = 마지막 접근한 페이지, 이탈한 페이지 접근 분석 도구에 따라서는 이탈 페이지라고도 부름. 코드15-1. 각 세션의 입구 페이지와 출구 페이지 경로를 추출하는 쿼리 WITH activity_log_with_landing_exit AS( select session ,path ,stamp ,first_value(path) over( partition by session order by stamp asc rows between unbounded preceding and unbounded following ) as landing ,last_va..
[데이터 분석을 위한 SQL 레시피] 6장 15강 사이트 내의 사용자 행동 파악하기1절. 입구 페이지와 출구 페이지 파악하기 💡 입구 페이지 = 사이트에 방문했을 때 처음 접근한 페이지 접근 분석 도구에 따라서는 랜딩 페이지라고도 부름. 출구 페이지 = 마지막 접근한 페이지, 이탈한 페이지 접근 분석 도구에 따라서는 이탈 페이지라고도 부름. 코드15-1. 각 세션의 입구 페이지와 출구 페이지 경로를 추출하는 쿼리 WITH activity_log_with_landing_exit AS( select session ,path ,stamp ,first_value(path) over( partition by session order by stamp asc rows between unbounded preceding and unbounded following ) as landing ,last_va..
2023.06.19 -
시계열에 따른 사용자의 개별적인 행동 분석하기 사용자가 최종 성과(=결과)에 도달할 때까지 어느 정도의 검토기간(=과정)이 필요한지를 알면, 대책을 세울 수 있다. 사용자 액션을 ‘시간의 경과’라는 요소와 함께 고려해서 시각화하면 행동 패턴 등을 명확하게 할 수 있다. 13-1. 사용자의 액션 간격 집계하기 💡 SQL : 날짜함수, LAG 함수, datediff 분석 : 리드 타임 🔖 리드 타임을 집계했다면 사용자의 데모그래픽 정보를 사용해 비교해보기를 바랍니다. EC사이트라면 수도권보다 지방이 이전 구매일로부터의 리드 타임이 짧거나, 연령별로 구분이 되는 등 다양한 정향이 나타날 것입니다. 리드타임 실제 계약까지의 기간 → → → 리드타임 🔽 → 계약이 더 많이 일어남 → 매출 📈 같은 레코드에 있는 ..
[데이터 분석을 위한 SQL 레시피] 6장 13강,14강시계열에 따른 사용자의 개별적인 행동 분석하기 사용자가 최종 성과(=결과)에 도달할 때까지 어느 정도의 검토기간(=과정)이 필요한지를 알면, 대책을 세울 수 있다. 사용자 액션을 ‘시간의 경과’라는 요소와 함께 고려해서 시각화하면 행동 패턴 등을 명확하게 할 수 있다. 13-1. 사용자의 액션 간격 집계하기 💡 SQL : 날짜함수, LAG 함수, datediff 분석 : 리드 타임 🔖 리드 타임을 집계했다면 사용자의 데모그래픽 정보를 사용해 비교해보기를 바랍니다. EC사이트라면 수도권보다 지방이 이전 구매일로부터의 리드 타임이 짧거나, 연령별로 구분이 되는 등 다양한 정향이 나타날 것입니다. 리드타임 실제 계약까지의 기간 → → → 리드타임 🔽 → 계약이 더 많이 일어남 → 매출 📈 같은 레코드에 있는 ..
2023.06.19 -
6. 사용자의 잔존율 집계하기 💡 가로 축에 등록일, 세로 축에 해당 월의 서비스 사용자 수를 집계하는 표의 장점 이전과 비교해 n개월 후의 잔존율이 내려갔다면? 신규 등록자가 서비스를 사용하기 위한 장벽이 높아지지는 않았는지 확인하기 n개월 후에 잔존율이 갑자기 낮아지는 경향이 있다면? 서비스의 사용 목적을 달성하는 기간이 예상보다 너무 짧지는 않은지 확인하기 오래 사용하던 사용자인데도 특정 월을 기준으로 사용하지 않게 되었다면? 사용자가 서비스 내부에서의 경쟁 등으로 빨리 지친 것은 아닌지 확인하기 코드 12-21. 12개월 후까지의 월을 도출하기 위한 보조 테이블을 만드는 쿼리 WITH mst_intervals(interval_month) AS ( -- 12개월 동안의 순번 만들기(generate_..
[데이터 분석을 위한 SQL 레시피] 5장 12강 시계열에 따른 사용자 전체의 상태 변화 찾기_part2(p.275~p.302)6. 사용자의 잔존율 집계하기 💡 가로 축에 등록일, 세로 축에 해당 월의 서비스 사용자 수를 집계하는 표의 장점 이전과 비교해 n개월 후의 잔존율이 내려갔다면? 신규 등록자가 서비스를 사용하기 위한 장벽이 높아지지는 않았는지 확인하기 n개월 후에 잔존율이 갑자기 낮아지는 경향이 있다면? 서비스의 사용 목적을 달성하는 기간이 예상보다 너무 짧지는 않은지 확인하기 오래 사용하던 사용자인데도 특정 월을 기준으로 사용하지 않게 되었다면? 사용자가 서비스 내부에서의 경쟁 등으로 빨리 지친 것은 아닌지 확인하기 코드 12-21. 12개월 후까지의 월을 도출하기 위한 보조 테이블을 만드는 쿼리 WITH mst_intervals(interval_month) AS ( -- 12개월 동안의 순번 만들기(generate_..
2023.06.17 -
💡 사용자의 서비스 사용 시계열로 수치화하고 변화를 시각화하는 방법을 소개 샘플데이터 사용자 마스터(mst_users) withdraw_date : 탈퇴일 CREATE TABLE mst_users( user_id STRING, sex CHAR(1), birth_date DATE, register_Date DATE, register_device STRING, withdraw_date DATE ) 액션 로그(action_log) CREATE TABLE action_log( session STRING, user_id STRING, action STRING, stamp DATETIME ) 1. 등록 수의 추이와 경향 보기 💡 SQL : COUNT(DISTINCT ~) 분석 : 등록수, 작대비 등록자가 ⬇️ ⇒ ..
[데이터 분석을 위한 SQL 레시피] 5장 12강 시계열에 따른 사용자 전체의 상태 변화 찾기_part1(p.233~p.275)💡 사용자의 서비스 사용 시계열로 수치화하고 변화를 시각화하는 방법을 소개 샘플데이터 사용자 마스터(mst_users) withdraw_date : 탈퇴일 CREATE TABLE mst_users( user_id STRING, sex CHAR(1), birth_date DATE, register_Date DATE, register_device STRING, withdraw_date DATE ) 액션 로그(action_log) CREATE TABLE action_log( session STRING, user_id STRING, action STRING, stamp DATETIME ) 1. 등록 수의 추이와 경향 보기 💡 SQL : COUNT(DISTINCT ~) 분석 : 등록수, 작대비 등록자가 ⬇️ ⇒ ..
2023.06.17 -
💡 사용자의 속성 또는 행동과 관련된 정보를 집계해서 사용자 행동을 조사하고, 서비스를 개선할 때 실마리가 될 수 있는 리포트를 만드는 SQL을 학습. 사용 데이터 mst_users: 사용자 마스터 테이블 —> 기준 column은 user_id(사용자) action_log: 사용자 로그 테이블 —> 기준 column은 session(각 접속 시기) 11-1. 사용자의 액션 수 집계하기 액션과 관련된 지표 집계하기 사용자들이 특정 기간 동안 기능을 얼마나 사용하는지 집계. 사용률(usage_rate)과 1명당 액션 수(count_per_user)를 계산 code 11-1.(액션 수와 비율을 계산하는 쿼리) WITH stats AS ( -- 로그 전체의 유니크 사용자 수 구하기 SELECT COUNT(DIS..
[데이터 분석을 위한 SQL 레시피] 5장 11강. 사용자 전체의 특징과 경향 찾기💡 사용자의 속성 또는 행동과 관련된 정보를 집계해서 사용자 행동을 조사하고, 서비스를 개선할 때 실마리가 될 수 있는 리포트를 만드는 SQL을 학습. 사용 데이터 mst_users: 사용자 마스터 테이블 —> 기준 column은 user_id(사용자) action_log: 사용자 로그 테이블 —> 기준 column은 session(각 접속 시기) 11-1. 사용자의 액션 수 집계하기 액션과 관련된 지표 집계하기 사용자들이 특정 기간 동안 기능을 얼마나 사용하는지 집계. 사용률(usage_rate)과 1명당 액션 수(count_per_user)를 계산 code 11-1.(액션 수와 비율을 계산하는 쿼리) WITH stats AS ( -- 로그 전체의 유니크 사용자 수 구하기 SELECT COUNT(DIS..
2023.06.17 -
5.16_4장 9강, 10강 📌 4장의 목표 : 웹사이트, 각종 서비스의 상태를 파악할 때 굉장히 중요한 매출 파악하기 위한 SQL을 알아보자. 9. 시계열 기반으로 데이터 집계하기 목표 : 웹사이트 또는 서비스의 상태를 파악할 때 굉장히 중요한 작업인 시계열 데이터를 알아보자! 💡 시계열 데이터란? 일정한 시간 간격으로 측정되었거나 특정 시간 간격으로 수집된 주기적인 시간 간격을 따른다. 즉, 시계열은 단순히 시간에 따라 정렬된 일련의 데이터 지점이며 시계열 분석은 이 데이터를 이해하는 프로세스이다. 💡 시계열 데이터의 장점 현재 데이터와 과거 데이터를 비교하고, 변칙 현상을 검색하고, 실시간 경고를 생성 가능 과거 추세를 시각화할 수 있음. 시계열 분석은 예측 모델링 및 결과 예측에도 매우 적합. 많..
[데이터 분석을 위한 SQL 레시피] 4장 9강, 10강5.16_4장 9강, 10강 📌 4장의 목표 : 웹사이트, 각종 서비스의 상태를 파악할 때 굉장히 중요한 매출 파악하기 위한 SQL을 알아보자. 9. 시계열 기반으로 데이터 집계하기 목표 : 웹사이트 또는 서비스의 상태를 파악할 때 굉장히 중요한 작업인 시계열 데이터를 알아보자! 💡 시계열 데이터란? 일정한 시간 간격으로 측정되었거나 특정 시간 간격으로 수집된 주기적인 시간 간격을 따른다. 즉, 시계열은 단순히 시간에 따라 정렬된 일련의 데이터 지점이며 시계열 분석은 이 데이터를 이해하는 프로세스이다. 💡 시계열 데이터의 장점 현재 데이터와 과거 데이터를 비교하고, 변칙 현상을 검색하고, 실시간 경고를 생성 가능 과거 추세를 시각화할 수 있음. 시계열 분석은 예측 모델링 및 결과 예측에도 매우 적합. 많..
2023.06.17 -
문제링크 : https://www.hackerrank.com/challenges/harry-potter-and-wands/problem?isFullScreen=true ❓문제 Harry Potter and his friends are at Ollivander's with Ron, finally replacing Charlie's old broken wand. Hermione decides the best way to choose is by determining the minimum number of gold galleons needed to buy each non-evil wand of high power and age. Write a query to print the id, age, coins_need..
[해커랭크] Ollivander's Inventory문제링크 : https://www.hackerrank.com/challenges/harry-potter-and-wands/problem?isFullScreen=true ❓문제 Harry Potter and his friends are at Ollivander's with Ron, finally replacing Charlie's old broken wand. Hermione decides the best way to choose is by determining the minimum number of gold galleons needed to buy each non-evil wand of high power and age. Write a query to print the id, age, coins_need..
2023.04.08