여행 갈 때 어디로 가면 좋을까? (여행 선호도 트렌드 분석)
·
데이터분석
1. 배경 이번 분석 주제 선정은 일상속의 약간의 불편함? 답답함?으로 호기심이 생긴 주제로 정해봤습니다. '부모님과 여행 갈 때 어디로 가면 좋을까?', '부모님 연령대가 선호하는 여행지역이 있을까?' 지난달인 4월 둘째주에 엄마랑 둘이서 해외여행을 다녀왔는데, 여행지 고를 때 매우 힘들었던 기억이 있었습니다. 어딘가로 자꾸 떠나고 싶으시던 엄마는 해외여행을 가자고 저에게 이야기를 하셨지만, 막상 어디가고싶냐고 여쭤봤을땐.. 👩: 엄마는 너랑 가면 어디든 좋아~ 👩: 엄마는 너 가고싶은 곳 가도 돼 맞출게~ 👩: 그런데 저번에 누가 여기 다녀왔다던데 좋았다더라~~ 사실 자식이라면 부모님께 좋은 경험이나 좋은 것들을 해주고싶은 마음이 크다보니 부담이 많았어요 🫠 결국 엄마를 잘 만족시키고 싶다라..
DuckDB 개념 및 사용방법 (Python)
·
DATA/Tool
안녕하세요, 이번글은 DuckDB에 대한 설명을 작성했습니다.데이터분석 업무를 하며 로컬 DuckDB를 통해 분석환경을 구축한 경험을 바탕으로 간단한 개념과 사용방법에 대해 다뤄보도록 하겠습니다.DuckDB란 무엇인가?DuckDB는 별도의 서버 설치 없이 로컬 환경에서 즉시 사용 가능한 임베디드 분석용 데이터베이스입니다. 특히 전처리가 완료된 데이터를 로컬에 저장하고 빠르게 조회하여 분석용 데이터 마트를 구축하는 데 적합합니다. 분석가가 반복적으로 사용하는 데이터를 빠르게 접근하고 분석을 수행하는 목적으로 활용됩니다. 분석 전용 데이터베이스 : DuckDB는 애플리케이션(파이썬, R 등) 안에 ‘넣어서’ 바로 사용할 수 있는, 분석용(OLAP) 데이터베이스입니다.설치나 서버 설정이 따로 필요 없음 : 별..
ad hoc : 데이터 분석가의 빠르게 의사결정 지원 하는 법
·
데이터분석
예상독자데이터분석 업무 방식에 대해 알고 싶은 분ad hoc 분석 개념과 실무 적용을 알고 싶은 분ad hoc 데이터 분석 프로세스에 대해 알고싶은 분데이터 기반 의사결정을 해야 하는 비즈니스 직군 (PM, 기획자, 마케터 등)목차1. ad hoc 분석이란?2. ad hoc 분석은 언제 필요한가?3. ad hoc 데이터 분석의 프로세스4. ad hoc 분석 진행 시 고려할 점5. 마치며1. ad hoc 분석이란?ad Hoc는 라틴어로 "이것을 위해"라는 뜻을 가지고 있으며, 주로 특정 목적, 문제, 또는 작업을 위해 설계된 해결책을 의미한다. 한국어로는 임시적, 즉흥적 으로 해석할 수 있다. ad hoc 분석은 특정한 문제나 의사결정을 위해 즉시 수행되는 데이터 분석을 의미한다. 정기 리포트나 대시보드처..
해산물은 언제 먹어야 싸게 먹을 수 있을까? (제철 찾기 프로젝트)
·
데이터분석/Project
이 글은 월간데이터노트 프로젝트의 2월 주제로 작성한 글입니다.  나는 해산물을 아주 좋아한다. 제철에는 그에 맞는 회를 먹어줘야 직성이 풀리는데, 문득 내가 오징어회를 먹은게 언제더라..? 라는 생각이들었다.  오징어회를 안먹게 된 이유는 2가지다.1. 합리적인 가격을 모름2. 언제 먹어야 맛있는지 모름 (제철) 그래서 데이터를 활용해 이를 분석해 보기로 했다. 분석 주제 및 목적가장 많이 팔리는(수요가있는?) 해산물이 무엇인지해산물마다 포획량을 기준으로 제철 시기 알기특정 해산물마다 가장 싸게 먹을 수 있는 시기 데이터 출처데이터는 어떤 데이터를 쓸까 하다가 해양 빅데이터센터의 '위판장 판매 정보'를 가져와서 사용하기로했다.위판장에서 거래된 해산물의 가격과 물량 정보를 통해 분석을 진행했다. Raw ..
비즈니스 분석 보고서 작성 시 고려할 점
·
데이터분석/회고
안녕하세요, 이번글에서는 분석 결과 보고서를 작성할 때 경험했던 내용을 토대로 고려사항을 회고하는 글을 작성하였습니다. 비즈니스 데이터 분석가는 단순히 데이터를 모으고 분석하는 것을 넘어서, 기업 성장에 직접적으로 기여할 수 있는 인사이트를 도출하는 역할을 담당한다. 데이터 분석 보고서는 경영진부터 현업 담당자까지 다양한 사람들이 실제 비즈니스 전략 수립에 활용할 수 있도록 맞춤형으로 구성되어야 한다. 이번 글에서는 비즈니스 성장에 초점을 맞춘 데이터 분석 보고서를 어떻게 작성해야 하는지 단계별로 간단히 살펴보겠다. 목차1. 보고서 작성 목적 명확화2. 보고 형식의 유연성3. 데이터 신뢰성과 KPI 중심의 분석4. 핵심 인사이트 도출과 실행 가능한 전략 제시5. 효과적인 시각화와 스토리텔링1. 보고서 작..
비즈니스 데이터 분석을 위한 데이터마트(Data Mart) 활용법
·
DATA
목차데이터를 제공하는 방법데이터마트(Data Mart)란?데이터마트의 목적 및 특징데이터마트 구축 및 활용 프로세스마무리1. 데이터를 제공하는 방법 비즈니스 데이터분석가의 주요 역할 중 하나는 데이터를 기반으로 인사이트를 제공하고, 이를 통해 비즈니스 성장을 지원하는 것입니다. 문제 해결을 위한 근거를 마련하기 위해 관련 부서의 특정 데이터분석 요청을 처리하거나, 명확한 문제 파악이 어려운 경우 근거 자료를 통해 해결해야합니다. 데이터 제공 방법은 여러 기준으로 분류할 수 있지만, 여기서는 데이터 활용 빈도(필요시점)를 기준으로 분류하겠습니다.즉, 데이터가 일회성, 정기적, 비정기적으로 필요한지에 따라 구분됩니다. 1.1 일회성(ad-hoc) 데이터 추출 및 제공특정 요구에 따라 일회성으로 데이터를 분석..
데이터분석가의 데이터 수집 단계 회고 (feat.데이터분석 하러 왔는데, 데이터를 만들라고요?)
·
데이터분석/데이터 리터러시
데이터 분석 실무를 하면서 데이터 수집과 관련된 내용을 회고형식으로 작성하였습니다. 목차예상독자1. 데이터수집 환경2. 데이터분석을 위한 데이터 수집의 목적3. 데이터수집 해결방법4. 데이터수집 단계에서의 이슈5. 결론 및 마무리 예상독자* 데이터분석가로 이제 막 현업을 시작하는 분* 오프라인 데이터를 다루는 분* 사람이 데이터를 만드는 환경에서 데이터분석을 하는 분* 데이터 구축이 안되어서 힘듦을 겪는 분 * 분석을 지시 받았으나 데이터가 없는 환경에 있는 분 * 데이터분석을 위한 지표를 설정하는 방법에 대해 알고싶은 분 1. 데이터 수집 환경 옛날 옛적 데이터분석 취준할때만해도 데이터 수집에 대한 큰 문제는 없었다.  우선 실무에서 데이터를 다루는 것이 아니다 보니 공공데이터 기반으로 프로젝트를 짤 ..
[BigQuery] 배달 어플리케이션 앱로그 데이터 분석
·
데이터분석/데이터 리터러시
예상독자배열 구조의 앱로그 데이터를 다루고 싶은 사람BigQuery 함수 기반으로 앱로그 데이터를 전처리 방법을 알고 싶은 사람데이터분석의 전반적인 프로세스를 알고 싶은 사람윈도우 함수를 사용하여 데이터집계 쿼리를 작성하고 싶은 사람글을 쓰게 된 배경과 목적이번글은 우선 강의를 들은 내용을 한 번 정리하는 시간을 가지고 싶었다.새로 알게 된 함수위주로 작성하려다가 조금 더 욕심내서 빅쿼리 데이터로 어떻게 데이터분석을 하는지 시각화와 Action item까지 전체적인 프로세스를 정리해 보기로 했다. 글에서 중점적으로 작성할 내용:빅쿼리 환경의 데이터구조 파악하는 방법원하는 형태의 데이터 집계를 위해 어떤 식으로 데이터전처리를 진행하는지빅쿼리 환경에서 사용할 수 있는 함수들의 정의와 용도 쿼리를 통해 나온 ..
Funnel 분석 - 이탈 구간 데이터분석
·
데이터분석/데이터 리터러시
회사에서는 성과가 안나면 문제점을 찾아 개선하려고 노력한다.우리회사에서는 그 첫번째를 고객의 이탈이 어디서 많이 일어나느냐. 즉 이탈율 관리를 가장 먼저한다.반대로 이탈이 적어서 예약율,방문율이 올라간다면 성과로 취급하고 이 성과를 각 부서별 KPI로 관리하고있다.그럴 때 가장 많이 쓰는 방법이 Funnel 분석이다.1. Funnel 분석이란?Funnel 분석은 고객이 최종 목표(방문, 예약, 결제 등)에 도달하는 여정의 각 단계를 추적하여, 이 과정에서 고객이 어디에서 이탈하는지를 파악하는 데이터분석 방법이다. Funnel 분석을 통해 각 단계별 이탈율과 목표 달성율을 분석함으로써, 매출 증대와 마케팅 효율성을 최적화 또는 문제 개선을 할 수 있다. 2. Funnel 분석의 목적Funnel 분석의 가장..
[Python] merge,concat 데이터 join하기(=합치기) feat. 이제 행 중복 오류를 곁들인...
·
DATA/데이터전처리
데이터 전처리를 하다 보면 여러 테이블을 하나의 테이블로 합쳐서 사용하는 경우가 많다. 파이썬에서 데이터프레임을 결합하는 방법은 크게 두 가지, concat과 merge가 있다. 이 두 가지의 차이점과 어떤 상황에서 무엇을 쓰는 게 유리한지,그리고 merge를 사용할 때 행 데이터가 중복으로 나오는 문제의 이유와 해결 방법을 정리해 보려고 한다! 1. concatconcat은 여러 데이터프레임을 축(axis)을 기준으로 결합하는 기능을 제공한다. 주로 데이터프레임을 수직(행 방향) 또는 수평(열 방향)으로 간단하게 연결할 때 사용된다.사용할 때 적합한 경우: 데이터프레임의 구조가 동일하거나 비슷할 때, 즉 같은 열을 가진 여러 데이터프레임을 단순히 이어붙이고 싶을 때 유용하다. 예를 들어, 같은 형식의 ..