본문 바로가기

반응형

데이터분석 #데이터분석부트캠프 #패스트캠퍼스 #패스트캠퍼스부트캠프 #패스트캠퍼스데이터분석부트캠프

[13주차] 태블로 입문2 Day1차트 시각화 표현 방식 활용: 사용할 값들을 ctrl을 통해 전부 선택: 표현 방식에서 사용하고자 하는 표현 방식 선택 통합서식을 활용한 눈금선 지우기 선 그래프에서 마지막 숫자만 보이게 하기: 레이블 마크에서 '가장 최근' 설정: 필요한 방식대로 레이블 마크에서 수정 스캐터플롯: 상관관계를 시각화하는 그래프 박스플롯: IQR*1.5의 범위 바깥에 있는 수치 - 이상치: 이상치 - 평균이나 중앙값과 비교했을 때 너무 높거나/낮은 값: 박스플롯은 이상치를 판단하기에 좋은 시각화 히스토그램: 이상치를 포함해 전체적인 분포를 확인할 수 있음     Day2기본 차트 그리기 에어리어 차트: 누적형 차트 트리맵: 사각형의 형태로 컬럼별 비율을 시각화하는 데 유용한 차트 박스 플랏과 이상치: 값 분포 현황,.. 더보기
[12주차] 생성형 AI, 태블로 입문 Day1생성형 AI 서비스 활용하기 소스코드나 데이터 유출이 되지 않게 질문하는 방법: 자체 생성형 AI 사용: 가짜 데이터셋을 생성, 예시 데이터셋을 기반으로 분석 후 이를 활용 무료 버전을 유료 버전처럼 보여주려면: 활용할 데이터의 일부를 보여주고 이를 기반으로 분석 진행 Google Gemini: Google gemini 를 검색창에서 바로 사용하기 => 실험실 기능: 다양한 정보 및 플렛폼 기반의 정확한 정보를 찾는데 유용   - ex) 구글 지도, 구글 항공편 검색  이미지 생성형 AI를 통한 이미지 생성 및 묘: google gemini 로 마음에 드는 이미지를 라디오로 설명한다 가정하고 설명을 작성하라고 함: 해당 설명으로 이미지를 생성: gemini와 bing creator, chatgpt.. 더보기
[10-11주차] SQL 프로젝트 Day2실습 첫날_데이터 둘러보기, 전처리 전체적인 테이블과 컬럼 확인 후 각자 분석을 시도함.나는 2017년도 11월의 olist_eccomerce 매출 데이터가 유난히 높은 걸 확인한 후 이를 중점으로 원인 분석을 시도함. 그러나 원인은 데이터 내부가 아닌 바깥에 있었고~(블랙 프라이데이)내 데이터는 그렇게 휴지쪼가리가 되어 날아간 뒤 다른 팀원들의 데이터 분석에 추가로 살을 덧대는 분석을 하였다.     Day3도메인 분석 및 발표 자료 제작 부제: 스스로 불러온 재앙에 짓눌려 a.k.a. 복면가왕 이튿날에는 전날 하지 못한 도메인 분석을 하고 이와 분석 결과를 취합해 발표자료를 만들기로 했다.그러나 olist와 브라질에 대해 조사할 수록 뭔가 이건 아닌데..? 싶은 생각이 들었다.이유는 별 거 없.. 더보기
[9주차] SQL 입문2 Day1실무에서 SQL 활용하기 실무 문제풀이_1: 2020년 7월 가장 많이 구매한 10위-15위 고객  - SELECT customer_id, SUM(price) AS rev FROM tbl_purchase    WHERE purchased_at LIKE '2020-07%' GROUP BY customer_id    LIMIT 6 OFFSET 9    → LIMIT n OFFSET x : x개를 넘기고 x+1개째부터 n개의 결과값만 리턴 실무 문제풀이_2: 성별과 연령을 합친 컬럼을 만든 후 유저 세그먼트 및 비율 구하기  - SELECT CONCAT(    CASE WHEN LENGTH(gender)    WHEN gender='F' THEN '여성'    ELSE '남성' END,    '(', .. 더보기
[8주차] SQL 입문2 DAY1 현직자가 이야기하는 업계와 데이터 분석가업계 인재상 데이터 분석가: 문과적 분석, 이해, 표현, 자기주도 역량에 이과적 기술 역량을 합친 복합적인 포지션: 자기주도적 역량 필요: SQL 현장 강의 목표 - 자기주도적 사고 하에 문제를 해결하는 역량 기르기: HOW? - SQL을 배우고 코딩테스트, 실무 분석 연습을 통해 확고한 기본 기술 역량 구축 진짜 전문가가 되기 위한 과정: 스스로 이슈 해결하기 - 구글 검색, 챗GPT 적극 활용.: 스스로 문제 정의하고 해결하기   RDBMS(Relational Database Management System) 데이터베이스: 체계화된 데이터의 모임으로, 여러 응용 시스템들의 정보를 저장하고 운영할 수 있는 공용 데이터 묶음 : 논리적으로 연관된 하나 이상.. 더보기
[7주차]SQL 입문 Day1데이터베이스 다루기 데이터 종류 알아보기: 문자형  - 텍스트로 구성된 문자형 데이터  - 반드시 따옴표와 사용해야 함. 안 그러면 키워드나 함수, 데이터베이스/테이블/컬럼의 이름으로 인식.  - CHAR(n) : 고정 길이 문자열. 정해진 만큼의 공간을 모두 사용.  - VARCHAR(n) : 변동 길이 문자형. 필요한 만큼의 공간만 사용.  - n은 사용할 저장공간을 바이트 수로 표기한 숫자.: 숫자형  - 정수형(소수점x) : 바이트에 따라 표현할 수 있는 숫자의 범위가 달라짐. 주 사용 타입은 INT  - 실수형(소수점ㅇ) : 주 사용 타입은 FLOAT.  - 데이터 간 연산 가능: 날짜형  - 날짜와 시간 데이터: 데이터를 저장하기 전에 데이터의 타입을 정하지 않으면 저장 불가능 기본적인.. 더보기
[5주차] 파이썬 실습2 및 1차 미니 프로젝트 Day1와인 데이터 분석 실습 데이터 로드: import pandas as pd: df=pd.read_csv('winequality.csv')기본 정보 확인: df.info()와 df.describe() 이용 질문거리 생각: 레드 와인과 화이트 와인의 개수  - df_redwine=df[df['type']=='red']   - df_whitewine=df[df['type']=='white']: 두 와인의 평균 등급  - df_redwine['quality'].mean()   - df_whitewine['quality'].mean(): 와인의 최상위 등급이 9등급이라는 가정 하의 와인 정렬  - df['quality'].unique() : 3등급~9등급의; 와인 존재 확인  - df['quality'].v.. 더보기
[4주차] 파이썬 기초2 및 실습 Day1Ch02. 파이썬을 이용한 데이터 분석 - 02.데이터 시각화 plotly 이해하기: 인터랙티브한 그래프를 그릴 수 있는 라이브러리: 인터랙티브한 그래프를 html로 저장하기 용이*인터랙티브하다: 그래프에 커서를 대면 값에 대 설명이 나옴: 기본 문법  - fig = px.그래프종류(data_frame=데이터, x=X축 컬럼, y=Y축 컬럼, color=범례 컬럼, title=제목,                  labels=dict(X축 컬럼=X축 라벨, Y축 컬럼=Y축 라벨),                  width=그래프 가로길이, height=그래프 세로길이, text_auto=True/False) fig.show()  - 문법 수식 안에 추가하여 사용하기 좋은 것들    - barmod.. 더보기

반응형