본문 바로가기
반응형

데이터 사이언스6

기초통계학 | 4. 분할표, 비교그림, 산점도, 공분산 & 상관계수 1. 분할표 (Cotingency table)- 2개 이상의 변수 간 관계를 표현- 각 변수 값에 따라 교차된 빈도를 나타내며, 범주형 데이터 간 관계를 분석할 때 사용    1. 분할표 (Cotingency table)- 2개 이상의 변수를 동시에 고려해  각각의 범주에 관측개체의 빈도를 정리한 교차표 (Cross tabulation) - 칸(Cell) : 각 범주에 교차되는 부분- 행(Row) : 하나의 변수의 범주들- 열(Column) : 또 다른 변수의 범주들흡연여부 \ 성별남여합계흡연503080비흡연120150270합계170180350   2. 비율(상대도수) 표시- 전체 중에서 특정 범주가 차지하는 비율- 비율은 분석목적 또는 자료 수집 방법에 따라 다르게 표시됨   3. 차이 또는 관련 여부.. 2025. 1. 4.
기초통계학 3 | 자료의 중심위치, 산포, 분포 형태 분석 1. 수치를 이용한 자료정리중심위치- n개의 수치자료 x₁, x₂, x₃, ... , xₙ- xᵢ :  i 번째 표본의 값 (관측값)- n : 표본 크기 (Sample size) 1. 표본평균 (Sample mean)- 주어진 표본 데이터의 평균- 전체 모집단을 조사할 수 없는 경우,  모집단 특성을 유추할 때 사용   2. 표본비율 (Sample proportion)- 표본 데이터에서 특정 조건을 만족하는 비율- y = x₁ + x₂ + x₃ + ... + xₙ (해당 범주에 포함된 표본의 수)- 표본비율 = y/n  3. 이상점 (Outlier)- 데이터셋에서 다른 값들과 크게 벗어난 데이터 값- 다양한 원인으로 평균이나 표준편차 계산에 영향을 주어  왜곡될 수 있기 때문에 주의해야함- 이상점을 대체.. 2025. 1. 4.
기초통계학 2 | 자료 분류와 특성, 범주형 자료, 수치자료 1. 자료 특성  통계분석 방법- 데이터를 분석할 때, 어떤 데이터를 가지고 있는지(속성)과  무엇을 알고 싶은지(목적)에 따라 적합한 방법을 선택해야함자료 속성질적자료 (Qualitative)- 숫자가 아닌 범주형 데이터- 분석방법 : 빈도분석, 교차분석 등ex) 성별, 색상양적자료 (Quantitative)- 숫자로 측정되는 데이터- 분석방법 : 평균, 분산, 상관분석 등ex) 키, 몸무게변수 (Variable)- 변할 수 있는 값- 데이터의 속성독립변수 (Independent Variable)- 다른 변수에 영향을 주는 변수- 원인 또는 조건종속변수 (Dependent Variable)- 독립변수에 영향을 받는 변수- 결과 또는 반응ex) 공부시간(독립변수)이 시험점수(종속변수)에 영향을 줌 질적변.. 2025. 1. 3.
기초통계학 1 | 모집단, 표본, 표본추출방법, 가중치 통계학- 데이터를 수집 · 분석 · 해석 · 표현하는 학문- 의사결정을 돕기 위해 데이터를 체계적으로 다루는 방법 연구- 연구, 비즈니스, 경제, 의료, 사회학 등 여러 분야에서  데이터 패턴을 파악하거나 미래예측, 문제해결 등 활용되고 있음 예시)Q. 동전을 100번 돌리면 앞면이 나올 확률은 60%일 것이다.A.예상 → 앞 : 뒤 = 60 : 40실제 → 앞 : 뒤 = 60 : 40통계학적 관점의 해석1. 예상 : 가설(문제, 주제)을 설정하여 관심의 대상을 정의 (앞면이 나올 확률은 60%)2. 실험 : 동전을 100번 던져서 데이터를 수집3. 실제 : 수집된 데이터를 정리하고 요약해 기대치와 비교4. 해석① 결과가 가설과 일치함 → 동전 앞면이 나올 확률이 약 60%② 일정 확률로 동전 던지기 반.. 2025. 1. 2.
수리통계학 | 기초 용어 개념 정리 1. 통계학 통계학 정의- 데이터를 수집 · 분석 · 해석 · 표현하는 학문- 연구 결과를 근거로 결론을 도출하거나 의사 결정을 돕는 역할 - 불확실한 상황에서 확률을 통해 바람직한 의사결정을 하기 위함기술통계- 자료 수집 · 정리 · 해석추리통계- 표본으로 모집단 추론척도- 데이터를 측정하기 위한 기준명목척도(Nominal) : 범주를 구분하기 위해 이름을 부여함 (예: 성별)서열척도(Ordinal ): 순위에 따라 나눔 (예: 만족도 등급)등간척도(Interval) : 간격이 일정한 임의영점와 순위를 가짐 (예: 온도)비율척도(Ratio) : 절대영점을 가지고, 사칙연산 가능 (예: 무게, 길이)   2. 데이터 표현과 요약빈도분포(Frequency Distribution)- 어떤 사건이 일어나는 횟.. 2024. 12. 30.
데이터 분석과 코딩 | 무료 플랫폼 1. 과학데이터 교육센터    KISTI - 과학데이터교육센터브라이틱스(Brightics) 분석도구를 활용한 데이터 분석kacademy.kisti.re.kr    KISTI의 K-Academy는 과학기술 분야의 전문가 양성을 위해다양한 온라인 교육 프로그램과 콘텐츠를 제공하는 플랫폼입니다.연구자와 기술자들이 최신 기술과 지식을 습득할 수 있도록 지원합니다.    DATA (무료 온라인과정)- D3.js를 이용한 데이터 시각화- DMP(Data Management Plan) - 데이터 과학 기초 - 분석용 데이터 탐색 - 브라이틱스(Brightics) 분석도구를 활용한 데이터 분석 - 빅데이터 분석 결과 시각화 - 빅데이터 분석 기획 - 빅데이터 수집 - 빅데이터 처리 - 사례를 통한 빅데이터 분석 - 오.. 2024. 12. 28.
반응형