본문 바로가기

python

(18)

[Python][Pandas] 판다스(Pandas) 인덱스 이해하기 목차서론판다스란 무엇인가?인덱스의 중요성인덱스란 무엇인가?정의행 인덱스와 열 인덱스인덱스 객체 (Index Object)인덱스 생성기본 인덱스 설정사용자 정의 인덱스 설정다중 인덱스 (MultiIndex)인덱스 조작인덱스 재설정 (reset_index)인덱스 설정 (set_index)인덱스 정렬 (sort_index)인덱스 활용데이터 추출 (loc, iloc)인덱스를 통한 데이터 필터링인덱스 기반 연산실제 사례인덱스를 활용한 데이터 분석 예제인덱스가 있는 데이터프레임에서 효율적인 작업고급 인덱싱 기법조건부 인덱싱슬라이싱 (slicing)교차 인덱싱문제 해결중복 인덱스 처리인덱스 이름 변경결측값이 포함된 인덱스 처리결론요약참고 자료 및 추가 학습 자료1. 서론1. 서론판다스란 무엇인가?판다스(Pandas)..

[Python][ML] 스펙트럴(Spectral) 클러스터링 시각화 예시 1. 클러스터링 소개 1.1 클러스터링의 개념 클러스터링은 비슷한 특성을 가진 데이터들을 그룹화하는 비지도 학습 기법입니다. 데이터들 간의 유사성을 기반으로 서로 비슷한 특성을 가지는 데이터들을 한 그룹으로 묶어주는 작업을 의미합니다. 클러스터링은 데이터 마이닝, 패턴 인식, 이미지 처리, 고객 분류 등 다양한 분야에서 널리 활용되며, 데이터를 탐색적으로 분석하거나 데이터를 압축하고 간결하게 표현하는 데 사용될 수 있습니다. 1.2 클러스터링의 활용 분야 클러스터링은 다양한 분야에서 활용될 수 있습니다. 예를 들어, 마케팅 분야에서 고객들을 서로 비슷한 특성을 가진 그룹으로 나누어 대상 고객들에게 타겟 마케팅 전략을 수립하는 데 활용될 수 있습니다. 또한, 의료 분야에서 환자들을 비슷한 증상이나 질병을 ..

[Python][ML] K-Means 클러스터링 시각화 예시 1. 클러스터링에 대한 소개 1.1 클러스터링의 개념과 목적 클러스터링은 비슷한 특징을 가진 데이터들을 그룹으로 묶는 비지도 학습 알고리즘입니다. 클러스터링의 목적은 유사한 데이터를 하나의 그룹으로 묶어 비슷한 특성을 갖고 있는 데이터끼리 더 잘 이해하고 분석하기 위함입니다. 클러스터링은 데이터의 패턴을 발견하고, 유사한 데이터들을 그룹으로 분류하는데 사용됩니다. 예를 들어, 고객 세분화, 이미지 분류, 소셜 미디어 분석 등 다양한 분야에서 활용됩니다. 1.2 클러스터링의 활용 분야 클러스터링은 다양한 분야에서 활용됩니다. 예를 들어, 마케팅 분야에서는 고객을 그룹으로 나누어 특정 그룹의 특성을 파악하여 정확한 마케팅 전략을 수립할 수 있습니다. 또한, 의료 분야에서는 질병 패턴을 분석하여 효과적인 치료..

[Python][인공지능] 혼동 행렬, 정확도, 정밀도, 재현율 예시 1. 소개 1.1 정확도 계산이란? 정확도 계산은 인공지능 모델이 예측한 결과와 실제 값 사이의 일치 여부를 평가하는 방법입니다. 이는 모델의 성능을 정량화하고 개선하기 위해 중요한 지표입니다. 1.2 정확도 계산의 중요성 정확도 계산은 모델의 성능을 평가하고 비교함으로써 모델의 신뢰성을 확인하는 데 도움을 줍니다. 제대로 작동하지 않는 모델은 잘못된 예측을 할 수 있으며, 이는 비용이 크거나 위험한 결과로 이어질 수 있습니다. 따라서 정확한 분류 기능을 가진 모델을 개발하고 평가하기 위해 정확도 계산은 필수적입니다. 이제 다음으로 혼동 행렬에 대해 알아보겠습니다. 2. 혼동 행렬 2.1 TP, FP, TN, FN의 개념 설명 혼동 행렬은 분류 모델의 예측 결과를 비교하여 실제 값과의 일치 여부를 표현하..

[Python][Matplotlib] 히스토그램(hist) 사용법 히스토그램의 개념과 용도 히스토그램이란? 히스토그램은 데이터의 분포를 시각화하는데 사용되는 차트입니다. 데이터의 빈도를 막대 형태로 표현하며, 가로 축에는 데이터의 구간, 세로 축에는 해당 구간에 속하는 데이터의 빈도 수를 나타냅니다. 각 막대의 높이는 해당 구간에 속하는 데이터의 개수를 나타내며, 전체 막대의 너비는 데이터의 전체 개수가 됩니다. 히스토그램을 통해 데이터의 분포, 중심 경향성, 이상치 등을 파악할 수 있습니다. 데이터의 분포가 어떠한 모양을 가지고 있는지, 데이터가 어느 범위에 몰려 있는지, 극단적인 값(이상치)이 있는지 등 시각적으로 파악할 수 있습니다. 히스토그램의 용도 히스토그램은 데이터 분석에서 다양한 용도로 사용됩니다. 주요 용도는 다음과 같습니다. 데이터 분포 확인: 데이터가..

[Python][Matplotlib] 바(bar) 차트 사용법 1. 바 차트 개요 바 차트는 데이터의 범주를 나타내는 그래프 중 하나로, 세로 축에 막대 형태로 표시되는 데이터를 이용하여 각 범주별 값을 비교하는데 사용됩니다. 주로 범주형 데이터를 시각화하거나, 카테고리 간의 상대적인 크기를 비교하는데 유용합니다. 바 차트의 기본 개념 바 차트는 주로 수직으로 표현되는데, 각 막대의 높이는 해당 범주의 값을 나타냅니다. X축은 범주를, Y축은 값의 크기를 나타냅니다. 막대는 독립적으로 그려지며, 각각의 막대는 서로 다른 범주를 대표합니다. 바 차트는 주로 다음과 같은 정보를 시각화하는데 사용됩니다: 범주형 데이터의 분포를 보여줄 때 범주간의 비교를 위해 값의 크기를 시각화할 때 바 차트 사용 사례 소개 바 차트는 다양한 분야에서 사용되는 통계 그래프 중 하나로 유용..

[Python][Matplotlib] 선(Line) 차트 사용법 1. 소개 선 차트(Line Chart)는 데이터의 변화를 추적하거나 비교하기 위해 많이 사용되는 시각화 방법입니다. 선 차트는 시간, 연령, 온도 등 연속적인 값들의 변화를 보여줄 때 효과적으로 사용됩니다. 또한, 여러 개의 데이터 시리즈를 한 번에 비교할 수 있는 다중 라인 차트를 만들어 정보를 비교하고 해석하는 데에도 유용합니다. 선 차트의 역할과 중요성 선 차트는 데이터의 변화를 직관적으로 이해할 수 있도록 도와주며, 주요한 경향성과 패턴을 시각적으로 파악할 수 있게 해줍니다. 선 차트를 통해 일련의 데이터를 시각적으로 표현하면, 데이터의 숫자나 수치에 비해 더욱 쉽고 빠르게 추세를 파악할 수 있습니다. 또한, 다양한 변수 간의 관계를 시각적으로 확인할 수 있어 비교 분석에 효과적입니다. 선 차트..

[Python][Pandas] 판다스 데이터 프레임 기본 통계 ( describe...) 1. 데이터 확인하기 판다스는 파이썬에서 데이터를 다루는 가장 효과적인 도구 중 하나입니다. 데이터를 분석하기 전에 먼저 데이터의 구조와 기본 통계량을 확인해야 합니다. 이를 통해 데이터의 형태를 파악하고, 이상치 또는 결측치를 확인할 수 있습니다. 1-1. 데이터 구조 파악하기 판다스의 DataFrame은 표 형태로 데이터를 다룰 수 있는 자료구조입니다. 데이터의 구조를 파악하기 위해 다음의 함수를 활용할 수 있습니다. 1) head() 함수 head() 함수는 데이터의 처음 5개 행을 출력해줍니다. 기본값은 5이지만, 괄호 안에 다른 숫자를 넣어 데이터를 원하는 만큼 출력할 수도 있습니다. import pandas as pd # 데이터프레임 생성 df = pd.DataFrame({'A': [1, 2,..

이전 1 2 3 다음

티스토리툴바