본문 바로가기

카테고리 없음

[Python][Pandas] 판다스 데이터 프레임 열(raw) 통계

반응형

1. 특정 열에 대한 통계 계산하기

판다스(pandas)는 파이썬 데이터 분석 라이브러리로, 데이터 프레임(DataFrame)이라는 자료구조를 제공합니다. 데이터프레임은 행과 열로 이루어진 테이블 형태의 데이터를 다루는 데에 효과적이며, 데이터의 통계 정보를 쉽게 계산할 수 있습니다.

1-1. 특정 열의 평균 계산하기

특정 열의 평균은 mean() 함수를 사용하여 계산할 수 있습니다. 다음은 데이터프레임에서 '열 이름'이라는 열의 평균을 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열 이름': [1, 2, 3, 4, 5]})

# 특정 열의 평균 계산
mean_value = df['열 이름'].mean()

print(f"평균: {mean_value}")

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

평균: 3.0

1-2. 특정 열의 합계 계산하기

특정 열의 합계는 sum() 함수를 사용하여 계산할 수 있습니다. 아래는 데이터프레임에서 '열 이름'이라는 열의 합계를 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열 이름': [1, 2, 3, 4, 5]})

# 특정 열의 합계 계산
sum_value = df['열 이름'].sum()

print(f"합계: {sum_value}")

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

합계: 15

1-3. 특정 열의 최소값, 최대값 계산하기

특정 열의 최소값과 최대값은 각각 min()max() 함수를 사용하여 계산할 수 있습니다. 아래는 데이터프레임에서 '열 이름'이라는 열의 최소값과 최대값을 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열 이름': [1, 2, 3, 4, 5]})

# 특정 열의 최소값과 최대값 계산
min_value = df['열 이름'].min()
max_value = df['열 이름'].max()

print(f"최소값: {min_value}")
print(f"최대값: {max_value}")

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

최소값: 1
최대값: 5

판다스를 사용하면 간편하게 데이터프레임의 열에 대한 통계 정보를 계산할 수 있습니다. 다음으로는 여러 열에 대한 통계 계산에 대해 알아보겠습니다.

2. 여러 열에 대한 통계 계산하기

판다스(pandas)를 사용하면 여러 열에 대한 통계 계산도 쉽게 할 수 있습니다. 여러 열의 평균, 합계, 최소값, 최대값을 계산하는 방법을 알아보겠습니다.

2-1. 여러 열의 평균 계산하기

여러 열의 평균을 계산하기 위해서는 mean() 함수를 이용하고, axis 인자에 1을 지정해야 합니다. 다음은 데이터프레임에서 '열1', '열2', '열3'의 평균을 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열1': [1, 2, 3, 4, 5],
                   '열2': [2, 4, 6, 8, 10],
                   '열3': [3, 6, 9, 12, 15]})

# 여러 열의 평균 계산
mean_values = df.mean(axis=1)

print(mean_values)

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

0    2.0
1    4.0
2    6.0
3    8.0
4    10.0
dtype: float64

2-2. 여러 열의 합계 계산하기

여러 열의 합계를 계산하기 위해서는 sum() 함수를 이용하고, axis 인자에 1을 지정해야 합니다. 다음은 데이터프레임에서 '열1', '열2', '열3'의 합계를 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열1': [1, 2, 3, 4, 5],
                   '열2': [2, 4, 6, 8, 10],
                   '열3': [3, 6, 9, 12, 15]})

# 여러 열의 합계 계산
sum_values = df.sum(axis=1)

print(sum_values)

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

0     6
1    12
2    18
3    24
4    30
dtype: int64

2-3. 여러 열의 최소값, 최대값 계산하기

여러 열의 최소값과 최대값을 계산하기 위해서는 각각 min(), max() 함수를 이용하고, axis 인자에 1을 지정해야 합니다. 다음은 데이터프레임에서 '열1', '열2', '열3'의 최소값과 최대값을 계산하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'열1': [1, 2, 3, 4, 5],
                   '열2': [2, 4, 6, 8, 10],
                   '열3': [3, 6, 9, 12, 15]})

# 여러 열의 최소값과 최대값 계산
min_values = df.min(axis=1)
max_values = df.max(axis=1)

print(min_values)
print(max_values)

위 코드를 실행하면, 다음과 같은 결과가 출력됩니다.

0    1
1    2
2    3
3    4
4    5
dtype: int64
0     3
1     6
2     9
3    12
4    15
dtype: int64

판다스를 사용하면 여러 열에 대한 통계 정보를 쉽게 계산할 수 있습니다. 이제 여러 열에 대한 통계 계산 방법을 알아보았으니, 데이터 분석에 활용할 수 있는 많은 기능들을 활용해보세요!

본 블로그 글은 G-ChatBot 서비스를 이용하여 AI(ChatGPT) 도움을 받아 작성하였습니다.

https://gboysking.net

 

G-ChatBot

Our service is an AI chatbot service developed using OpenAI API. Our service features a user-friendly interface, efficient management of token usage, the ability to edit conversation content, and management capabilities.

gboysking.net

 

반응형