알고리즘

(파이썬) 백준 알고리즘 - 2108번 / Counter

joy_lee 2021. 8. 26. 17:16

통계학

https://www.acmicpc.net/problem/2108

 

2108번: 통계학

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.

www.acmicpc.net

입력받는 수의 개수(N)가 최대 500,000개까지 가능하므로 빠른 입력을 위해 sys.stdin.readline()을 사용했다.

평균값, 중간값, 범위는 쉽게 구할 수 있었는데 최빈값은 collections 모듈을 사용해서 처리했다.

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import sys
from collections import Counter
= int(input())
numbers = [int(sys.stdin.readline().strip()) for _ in range(N)]
numbers.sort()
# 출력
print(round(sum(numbers) / N)) # 평균값
print(numbers[N//2]) # 중간값
# 최빈값
count = Counter(numbers).most_common()
if len(count) == 1:
    print(count[0][0])
elif count[0][1== count[1][1]:
    print(count[1][0])
else:
    print(count[0][0])
print(max(numbers) - min(numbers)) # 범위
cs

numbers를 sort()로 처음부터 정렬해줬다.

 

평균값과 중간값은 입력받는 수의 개수를 처음 입력받기 때문에 len(numbers)를 굳이 이용할 필요가 없었다.

1. 산술평균

round()로 평균값을 소수점 첫째자리에서 반올림한 값을 출력했다.

2. 중앙값

numbers[N//2]으로 작성했다. numbers의 index가 0부터 N-1까지이고, 문제에 N은 홀수라고 제한되어 있다. 그래서 N을 2로 나눈 몫이 중간값이 된다(1부터 N까지였으면 N//2 + 1을 사용해야 된다).

4. 범위

list안에 저장된 값들은 min()과 max()로 최소/최대값을 쉽게 구할 수 있다.

 

3. 최빈값

은 Counter함수를 이용해서 구했다.

Counter(numbers)를 하면 dict 형태로 출력되기 때문에 .most_common()함수를 리스트에 담긴 튜플 형태로 요소들의 빈도를 구했다.

5개의 수 1, 3, 8, -2, 2를 입력한 경우 counter()와 counter().most_common()은 아래와 같다.

수를 하나만 입력받은 경우에는 최빈값이 여러개인지 확인할 필요가 없으므로 if를 통해 맨 처음 확인해줬다.

여러 수를 입력받은 경우는 최빈값이 여러개인지 확인한다.

 

most_common()을 통해 만들어진 튜플 (요소, 빈도수) 형태로 빈도수가 많은 수부터 작은수 순서대로 저장되어 있고, 같은 빈도수라면 처음 나온 값이 앞에 위치한다.

정렬되지 않은 numbers(그림 아래쪽)를 가지고 count(numbers).most_common() 을 실행한 경우는 2회씩 입력된 -1과 -2 중 처음 입력된 -1의 빈도수인 (-1, 2) 가 0번으로 저장되어 있다.

 

코드를 작성할 때 맨 처음 numbers.sort()로 정렬해줬기 때문에

최빈값 중 최소값 : count[0][0]

최빈값 중 두번째로 작은 값 : count[1][0]

으로 사용할 수 있다.

count[0][1] 와 count[1][1] 을 비교해 두번째로 많은 수가 첫번째로 많은 수와 같은지(최빈값이 여러개인지) 확인한 후 최빈값이 여러개면 최빈값 중 두번째로 작은 값을 출력하고, 그렇지 않으면 최빈값 중 최소값을 출력한다.

 

 

 

 

참고한 사이트

https://infinitt.tistory.com/183

 

파이썬(Python) Collections 모듈 - counter , most_common

collections 모듈은 기본적으로 파이썬에 내장되어있는 내장함수입니다. (따로 설치가 필요 없..) 리스트나, 문자열의 요소에 대한 개수를 구할때 반복문으로도 구할 수 있지만, counter 함수를 사용

infinitt.tistory.com

 

https://yoonsang-it.tistory.com/42

 

백준 2108번 파이썬 풀이: 통계학

백준 2108번 통계학 알고리즘 분류: 구현, 정렬 링크: www.acmicpc.net/problem/2108 2108번: 통계학 첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는..

yoonsang-it.tistory.com