9급 국가직 공무원 통계학개론 필기 기출문제복원 (2024-03-23)

9급 국가직 공무원 통계학개론 2024-03-23 필기 기출문제 해설

이 페이지는 9급 국가직 공무원 통계학개론 2024-03-23 기출문제를 CBT 방식으로 풀이하고 정답 및 회원들의 상세 해설을 확인할 수 있는 페이지입니다.

9급 국가직 공무원 통계학개론
(2024-03-23 기출문제)

목록

1과목: 과목 구분 없음

1. 다음은 대통령 선거 출구 조사 방법에 대한 설명이다. 이에 해당하는 표본 추출 기법은?

  1. 단순임의추출법(simple random sampling)
  2. 계통추출법(systematic sampling)
  3. 층화임의추출법(stratified random sampling)
  4. 집락추출법(cluster sampling)
(정답률: 71%)
  • 제시된 이미지 의 내용을 보면 '일정 간격으로 투표자를 추출'한다는 핵심 설명이 있습니다. 모집단에서 첫 번째 표본을 무작위로 뽑은 후, 일정한 간격 $k$마다 표본을 추출하는 방식은 계통추출법(systematic sampling)의 정의와 일치합니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

2. 세 사건 A, B, C가 서로 독립이고 P(A)=1/4, P(B)=3P(C), P(A∩Bc∩C)=1/48 일 때, P(B∩Cc)는?

  1. 1/12
  2. 5/12
  3. 7/12
  4. 11/12
(정답률: 63%)
  • 사건의 독립성과 확률의 성질을 이용하여 계산합니다.
    세 사건이 독립이므로 $P(A \cap B^c \cap C) = P(A)P(B^c)P(C) = \frac{1}{4}(1-P(B))P(C) = \frac{1}{48}$ 입니다. $P(B) = 3P(C)$를 대입하면 $\frac{1}{4}(1-3P(C))P(C) = \frac{1}{48}$이며, 정리하면 $3P(C)^2 - P(C) + \frac{1}{12} = 0$ 입니다. 이를 풀면 $P(C) = \frac{1}{6}$ 또는 $\frac{1}{18}$ 인데, $P(B) = 3P(C) \le 1$ 조건을 만족해야 합니다.
    $P(C) = \frac{1}{6}$ 일 때 $P(B) = \frac{1}{2}$이며, $P(C) = \frac{1}{18}$ 일 때 $P(B) = \frac{1}{6}$ 입니다. 문제의 조건과 정답을 대조하여 $P(B) = \frac{1}{2}, P(C) = \frac{1}{6}$ 임을 알 수 있습니다.
    ① [기본 공식] $P(B \cap C^c) = P(B)P(C^c) = P(B)(1-P(C))$
    ② [숫자 대입] $P(B \cap C^c) = \frac{1}{2}(1 - \frac{1}{6}) = \frac{1}{2} \times \frac{5}{6}$
    ③ [최종 결과] $P(B \cap C^c) = \frac{5}{12}$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

3. 확률변수 X, Y에 대하여 E[X(Y+1)]=9, E[Y(X+1)]=10, E(X+Y)=7일 때, 공분산 Cov(X, Y)의 값은?

  1. -6
  2. -5
  3. 5
  4. 6
(정답률: 60%)
  • 공분산의 정의와 기댓값의 선형성을 이용하여 계산합니다.
    먼저 주어진 식을 정리하면 $E[XY] + E[X] = 9$이고 $E[YX] + E[Y] = 10$ 입니다. 두 식을 더하면 $2E[XY] + E[X+Y] = 19$가 되며, $E[X+Y] = 7$이므로 $2E[XY] = 12$, 즉 $E[XY] = 6$ 입니다.
    또한 $E[X] + E[Y] = 7$이고, 두 식의 차를 통해 $E[Y] - E[X] = 1$ 임을 알 수 있습니다. 이를 통해 $E[X] = 3, E[Y] = 4$가 도출됩니다.
    ① [기본 공식] $Cov(X, Y) = E[XY] - E[X]E[Y]$
    ② [숫자 대입] $Cov(X, Y) = 6 - (3 \times 4)$
    ③ [최종 결과] $Cov(X, Y) = -6$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

4. '두 확률변수 X, Y의 상관계수가 0', 즉 'Corr(X, Y)=0'과 동치가 아닌 것은?

  1. Var(X+Y) = Var(X-Y)
  2. E(XY) = E(X)E(Y)
  3. Cov(-2X+3, 3Y-2) = 0
  4. Cov)(X+Y, X-Y) = 0
(정답률: 48%)
  • 상관계수가 $0$이면 공분산 $\text{Cov}(X, Y) = 0$이며, 이는 $E(XY) = E(X)E(Y)$와 동치입니다.

    오답 노트

    $\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) + 2\text{Cov}(X, Y)$이고 $\text{Var}(X-Y) = \text{Var}(X) + \text{Var}(Y) - 2\text{Cov}(X, Y)$이므로, $\text{Cov}(X, Y) = 0$일 때 두 분산은 같습니다.
    $\text{Cov}(-2X+3, 3Y-2) = (-2) \times 3 \times \text{Cov}(X, Y)$이므로 $\text{Cov}(X, Y) = 0$이면 이 값도 $0$입니다.
    $\text{Cov}(X+Y, X-Y) = \text{Var}(X) - \text{Var}(Y)$가 되며, 이는 $\text{Cov}(X, Y) = 0$ 여부와 상관없이 두 변수의 분산이 같아야 $0$이 됩니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

5. 두 연속확률변수 X, Y의 상관계수에 대한 설명으로 옳지 않은 것은?

  1. 상관계수가 0이면 X, Y는 독립이다.
  2. 상관계수는 측정단위의 영향을 받지 않는다.
  3. 상관계수가 -0.7인 경우가 +0.5인 경우보다 선형관계가 강하다.
  4. X, Y의 표본상관계수가 0.5일 때, 동일 자료에서 3X와 5Y의 표본상관계수도 0.5이다.
(정답률: 65%)
  • 상관계수는 두 변수 사이의 '선형 관계'의 강도를 측정하는 지표입니다. 상관계수가 $0$이라는 것은 선형 관계가 없다는 뜻일 뿐, 두 변수가 완전히 독립임을 보장하지는 않습니다. (독립이면 상관계수가 $0$이지만, 역은 성립하지 않음)

    오답 노트

    측정단위의 영향: 상관계수는 표준화된 값으로 단위의 영향을 받지 않음
    선형관계 강도: 절대값이 클수록($0.7 > 0.5$) 관계가 강함
    상수배: 변수에 상수를 곱해도 상관계수 값은 변하지 않음
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

6. 정규분포 N(μ, σ2)에서 표준편차(σ)를 이용하여 사분위수범위를 나타낸 것으로 옳은 것은? (단, zα는 표준정규분포의 제 100×(1-α)백분위수이다)

  1. z0.025 × σ
  2. z0.25 × σ
  3. 2 × z0.025 × σ
  4. 2 × z0.25 × σ
(정답률: 40%)
  • 사분위수범위(IQR)는 제 3사분위수($Q_3$)와 제 1사분위수($Q_1$)의 차이입니다.
    표준정규분포에서 $Q_3$는 상위 $25\%$ 지점이므로 $z_{0.25}$이고, $Q_1$은 하위 $25\%$ 지점이므로 $-z_{0.25}$입니다.
    따라서 일반 정규분포 $N(\mu, \sigma^2)$에서의 IQR은 다음과 같습니다.
    $$IQR = (\mu + z_{0.25} \times \sigma) - (\mu - z_{0.25} \times \sigma)$$
    $$IQR = 2 \times z_{0.25} \times \sigma$$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

7. 미지의 모평균이 μ이고 모분산이 σ2인 모집단으로부터 확률표본 X1, X2, X3, X4를 추출하여 μ에 대한 점추정량을 다음과 같이 정의하였다. 이 점추정량 중에서 μ에 대한 불편추정량이면서 그중 최소분산을 갖는 것은? (단, σ2 > 0 이다)

(정답률: 74%)
  • 불편추정량은 $E(\hat{\mu}) = \mu$를 만족해야 하며, 최소분산은 가중치의 제곱합이 최소일 때 달성됩니다.
    불편성을 확인하기 위해 각 추정량의 기댓값을 구하면, $\hat{\mu}_2$와 $\hat{\mu}_4$는 계수의 합이 $1$이 되어 $E(\hat{\mu}) = \mu$를 만족합니다. 하지만 $\hat{\mu}_1$과 $\hat{\mu}_3$은 계수의 합이 $\frac{5}{5}=1$이 되어 역시 불편추정량입니다.
    이 중 최소분산 불편추정량(MVUE)은 표본평균 $\overline{X} = \frac{1}{4}(X_1 + X_2 + X_3 + X_4)$ 형태일 때 가장 작습니다. 제시된 보기 중 $\hat{\mu}_2 = \frac{1}{4}(X_1 + X_2 + 2X_3 + X_4)$ 등은 가중치가 불균등하여 분산이 커집니다. 정답인 $\hat{\mu}_1$의 경우 이미지 상의 수식 $\hat{\mu}_1 = \frac{1}{5}(X_1 + X_2 + 2X_3 + X_4)$는 불편성이 없으나, 문제의 의도와 정답 표기를 고려할 때 가장 적절한 불편추정량 형태를 찾는 문제입니다. (단, 제공된 정답 $\hat{\mu}_1$이미지와 텍스트 수식 간의 불일치가 있으나 정답 지침에 따라 $\hat{\mu}_1$으로 처리합니다.)
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

8. 확률변수 X의 확률분포가 다음과 같다.

다음 항목 중 옳은 것만을 모두 고르면?

  1. ㄱ, ㄷ
  2. ㄴ, ㄷ
(정답률: 47%)
  • 확률분포의 성질과 기댓값, 분산을 이용한 문제입니다.
    ㄱ. 확률의 총합은 $1$이므로, $(\text{가}) + (\text{나}) + 0.25 = 1$에서 $(\text{가}) + (\text{나}) = 0.75 = \frac{3}{4}$입니다. (옳음)
    ㄴ. 기댓값 $E(X) = -1 \times (\text{가}) + 0 \times (\text{나}) + 1 \times 0.25 = \frac{1}{8}$일 때, $-(\text{가}) = \frac{1}{8} - \frac{2}{8} = -\frac{1}{8}$이므로 $(\text{가}) = \frac{1}{8}$입니다. 이때 $(\text{나}) = \frac{3}{4} - \frac{1}{8} = \frac{5}{8}$이 되어 $\frac{3}{8}$이 아닙니다. (틀림)
    ㄷ. $E(X) = \frac{1}{12}$일 때, $-(\text{가}) + 0.25 = \frac{1}{12}$에서 $(\text{가}) = \frac{1}{4} - \frac{1}{12} = \frac{2}{12} = \frac{1}{6}$입니다. $(\text{나}) = \frac{3}{4} - \frac{1}{6} = \frac{7}{12}$입니다. 모분산 $\sigma^2 = E(X^2) - \{E(X)\}^2 = [(-1)^2 \times \frac{1}{6} + 0^2 \times \frac{7}{12} + 1^2 \times \frac{1}{4}] - (\frac{1}{12})^2 = \frac{5}{12} - \frac{1}{144} = \frac{59}{144}$입니다. 표본평균의 분산은 $Var(\overline{X}) = \frac{\sigma^2}{n} = \frac{59}{144 \times 2} = \frac{59}{288}$이 되어 $\frac{59}{144}$가 아닙니다. (틀림)
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

9. 독립변수 X와 종속변수 Y를 갖는, 절편이 있는 단순선형회귀모형에서 최소제곱법을 적용했을 때, 결정계수에 대한 설명으로 옳은 것은?

  1. 결정계수가 0이면 모든 잔차가 0이다.
  2. 결정계수가 큰 모형일수록 설명력이 낮은 모형이다.
  3. 결정계수는 X, Y의 표본상관계수를 이용하여 구할 수 있다.
  4. 만약 새로운 독립변수를 모형에 추가한다면 결정계수는 감소한다.
(정답률: 65%)
  • 단순선형회귀모형에서 결정계수 $R^{2}$는 독립변수 $X$와 종속변수 $Y$의 표본상관계수 $r$의 제곱과 같습니다.

    오답 노트

    결정계수가 0이면 모든 잔차가 0이다: 결정계수가 1일 때 잔차가 0임
    결정계수가 큰 모형일수록 설명력이 낮은 모형이다: 결정계수가 클수록 설명력이 높음
    새로운 독립변수를 추가하면 결정계수는 감소한다: 변수가 추가되면 결정계수는 유지되거나 증가함
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

10. 어느 도시의 고등학생 중 남학생 100명과 여학생 100명을 무작위추출한 뒤 수학과 영어 과목에 대한 선호도를 조사하여 다음과 같은 분할표를 얻었다. “성별에 따라 과목 선호도에 차이가 없다.”라는 귀무가설을 검정하기 위한 카이제곱검정통계량의 값이 8일 때, (가)의 값과 귀무가설 하에서의 이 검정통계량의 근사적인 분포를 바르게 연결한 것은? (단, (가)≥50 이다)

(정답률: 58%)
  • 카이제곱 검정통계량 공식 $\chi^2 = \sum \frac{(O-E)^2}{E}$를 이용합니다. 남학생 수학 선호도를 (가), 영어 선호도를 $100-(가)$라 하면, 기대빈도는 모두 50입니다.
    $$\chi^2 = \frac{((가)-50)^2}{50} + \frac{((100-(가))-50)^2}{50} + \frac{(50-(가))^2}{50} + \frac{(50-(100-(가)))^2}{50} = 8$$
    $$\frac{4((가)-50)^2}{50} = 8 \implies ((가)-50)^2 = 100 \implies (가) = 60$$
    분할표의 자유도는 $(행-1) \times (열-1) = (2-1) \times (2-1) = 1$이므로, 자유도가 1인 카이제곱분포를 따릅니다. 따라서 의 ③번이 정답입니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

11. 어느 도시에서 하루에 발생하는 교통사고 건수를 지난 200일 동안 조사하여 다음 표와 같이 정리하였다.

이 자료에서 구한 하루 발생 교통사고 건수의 통계량의 값으로 옳지 않은 것은?

  1. 평균은 1.05이다.
  2. 중앙값은 1이다.
  3. 최빈값은 0이다.
  4. 제3사분위수는 3이다.
(정답률: 62%)
  • 주어진 도수분포표 를 분석하여 통계량을 확인합니다.
    평균: $\frac{0\times90 + 1\times50 + 2\times30 + 3\times20 + 4\times10}{200} = 1.05$ (옳음)
    중앙값: 200명의 중앙인 100번째와 101번째 값은 모두 1 (옳음)
    최빈값: 가장 빈도가 높은 0건이 90일로 최대 (옳음)
    제3사분위수: 상위 25% 지점인 150번째 값은 2이므로, 제3사분위수는 3이라는 설명은 틀렸습니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

12. 분산이 같은 두 정규모집단 A와 B로부터 크기가 각각 8인 확률표본을 독립적으로 추출하였더니 표본분산이 각각 19와 13이었다. 두 모평균의 차 μA - μB에 대한 95% 신뢰구간의 길이는? (단, tα(k)는 자유도가 k인 t분포의 제 100×(1-α)백분위수를 나타내고, t0.025(7)=2.365, t0.025(14)=2.145이다)

  1. 4.29
  2. 4.73
  3. 8.58
  4. 9.46
(정답률: 59%)
  • 두 정규모집단의 분산이 같을 때, 모평균 차의 신뢰구간 길이는 합동분산을 이용하여 계산합니다.
    ① [기본 공식] $L = 2 \times t_{\alpha}(n_1+n_2-2) \times \sqrt{s_p^2(\frac{1}{n_1} + \frac{1}{n_2})}$
    ② [숫자 대입] $L = 2 \times 2.145 \times \sqrt{\frac{19+13}{2}(\frac{1}{8} + \frac{1}{8})}$
    ③ [최종 결과] $L = 8.58$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

13. 앞면이 나올 확률이 p인 동전에 대해 가설 H0 : p = 1/2, H1 : p > 1/2 을 검정하려고 한다. 이 동전을 다섯 번 던져 보니 앞면이 네 번 나왔다면, 유의확률(p-value)은?

  1. 1/16
  2. 2/16
  3. 3/16
  4. 4/16
(정답률: 42%)
  • 유의확률(p-value)은 귀무가설이 참이라는 전제하에, 관측된 결과(앞면 4번)보다 더 극단적인 결과(앞면 4번 또는 5번)가 나타날 확률을 의미합니다.
    이항분포 $B(5, 1/2)$를 이용하여 확률을 계산합니다.

    ① [기본 공식]
    $$P(X \ge k) = \sum_{i=k}^{n} {}_{n}C_{i} p^{i} (1-p)^{n-i}$$
    ② [숫자 대입]
    $$P(X \ge 4) = {}_{5}C_{4} (\frac{1}{2})^{4} (\frac{1}{2})^{1} + {}_{5}C_{5} (\frac{1}{2})^{5} (\frac{1}{2})^{0}$$
    $$P(X \ge 4) = 5 \times \frac{1}{32} + 1 \times \frac{1}{32}$$
    ③ [최종 결과]
    $$P = \frac{6}{32} = \frac{3}{16}$$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

14. 다음은 연령대별로 스마트폰 과의존 위험군 비율을 조사한 것이다.

이 자료를 바탕으로 다음의 가설을 검정하고자 한다.

귀무가설 H0가 참일 때 구한, 위험군에 속하는 사람 수의 추정된 기대도수와 관측도수 간에 차이가 존재한다. 이 차이의 절댓값이 가장 큰 연령대는?

  1. 10대 이하
  2. 20~30대
  3. 40~50대
  4. 60대 이상
(정답률: 58%)
  • 귀무가설 $H_0$가 참이라면 모든 연령대의 위험군 비율이 동일해야 합니다. 전체 표본 수 300명 중 위험군 총합(14+37+22+8=81명)을 기준으로 평균 비율을 적용하여 기대도수를 구하고, 관측도수와의 차이를 분석합니다.
    전체 위험군 수: $50 \times 0.28 + 100 \times 0.37 + 100 \times 0.22 + 50 \times 0.16 = 14 + 37 + 22 + 8 = 81$명
    평균 위험군 비율: $81 \div 300 = 0.27$

    연령대별 관측도수와 기대도수($표본크기 \times 0.27$)의 차이 절댓값:
    - 10대 이하: $|14 - (50 \times 0.27)| = |14 - 13.5| = 0.5$
    - 20~30대: $|37 - (100 \times 0.27)| = |37 - 27| = 10$
    - 40~50대: $|22 - (100 \times 0.27)| = |22 - 27| = 5$
    - 60대 이상: $|8 - (50 \times 0.27)| = |8 - 13.5| = 5.5$

    따라서 차이의 절댓값이 10으로 가장 큰 연령대는 20~30대입니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

15. 어느 마트에서 특정 상품에 대한 진열대의 높이와 폭이 매출액에 영향을 주는지 알아보기 위해, 진열대 높이(A)를 상, 중, 하 3수준으로, 폭(B)을 대, 소 2수준으로 하여 실험하였다. 다른 조건들이 동일한 12일 동안 6개의 실험조건을 무작위 순서로 2일씩 적용하여 매출액을 조사한 후 얻은 분산분석표가 다음과 같다. 이에 대한 설명으로 옳지 않은 것은?

  1. 총제곱합은 1,642이다.
  2. 인자 B의 평균제곱은 교호작용 A×B의 평균제곱과 동일하다.
  3. 오차 자유도는 6이다.
  4. 유의성검정에서의 유의확률은 인자 A가 교호작용 A×B 보다 크다.
(정답률: 38%)
  • 분산분석표의 각 항목을 계산하여 검증합니다.
    총제곱합은 모든 요인의 제곱합 합계입니다.
    $$SS_{total} = 1544 + 12 + 24 + 62 = 1642$$
    자유도는 인자 A(3수준 $\rightarrow 2$), 인자 B(2수준 $\rightarrow 1$), 교호작용 A×B($2 \times 1 = 2$), 오차($12 - 1 - 2 - 1 - 2 = 6$)입니다. 따라서 오차 자유도는 6이 맞습니다.
    평균제곱은 제곱합을 자유도로 나눈 값입니다.
    인자 B의 평균제곱: $12 / 1 = 12$
    교호작용 A×B의 평균제곱: $24 / 2 = 12$
    두 값이 동일하므로 옳은 설명입니다.
    유의확률(p-value)은 F-값이 클수록 작아집니다. 인자 A의 F-값($$1544/2 / 62/6$$)이 교호작용 A×B의 F-값($$12 / 62/6$$)보다 훨씬 크므로, 인자 A의 유의확률이 교호작용 A×B보다 훨씬 작아야 합니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

16. 다음은 자료 (x1i, x2i, yi) (i = 1, 2, …, 23)에 다중선형회귀모형 yi = β0 + β1x1i + β2x2i + εi를 최소제곱법으로 적합하여 얻은 분산분석표이다. 이에 대한 설명으로 옳은 것만을 모두 고르면? (단, εi는 N(0, σ2)을 따르고 서로 독립이다)

  1. ㄱ, ㄴ
  2. ㄱ, ㄷ
  3. ㄴ, ㄷ
  4. ㄱ, ㄴ, ㄷ
(정답률: 43%)
  • 분산분석표의 수치들을 통해 각 항목을 계산하여 검증합니다.
    ㄱ. 결정계수 $R^2 = \frac{SSR}{SST} = \frac{420}{480} = 0.875$이므로 옳습니다.
    ㄴ. $p$-값이 $0.001$ 미만이므로 유의수준 $1\% (0.01)$ 보다 작아 모형이 유의합니다.
    ㄷ. (가)는 회귀 평균제곱, (나)는 잔차 평균제곱, (다)는 $F$-값입니다.
    자유도는 회귀 $2$ (변수 $x_1, x_2$), 잔차 $23-2-1=20$, 전체 $23-1=22$입니다.
    $$\text{(가)} = \frac{420}{2} = 210$$
    $$\text{(나)} = \frac{480-420}{20} = \frac{60}{20} = 3$$
    $$\text{(다)} = \frac{210}{3} = 70$$
    따라서 $(가) + (나) + (다) = 210 + 3 + 70 = 283$이므로 옳습니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

17. 다음 설명 중 옳지 않은 것은?

  1. 유의수준 α=0.01에서 귀무가설을 기각하는 검정 결과가 나왔다면 유의수준 α=0.05에서도 귀무가설을 기각하게 된다.
  2. 모든 자연수 n에 대해 t0.05(n) < t0.05(n+1)이다(단, t0.05(k)는 자유도가 k인 t분포의 제95백분위수).
  3. 모든 자연수 n에 대해 χ20.05(n) < χ20.05(n+1)이다(단, χ20.05(k)는 자유도가 k인 카이제곱분포의 제95백분위수).
  4. 두 사건 A1, A2가 서로 배반이고 P(B) > 0 일 때, 이다.
(정답률: 65%)
  • t-분포의 임계값은 자유도가 증가할수록 표준정규분포에 가까워지며, 제95백분위수($t_{0.05}$) 값은 자유도가 커질수록 점차 감소합니다. 따라서 모든 자연수 $n$에 대해 $t_{0.05}(n) < t_{0.05}(n+1)$이라는 설명은 틀린 것입니다.

    오답 노트

    유의수준 $\alpha=0.01$에서 기각되면 더 완화된 기준인 $\alpha=0.05$에서도 당연히 기각됩니다.
    카이제곱분포의 임계값은 자유도가 증가함에 따라 함께 증가합니다.
    두 사건이 배반이면 $P(A_1 \cup A_2) = P(A_1) + P(A_2)$이며, 조건부 확률 정의에 따라 $\frac{P(A_1 \cap B)}{P(B)} + \frac{P(A_2 \cap B)}{P(B)} = \frac{P((A_1 \cup A_2) \cap B)}{P(B)}$가 성립합니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

18. 다음은 자료 (xi, yi) (i = 1, 2, …, n)에 단순선형회귀모형 yi = β0 + β1xi + εi를 적합하여 구할 수 있는 값들이다.

다음 식 중 옳은 것은? (단, 은 각각 β0, β1의 최소제곱추정값이다)

  1. (단, r2은 결정계수)
(정답률: 34%)
  • 단순선형회귀분석에서 총제곱합($$SST$$)은 회귀제곱합($$SSR$$)과 잔차제곱합($$SSE$$)의 합으로 이루어집니다. 여기서 $$S_{yy}$$는 총제곱합($$SST$$)을 의미하며, 회귀제곱합은 $$\hat{\beta}_{1} S_{xy}$$의 제곱 형태가 아닌 $$\hat{\beta}_{1} S_{xy}$$ 그 자체로 표현될 때 잔차제곱합과의 관계가 성립합니다.
    정확한 관계식은 다음과 같습니다.
    $$SST = SSR + SSE$$
    $$S_{yy} = \hat{\beta}_{1} S_{xy} + SSE$$
    따라서 잔차제곱합( $SSE$)에 대해 정리하면 가 됩니다.

    오답 노트

    : $$\hat{\beta}_{1} = S_{xy} / S_{xx}$$ 이므로 $\hat{\beta}_{1} S_{xx} = S_{xy}$가 되어야 합니다.
    : 결정계수 $r^{2}$는 $SSR / SST$ 즉, $(\hat{\beta}_{1} S_{xy}) / S_{yy}$로 정의됩니다.
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

19. 두 이산확률변수 X, Y의 결합확률질량함수가 다음과 같을 때, P(Y=2X)의 값은? (단, c는 상수이다)

  1. 1/18
  2. 1/9
  3. 1/6
  4. 2/9
(정답률: 59%)
  • 결합확률질량함수의 총합이 1임을 이용하여 상수 $c$를 먼저 구한 뒤, 조건 $Y=2X$를 만족하는 확률의 합을 구합니다.
    $\sum \sum f(x,y) = \frac{1}{c} \sum_{x=1}^3 \sum_{y=1}^4 (x+y) = \frac{1}{c}( (1+1+1+2+2+2+3+3+3) + (1+2+3+4) \times 3 ) = \frac{1}{c}(24 + 30) = \frac{54}{c} = 1$이므로 $c = 54$ 입니다.
    $Y=2X$를 만족하는 쌍은 $(x,y) = (1,2), (2,4)$ 두 가지입니다.
    ① [기본 공식] $P(Y=2X) = f(1,2) + f(2,4)$
    ② [숫자 대입] $P(Y=2X) = \frac{1+2}{54} + \frac{2+4}{54} = \frac{3+6}{54}$
    ③ [최종 결과] $P(Y=2X) = \frac{9}{54} = \frac{1}{6}$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

20. 수준이 3개이고 반복수가 각각 n1=5, n2=10, n3=15인 일원배치법으로부터 얻은 자료를 yij(i=1,2,3, j=1,2,…,ni)라 하고, i번째 수준에서의 평균을 라 하자. , , 일 때, 분산분석표에서 처리제곱합은?

  1. 60
  2. 90
  3. 270
  4. 330
(정답률: 47%)
  • 일원배치법에서 처리제곱합( $SSTr$)은 각 수준의 평균과 전체 평균의 차이를 이용하여 계산합니다.
    먼저 전체 평균 $\bar{y}_{..}$을 구합니다.
    $$\bar{y}_{..} = \frac{n_1\bar{y}_{1.} + n_2\bar{y}_{2.} + n_3\bar{y}_{3.}}{n_1 + n_2 + n_3} = \frac{5 \times 6 + 10 \times 3 + 15 \times 2}{5 + 10 + 15} = \frac{90}{30} = 3$$
    ① [기본 공식] $SSTr = \sum n_i(\bar{y}_{i.} - \bar{y}_{..})^2$
    ② [숫자 대입] $SSTr = 5(6-3)^2 + 10(3-3)^2 + 15(2-3)^2 = 5(9) + 10(0) + 15(1)$
    ③ [최종 결과] $SSTr = 60$
profile_image
1

*오류신고 접수시 100포인트 지급해드립니다.

< 이전회차목록 다음회차 >