(이 글은 정재현 강사님의 '기본부터 실전까지 한 권으로 끝!' 강의를 토대로 작성되었습니다.)


(아울러 강의 내용은 굳이 필요하지 않는 한 따로 적지 않습니다. 주로 적게 되는 것은 그날 강의의 이해에 도움이 되는 팁임을 미리 알려드립니다.)



오늘의 내용을 하기에 앞서, 우리는 창의적인 활동을 하는 게 아니다. 토익은 전혀 창의적인 답이 없다. 연산 문제를 풀면서 창의적인 답을 기대하지 않는 것처럼 토익도 그냥 정해진 답을 내면 되는 것이다.


또, 연산 문제를 풀 때 정해진 연산자가 있고 그걸 결합해서 문제를 푸는 것처럼 토익 문제도 보기 중에 답이 될 가능성을 추려주는 아이디어가 있고 그걸 조합해서 어느 경우에도 가능한 답을 찾아내면 되는 것이다.


연산 문제에서는 복잡한 유형에 대해 푸는 방법을 어느 정도 밝혀 놓았고, 그게 비교적 쉬운 문제이면 교과서에서 배우고, 좀 어려우면 대학가서 배우고, 더 어려우면 논문에서 찾아보면 써 있다.


그렇다면 연산 풀이에서처럼 쉽고 어려운 아이디어가 토익에서도 존재한다고 유추해볼 수 있다. 그리고 그렇다면 토익에서 선지를 확인할 때 빠르고 쉽게 적용할 수 있는 것부터 순서대로 확인하면 시간과 정답률의 향상에 도움이 될 것이다.


그리고 실제로 영문법에도 쉽고 어려움이 존재한다는 것은 마찬가지의 사례로 알 수 있다. 대학교 영문학과에서 가르치는 것과 초등학교 영어 시간에 가르치는 것이 같을 리는 없지 않은가.


결국 '자신만의 빠르기와 난이도에 맞는 방법들을 시도하는 순서'를 루틴으로 만드는 것이 어떤 문제든 가능한 빠르고 정확하게 푸는 방법이라 하겠다.



1. 능/수동태 일반


문제:

Critics of the movie which dealt with a number of sensitive issues have ------ that it was too predictable.


(A) complained (B) been complained


정답:

(A)


해설:

1일차와 2일차 내용은 루틴 면에서 가장 먼저 써봄직한 내용이다. 이를 먼저 적용해보자. 1강에 있던 문장의 구조는 가장 먼저 주어와 동사를 찾는 것으로부터 시작한다.


이 단계에서 빠르게 끊어읽기가 된다면 더 좋을 것이다.


Critics / of the movie / which dealt with a number of sensitive issues / have ------ / that it was too predictable.


모든 절을 다 끊어칠 필요는 없다. 빈 칸에 해당하는 수준의 절만 끊어 읽어도 문법 문제를 푸는데는 지장이 없는 경우가 많다. 그러니 시간을 아끼려면 일단 빈 칸 수준의 절만 끊어읽는 것도 방법이다.


'which dealt with a number of sensitive issues'는 movie를 수식하는 절인데 빈 칸에 대해서 하위절이고, 'that it was too predictable' 역시 빈 칸이 속한 절의 목적어에 해당하는 하위절이다.


주어와 동사는 이로써 찾았다. 그리고 동사가 이미 등장했으므로 2강의 수 일치는 쓸 구석이 없다.


그럼 이제 능동과 수동을 따지면 되는데, 끊어읽기한 것을 보니 that이 있다. 목적어절을 이끌고 있는 접속사스러운 무언가다. 이것을 눈치챘다면 바로 능동이 답이라는 것을 알 수 있다.


1일차에서 있었던 이야기를 떠올려보자.


수동태인지 능동태인지에 따라 답을 결정하는데 수동태임을 확인하는 것은 by를 찾거나 목적어(명사스러운 것들)가 없다는 것을 확인하면 된다.


보라색 글씨에 주목하자. by를 찾거나 목적어가 없다는 것을 확인하면 수동태라는 것이다. that은 목적격 절을 이끌고 있으니 능동이라는 것이다. 따라서 정답은 (A)이다.


그런데  목적어가 없어도 능동태인 것들도 있다. 그리고 가끔 명사(목적어)가 따라나오는데도 수동태인 경우가 있다. 그건 다음 문제를 통해 알아보자.



2. 자동사


Barring extreme fluctuations in the exchange rate, prices for our products ------ the same.


(A) were remained (B) will remain


정답:

(B)


빈출 오답:

(A)

(B) (remain이 자동사인지 모르고, 동시에 the same의 품사를 잘못 보고)


오답자들의 생각:

1. 목적어 없잖아요? the same은 부사고..

2. 무슨 소리야. 목적어 있잖아요? the same!


해설:

the same은 명사일 수도 있고, 부사일 수도 있다. 짜증나는 녀석이니까 알아두자. 정재현 강사님 표현을 빌리자면 '명부어' 정도 되겠다.


만약에 the same을 명사로 보고 목적어로 생각해서 (B)를 골랐다면 얻어걸린 것이다. 왜냐하면 remain은 자동사이기 때문이다. 그래서 보기에 remain만 남은 시점에서 문장에는 목적어가 없는 것이 된다. 


그래서 목적어가 없으니 (A)를 고를 수 있다. 하지만, remain이 자동사라면 원래 문장에서도 목적어는 없었다. 그러니 이걸 수동태로 쓰려면 주어가 없는 해괴한 문장으로밖에 쓸 수가 없다. 따라서 자동사는 수동태로 쓸 수 없다. 그래서 (B)가 정답이다.


참고:

사실 영어에 자/타만 있는 것은 아니다. 


이상하지 않은가. 1형식은 자동사, 3형식은 타동사, 4형식과 5형식도 타동사를 쓰는데 그럼 2형식은 무엇인가. 혹자는 자동사라고 할 수도 있다. 그러나 엄밀히 말해 모든 자동사가 2형식에 쓰일 수는 없다.


그래서, 2형식에 쓰일 수 있는, 즉 보어를 가질 수 있는 동사를 부르는 말이 있다. 바로 "linking verb"이다. 원래 이것은 주어의 상태를 수식한다, 주어와 연관된다는 의미로 linking이라는 말을 쓰는 것이지만 이러한 연관성이 곧 주어를 보충설명하는 것을 이끌게 되므로 보어가 자연스레 나오게 되는 것이다.


이 그룹은 "Intransitive linking"이라고 부른다.


그런데 이것은 보어는 가지지만, 여전히 목적어를 가질 수는 없다. 따라서 자동사에 속한다. 그럼 자동사이면서 "linking verb"가 아닌 동사의 그룹이 있을 것이다. 이는 "Intransitive complete" (완전 자동사) 라고 부른다.


(보어가 명사가 될 수 있음에도 목적어와는 차이가 있다. 명사인 보어는 동격 내지는 비유의 대상이 되지만 목적어는 그렇지 않다.)


보어를 쓰는 문장의 특징은 동사가 있을지언정 주어와 보어만으로 말이 된다는 것이다. 극단적으로 she looks poor.이라는 문장에서 looks를 빼도 동사가 be 혹은 to be의 의미를 내포하기 때문에 어느 정도의 상황 혹은 문맥을 알고 있다면 is 정도로만 치환해도 의미가 전달된다. action verb는 이런 게 안 된다. I you. 어쩌라고.


그래서, 보어가 동사보다 문장의 중심 역할을 담당하기 때문에 보어의 형태가 조금 더 자유로워지게 되는 결과가 나타난다. 이렇게 확장된 보어의 품사 중 명사가 있는 것이다, 라고 생각할 수 있다면 앞 문제의 the same이 명사인 보어라고도 생각할 수 있다. remain이 linking verb라고 간주하면서 말이다.


https://www.khanacademy.org/humanities/grammar/parts-of-speech-the-verb/linking-and-helping-verbs/v/linking-verbs-the-parts-of-speech-grammar


http://www.dailygrammar.com/Lesson-119-Transitive-and-Intransitive-Verbs.htm


https://www.btb.termiumplus.gc.ca/tpv2guides/guides/hyper/index-fra.html?lang=fra&page=objcompl.html


http://examples.yourdictionary.com/examples-of-linking-verbs.html


함정을 피하고 빠르게 풀기:

자/타를 구분할 수 있으면 뒤에 있는 것들은 부사인 척 무시하고 풀 수 있다. 그게 안 되는데 뒤에 명사가 출현하고 있다면 일단 is를 때려넣어 보자. 뭔가 해석 상 주어의 '상태'에 대해 둘 다 비슷하다는 느낌이 오면 빈 칸의 동사는 linking verb일 수 있고, 뒤에 있는 줄줄이들은 보어일 수 있다.


(강조하는데, 뒤에 붙는 명사가 주어의 상태를 수식해야 linking인 것이다.)


그러면 linking이라는 특성은 자동사에만 나타나므로 동사가 자동사라는 것을 짐작할 수 있다. 반대로 느낌이 1도 안 오면 목적어이니 타동사임을 알 수 있다.



3. 4, 5형식 동사와 능/수동태 결정


문제:

Melanie Gathers has appeared on TV several times since she ------ one of the most influential economists in the country.


(A) named (B) was named


정답:

(B)


빈출 오답:

(A)


오답자들의 생각:

뒤에 목적어가 있으니까 수동태 아닌가?


해설:

태생이 목적어를 2개 취할 수 있는 동사를 쓰는 문장이 있다. 바로 4형식과 5형식이다. 이 문장은 목적어가 두 개일 수 있으니 이 상태에서 수동태를 만들면 목적어 하나는 주어로 쓰고 하나가 남는다. 그것이 그대로 남아서 수동태의 목적어가 된다.


그럼 분류 기준이 다소 복잡해지는 게 아닌가 생각이 든다면 사실 맞다. 앞서 말했던 분류기준에 지금 막 추가된 것을 더하면 아래와 같다.


자동사 능동태, 타동사(3, 5형식) 수동태 + 목적어 없음

타동사(3, 4, 5형식) 능동태, 타동사(4, 5형식) 수동태 + 목적어 있음


즉 동사가 들어갈 자리가 빈 칸이면 뒤에 목적어가 있는지 보고 둘 중 하나를 적용하면 된다.


그런데 목적어가 없다면 문법 문제에서는 동사의 근본은 같고 형태만 다르니 자/타 여부만 알면 능/수를 결정할 수 있다. 그 반대도 가능하고 말이다. 그리고 3형식 동사라면 목적어 유무에 따라 능/수를 결정할 수 있다. 그런데 4형식이나 5형식의 동사는 목적어가 있으면 능/수를 구분할 수가 없다.


그래서 해석이 필요하게 된다.


문제를 해석해보면 아래와 같다.


'M뭐시기'는 TV에 자주 나온다 / 그녀가 그 나라에서 가장 영향력이 있는 경제학자~ 인 이후로


(A) ~를 임명한 (B) ~로 임명된


유명한 경제학자를 임명했으면 아마 그 사람이 TV에 나오는 것이 문맥상 어울린다. 그러니 그녀가 임명당해서 TV에 잘 나오는 것이 문맥상 더 맞다는 것이다. 그래서 답이 (B)이다.


그런데 만약에 능동과 수동 모두 말이 되는 것 같을 때는 어떻게 할까? 그럴땐 고민하지 말고 그냥 찍고 넘어가는 게 속 편한 방법일 수도 있다. 그래도 잘 찍는 방법이 있다면 이 토익 이야기를 맨 처음 했던 첫 게시물에 있었던 내용을 떠올려보자.


중간에 'Passive voice misuse'라는 것과 'Why avoid using passive voice'라는 것이 보일 것이다.


원어민이 수동태를 가급적 피해야 한다고 말하는데 능동태와 수동태 중에 뭐가 그래도 답일 가능성이 있을까? 당연히 능동태이다. ETS도 어쨌든 원어민 아닌가. 그러니 일단 능동태로 해석해서 말이 되면 그냥 능동태를 찍고 넘어가자는 것이다.

'배워가는 날들 > 토익' 카테고리의 다른 글

[토익] 2일차. 주어 동사 수 일치  (0) 2018.10.07
[토익] 1일차. 문장의 구조  (0) 2018.10.06
토익 공부 시작  (0) 2018.10.06
블로그 이미지

Amorest

,

(이 글은 정재현 강사님의 '기본부터 실전까지 한 권으로 끝!' 강의를 토대로 작성되었습니다.)


(아울러 강의 내용은 굳이 필요하지 않는 한 따로 적지 않습니다. 주로 적게 되는 것은 그날 강의의 이해에 도움이 되는 팁임을 미리 알려드립니다.)


1. 주어와 동사의 수 일치


문제:

Our present joint sales strategy ------ to be in place in time for the upcoming season.


(A) expectation (B) is expected (C) expect (D) have expected


정답:

(B)


빈출 오답:

(A)


오답자들의 생각:

sales가 명사면 동사가 필요하니 (B)가 정답인데, sales가 동사면 어떻게 되는거지?


해설:

joint sales strategy가 '공통(된) 판매 전력'이라고 해석될 수 있다는 것을 안다면 빈 칸에는 동사가 들어가야 된다는 것을 알 수 있다. 따라서 (B), (C), (D) 중 하나인데 주어인 strategy가 단수 명사이므로 (C)와 (D)는 문법상 오류가 있다. 따라서 (B)가 답이다.


참고:

물론 sales가 동사일 가능성도 있다. 당장에 빈 칸을 제외하고 보이는 문법상 오류는 없다. 'present joint'가 뭔진 모르지만 'strategy ------'를 팔고 있다고 하면 되니까 말이다.


그런데 그렇게 동사를 sales로 하면 자연스레 답은 (A)가 된다. 그리고 나서 그 뒤를 해석하지 않는다면 그대로 (A)를 찍고 넘어가게 된다.


다시 말해, 전체를 한 번 해석하면 (A)를 찍어도 고칠 수 있다. 그런데 그럼 어떤 부분과 맞지 않길래 이렇게 이야기할 수 있는 걸까?


Grammarly 프로그램 테스트:

입력:

Our present joint sales strategy expectation to be in place for the upcoming season.


결과:

The word expectation doesn't seem to fit this context.


수정 입력:

Our present joint sales strategy expectation.


결과:

문제 없음.


수정 입력:

Our present joint sales strategy expectation for the upcoming season.


결과:

문제 없음.


수정 입력:

Our present joint sales strategy expectation to be in place.


결과:

The word expectation doesn't seem to fit this context.


중간 결론:

strategy expectation과 to be in place는 어울리지 않을 수 있다.


수정 입력:

Our present joint sales strategy to be in place.


결과:

문제 없음.


수정 입력:

The strategy expectation to be in place exists.


결과:

문제 없음.


수정 입력:

We sales the strategy expectation to be in place.


결과:

The word expectation doesn't seem to fit this context.


수정 입력:

We sales the strategy expectation to be in place.


결론:

The word expectation doesn't seem to fit this context.


수정 입력:

We sales the strategy that expectation to be in place.


결과:

문제 없음.


결론:

위 입력들 중에 문제가 있었던 것은 전부 strategy와 expectation이 같이 쓰였을 때이다. 이로 미루어 볼 때, 오류가 있던 문장들은 중의적이었음을 짐작할 수 있고 이를 마지막 예시에서 that를 끼워넣으니 해결된 것으로 볼 때 그 짐작이 타당하다.


다시 말해, strategy expectation은 흔히 쓰는 관용구적인 복합 명사가 아니며, 문장의 목적어가 의미상 strategy가 강조되는 것인지, expectation이 강조되는 것인지 알 수 없기 때문에 to be in place가 수식하는 대상이 모호해지는 것이다.


이 정도는 그래도 문맥상에서 해결할 수 있는 정도일 수도 있다. 그러나 여기에 동사가 붙게 되면 동사가 취하는 목적어 역시 위와 같은 모호함이 생기므로 가독성이 심각하게 훼손된다.


이렇듯, 관용구나 문맥에서 이미 등장한 것이 아닌 복합명사에 수식어구가 붙으면 의미가 모호해지는 경우가 존재한다.


함정을 피하고 빠르게 풀기:

참고로, 이 방법은 시간을 소모하므로 먼저 다른 선지를 확인하는 것이 좋다. 다른 선지를 확인해도 답이 확실하지 않다고 생각되는 경우만 시도하자.

빈 칸을 채워서 복합 명사 형태가 되는 경우 문장을 꼭 한 번 해석하자.  전체 해석이 불가능하다고 해도 수식어구가 복합 명사들 중 정확히 어떤 단어를 수식하는 지 파악이 되어야 한다. 그것도 불가능하다면 복합 명사를 한 단어로 표현할 수 있는지 생각해보자. 한 단어로 표현이 안 되면 빈 칸은 복합 명사가 되어서는 안 된다.




문제:

The system for processing reimbursement request forms ------ since Mr. Jonas Hall was hired to work as office manager.


(A) have streamlined (B) streamline (C) to be streamlined (D) has been streamlined


정답:

(D)


빈출 오답:

(D) (다른 구문 분석으로 인한)


오답자들의 생각:

보기에 have가 둘이나 있으니 since는 현재완료시제에 따라 붙는 그 녀석(?)일거야.


해설:

일단 끊어읽기부터 시작해보자.


The system / for processing reimbursement request forms / ------ / since Mr. Jonas Hall / was hired to work / as office manager.


수식어구 표시, 예를 들면 분사, 전치사로 시작하지 않는 무언가를 본다면 주어인 것은 명확하다. 그러니 The system이 주어인 것은 아주 잘 알 수 있다.


동사는 얼핏보면 빈 칸이 동사인듯 하지만 뒤에 was가 있다. was 이하가 관계대명사절인가, 하고 생각할 수도 있지만 who만 날려먹는 문법은 없다. 그래서 was는 동사가 맞다.


그런데 얘가 The system에 호응하는 동사인지, Mr. Jonas에 호응하는 동사인지는 파악할 수 있으면 좋다. 물론 풀다가 for를 머릿속에서 임의로 that으로 치환해버린 결과, processing을 잘못된 절의 주어로 생각하더라도 (D)가 정답이긴 하지만 말이다.


방금 문제의 정답을 먼저 말하자면, The system에 호응하는 것이 맞다. 하지만 Mr. Jonas가 왜 아닌지를 알아야 하니, 여기서부터는 처음에 Mr. Jonas와 호응한다고 생각했다는 가정을 해보려고 한다.


그 오답으로 들어가는 입구는 since와 보기에 있다. 현재완료시제를 공부했다면 since가 튀어나오고 보기에 have가 있으니 분명 현재완료시제를 의심해볼 만 하기는 하다.


그런데 그렇다면 빈 칸이 동사를 포함하는 답이라고 할 때 forms를 수식하는 관계대명사절이 되는 것인가? 그런데 아까 who만 날려먹는 문법은 없다면서 which만 날려먹는 문법은 있는 것일까?


그런 문법은 없다. 따라서 since는 have와 호응할 수 없고, 그래서 since는 평범한 접속사가 된다. since가 접속사이기 때문에 since 앞에서 문장이 끝나고, 그 앞에는 동사가 없으므로 빈 칸은 The system에 호응하는 동사이다. 그래서 (D)가 정답인 이유까지 설명할 수 있다.



문제:

Because the capabilities Mr. Donald demonstrated ------ the expectations for his position, the nominating committee suggests he be promoted to the position of vice president of sales.


(A) exceeding (B) exceeds (C) exceeded (D) to exceed


정답:

(C)


빈출 오답:

(C) (다른 구문 분석으로 인한)


오답자들의 생각:

the capabilities가 목적격 관계대명사절의 목적어 아닌가요?


해설:

문법 문제인데 빈칸 앞에 문장이 완벽하지 않고 because를 봤다면 일단 콤마부터 찾는다. 그리고 그 뒤는 볼 필요가 없다.


그 다음, 동사처럼 보이는 것이 demonstrated이고 the capabilities와 Mr. Donald의 연결이 복합 명사가 되지 않는 것이 자명하니 관계대명사절인 건 알 수 있다.


그런데 그 관계대명사절이 목적어를 취하는 절인데 그 목적어가 the capabilities고 그 뒤는 다시 관계대명사절이면 빈 칸에 다시 동사가 와도 문제가 되지 않는다. 즉 (C)는 동사로서가 아닌 과거분사로써 앞의 관계절에서 생략되어버린 the capabilities를 수식한다고 말하는 것이다.


그런데 그러면 큰 문제가 있다. 바로 최조의 절인 Because the capabilities~의 동사가 없는 것이다. 그러므로 이 경우 Because of the capabilities~ 가 되어야 한다.


함정을 피하고 빠르게 풀기:

파악된 절 갯수와 파악된 동사의 갯수를 맞춰보자. 안 맞으면 구문 분석을 틀린 것이다.

'배워가는 날들 > 토익' 카테고리의 다른 글

[토익] 3일차. 능동태와 수동태  (0) 2018.10.08
[토익] 1일차. 문장의 구조  (0) 2018.10.06
토익 공부 시작  (0) 2018.10.06
블로그 이미지

Amorest

,

(이 글은 정재현 강사님의 '기본부터 실전까지 한 권으로 끝!' 강의를 토대로 작성되었습니다.)


(아울러 강의 내용은 굳이 필요하지 않는 한 따로 적지 않습니다. 주로 적게 되는 것은 그날 강의의 이해에 도움이 되는 팁임을 미리 알려드립니다.)


1. 주어


문제:

After Mr. Kim's work performance was evaluated, there have been ------ in his everyday tasks.


(A) improve (B) improved (C) improvements (D) improving


정답:

(C)


빈출 오답:

(B), (D)


오답자들의 생각:

1. Be동사가 나왔으니 분사형태가 답인가?

2. 동명사도 주어 되지 않나?


해설:

After Mr. Kim's work performance was evaluated, there have been ------ in his everyday tasks.


there은 가주어이다. 그래서 there have been은 뜻이 '~가 존재한다' 등으로 해석되며 이 구에는 주어가 없다. 따라서 주어가 필요하므로 명사인 (C), 동명사일 수도 있는 (D)를 고려할 수 있는데 동사가 복수 동사 have이므로 복수인 (C)가 답이다. 게다가 (D)가 동명사라면 관사가 있어야 하는데 관사도 없다. 따라서 (D)는 동명사가 아니라 현재분사다.


해설 이해를 위한 핵심 포인트:

there가주어다.


납득하기:

1. 동사는 주어에 수를 일치시킨다.

2. there에 수 일치가 가능한가?

3. 불가능하다. 따라서 there주어가 아니다.


(같은 카테고리인 가주어 it에 대해서는 익숙한 사람들을 위한 것입니다.


it은 수 일치가 가능하기 때문에 같은 방식을 적용할 수 없습니다.)


참고:

1. 'there be'는 문법상으로 주어인 듯하나 의미상 주어가 아니라서 허사라고 부른다고 한다. (위키피디아)

2. 그럼 'there 일반동사'는 뭘까? 이렇게 쓰면 there가 주어 아닌가?

 예시:

 There repaired the airplane.


 Grammarly 프로그램 테스트:

 문제 없음.


 구글 번역기:

 거기 비행기가 수리되었습니다. (수동태로 해석하고 문장의 주체가 비행기이다. 따라서 there은 주어가 아니다.)


 네이버 번역기:

 그곳에서 비행기를 수리했다. (부사로 해석하고 문장의 주체는 생략했다. 역시 there은 주어가 아니다.)


 결론:

 'there 일반동사'는 문법적으로는 문제가 없으나 가독성이 떨어질 수 있다. 영작할 땐 쓰지 말 것.


3. 조동사를 써도 결국엔 그 뒤에 Be동사나 일반동사가 오니 같은 경우라 볼 수 있다. 따라서 'there 동사' 구문, 다시 말해 there주어가 아니다.


함정을 피하고 빠르게 풀기:

there가 나왔는데 문법 문제이고, 콤마-콤마절 등 수식어구, 부사구, 관용구 등등 다 빼고 동사 근처에 빈칸이면 주어를 찾아보자. 아마 없을걸?



* * *



2. 동사


문제:

All of the members of the computer repair team have ------ persistently to make sure that the computer hardware is in perfect condition.


(A) working (B) worked


정답:

(B)


오답자들의 생각:

동명사 아닌가?


해설:

that절 이하는 수식절이니 무시하고 to도 수식어구나 무시하면 빈 칸이 있는 절은 주어와 동사만 있다. 이건 1형식일 수도 있고 빈칸에 목적어가 들어갈 수도 있다. 하지만 결정적으로 (A)는 관사가 없어서 동명사가 아닌 현재분사이다. 게다가 'have v-ing'라는 문법은 없다. 따라서 (B)이다.


참고:


 Grammarly 프로그램 테스트:

 입력:

 This sentence has emphasizing.


 결과:

 It appears that the verb emphasizing should be in the past participle form. Consider changing it.


 또 다른 결과:

 수정 입력:

 This sentence has an emphasizing.


 결과:

 문제 없음.

 

 수정 입력:

 This sentence has been emphasizing.


 결과:

 문제 없음.


 결론:

 'have v-ing'란 문법은 없다. 관사를 붙여서 동명사임을 밝히던지, been을 붙여서 진행형을 만들던지, pp 형태로 고치던지 셋 중 하나를 해야 한다.


함정을 피하고 빠르게 풀기:

동명사처럼 보이는 보기가 있다면 그 보기나 빈 칸 바로 앞에 관사가 있는지 보자. 없으면 현재분사다. 그 상황에서 앞에 been도 없으면 그냥 문법적으로 있을 수 없는 문장이다.



문제:

Dr. Xavier will receive an invitation from the Santa Clara Country Office of Education to attend a reception ------ the new County Superintendent of Schools.


(A) honoring (B) honors


정답:

(A)


오답자들의 생각:

명사랑 명사 사이 빈 칸이면 3형식 문장 아닌가?


해설:

from~Office of Education의 수식어구 빼고, a reception은 주어가 될 수 없다. 왜냐하면 앞에 to가 있으니 to부정사구인데 접속에 필요한 콤마나 that, 접속어가 하나도 없기 때문이다. 따라서 이 전체 문장은 하나의 문장이며 주어는 유일하다. 동사도 유일하다. 근데 동사가 이미 있으니 동사인 (B)가 답이 될 수 없다. 따라서 (A)이다.


추가적으로 분사, 형용사, 전치사가 주격관계절을 이끌 수 있다, 접속시킬 수 있다는 것을 알면 빈 칸이 들어간 절로 추정되는 서두와 전체 문제의 서두 사이에 접속에 필요한 무언가가 없다는 것을 확인하자마자 다른 보기를 먼저 지우고 시작할 수 있다.


함정을 피하고 빠르게 풀기:

명사랑 명사 사이 빈칸이면 답은 동사이거나, 빈칸이 접속에 필요한 무언가가 되거나, 복합 명사 또는 수식어구를 만들거나 셋 중 하나다.


일단 수식어구 빼고 동사가 문장 내에 하나도 없다면 동사가 답이다.


일단 복합 명사 또는 수식어구를 만드는 게 아니라면, 접속에 필요한 것이 있는지를 체크하자. 있다면 접속된 절을 끊어서 빈 칸이 있는 절에 동사가 있는지 보고 없다면 동사가 답이다. 위의 경우가 아니라면 분사, 형용사, 전치사가 답이다.


이 경우 현재분사와 과거분사가 같이 있으면 수동태인지 능동태인지에 따라 답을 결정하는데 수동태임을 확인하는 것은 by를 찾거나 목적어(명사스러운 것들)가 없다는 것을 확인하면 된다. 확인했다면 과거분사, 아니면 현재분사이다.


참고:

이렇게 생각하면 같은 어원을 가지고 가장 문제를 깊게 생각하게 만드는 경우의 보기가 다음과 같다.


(A) 동사원형 (B) 현재분사 (C) 과거분사 (D) 명사


실제로 드럽게 많이 나오는 형태다. 그래서 방금 적은 해설이 매우 자주 쓰인다. 그래서 해설을 요약하면,


1. 동사인가?

2. 명사인가?

3. 수동태인가?


순으로 답을 찾는다.


그리고 모를 때 빠르게 찍으려면 1번 확인하고 빈칸 뒤를 본다. 명사가 있는데 만약에 고유명사다 그러면 명사도 거른다. 명사랑 고유명사 연결할 일이 거의 없다. 사과와 애플 사의 관계 이런거 아니면.. 그래서 명사 거르고 나서 덕지덕지 뭐가 붙어 있으면 걔 중 하나는 목적어일 가능성이 있다. 그래서 과거분사는 거른다. 사실 전치사가 붙어서 오면 과거분사나 현재분사 둘 다 가능하다. 케이스를 봐도 현재분사가 커버하는 케이스가 더 크기에 찍는다면 과감히 과거분사를 버리는 것이다. 물론 썰렁하게시리 없으면 과거분사다.



'배워가는 날들 > 토익' 카테고리의 다른 글

[토익] 3일차. 능동태와 수동태  (0) 2018.10.08
[토익] 2일차. 주어 동사 수 일치  (0) 2018.10.07
토익 공부 시작  (0) 2018.10.06
블로그 이미지

Amorest

,

안녕하세요 Amorest 입니다.


군대를 전역하고 약 1주일간 재미있게 놀다 왔습니다. 그런데 놀다 보니 문득 '공부는 언제하지?' 라는 생각이 들었고 무엇을 할까 생각하다가 마침 복학하면 3학년이고 2년 사용가능 기한인 토익을 지금 따면 졸업학기에 제출이 가능하니 먼저 토익을 하기로 했습니다.


일단 수능 영어는 3등급이었고, 대학교 때도 영어로 강의를 하는 대학이어서 영어를 꽤 썼습니다만, 중국을 1년 다녀오면서 영어를 쓰는 비중이 줄었고, 이어서 바로 군대를 다녀왔으니 수업을 듣는다면 중급 정도 들으면 되지 않겠나 하는 생각이 들었습니다.


그래서 인강을 하나 구매했습니다. 평판이 좋은 것들 중에 정재현 강사님의 RC 강의가 맘에 들더군요. RC가 끝나면 LC를 할 생각입니다. 일단 공부 자체는 올해 안에 최대한 끝낼 거고 내년 1월부터는 미적분과 미분방정식 등 수학계통의 복습을 하고자 합니다.


이렇게 적고보니 상당히 빡빡한 군휴학이 될 것 같습니다. 하지만 해야겠죠.




1일차 강의에 대한 이야기를 하기 전에 여러분께 추천하고 싶은 프로그램이 있습니다.


사실 곧 1일차 강의에 대한 내용을 개인적인 정리 차 적겠지만, 그 전에 저는 어제 이미 1일차 강의를 반 이상 수강했습니다. 그러면서 든 생각이 '강의에서 설명해주는 오답은 이해하겠는데 내 답이 오답이고 그걸 설명을 안해주면 나는 어떻게 이게 틀렸다는 걸 이해할까?' 였습니다.


그래서 다운로드 받은 것이 'Grammarly'라는 프로그램입니다. 설치 방법은 구글링하면 금방 나오니 따로 적지 않겠습니다.


도움이 되는 건 구글 확장 프로그램보다는 Windows판입니다. 이 프로그램을 실행시켜서 본인의 오답을 적어넣으면 문법적으로 틀린 이유를 설명해줍니다. 물론 영어로 설명해주지만 이해하는데 문제는 없습니다.




이하는 간단한 예시입니다.


입력 문장:

There is cars.


설명:

The singular verb form is does not seem to agree with the plural subject cars. Consider changing the verb form.

(단수 동사인 is가 복수 명사인 cars와 맞지 않는 듯 합니다. 동사 형태를 바꾸는 것을 고려해보세요.)


굳이 한글 해석이 없어도 이 정도 해석은 즉석에서 할 수 있죠. 수정해야 하는 상황도 틀린 문장을 쓰는 사람이 조작한 거니까요.


그리고 추가적으로 문법적으로 맞는 문장도 영작법 면에서 어디가 틀렸는지 대략적인 힌트를 줍니다.


입력 문장:

After Mr. Kim's work performance was evaluated, there have been improvements in his everyday tasks.


Primium Alarts란에서의 경고:

Passive voice misuse

(프리미엄 판을 구독하시면 그냥 볼 수 있습니다만 저는 무료 유저라서..)


이걸 이용해서 구글링을 하면 다시 어디가 틀린지 정확하게 나옵니다. 사알짝 번거롭지만 이렇게 하면 토익 뿐만 아니라 영어 전반에 대해 공부할 수 있죠.


Passive voice detector

https://datayze.com/passive-voice-detector.php


Article: Why avoid using passive voice

http://advice.writing.utoronto.ca/revising/passive-voice/


(위 기사를 읽기 귀찮은 분들을 위한 해석 겸 요약.


1. 아래와 같은 경우에서 수동태를 사용한다. 아니면 쓰지 마라.


 - 주체자를 모른다.

 - 주체자가 누구든 상관없다.

 - 주체자를 숨기고 싶다. (주로 공문, 누가 한 건지는 그다지 밝히고 싶지 않으니)

 - 일반적인 사실이나 관용구, 흔히 쓰는 속담

 - 행위에 대한 강조

 - 랩 리포트의 경우, 본문에서 실험자보다는 실험체가 주가 되는 상황


2. 글쓰기, 특히 학문적인 글에서 수동태를 쓰면 주어의 부재로 혼란이나 부작용이 야기되는 경우가 있다.


 - 복수 주어 문장 다음에 문맥상 이어지는 단수 주어와 수동태 문장은 가독성에 문제를 야기할 수 있다. 예시:

 Both Othello and Iago desire Desdemona. She is courted.

 [Who courts Desdemona? Othello? Iago? Both of them?]

 - 행위자를 모른다는 것은 스스로 사전 조사가 부족함을 넌지시 말하는 것일 수도 있다. 그것은 자신의 무지와 준비 부족을 드러내는 것이다.

 - 어떤 행동을 자신의 과업인냥 취하려는 행위로 보일 수 있다. 이것은 읽는 사람 입장에서 불쾌할 수 있다.

 - 인과성을 떨어뜨린다. 이는 물흐르듯 이어져야 하는 글을 읽는 데 방해가 될 수 있다.


3. 따라서 1번을 잘 보고 꼭 필요한 것이 아니면 제거하자.)


저는 옆길로 새면서 다각도로 공부하는 게 취미라서 이렇게 하는 것도 좋더군요.


그럼 모쪼록 즐거운 공부 되시길 바랍니다.

블로그 이미지

Amorest

,

잘 따라오고 계신가요, Amorest입니다. 오늘은 교수님이 '확률 변수를 더 하고 시간 남으면 random process 에 대해서 공부해보렴' 이라는 소리를 들었지만, 이거 지금 하지 않으면 언제 하나 하는 느낌으로 계속 나가보겠습니다. 그리고 확률변수는 각 distribution 과 기댓값, 분산, 공분산, 적률생성함수, 그리고 합성곱을 빼면 남는게 없기 때문에 이것들에 대해서 잘 익혀두면 언제든지 필요한 부분을 써먹을 수 있습니다.


시작하기에 앞서, 여러분들에게 random process 에 대해 mental model 을 하나 제공해드리려고 합니다. 앞으로 random process를 이야기하고 무엇이 이전과 다른 것이었는지를 설명할 때 유용하게 써먹으실 수 있을 것입니다.


여러분과 제가 어떤 건물 안에 있다고 합시다. 눈 앞에는 건물 벽에 그대로 붙어 있는 아주 거대한 책장이 있는데 끝없이 길어서 오른쪽 끝이 보이지 않습니다. 다행히도 우리가 왼쪽 끝에 서 있어서 왼쪽 끝은 보이네요. 이제 책장을 보면, 책장은 칸으로 나뉘어 있습니다. 그리고 그 한 칸 한 칸에는 종이가 빼곡히 꽂혀 있습니다. 종이를 한 장 뽑아보니, 숫자가 쓰여 있습니다. 같은 칸의 다른 종이를 뽑아보니 다른 숫자가 쓰여 있습니다. 같은 칸에서 100장쯤 뽑아서 보고 있을 무렵, 사서가 와서 물었습니다.

'그래서 무슨 분포던가요?'


이것이 DTCV 혹은 DTDV random process 에 대한 mental model 입니다. 거대한 책장은 sample space를 말합니다. 그리고 한 칸 한 칸이 sample space element 가 됩니다. 여기서는 discrete 하기 때문에 칸이 나뉘어 있습니다. 칸 안에 들어 있는 종이들은 같은 sample space element들의 realization입니다. 칸에 든 200개의 종이에 숫자가 쓰여 있었다면 해당 random process의 결과로 나온 앙상블의 수가 200개인 것입니다. 그리고 각 종이에 쓰인 숫자는 process 의 결과인 것이죠. 그리고 한 sample space element, 여러 앙상블에서 나온 결과들을 보고 있으니 사서(혹은 교수님)가 와서 해당 sample space에서 어떤 분포를 가지는지 물어보았습니다.


궁극적으로 우리는 책장 안에 남겨진 결과들로 X[n]에서 어떤 분포가 나오는지를 추론하고 그 분포에 맞는 모델을 세우고, 그것을 다시 현실의 또 다른 sample에 적용시켜 우리의 모델이 실제 상황을 잘 follow하는지를 보고 싶은 것입니다. 이것이 random process를 배우는 이유입니다.


똑똑한 학생은 여기서 하나의 질문을 할 수 있습니다. 만약에 한 앙상블을 실험할 때, (새로 realization을 해서 결과를 칸 당 종이 한 장씩 기록해서 넣으려고 할 때)책장의 칸들이 서로 연관을 가질 수도 있지 않을까요? 그렇습니다. random variable과 random process의 차이가 바로 여기에 있습니다. random variable은 분포를 알고 있다고 가정하였습니다. 우리는 random variable을 배울 때 (어떤)분포 라고 이미 가정을 하면서 배우기 시작하죠. 예를 들면 푸아송 분포, 정규 분포, 감마 분포... 처럼 말이죠. 분포를 안다는 것은 매 시도에서 분포가 바뀌지 않음을 말합니다. 축구공을 보고 있는데 축구공이 야구공으로 바뀌거나 하지 않지요.


그러나, random process는 분포를 추론하는 방법에 대한 이야기입니다. 따라서 '어떤 분포일 때 이렇다'라고 얘기할 수는 있지만, 결과로부터 추론을 하고자 할 때는 모든 분포에 대한 가능성을 열어두어야 합니다. 분포를 모르고 시작하는 것이죠. 공이 축구공일 수도 있고 야구공일 수도 있고 탁구공일 수도 있는 것입니다. 그리고 놀랍게도 매 경기마다 공이 바뀔 수도 있습니다. 무엇인지 모르는 공으로 게임을 하고 몇십 판 해본 뒤에야 '아 이게 3번째 게임은 축구공이었는데 4번째 게임은 탁구공이었구나'하고 알게 된다는 것이죠. 마찬가지로 지난 번에 예시로 든 가챠도 11번째는 뭔가 달랐죠? 이 꼴로 비유하자면, 앞선 게임은 축구공으로 했었는데 11번째 게임만 탁구공으로 했던 겁니다. 그리고 심지어 'n번째 게임이 축구공이면 n+1번째 게임은 럭비공'이라는 아주 이상한 룰이 있을 수도 있는 것입니다. 이는 나아가서 우리에게 보이는 확률에 대한 논리의 복원 (컴퓨터 용어로 비유하자면 디컴파일 혹은 리버스) 을 과제로 제시하고 있는 겁니다.


이제 이야기를 종합하자면, random variable은 random process에서 X[n]에 대한 추론을 확인하는 데에 쓰는 방법론이 되는 것이죠. 그리고 X[n] 끼리 어떠한 상관관계가 있다면 (예를 들어 앞의 아주 이상한 룰 같은 게 있다면) 그것은 X[n]만 보는 random variable에선 찾을 수 없는 내용이고, X[n]'들'을 보는 random process에서만 찾을 수 있는 내용인 것이죠.


예를들면

'A 게임의 가챠를 분석해보자!' -> '가챠 process 를 realization 해본다' (혹은 데이터가 나와있다.) -> '결과들을 보니 n번째 distribution(X[n])의 분포는 P분포라고 생각한다' -> 'P분포는 각 확률변수에 따라 이러한 모양의 분포곡선을 가진다' -> '오차를 계산해본다' (개론에서는 다루지 않는 부분) -> '오차를 줄여본다' (마찬가지) -> '모델이 완성되었으니 잘 써먹어 보자'

의 흐름에서 random variable 에서 배운 P분포의 분포곡선은 X[n]들이 들어 있는 random process에 대한 model을 세우기 위한 도구로 쓰인 겁니다.




어쩌다보니 random variable과 random process의 scope의 차이를 쓰게 되었네요. 요약하자면 random variable은 나무를 보는 것이고, random process는 숲을 보는 것입니다. 그러니 앞으로 X[n]에 대한 함수가 나온다는 것은 두 책장 사이에 어떤 이상한 상관관계가 있다고 생각하시면 됩니다. X[n]이 베르누이 분포를 따를 때, X[n+1]은 정규 분포를 따른다 같은 아주 이상한 룰 말이죠. 하지만 이 정도로 이상한 룰은 현실에서의 모델링엔 쓸모가 별로 없을테고, 여러분들은 적어도 이거보다는 질서정연한 성질들에 대해서 배우게 될 테니 안심하셔도 좋습니다.


오래 기다리셨습니다. 이제 본론으로 들어갈까요? 가우시안 백색 잡음이란, 가우시안 분포를 이용한 랜덤 프로세스의 결과입니다. 가우시안 분포는 다른 말로 정규 분포입니다. 우리가 여러 분포들을 안짚고 넘어왔기 때문에, 짚어보는 차원에서 먼저 정규 분포에 대해서 보고 나서 넘어가고자 합니다.


%5CEalign%20f(x)%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%201%20%7D%7B%20%5Csqrt%20%7B%202%5Cpi%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%20%7D%5Ccombi%20%5E%7B%20-%5Cfrac%20%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20(x-E%5C%5B%20X%5C%5D%20)%20%7D%20%7D%7B%202%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%20%7D%7B%20e%20%7D%5Cquad%20%EB%98%90%EB%8A%94%5CEalign%20%3D%5Cquad%20%5Cfrac%20%7B%201%20%7D%7B%20%5Csqrt%20%7B%202%5Cpi%20%20%7D%5Csigma%20%20%7Dexp%5C%7B-%5Cfrac%20%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20(x-E%5C%5B%20X%5C%5D%20)%20%7D%20%7D%7B%202%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%5C%7D%20


정규 분포는 위와 같은 확률밀도함수를 가집니다. 눈여겨 볼 곳은 첫 번째 식의 계수인 1/sqrt(2πσ^2) 과 exp 내의 부분에서 분산을 바로 찾을 수가 있다는 것입니다. 이것이 왜 눈여겨 볼 곳인지는 Multivariate Gaussian random process 를 볼 때 알 수 있습니다.


정규 분포는 이쯤에서 넘어가고, 이제 Gaussian random process 를 보도록 합시다. 앞서 배운 Bernoulli random process와 random walk 에서 나온 변형된 Bernoulli random process 는 IID에 의해 각 책장이 '독립'이라고 언급을 했습니다. 지금 나오는 white Gaussian noise 역시 IID입니다. 따라서 marginal PDF(주변밀도함수) X[n]은 평균이 0이고 분산이 σ^2인 정규 분포를 따른다고 가정하겠습니다.


여기서 왜 marginal PDF라는 표현이 나오는가에 대해서는, RandomProcess[N, X[N]]의 marginal of X[N]=X[n] 이고 따라서 RandomProcess[N] = X[N] = X[n] 이라고 생각하시면 됩니다. 즉,

'어떤 random process의 결과는 N(책장의 순서, N번째 책장) 과 X[N](N번째 책장에 관련된 책장 사이의 룰) 으로 결정된다고 할 때, X[N=n]에 대한 RandomProcess[N, X[N]]의 주변밀도함수 = 분포 X[n]'

이라고 해석하시면 됩니다. marginal PDF 라는 게 사실 두 변수를 가진 joint PDF에서 하나의 변수를 특정한 상태로 고정했을 때 다른 변수에 따른 분포를 보고자 함이니까 여기서는 책장 사이의 규칙을 IID, 정확하게는 독립으로 고정한 것입니다.



위 식은 IID 인 white Gaussian noise random process 가 stationary 함을 보여주고 있습니다. 또한 joint PDF 가 multivariate Gaussian PDF 즉 WGN[N, X[N]] (WGN는 white Gaussian noise random process)의 관점에서는 영벡터 평균과 분산 대각행렬을 모수로 하는 정규 분포를 따른다고 언급하였습니다. 다른 말로 하면, X[N] (책장 사이 규칙) 을 고정하지 않았을 경우 (IID를 명시하지 않았을 경우), Cov(X_i, X_j) (i ≠ j)를 정의할 수 있는데 이 값이 0임을 말합니다.


바꿔 말하면, 'IID 인 WGN random process 의 분포 X[n] 은 0과 σ^2를 모수로 하는 정규 분포를 따른다' = 'WGN random process 의 joint PDF 가 영벡터와 σ^2 대각행렬을 모수로 하는 정규 분포를 따른다' 인 것이죠.


마침 오늘 multivariate random process 내용이 수업시간에 나왔으니, 이것을 조금 더 보도록 합시다.



X[n] 사이의 규칙을 이상과 같이 정의한 것이 앞서 말한 표현입니다.


이상으로 확률변수 기본을 마치겠습니다. 더 어려운 부분은 나중에 배울 기회가 또 생기지 않을까 생각하며 다음을 기약해보겠습니다. 이상 Amorest 였습니다.

블로그 이미지

Amorest

,

잘 따라오고 계신것 같아 매우 만족스럽습니다! 자 그럼 예고한 대로 stationary에 대해 알아보겠습니다. Stationary, 우리말로 풀어쓰면 '정지된', '가만히 있는' 이라는 뜻입니다. 즉, 우리가 알아볼 프로세스는 가만히 있는 랜덤 프로세스라는 것이죠. 뭐가 가만히 있을까요?


바로 '시간에 따른 확률이 가만히 있는' 랜덤 프로세스 입니다. 예를 들어 TCG를 생각해보죠. 여기 11연 가챠가 있습니다. 확률 p로 슈퍼 레어 카드가 드랍됩니다. 그리고 모든 i번째 가챠는 독립적이며 같은 확률 분포를 가지고 있는 IID 입니다. 이 경우 시간 i에 대해 확률 p는 변하지 않으므로 stationary random process로 이 가챠를 realizing 할 수 있습니다. 이것을 수식으로 증명하면,



이렇게 됩니다. Notation이 약간 주관적인데 코멘트를 달자면, p_X[n_1],X[n_2],...,X[n_N] 은 '결과로 나온 사건 X[n_1], X[n_2],... 의 이벤트 발생 확률' 을 의미하며 여기서는 이 사건들이 전부 독립적이므로 (multiply 1 to N){X[n_i]} 입니다. 여기서 multiply는 위 식에 있는 large pi 랑 같습니다.


이해가 안되시는 분들을 위해 추가 설명, 위에서 예시로 든 11연 가챠에서 각 가챠는 discrete 한 단위를 갖습니다. '나온다' 혹은 '안 나온다'의 상태밖에 없으니까요. 우리는 '나온다'에 1, '안 나온다'에 0이라는 표시 변수를 확률변수로서 할당할 수 있습니다. 이 경우 X는 p=(슈퍼 레어 카드가 나올 확률) 인 베르누이 랜덤 프로세스가 되죠. 여기서 이 프로세스를 수행하고 결과를 보았을 때, 결정된 X[n_i]들은 슈퍼 레어카드가 나왔을 경우 p, 나오지 않았을 경우 1-p 의 확률이었습니다. 그리고 각 사건들은 독립이었으므로, 프로세스가 그러한 결과를 가질 확률은 (p^a)((1-p)^b) (a+b = N) 이었던 것이죠. 따라서 두 식이 같음을 알 수 있습니다.


중요한 것은 두 번째 식과 세 번째 식이 같다는 것입니다. 이 식이 의미하는 바는 간단합니다. n_i 시간과 n_i+n_o 시간의 사건의 이벤트 발생 확률이 같다는 것입니다. 이 말은 이것이 같지 않은 경우를 예시로 들면 이해하시기 쉬울 것 같습니다. 예를 들면 11연 가챠의 마지막엔 항상 슈퍼 레어 이상의 카드를 드랍한다고 합니다. 그렇다면 X[0] (1번째 가챠)와 X[10] (11번째 가챠) 의 슈퍼 레어 드랍 확률에 대한 distribution은 다릅니다. X[n] (10이 아닌 n) 은 위와 같은 베르누이 확률변수를 가지는 반면에 X[10]은 확률변수가 아니죠. (변수는 최소 두 가지 이상의 상태를 필요로 합니다. 그런데 무조건 1이 나오는 것은 변수라고 할 수 없지요.) 두 distribution 이 다르기 때문에, 이러한 형태의 가챠는 IID 프로세스가 아니며 또한 Stationary가 아닙니다.


그렇다면 n_i 시간과 n_i+n_o 시간이 같다는 것은 모든 가챠에 대해 같은 distribution을 가진다는 것을 알 수 있습니다. 그리고 이에 따라 첫 번째 식과 네 번째 식이 같게 되며, 이를 만족시키는 경우 우리는 process 가 stationary 하다고 합니다.



주의하셔야 할 것은, 한 번의 시행만으로 해당 random process가 stationary라고 단정해서는 안된다는 것입니다. 앞에서 말했지만 결과는 봐야 합니다. 그래서 제가 구태여 과거형 표현들을 쓴 것이죠. '결과를 보았을 때' 라는 표현도 썼고요. 그러나 혹시 모릅니다. stationary 가 아님에도 우연히 stationary 한 결과를 내었을 수도 있습니다. 예를 들어서 아까 11번째 가챠가 무조건 나오는 것은 아니지만, 앞의 가챠들보다 20% 높은 확률을 가지고 있다고 합시다. 그러나 한 번의 시행으로는 이것이 20% 높은 확률을 가지고 있는지 알 수 없습니다. 따라서 이 정보만을 가지고 이것이 stationary 하다고 하면 error 라는 것이죠. Don't determine from a single realization 인겁니다.


아, 그리고 하나 추가하자면 어떤 랜덤 프로세스의 각 X[N]들이 IID 라면 그 프로세스는 stationary 하지만, 프로세스가 stationary 하다고 해서 그 랜덤 프로세스의 각 X[N]들이 IID 한지는 저도 아직 배우지 않아서 모르겠네요. 만약 어떤 확률이 fundamental set 을 가지고 있어서 같은 확률 분포를 가지지만 distribution이 다르다면 (아마 어떤 해석을 썼을 때 확률측도의 수의 영역을 복소수까지 확장하고 미분연립방정식을 허용한다면 이러한 경우도 있을 것입니다.) 이것은 성립하지 않을 것입니다만, 직관적으로 보기에는 성립하는 것처럼 보이는군요. 확률이 같으면 분포가 달라도 계산과 응용이 가능한가라는 실용성 문제도 있는 것 같고요.


다음 글에서는 가우시안 백색 잡음(Gaussian white noise)에 대해서 알아보겠습니다.

블로그 이미지

Amorest

,


지금부터는 앞 내용이 뒷 내용에 영향을 미치는 직렬 관계라기 보다는 병렬 관계에 가깝습니다. 그러니 앞 내용을 완전히 이해하지는 못해도 뒷 내용을 보는데 지장은 없을 겁니다. 자 그럼 이제 랜덤 워크(Random walk) 프로세스를 볼까요?

16.1 의 식을 설명하자면,
'모든 독립이고 동일 분포를 가지는(약자로는 IID) U_i에 대해서, 결과값 k=-1 과 k=1이 각각 p=0.5의 확률로 나타날 때, X_n은 지금까지 시도된 모든 U_i들의 합으로 정의한다.'
입니다. 이것이 랜덤 워크라고 불리는 것은 0.5의 확률로 오른쪽으로 갈지 왼쪽으로 갈지를 결정하기 때문입니다. 수직선 위에 사람이 서있다고 하고 U_i는 (i+1)번째 걸음이라고 하면 X_n은 그 사람의 변위라고 할 수 있습니다.

그럼 바로 아래의 식을 봅시다. 이 식은 위의 랜덤 워크를 프로세스로 바꾼 것입니다. 앞서 배운 notation을 기억하신다면, X[N, S] 형태를 떠올리실 수 있을 것입니다. 그것은 결과를 보고 이야기할 때 쓰는 notation인데요, 왜냐하면 앙상블이 여러 개 있어야 하기 때문이고 앙상블을 기록할 수 있는 조건은 프로세스가 수행되야 한다는 것이죠. 프로세스를 수행하지 않으면 결과가 없고, 기록할 앙상블도 없는 것입니다. 이 식은 결과를 이야기 하기 전의 식이므로 앙상블에 대한 변수가 정의되지 않으므로 X[N] 형태의 notation이 됩니다. 여기서 N은 sample space element인 것이죠.

이를 일반적인 notation으로 생각해본다면, X[(time)] 이라고 생각할 수 있습니다. n이나 t 등은 '시간'이라고 말씀드렸기 때문이죠. 마찬가지로 보면, U[i]역시 i라는 시간에 대해서 위에 있던 '걸음'을 재정의한 것입니다. 즉, U[i]는 'i번째 걸음'이라는 뜻이죠.

이러한 랜덤 워크 프로세스는 실생활에서 그 예시를 많이 찾아볼 수 있습니다. 저와 여러분이 가위바위보를 해서 여러분이 이기면 제가 모찌떡 하나를 드리고 제가 이기면 여러분이 저한테 모찌떡 하나를 주시면 되는 그런 심플한 게임은 사실 랜덤 워크 프로세스인 것이죠. (모찌떡이 먹고 싶었습니다.)


눈치채신 분도 계시겠지만, 사실 U_i는 베르누이 확률변수의 결과값인 0과 1대신에 -1과 1로 바꿔치기 한 것 뿐입니다. 하지만 바뀐게 있습니다. 베르누이 랜덤 프로세스는 매 X[n] (n번째 베르누이 확률변수) 의 평균이 0.5 였다면, U[i] (i번째 U_i)의 평균은 0입니다. 따라서 전체 (n+1)걸음을 걸었을 때의 평균 변위는 0이 되는 것이죠. 만약 랜덤 워크가 아니라 베르누이 랜덤 프로세스였다면 평균은 (n+1)/2 가 되었을 것입니다.

눈치가 더 좋으시다면 이 식에서 IID가 랜덤 프로세스에 미치는 영향도 알 수 있으실 겁니다. U[0] represent U[i]/(n+1)이라는 것이죠. 이것 때문에 평균이 (n+1)U[0]가 되며 분산이 (n+1)Var(U[0])가 되는 것입니다. 이것이 전부 IID에서 나오는 성질입니다.

이 프로세스를 수행하면 위와 같은 앙상블을 얻을 수 있습니다. 앙상블이 하나밖에 없으므로 여기서도 S가 생략됐습니다.

이번 글에서는 베르누이와 변형된 베르누이(랜덤 워크) 프로세스를 보았으며, IID 프로세스의 성질에 대해서 살펴보았습니다. 다음 글에서는 IID에 의해 일어나는 성질인 'Stationary'에 대해 알아보겠습니다.


블로그 이미지

Amorest

,

드디어 랜덤 프로세스입니다. 우리가 비록 각종 분포들 (정규, 베르누이, 푸아송, 감마, 카이제곱, 균등, ...) 을 생략하고 왔지만 이 분포는 여러분들과 제가 필요할 때 보아서 이해할 수 있을 것이라 생각하고 나가겠습니다.


랜덤 프로세스가 무엇일까요? 한국말로 무식하게 번역하면 '무작위 절차'라고 할 수 있을 겁니다. 무언가를 주면 무작위로 무언가가 나오는 절차라고 생각할 수 있습니다. 그리고 실제로 그렇습니다. 그럼 '작위적 절차'라는 것은 무엇일까요? 그것은 함수라고 생각합니다. y=f(x) 에서 X={a, b, c} 이고 Y={p, q, r} 이라 하면 Sample space (혹은 domain) 에서 a를 주면 언제나 결과는 q입니다. 이 관계는 시간 불변인 관계이죠. 그러나, 무작위 절차 즉 랜덤 프로세스에서는 이 공리가 깨집니다. Sample space 에서 같은 것을 주었다고 해도 결과가 다를 수 있습니다. 이 원인이 시간이라고 한다면 이 관계는 시간에 간섭되고 있는 것입니다.


이 경우 우리는 작위적 절차처럼 '함수'라는 것으로 직관적인 정형화를 할 수가 없습니다. (모든 랜덤 프로세스에 대해 최적화된 정형화를 직관적으로 할 수 있다면 지금 당장 취업을 하세요. 물론 직관을 증명해야 하겠지만, 증명 시간이 짧고 가성비가 좋은 랜덤 프로세스를 만들 수 있기 때문에 회사가 좋아할 겁니다. 한 사람이 일을 하는데 적은 시간이 걸린다는 것은 같은 월급을 주고도 더 많은 일을 시킬 수 있다는 것이니까 회사 입장에선 마다할 이유가 없죠.) 그러나 랜덤이라는 관계를 성립시키기 위해서는 주어진 결과를 represent 하면서도 어떻게든 랜덤'처럼 보이도록' 해야 합니다. 그리고 이 랜덤처럼 보이도록 만든 시간 의존적인 식은 우리가 제시하는 분포에도 맞아야 합니다.


이것을 직관적으로 하기 어렵기 때문에, 우리는 랜덤 프로세스들을 여러 case에 따라 분류할 것이며, 각 case에 대한 효과적인 식을 drive하기 위해 노력할 것입니다. 그리고 이 효과적인 식 (계산 수행 시간이 짧고, 필요한 정보가 적고 등등 효과를 논하기 위한 요소들이 있습니다.) 을 만들고, 더 개선하기 위해 지금부터 랜덤 프로세스를 배워봅시다.


(출처 : Intuitive Probability and Random Process using MATLAB)


앞으로 쓰일 notation들을 간단히 알아보기 위해 쉬운 랜덤 프로세스를 하나 가져왔습니다. 위 그래프들은 0부터 30의 자연수를 caring sample space로 하여 (실제 sample space는 infinite하지만 31이후로는 don't care한 경우입니다.) 이로부터 Bernoulli random process (p = 0.5) 를 수행하였습니다. 3개의 ensemble (그래프의 수가 3개이다.) 을 얻었으며, 그 결과를 위에 기록하였습니다.


앞으로 s represents s_i 는 i번째 앙상블 s_i 에 대하여 모든 앙상블을 s 라고 말하는 것을 의미합니다. 따라서 이 경우 X[N, S]에 대하여 S=s 이면 모든 앙상블을 지정합니다. 또한 N=n 이면 모든 sample space element 를 지정합니다. 예를 들어 E[X[n, s]] 이면 모든 앙상블, 모든 sample space element 에 대한 평균을 의미합니다. 위에서 보면 점선으로 표시된 영역이 X[18, s] 즉 N=18 인 sample space element 에 대한 모든 앙상블을 지정하고 있는 영역을 표시하고 있음을 알 수 있습니다.


일반적으로, n이나 t 등 sample space element들은 'time' 즉 시간이라고 합니다. 간단히 생각해서, N=20 이면 20 단위 시간이라는 표현과 같다는 것입니다.


우리는 앞으로 이 notation들을 이용해 여러 case들을 정의해 나갈 것입니다.


위 예시는 Bernoulli random process 였습니다. 그런데 이것을 잘 생각해보면 time(sample space)이 항상 discrete 하다고 생각할 수는 없습니다. 마찬가지로 value (여기서는 x_i[n] (i는 i번째 앙상블을 의미함), (x_i[n] = X[n, s_i])) 또한 항상 discrete 하다고 생각할 수 없습니다. 이 생각으로부터 우리는 DTDV, DTCV, CTDV, CTCV 를 정의합니다.


DTDV: Discrete Time, Discrete Value

DTCV: Discrete Time, Continuous Value

CTDV: Continuous Time, Discrete Value

CTCV: Continuous Time, Continuous Value


예시는 이렇습니다. 간단히 생각하면 discrete와 continuous의 차이는 최소 단위를 정할 수 있는가 없는가의 차이입니다. (a)를 보면 time과 value 모두 1이라는 최소 단위를 정할 수 있습니다. (b)는 time에 대해서는 가능하지만 value는 실수 범위이기 때문에 최소 단위를 지정할 수 없습니다. (c)는 time의 어디서 step이 일어나는지 모르고 따라서 최소 단위가 없지만 value는 1이라는 최소 단위를 지정할 수 있습니다. (d)는 그냥 없네요.


지금까지 앞으로 쓰일 notation들과 정의역(time)-공역(value)의 연속성 여부에 따라 DTDV, DTCV, CTDV, CTCV에 대해 정의해보았습니다. 다음부터는 잘 알려진 특성에 따라 앞서 연구한 수학자들이 밝혀 놓은 case들을 따라가 보겠습니다.

블로그 이미지

Amorest

,

합성곱은 여러분이 공대 혹은 수학을 조금만 하셔도 미분방정식, 신호처리이론, 물리, 전자기학 등등 많은 분야에서 등장하기 때문에 여기서 한 번 다루고 넘어가는 것이 좋을 것 같습니다.


사실 합성곱에 대해서 그 정의는 위키피디아만큼 완벽하게 설명된 곳이 없습니다.

https://ko.wikipedia.org/wiki/%ED%95%A9%EC%84%B1%EA%B3%B1


위키를 보면, 합성곱은 '하나의 함수와 또 다른 함수를 반전 이동한 값을 곱한 다음, 구간에 대해 적분하여 새로운 함수를 구하는 수학 연산자'라고 정의되어 있습니다. 실제로 오른쪽의 도식을 보면, 그러한 특성을 잘 확인할 수 있습니다.


확률변수의 개념 중 함수들, 정확하게는 CDF와 PDF를 이 함수로 볼 때, 그 합성곱에 대한 연산을 정의할 수 있습니다. CDF의 convolution은 독립인 확률분포 X와 Y로부터

%5CEalign%20%5Ccombi%20_%7B%20X%2BY%20%7D%7B%20F%20%7D(a)%5Cquad%20%3D%5Cquad%20P%5C%7BX%2BY%5Cquad%20%5Cle%20%5Cquad%20a%5C%7D%5CEalign%20%3D%5Cquad%20%5Ciint%20%7B%20%5Ccombi%20_%7B%20X%20%7D%7B%20f%20%7D(x)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dxdy%5Cquad%20(%5Cbecause%20%5Cquad%20%EB%8F%85%EB%A6%BD%EC%9D%B4%EB%AF%80%EB%A1%9C)%20%7D%5CEalign%20%3D%5Cquad%20%5Cint%20_%7B%20-%5Cinfty%20%20%7D%5E%7B%20%5Cinfty%20%20%7D%7B%20%5Cint%20_%7B%20%5Cinfty%20%20%7D%5E%7B%20a-y%20%7D%7B%20%5Ccombi%20_%7B%20X%20%7D%7B%20f%20%7D(x)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dxdy%20%7D%20%7D%5CEalign%20%3D%5Cquad%20%5Cint%20_%7B%20-%5Cinfty%20%20%7D%5E%7B%20%5Cinfty%20%20%7D%7B%20%5Ccombi%20_%7B%20X%20%7D%7B%20F%20%7D(a-y)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dy%20%7D%20

PDF의 convolution은 역시 독립인 확률분포 X와 Y로부터 구한 CDF를 미분하여

%5CEalign%20%5Ccombi%20_%7B%20X%2BY%20%7D%7B%20f%20%7D(a)%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%20d%20%7D%7B%20da%20%7D%5Cint%20_%7B%20-%5Cinfty%20%20%7D%5E%7B%20%5Cinfty%20%20%7D%7B%20%5Ccombi%20_%7B%20X%20%7D%7B%20F%20%7D(a-y)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dy%20%7D%5CEalign%20%3D%5Cquad%20%5Cint%20_%7B%20-%5Cinfty%20%20%7D%5E%7B%20%5Cinfty%20%20%7D%7B%20%5Cfrac%20%7B%20d%20%7D%7B%20da%20%7D%5Ccombi%20_%7B%20X%20%7D%7B%20F%20%7D(a-y)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dy%20%7D%5CEalign%20%3D%5Cquad%20%5Cint%20_%7B%20-%5Cinfty%20%20%7D%5E%7B%20%5Cinfty%20%20%7D%7B%20%5Ccombi%20_%7B%20X%20%7D%7B%20f%20%7D(a-y)%5Ccombi%20_%7B%20Y%20%7D%7B%20f%20%7D(y)dy%20%7D%20

위와 같이 구할 수 있습니다.


확률변수의 '합'이 어떻게 합성'곱'이 되는 걸까요? 수식으로는 납득이 되지만, 도저히 마음속으로는 이해가 안되시는 분들을 위해서 설명해드리겠습니다.


위키피디아를 잘 읽어보면, 사실 합성곱은 '곱'은 아니고 겹친 부분의 적분입니다. 곱의 형태가 된것은 X와 Y가 독립이었기 때문에 조건부 형태의 joint PDF가 아닌 두 개의 분리된 PDF들의 곱이 된 것, 단지 그 이유입니다. 그러니 X의 PDF와 Y의 PDF가 곱해진 것을 그냥 '겹쳐진 부분에 대한 함수'로 보아도 됩니다.


그렇다면 a는 무엇일까요? a는 X의 PDF의 2*(축)의 위치입니다. 무슨 소리냐 하면, 예를 들어 X와 Y가 같은 분포, 이른바 IID (독립임은 앞에 언급했으므로) 라고 합시다. 그렇다면 곱해지는 함숫값에 해당하는 정의역의 위치는 y와 a-y 입니다. y 에서 -y가 된 것은 전치를 의미하므로 전치가 되는 축을 구하기 위해 y = a-y 라 하면 y = a/2 가 됩니다. 이 때의 y를 '축'이라고 합니다.

예를 들어 a=1 이면 축은 y=1/2 인 것이죠.

IID인 두 분포 X와 Y의 평균이 m이라면 a=2m 일 때 합의 분포 X+Y가 최댓값을 보임은 쉽게 알 수 있습니다.


왜 이런 겹치는 형태가 될까라고 의아해 하실 수도 있습니다.


그것은 한 가지 예시로 쉽게 알려드리겠습니다.

철수와 영희가 영호에게 영호가 내는 문제를 맞추면 50원씩을 각각 받기로 했습니다. 철수와 영희는 문제를 잘 몰랐고, 할 수 없이 맞다, 틀리다 중 하나를 고르는 문제를 내었습니다. 이 때 철수의 돈의 획득 분포는 p=0.5인 베르누이 확률변수이며 영희도 마찬가지입니다. 그렇다면 두 사람이 받을 수 있는 돈의 합은 0원, 50원, 100원 중 하나입니다.

이제 겹치는 것의 의미를 보여드리겠습니다.


영희가 틀린 것은 흰색 별, 맞은 것은 검은 별, 철수가 틀린 것은 흰색 동그라미, 맞은 것은 검은 동그라미라고 합시다.


      ☆★

○●


철수와 영희가 떨어져 있으므로 (다시 언급하지만, 곱의 형태가 된것은 다름이 아니고 조건부가 '독립'이기 때문입니다. 따라서 아래와 같은 표현을 쓸 수 있습니다.)


 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 틀릴 확률

 정의되지 않음 (=0)

 철수 틀리고 영희 틀림

 0

 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 맞을 확률

 정의되지 않음 (=0)

 철수 틀리고 영희 맞음

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 틀릴 확률

 정의되지 않음 (=0)

 철수 맞고 영희 틀림

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 맞을 확률

 정의되지 않음 (=0)

 철수 맞고 영희 맞음

 0


이제 철수의 함수를 한칸 옆으로 옮기면,


      ☆★

   ○●


 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 틀릴 확률

 정의되지 않음 (=0)

 철수 틀리고 영희 틀림

 0

 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 맞을 확률

 정의되지 않음 (=0)

 철수 틀리고 영희 맞음

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 틀릴 확률

 0.5

 철수 맞고 영희 틀림

 0.25

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 맞을 확률

 0

 철수 맞고 영희 맞음

 0


     ☆★

     ○●


 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 틀릴 확률

 0.5

 철수 틀리고 영희 틀림

 0.25

 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 맞을 확률

 0

 철수 틀리고 영희 맞음

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 틀릴 확률

 0

 철수 맞고 영희 틀림

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 맞을 확률

 0.5

 철수 맞고 영희 맞음

 0.25


     ☆★

        ○●


 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 틀릴 확률

 0

 철수 틀리고 영희 틀림

 0

 철수 틀릴 확률

 0.5

 철수 틀릴 확률 위치에서 영희 맞을 확률

 0.5

 철수 틀리고 영희 맞음

 0.25

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 틀릴 확률

 정의되지 않음 (=0)

 철수 맞고 영희 틀림

 0

 철수 맞을 확률

 0.5

 철수 맞을 확률 위치에서 영희 맞을 확률

 정의되지 않음 (=0)

 철수 맞고 영희 맞음

 0


이때 맞은 사람 수를 기준으로 전체 확률을 합하면 0.25, 0.5, 0.25로 각각 0원, 50원, 100원의 확률임을 알 수 있습니다. 합성곱은 연속확률변수에서 적용되므로 베르누이 분포대신 균등분포를 사용하면 이와같은 삼각형 꼴의 연속한 분포 (삼각분포) 를 얻을 수 있습니다.


다음 글에서는 랜덤 프로세스에 대해 알아보겠습니다.

블로그 이미지

Amorest

,

이번에는 분산입니다. 분산이라 하는 데이터의 의미는 어떠한 실험 혹은 자료로부터 그 결과가 reliability 한가 라는 것을 알아보기 위한 것입니다. 예를 들어서 제가 어떤 실험을 계획했을 때 이 실험의 이론적 평균은 m이다 라고 했으면 가장 이상적인 결과는 표본평균 (실험집단으로부터 얻은 평균) 이 m (max validity) 이고 분산이 0 (max reliability) 인 것이죠.


validity & reliability 개념은 아마 대부분의 과학, 공학이론에서 쉽게 만날 수 있을 것이라 생각합니다. 저같은 경우는 인간공학에서의 실험 분석의 경우에서 배우게 되었네요. 혹시 이해가 될 만한 그림을 보고 싶으시다면 이 사이트의 그림을 보시면 이해가 되실 겁니다. 의학 쪽의 같은 개념을 설명하고 있는데 의학적인 내용은 무시하셔도 됩니다.

 

자 그럼 서론은 여기까지 하고 분산이라는 녀석의 용도를 알았으니 정의를 알아야겠죠.


Var(X)%5Cquad%20%3D%5Cquad%20E%5C%5B%20(X-E%5C%5B%20X%5C%5D%20)%5E%7B%202%20%7D%5C%5D%20%5Cquad%20%3D%5Cquad%20%5Csum%20_%7B%20x%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20(x-%5Cmu%20)%20%7D%20%7Dp(x)%20

많은 사람들이 저 기댓값 기호 안이 왜 제곱이고 절댓값이 아닌가에 대해 이야기를 합니다. 이에 대한 가장 심플한 답은 '효용성'이라고 하겠습니다. 절댓값을 씌운 계산을 한 것을 '평균편차'라고 부릅니다. 그리고 위의 분산을 구하고 제곱근을 한 것이 '표준편차'이죠.


원래의 의미를 따져보자면 평균편차가 reliability를 나타내는 데 더 정확하다 말할 수도 있습니다. 그러나 이 정보는 계산하기는 표준편차보다 어렵고 정보를 많이 포함하지만 과잉정보라는 것이죠. 무슨 말이냐면, 이렇게 계산한 평균편차는 다른 집단의 표준편차와 비교하여 비율을 낼 수 있습니다. 예를 들면 'X의 평균편차는 Y의 평균편차보다 2배 크다. 따라서 reliability도 2배 높다.' 라는 표현이 합당합니다. 이것은 표준편차가 2배라고 하여 reliability에 대해서 2배라고 할 수 없는 것과는 비교되는 부분이죠. 제곱이 되었으니까 알 수가 없습니다.


그러나 그래서 reliability가 2배 높다는 정보를 대체 어디에 써먹겠다는 겁니까? 우리는 이 정보가 필요 없습니다. 따라서 우리가 사용할 정보의 한계 안에서는 (같다, 다르다는 유의미하나 비율을 구하는 것은 무의미하다.) 평균편차와 표준편차가 모두 충분히 합당한 측도인 것입니다. 그럼 계산이 쉬운 것을 사용하지 않을 이유가 없습니다. 따라서 우리는 표준편차를 선호하는 것입니다.


그리고 이렇게 표준편차를 구하는 과정에서 분산을 정의하면 공분산에 대해서도 쉽게 정의할 수 있습니다.


Cov(X%2CY)%5Cquad%20%3D%5Cquad%20E%5C%5B%20(X-E%5C%5B%20X%5C%5D%20)(Y-E%5C%5B%20Y%5C%5D%20)%5C%5D%20%5Cquad%20%3D%5Cquad%20%5Csum%20_%7B%20x%3AP(X)%3E0%2C%5Cquad%20y%3AP(Y)%3E0%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20(x-%5Ccombi%20_%7B%20X%20%7D%7B%20%5Cmu%20%20%7D)(y-%5Ccombi%20_%7B%20Y%20%7D%7B%20%5Cmu%20%20%7D)p(x%2Cy)%20%7D%20


사실 분산은 X와 X에 대한 공분산이라고 생각할 수 있습니다. 그러나 분산과 공분산은 그 의미가 다릅니다. 분산이 reliability 에 대한 것이었다면 공분산은 correlation에 대한 것입니다. 즉, X와 Y가 얼마나 관계가 있는지를 알아보겠다는 것이죠. 공분산의 정의를 보면 이를 '편차곱'이라고 부르는 것도 무리가 아닌데 (물론 p가 xy plane에서 uniform distribution을 가질 경우), 간단히 생각해보면 Y가 X를 잘 따를 수록 이 값이 크게 나오게 됩니다. 물론 X가 X를 따르는 것보다 Y가 X를 더 잘 따르면 공분산 값은 분산보다 커질 수 있습니다.


http://blog.naver.com/ikek21/220003173213 : 공분산 부연설명

예를 들면, y-E[Y] = 2(x-E[X]) 같은 상황에서는 공분산이 분산보다 큽니다.

이런 면에서 'X를 가장 잘 따르는 것은 X인데 왜 Y가 X랑 다른데도 공분산이 분산보다 크지?' 같은 질문에 공분산으로서는 답할 도리가 없습니다. 더 잘 따른다 거나 덜 따른다 같은 개념은 공분산에서는 쓸 수 없는 개념이라는 것이죠. 그러나 X와 Y에 대해 엄밀하지는 않지만 적당한 측도 즉 경향성을 제공하는 것은 맞으며 (정확하게는 양의 값으로 따른다, 따르지 않는다, 음의 값으로 따른다를 쓸 수 있습니다.), 간편하기 때문에 널리 쓰입니다.


마지막으로 정의와 의미도 알았으니 실제 계산에 들어가봅시다. 저와 여러분의 수준에서 분산을 구하는 가장 써먹기 좋은 방법은 역시 '적률생성함수'를 이용하는 것입니다. 적률생성함수를 두 번 미분하면 제곱평균을 얻을 수 있고, 한 번 미분하면 평균을 얻을 수 있으므로 평균제곱도 구할 수 있습니다. 이를 이용해 (제곱평균)-(평균제곱) 을 계산하여 분산을 얻을 수 있습니다.


이상으로 분산과 공분산의 정의와 의미, 그리고 분산의 가장 써먹기 좋은 계산을 알아보았습니다. 그러나 이 글에서 후에 랜덤 프로세스를 다루게 될 때에 눈에 익으실 식을 잠시 소개하고자 합니다.


%EB%A7%8C%EC%95%BD%5Cquad%20X%5Cquad%20represents%5Cquad%20%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D%5Cquad%20%EC%9D%B4%EA%B3%A0%5Cquad%20Y%5Cquad%20represents%5Cquad%20%5Ccombi%20_%7B%20j%20%7D%7B%20Y%20%7D%EC%9D%B4%EB%A9%B4%5C%5C%20Cov(X%2C%5Cquad%20Y)%5Cquad%20%3D%5Cquad%20%5Csum%20_%7B%20i%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20%5Csum%20_%7B%20j%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20Cov(%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D%2C%5Ccombi%20_%7B%20j%20%7D%7B%20Y%20%7D)%20%7D%20%7D%20


이것의 의미를 설명하자면, X의 분포가 X_i 분포들의 합으로 나타내어지고 Y의 분포 또한 그러할 때 각각의 작은 분포들의 공분산의 합은 작은 분포들의 합의 공분산과 같다는 것입니다. 또한 이 식으로부터 Y_j = X_j 라는 조건을 덧붙여


%EB%A7%8C%EC%95%BD%5Cquad%20X%5Cquad%20represents%5Cquad%20%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D%2C%5Cquad%20%5Ccombi%20_%7B%20j%20%7D%7B%20X%20%7D%EB%9D%BC%EB%A9%B4%5C%5C%20Var(X)%5Cquad%20%3D%5Csum%20_%7B%20i%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20%5Csum%20_%7B%20j%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20Cov(%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D%2C%5Ccombi%20_%7B%20j%20%7D%7B%20X%20%7D)%5Cquad%20%3D%20%7D%20%7D%5Cquad%20%5Csum%20_%7B%20i%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20Var(%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D)%2B%5Csum%20_%7B%20i%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20%5Csum%20_%7B%20j%5Cneq%20i%20%7D%5E%7B%20%5Cquad%20%20%7D%7B%20Cov(%5Ccombi%20_%7B%20i%20%7D%7B%20X%20%7D%2C%5Ccombi%20_%7B%20j%20%7D%7B%20X%20%7D)%20%7D%20%7D%20%7D%20 


를 얻을 수 있는데 여기서 가운데 식과 오른쪽 식이 등식이라는 것은 이후 ACS (autocorrelation sequence) 에서 디랙-델타 함수와 함께 다시 보게 될 것입니다. 저기 j ≠ i 라는 식이 바로 디랙-델타 함수가 들어가는 여지가 되는 것이죠.


다음 글은 합성곱에 대해 알아보겠습니다.

블로그 이미지

Amorest

,