YouTube Video — Transcript

기초 통계의 핵심인 선형 회귀와 딥러닝의 기본 개념, 회귀 분석의 수학적 원리와 실무 적용을 상세히 설명합니다.

Key Takeaways

  • 선형 회귀는 예측 문제의 기본 모델로, 출력값이 연속적인 실수형이라는 점이 분류 문제와 구분된다.
  • 가중치와 편향은 모델의 핵심 파라미터이며, 이를 통해 입력 데이터에 대한 예측값을 생성한다.
  • 최소 제곱법(OLS)은 잔차 제곱합을 최소화하여 최적의 회귀선을 찾는 표준 방법이다.
  • 딥러닝은 다층 구조로 선형 회귀를 확장하며, 역전파와 미분을 통해 모델을 학습한다.
  • 다중 공선성 문제는 독립 변수 간 상관관계로 인해 회귀 모델 성능 저하를 초래하므로 주의가 필요하다.

Summary

  • 선형 회귀는 기초 통계에서 가장 중요한 예측 모델로, 지도 학습의 핵심인 예측과 분류 중 예측에 해당한다.
  • 회귀 문제는 출력값이 연속적인 실수형 데이터이며, 분류 문제와 달리 결정 경계가 아닌 수치 근사를 목표로 한다.
  • 선형 함수 y=wx+b의 개념과 가중치(w) 및 편향(b)의 역할을 설명하며, 딥러닝의 기본 플러그로서 선형 회귀를 소개한다.
  • 다중 회귀와 다중 공선성 문제를 다루며, 독립 변수 간 상관관계가 모델 성능에 미치는 영향을 설명한다.
  • 최소 제곱법(OLS)을 통해 잔차 제곱합을 최소화하는 회귀선 추정 방법과 그 수학적 원리를 상세히 다룬다.
  • 딥러닝에서 선형 회귀가 확장되어 다층 신경망 구조로 발전하며, 미분과 역전파를 통한 파라미터 업데이트 과정을 설명한다.
  • 실제 예제로 아이스크림 판매량과 온도 관계를 통해 회귀 분석의 현실적 적용을 소개한다.
  • 정보와 데이터의 차이, 1차 및 2차 자료의 개념을 설명하며, 모델에 필요한 가중치 정보만을 활용하는 방식을 강조한다.
  • 수학적 표기법과 차원 개념(R^d)을 통해 입력과 출력의 선형 관계를 이해시키고, 복잡한 모델 구조를 간단히 설명한다.
  • 파이토치 등 오픈소스 모듈 활용과 통계 및 컴퓨터 공학 분야의 협업 중요성을 언급한다.

Full Transcript — Download SRT & Markdown

08:46
Speaker A
C 안녕하십니까? 네, 안녕하세요. 네. 자, 오늘은요. 이제 기초 부분이 오늘하고 내일 딱 이렇게 마무리가 될 거 같은데 이제 제일 중요한, 이제 기초 통계에서 가장 중요한 통계의 꽃이라고 하는 선형 회귀에 대해서 같이 공부해 보도록 할게요.
27:57
Speaker A
우리가 이제 보통 지도 학습에서 가장 중요한 게 이제 예측하고 분류라고 그랬잖아요. 그중에 이제 예측 모델 중에 가장 중심이 되는 회귀 분석입니다.
28:11
Speaker A
이제 문제 정리하고요. 우리가 다 이미 써 봤지만 NN 리니어 선형 함수고요. 그다음에 여러분들이 이제 커스텀 클래스를 이용해서 모델을 어떻게 정의할까? 이미 잘 알고 있는 미스드 라스 클래스를 이용해서 우리가 손실 함수를 계산하고 이제 여기는 이제 실제 교재에서 돌렸던 내용들
28:33
Speaker A
데이터 준비, 모델 정의, 경사 하강법, 결과. 그다음에 이게 이제 중액이라는 게 이제 다중이라는 거예요. 여러 개의 변수가 있을 때 모델 실제 이게 맞죠.
28:45
Speaker A
그니까 두 개 이상이 x가 독립 변수가 있으면 우리가 다중 회귀라고 해요. 그리고 러닝 레이트를 어떻게 변경하는가? 어떻게 보면 지금 이미 한 번씩 다 돌려봤던 내용들이었거든요.
29:00
Speaker A
그거를 아, 정리하는 시간이다. 이렇게 생각하시면 되겠습니다. 자, 우리가 회귀냐, 회귀 문제란 뭐냐 이렇게 하거든요. 자, 이렇게 세 가지라고 보시면 돼요. 회귀나 출력값, 우리가 아웃풋. 그 즉 우리가 예측 모델이 예측한 값이죠.
29:20
Speaker A
이게 중요한 단어가 연속이라는 거예요. 실수형으로 나온다. 수치로 나오는 문제예요. 플로트. 즉 어떤 내가 입력값의 정확한 수치로 자 근사하다
29:35
Speaker A
하죠. 요게 목표예요. 이게 자 그래서 이게 이제 뭐 딱 끝나는 거는 로지스틱 회귀라고 그랬죠. 분류 문제는. 자, 분류는 클래시피케이션 해요. 출력합이 즉 딱 카테고리예요.
29:51
Speaker A
라벨링이 있다는 거죠. 개, 고양이 그죠? 합격이냐 불합격이냐 이런 거예요. 그래서 당연히 얘하고 얘하고 구분하려면 서로 경계면이 있어요.
30:04
Speaker A
그걸 결정 경계요. 디시전 바운더리 요게 키워드입니다. 자, 그 핵심 차이는 얼마나 많이 how much고요?
30:15
Speaker A
어떤 거냐? 무어 이게 뭐야? 이제 이거예요. 그게 분류예요. 우리도 강아지가 여러 종류가 있잖아요. 그냥 녹이라고 하면 되지만 또 깊게 가면은 왜 얘 무슨 개야?
30:30
Speaker A
그러잖아요. 어. 그래서 그거라고 보면 돼요. 어. 그래서 어떤 x가 있으면요 36.5° 이런 이게 소수점이 있는 보정소점이 있는 실수형으로 나오는 거예요.
30:42
Speaker A
컨티뉴어스라는 게. 그 집값이나 제일 많이 이제 나오는 게 그 아니면 온도나 판매량 우리 제일 많이 쓰죠. 데이터 분석에서 사실 현실에서 제일 많이 쓰는 거죠.
30:54
Speaker A
분류는 아 내가 이걸 딱 보고 대야 고양이야 이거죠. 그래서 딱 이산적이라는 게 보면 끊어지는 거예요.
31:03
Speaker A
딱 딱 구분된다는 거죠. 서울 같은 도시라도 서울, 대전, 대구, 부산 다 틀리잖아요. 그래서 스팸이냐 아니냐, 암이냐 아니냐, 품종이 뭐냐 이런 거예요.
31:18
Speaker A
자, 선형 함수는 딥러닝의 기본 플러그다. 제가 그랬잖아. 딥러닝은 회귀 분석의 확장판이라고 했어요. 그래서 자, 여기 내고성 얘기가 나오죠. 이게 왜냐면 내고성이 블록으로 돼 있어서 그래요. 그렇죠?
31:33
Speaker A
화려한 탑, 성벽 다 만약 이걸 2 * 4 레고 블록으로 만들어 줘요. 그러니까 이런 거를 하는 게 바로 뉴럴 네트워크 이게 이제 모듈을 가져온다는데 있잖아요. 리니어예요.
31:46
Speaker A
그러면 여기서 wx + b니까 w 즉 웨이트가 중요하다 이거. 그렇죠? 그러면 그걸 보정해 주는 값, 편향 이런 게 새로운 정보를 만든다 이거죠.
32:00
Speaker A
자, 핵심적인 개념이 이거죠. 1차 함수예요. 원래. 그러니까 이거 제일 많이 나오는 통계 교재에서 제일 많이 나오는 게 이제 이런 예제예요. 처음에 단일 하나만 있는 많이 보는 책이 세 가지가 있거든요. 일반적인 통계학 책으로 가장 많이 가 서울대에서는 현대 통계학
32:26
Speaker A
재미없게 돼 있죠. 정통계책이에요. 그다음에 좀 실무에 가깝게 이제 많이 합부해서 추천하는 게 그 이름이 그 앤더슨이었나?
32:39
Speaker A
앤더슨 통계학이었나? 그건 경제학이었던 거 같고 통계학 책이 하나 있어요. 그 이름이 갑자기 제가 생각이 안 나는데 이제 해외 하나. 근데 이제 저때도 책 두꺼운데 애들이 사기 싫어했어요. 한국판이 있어도. 네.
32:58
Speaker A
실습이 엑셀로 돼 있었거든요. 근데 이제 실제 그 당시 돌렸을 때는 R로 돌렸기 때문에 그다음에 이제 경영 쪽에서 이제 많이 나오고 그 실제로 그 책에서 데이터 분석 시험들이 많이 나와요.
33:15
Speaker A
어 그 중에 하나가 이제 경영 통계학이라는 책이죠. 그렇죠. 어 그 책에서 이제 나오는 예제가 뭐가 있냐면 저번에 한번 말했지만 아이스크림 판매 이제 날씨가 더워지잖아요. 아이스크림 매출이 얼마나 영향이 끼지냐 그러면 온도라는 변수가 있다. 그렇죠? 어 보통은 여름에 많이 드시잖아요. 아이스크림
33:36
Speaker A
일반적으로 근데 겨울에 가도 있어. 그게 바로 비다. 편하면 있잖아요. 겨울에 가도. 근데 이제 그냥 시구땡으로 하시는 분도 있잖아요. 밥 먹으면 먹는 거 그죠? 밥 먹으면 내가 마지막에 과일 드신 아이스크림 드신 분들이 있단 말이에요. 그런 수요들이 있단 말이야. 기본적으로. 어, 그게
33:58
Speaker A
B죠. 그리고 WX는 뭐냐면 가중치가 달라지는 거죠. 왜냐면 겨울에는 판매량이 만약 1이라고 하면 여름에는 두 배로 늘어나. 그러면 2X잖아요.
34:10
Speaker A
그 웨이트가 있는 거죠. 그렇죠? 어. 큰 거야. 그렇게 생각하시면 돼요. 그러니까 이걸 그냥 수학으로 이렇게 하는 거는 이게 이제 도시화를 하기 위해서 하는 건데 수치로 계산하는데 그거 이제 예제를 이해하면은 좀 쉬울 거예요. 그래서 우리가 1차 함수인 y는 wx + b라는 이 텐의 수위로
34:30
Speaker A
확장한 거. 텐션 3, 원 이상이 나옵니다. 입력과 출력이 직선적인 관계를 가능합니다. 그러면 B는 뭐냐면 요거예요. 우리가 그냥 원드 커피로 그냥 아이스 아메리카노를 먹어도 돼도 여러분들이 설탕이나 그렇죠. 연유나 이런 거 넣잖아요. 어, 그게 B라고 보면 돼요.
34:54
Speaker A
자, 그래서 패시브 뉴런이 두 개 이렇게 열 개가 이거예요. 완전 연결돼 있으니까 열 개의 어떤 것이 들어가서 세 개가 된다 이거야. 입력선.
35:06
Speaker A
입력선 열 개인데 그거는 마지막에 출력은 세 개가 나온다. 어, 그 얘기입니다. 그래서 바로 이거죠. 입력과 가중치의 선형 결합 그리고 편향이 있다. 구조 하나면 W 웨이트죠. 어떤 입력값에 뭘 가중을 해서 기존에 갖고 있던 어떠한 새로운 정보를 더해서 예측 모델을 만든다 이거예요.
35:34
Speaker A
그래서 웨이트라는 건 이게 가장 중요하죠. 우리가 이제 어떤 걸 API에 갖고 와서 어떤 모델을 쓰겠다. 이 뜻은 웨이트를 가져와요.
35:44
Speaker A
B는 보통 안 가져와. 왜냐면 B는 그 데이터의 적합가에 있는 새로운 정보잖아요. 근데 우리도 그걸 필요 없잖아요. 그게 뭐냐면 여러분 이제 이거 시험에도 많이 나왔는데 정보라고 하면 여러분이 제가 정보 뭐라 그랬어요? 데이터는 팩트예요. 근데 내가 지금 이 순간 어떤 과제를 하기
36:05
Speaker A
위해서 여러분이 인터넷 검색하던가 도화에서 어떤 책을 찾던가 그렇죠. 어 그래요. 그러면은 내가 이미 갖고 있는 교과서나 내가 갖고 있는 선원적 경험, 지식 체계 그리고 내가 직접적으로 이 과제를 하기 위해서 내가 찾아요. 그러면은 내가 즉시성, 적시성이라고 그랬죠. 내가 지금 필요해서 갑자기 뜬금 없다가 아무것도
36:30
Speaker A
안에다가 로봇이라는 키워드로 정보를 찾기 시작, 그 데이터를 찾기 시작해. 그게 바로 정보라 그랬죠.
36:38
Speaker A
정보에는 두 가지가 있어요. 나랑 관련되어 있는 건 내가 기사나 직접적인 거를 찾는 거야. 그거 관련된 책이나 논문을 어요. 근데 1차 정부는 내가 지금 업무랑 관련돼 있고 내가 지금 갖고 있는 자료고 2차 자료라는 건 여러분 아까 말했던 논문, 기사 근데 그 논문이나 기사는
37:02
Speaker A
뭐예요? 다 다른 목적으로 의해서 유사한 주제를 갖고 쓴 거잖아요. 여러분들 그 내용을 그대로 갖고 오는 게 아니라 여러분과 거기에 맞게 반영이 되죠. 제 말 이해되시죠?
37:16
Speaker A
그걸 생각하시면 돼요. 그러면은 거기에 그 기사나 논문에서는 어떤 목적을 갖고 어떤 대상을 했으니까 거기에 편향돼 있는 게 있단 말이에요.
37:28
Speaker A
우리는 그걸 안 써요. 뭐만 써요? 가장 중요한 그래. 그래서 한마디로 로보스 하면 생산량이 두 배가 증가돼. 오케이. 그 두 배라는 그 웨이트만 갖다 쓰겠다 이거.
37:41
Speaker A
그래서 여러분이 가져와 쓰는 것은 다 웨이트라고요. 제 말 이해되시나요? 어 갖다 쓰는 거. 어 모델을 갖다 쓰는 거는. 자, 그러면 디멘션이라는 거는 우리가 이제 외국서 이제 나중에 대학원 교재 보면 놀래 막 놀래요.
37:57
Speaker A
아, 학등이나 수학도 실어 죽겠는데 여기까지는 용인할 수 있는데 막 이땅이가 나와. 어, 그냥 간단하게 쓴 거야. 구구조 말하기 싫으니까.
38:08
Speaker A
수학의 힘이 그거죠. 네가 어떤 x가 있으면 그건 이건 R은 뭐냐면 리얼 넘버라는 뜻이에요. 실수 체계에서 d는 뭐냐면 디멘션이야. 그야. R 제곱하니까 뭘 제곱하 그게 아니라 2차원 공간에 있는 거야. 아, 이해되시죠? 그 뜻이에요. 3이면 3차원 공간을 표현한 거야.
38:29
Speaker A
이렇게 표현합니다. 결론은 다 실수예요. 그래서 모델의 가정은 입력 X와 출력 Y 거기에 선형 관계를 가정합니다.
38:44
Speaker A
바로 우리가 많이 했던 게 이거잖아요. 다시 한번 정리를 하면 우리가 제일 많이 이제 이거 OLS, OLS 정말 많이 들어올 거예요. 최소 제곱법.
38:55
Speaker A
이게 용어를 알아야 돼요. 영어로도 OLS. 왜냐면 실제로 OLS가 뭐예요? 설명해 보세요라고. 아주 간단한 거죠. 그냥 최소 제곱법 여러분 다 머릿속에 있는 거예요.
39:06
Speaker A
근데 기술 면접장에서 OLS 틀어봤는데 어음 하면 예 수고하셨습니다 하고 가요. 그렇죠? 어 30초 이상을 안 기다려 줍니다.
39:21
Speaker A
면접자는 여러분에게 주어진 시간은 3분이에요. 자 그러면 5차의 제곱합이란 스케어드예요. 그니까 가장 최소가 되는 스케어드 비주얼라이제이션이잖아요.
39:38
Speaker A
어려운 게 아니라 인디펜던트 베리블 뭐 알리 했던 거잖아. 독립변수 거기에 종속되는 거 디펜던트 베리얼이에요. 그러면 이제 인터셉트라는 건 뭐냐면 원래 절편값 있잖아. 갖고 있는 b예요. 그렇죠? 그러면 mx + b라고 쭉 있다는 거는 뭐냐면 요거죠. 요게 우리가 그때도 계속 말했던요 차이와 내가 예측의 차이
40:03
Speaker A
이게 레지듀얼 차이 요걸 다 더하면 이러죠. 그렇죠? 음. 자, 그래서 우리의 목적은요 y - y죠. 이 차이 이것을 하였다 본데 요게 플러스 마이너스가 있기 때문에 어떤 문제가 있어요?
40:24
Speaker A
플러스 마이너스 있기 때문에 0이 돼 버렸죠. 얘 이게 기대값이다 보니까 이 자체 우리가 회귀선 긋는 거 자체가 그래서 제곱을 해 주죠.
40:35
Speaker A
제곱을 해서 걔를 따로 이렇게 봐서 결국 우리 줄이는 걸 라스 펑션이라 보니까 가장 작은 값을 찾는다는 거죠.
40:44
Speaker A
그냥 5차 제곱 합을 최소하는 걸 우리가 찾는 게 목표예요. 5차 각각 포인트에서 잔차, 실제값과 모델이 예측한 예측값을 빼 줘요. 각각을 제곱해서 다 더해요. 포인트에 있는 열 개면 열 개에도 관측했으니까.
41:02
Speaker A
그래서 그 제곱의 합을 가장 작게 만드는 선을 찾는 거예요. 자, 그래서 제곱의 효과는 제곱하니까 큰 잔차 즉 이상치가 있으면 엄청난 페널티를 줬죠. 우리 봤죠.
41:17
Speaker A
144배까지. 어, 10이 나면 제곱하면 144잖아. 자, 그래서 딥러닝 관점에서 이 선형을 보면 딥러닝은 자체가 제가 그랬잖아요. 변수가 많아요. 그데 여기서 이 지금 이게 하나예요. 임층에 만약 이게 세 개만 있어도 무시할 수 없죠. 이게 만약 보통 우리 몇 개 층까지 샀냐면 256층 사요.
41:44
Speaker A
자, 여기에 생각해 보세요. 여러분 상식적으로 내가 세 개씩 영향을 받고 그것을 하나씩 나가는데 이게 256층이 있다고 생각하세요.
41:57
Speaker A
계산력 폭 터진 거예요. 만약에 우리가 하면 x가 세 개의 변수 있어요. 우리 많이 했잖아요. 맞지.
42:09
Speaker A
맛집에 영향을 주는 게 뭐야? 맛, 뭐 교통, 뭐 뭐 서비스 뭐 이런 거겠죠. 서로는 개념상 독립적이어야 돼요. 서로 겹치는 내용이 없으면 안 돼요. 패키분 상에서 서로 개념이 겹치면 같이 움직여요.
42:29
Speaker A
그걸 공분산이 같이 움직인다 그러고 그런 문제를 다중 공선성 문제라고 해요. 굉장히 중요한 문제. 어, 일반적인 회귀에서는 그러면 결과가 잘 안 나오거든요.
42:42
Speaker A
당연히 서로 영향을 주기 때문에 얘는 얘한테만 영향을 딱딱 주게끔 해 줘야 돼요. 무슨 말인지 아시겠죠? 그래서 다 각각의 영향이 합쳐 가지고 오죠.
42:52
Speaker A
자, 생각해 보세요. 여러분이 학교 성적을 옛날에 생각하면 그냥 학교에 다닌다고만 해 가지고 수업만 듣는다고 해서 성적이 오를까요?
43:07
Speaker A
그러니까 이거 상식적으로 생각하면 돼요. 그 변수. 아, 그래. 학교 가서 하는 공부. 두 번째 자율학습이 중요하죠. 그리고 필요하면 학원도 다녔잖아요.
43:17
Speaker A
그러니까 그거 수업 시간 뭐 아니면 과외 활동 이런 것들 다 변수잖아요. 그래서 거기에 그 영향이 합쳐 가지고 어떤 거에 영향을 줬지 않겠어요?
43:30
Speaker A
그러니까 그 변수에 어떤데 그중에 누가 주한 뒤 뭐는 반드시 해야 되는지 그렇게 생각하고 아니에요. 여러분이 이제 실제로 막 맨날 그런 걸 요구를 하는 거예요. 왜 뭐 공부를 그냥 앉아 가지고 열심히 앉아 가지고 공부한다고 해서 성적이 오르지 않아요. 제가 저도 그랬던 거
43:49
Speaker A
같아요. 중학교 때까지 엄청 놀았거든요. 너무 행복했어요. 넌 그거는 뭐 내가 안 한 거라고 생각해요. 중학교까지 그래도 뭐라고 안 하시고 놀게끔 놔둔 거 같아요. 근데 이제 고등학교 가서 대학을 가야겠다. 그죠? 제가 40명 중에 20, 25등년 그랬을 거예요.
44:11
Speaker A
중학교 때 고등학교 가서 대학을 가야겠다 싶어 가지고 하려고 하는데 공부를 해 본 적이 없어지.
44:19
Speaker A
그죠? 공부를 해 본 적이 없거든요. 그죠? 그냥 그냥 그래도 학원에 그냥 앉아 가지고 수업은 들었던 거 같아요.
44:28
Speaker A
그렇죠? 어, 여러분들도
44:47
Speaker A
답답하니까 한범론을 물어본 거죠. 근데 그게 나한테 맞냐 이거예요. 다시 시도해 봤던 거 같아요. 고일 때 모르니까.
45:00
Speaker A
어 그런 거 똑같아요. 지금 딥러닝이 그런 거예요. 그 가만히 앉아. 제가 지금 수학은 진짜 아직도 기억나요.
45:09
Speaker A
방정식은 좀 할만 했던 거 같아. 그래서 제 수학 선생님이 저한테 너 어떻게 지도해야 될지 모르겠다 그랬었어요. 왜냐면 중간고사 때 제도 기억나 중간 고사 때 65점이 나왔는데 기말고사 때 94점이 나왔던 거 같아. 그러니까 그리고 그다음 학기에는 70 몇 점 나왔고 그다음에
45:33
Speaker A
또 100쪽 나왔어요. 그러니까 이게 1억 제가 왜 수치 한정성에 대해서 말씀드린지 알겠죠? 여러분이 거꾸로 어떤 학생을 지도하는데 얘가 이렇게 널뛰기로 해요. 점수가 어떻게 지도할 거예요?
45:48
Speaker A
고민되겠죠? 그냥 차라리 70점대 80점대 90점 대면 아 여기에 맞게까지 내 솔루션을 어떤 걸 얘가 소화할 수 있겠다 이렇게 생각하지 않겠어요?
46:01
Speaker A
어, 그만 같은 거예요. 그래서 x와 w의 선형 결합가 + p라. 그래서 우리가 하나만 있다 그러잖아요. 단일 뉴론, 싱글 뉴론.
46:20
Speaker A
선용기는 환수할 수가 없는 한계 요런과 수학적으로 동일하다 이거예요. 그리고 트레이닝 오픈을 우리가 입력 넣고 예측 모드 모델 예측하고 정답하고 비유해서 라스 구하면 얘가 다시 역전파 이때 가선 중요한게 뭐예요? 미분 제가 그렇게 강조하어요. 미분이 안 되면 딥러닝이 안 돼요.
46:41
Speaker A
그래서 옵티마이저 동 받아서 WRP를 업데이트해서 얘가 다시내는 거죠. 이걸 무한 반복한 거예요. 이거 한번 반복하는 걸 뭐라 그래요? F 그렇죠?
46:56
Speaker A
자, 그래서 연산 그래프 컴퓨테이셔널 그래프예요. 연산량이 중요하잖아요. 얼마나 걸리는지. 요거든요. 얘를 손실 뭐예요? 실제 예측한 모델과 Y를 비교해서 손실 계산한다. 팔스 원리는 역적예요.
47:13
Speaker A
백프로케이션.이 이 라스를 줄이는 방향으로 기울기 그레디언트를 계산해서 파라미터이 WB를 스스로 갱신한다. 그러면 파이토치의 뉴론 네트 리니어 구조를 이해해 보여요. 바로 이거죠.
47:30
Speaker A
y는 WX 이거 이게 왜 이건 줄 아세요? 이렇게 열로 이렇게 나오게 돼 있어요. 수학으로. 그래서 트랜스포즈 해 줘야 돼요. 왜? 내적하려면.
47:44
Speaker A
그래서 요렇게 씁니다. 수학적으로도 80 모델이 모듈 구조는 상속받죠. 다 만들어져 있어요. 대부분은 유럴 네트의 모듈을 상속받아 구현합니다. 그래서 선형 변화를 적용해서 출록벡터를 생성해요.
48:01
Speaker A
헬스 패라미터는 뭐냐면 웨이트죠. 왜 모듈이 다 파이토치나 이런 데에서 만들어 주냐. 그리고 커뮤니티에서 다 하죠. 특히 통계 쪽하고 항상 컴퓨터 공항 쪽하고요 모듈을 계속 만들어요.
48:18
Speaker A
어 논문 인용수랑 똑같거든요. 내가 파이트워치나 이런 오픈 소스에다가 만들어 내가 통계할 교수님도 그래 가지고 내가 어떤 통계 어떤 걸 데이터 분석이든 뭘 하려고 연구를 하기 위해서 요런 걸 만들어 통계 지식을 갖고 있는데 이걸 컴퓨터로는 못 만들어 내가 잘 모르니까 그 컴공
48:43
Speaker A
교수님하고 항상 이조자로 해 가지고 같이 해서 논문트 같이 쓰고 모드를 올리잖아요. 다운 받아 이게 알 때부터 그랬어요. R도.
48:55
Speaker A
그래서 다운 받으면 코드랑 보통 SCI 논문할 때 코드 공개를 보 다 했기 때문에 저도 R을 공부했던 거 같아요. 그래서 어떨 때는 데이터도 줘요. 그 데이터 돌려 봐. 그러면 나가 검증하라고. 그래서 어 검증에서 그걸 인용을 많이 하잖아요. 논문도.
49:15
Speaker A
한마디로 우리 뭐 그 인플루언서가 되는 거예요. 이쪽 계통에. 실제로 개발자도 그래요. 기터브인데 여러분 포크라고 있어. 나중에 배우겠네. F와 이렇게 포크가 쏘는 거. 처음에는 저도 이해가 안 됐거든요. 자기가 했던 코드를 다 공개해. 일부러. 자기가 필요는 우리 회사 기미이거나 어쩔 수 없는 내가
49:39
Speaker A
지금 개발 중인 건 아니어도 코드를 일부러 공개. 포크하면 그냥 그거 홍채로 가져갈 수 있어요. 코드를.
49:47
Speaker A
근데 왜 그렇게 오픈을 할까요? 그게 인용수거든요. 그 인용수를 보고 스카웃제가 오는 거야. 그렇죠? 어, 그래서 그래요.
50:03
Speaker A
그래서 여러분들은 개발직이니까 어떻게 반은 하프 개발 직권 하프 엔지니어니까 그렇죠. 물리적인 두 가지를 동시 공략해요. 그러니까 귀한 거예요. 그럴 사람이 없거든.
50:17
Speaker A
이해되시죠? 그런 사람이 별로 없거든요. 모듈 유저로 보면 이렇게 상속받아서 선배를 낸 패라미터야. 가동체적 내가 나가는 것과 들어오는 걸 곱해 줘. 마이너스는 자동 미분이 그죠? 이거 꼭 기억하세요.
50:43
Speaker A
requires 2. 자, 저걸 하다는 건 내가 그레이드를 이제 추적할게다는 뜻이에요. 그렇죠? 음. 학습할 때 쓰죠. 이게 평가할 땐 절대 쓰면 안 돼요.
50:59
Speaker A
예. 자, 생성신 인피처스와 아웃처스를 지정한다. 그렇죠? 필수 데이터 특징과 일차입니다. 자, 선형 함수 인스턴스예요.
51:12
Speaker A
두 개가 들어가 세 개 나와서 L이라는 걸 만들었어요. 뭐요? 이게 다시 말하지만 두 개가 이제 막 헷갈려 하는게 데이터 두 개가 아니라고요.
51:23
Speaker A
속성 들어가는 거야. 속성 특징 정보. 그에 두 개 들어가서 세 개로 나온다는 거. 그래서 인피셔스 원래 저기 생략했던 거죠. 아웃세적 바이오스 출력이 나와요.
51:42
Speaker A
자, 하나 입력하고 하나 출력하는 거죠요. 토치 매뉴얼 CD에서 랜덤하게 하고 하나 들어가서 하나 들어가 가장 간거예요.
51:50
Speaker A
WB 하나씩 들어가 W 하나 들어가서 Y 하나 나오는 거죠. 자, 웨이트가 나와요. 하나. 뭐 그리고 바이어스도 0.03.
52:02
Speaker A
여기 써 있는 뭐예요? 지금 학습하니까 recru라고 설정돼 있어요. 학습 대상이다 이거죠. 그래서 이거는 초기 b를 주는 거죠.
52:11
Speaker A
초기값 컨스턴스로 웨이트는 2를 주고요. 마이너스는 1을 주겠다 이거야. 그럼 2x + 1이라는 함수를 내가 직접 만든 거예요.
52:21
Speaker A
자, 그러면은 입력 데이터 볼까요? -2부터 2까지 하나씩 증가해요. 그러면 이거스 앤드 인터벌이잖아요.요 사이에서 하나씩 증가하는 거를 넘파이 배열로 만들어 배열로 반드시 만들어야 돼요. 그래야지 연상이 돼요.
52:38
Speaker A
리스트는 안 됩니다. 연장이라고 했어요. 넘파의 배열은 토치랑 100% 호환된다 그랬죠. 그래서요 XMP를 텐서로 바꿔요. 그리고 프로트로 지정해 주는 거죠. 그러면 디폴트로 32비트로 토치 갖고 있는 지정이 됩니다. 그런 다음에 우리가 n 1이죠. 이거 많이 쓰죠. 하나씩 낮게 n 배치
53:02
Speaker A
사이즈죠. 그래서 n은 데이터 개수고요. 요게 중요하단 말이에요. 선형 함수 모든 토치는 매트릭스 구조로 받는 거를 기대하고 있어요.
53:15
Speaker A
예. 여러 개를 묶어서 돌려야 되니까. 배치 묶음 데이터를 처리해요. 그 2차원 텐서 입력을 가정한다 그 말인 거예요. 그래서 우리가 이미 했던 거죠. 아, 우리 잘 모르겠는데 뒤에를 하나 낮게 그렇죠. 얘 열 정도 놓고 여기에 배치 몇 개인지 모르면 -1 때리면 되죠. 그래서
53:38
Speaker A
x를 업데이트해요. 그런 다음에 x를 넣어서 y값을 구합니다. 자, 그랬더니 출력이 여러분 낮게 포장한 거 이렇게 나온 거죠. 왜?
53:49
Speaker A
하나 둘 셋 넷 다 5 1 다섯 개 있잖아요. 우리 어떻게 됐어요? 이거 컴퓨터 입장에서 읽으면 2차원이네요. 다섯 개의 배열 있고요. 하나씩 속 정보가 들어가 있어요.
54:08
Speaker A
자, 그래서 y는 2x + 1 수식에 따라 정확하게 개선됩니다. 그래서 입력은 -2, -1, 0, 1, 2, 다섯 개잖아요. 여기에 대해서 여기 집어넣으면 그럼 곱하면 -3 -1 1 뭐 정확하게 출력 얘기라는 건 x가 두 개인 거야.
54:37
Speaker A
그렇죠? 어, x가 두 갠데이 두 개가 어렵게 생각하는게이 속성 좀 그러니까 이게 마 많이 헷갈려 하더라고. 선용 해결 이제 할 때 코드 단에서 그냥 대충 이제 기본이 없으면 데이터 두 개는 줄 알아요?
54:51
Speaker A
아니라고요. 데이터 두 개면 행 정보잖아요. 그게 아니라 열가 들어가요. 그게 뭐냐? 예를 들게요. 아까 아이스크림 얘기했죠? 자, 아이스크림 판매 매출에 또 영향을 미치는게 뭘까?
55:05
Speaker A
거기 경영 통계 나오는 책이에요. 그리고 그게 그대로 ADSP에서 시험이 나왔었어요. 그 책에서 시험이 많이 나오거든요. 왜냐면 뭐냐 여러분들 우리나라는 특히 습기 있죠? 어 그렇죠. 그죠? 온도 아까 온도인데 습도 습기 많잖아요 우리나라도. 그러면 여러분이 좀 짜증나잖아요. 습기하면 그렇죠.
55:32
Speaker A
찐득찐득하니까. 어 그럴 때 샤벳 같은게 실제로도 많이 판매가 된대요. 샤벳가 그냥 아이스크림 말고 샤벳 있잖아요.
55:41
Speaker A
그러니까 그게 그게 뭐죠? 유명한 거 조스바 막 이런 거 스크루바 같은 거 그런 샤벳이 좀 많이 팔린대요. 자 그러면 어찌됐든 판매 영향을 미끼 미치는 여러분 궁금한 거죠. 어느게 더 중요한지 온도가 더 영향을 미칠지 10도가 영향을 더 미칠지 궁금하잖아요.
56:02
Speaker A
이제 그러니까 변수가 두 개 되는 거예요.이 예제랑 맞죠? 두 개가 매출이 얼마나 영향을 이해됐어요? 속손 정보라고.
56:14
Speaker A
그까 내가 두 개를 갖고 그러면은 어떻게 되냐? w 1 온독 + wx2 뭐예요? 습도는 아이스크림 매출 y 이런 식으로 써요. 그걸 다중액이라고 하는 이해되시죠?
56:35
Speaker A
자, 그러면 여기에서 두 개가 들어가. 이제 속성 정보야. 이거 다시 말하지만 그래서 하나가 나와.
56:42
Speaker A
그 뜻이에요. 그 a2라고 하고 일단은 모르니까 초기값 다 1로 놓는게 편하죠. 곱하기는. 그리고 편양은 내가 2로 그냥 하겠다 이거야. 그래서 여기서 인값은 상수값으로 L2의 웨이트는 1 주고 L2의 바이어스 편양은 2를 주겠다.
57:00
Speaker A
이거야. 그러면 두 개잖아요. 제가 말씀드린 거 맞죠? x1 x2 1 2 + 2 함수이 다중의 개가 완성됐어.
57:12
Speaker A
별거 아닌데 요거 쓰라는게 ADSP나 비공계 시험에 나왔었다고.이 간단한 건요 코드를 보고 요렇게 써라. 못 쓴 사람이 잘못 배운 거.
57:30
Speaker A
그러니까 이게 지금 만들었으니 우리가 테스트형으로 2차 데이터를 준비해야 되죠. 두 개의 변수가 있어야지. 반드시 열잖아요.
57:41
Speaker A
그 데이터 두 개인 거고 데이터가네 개인 거고 00 1 10 1이라는 데이터를 집어넣어서 그러면 얘도 집어넣으려면 넘파이면 넘파이로 바꾸고 펜으로 바꿔 줘야죠.
57:57
Speaker A
그래서 집어넣으면 2 3 4차 나오죠. 자, 교재 내용이 그거예요. 그냥이 왜냐면 그니까 교재가 잘 돼 있어요.
58:12
Speaker A
기본 교재는 기초에 충실을 하게 돼 있어요. 진짜로. 근데 이제 응용 교재가 어쩔 수 없이 프로젝트 교재예요. 그니까 중간 단계가 좀 없어요. 그래서 그 부분이 조금 아쉽긴 해요. 어 기간이 짧아서 그런 거 같아요.음 그러니까 앞에 기초는 실무 코드는 없고 다이 원리를 이해하는 코드로 돼
58:37
Speaker A
있고 제 말 무슨 말이 어죠? 응용은 완전히 실무에서 쓰는 걸로 팍 근데 내용이 이어지지가 않거든요. 다 여러 가지.
58:47
Speaker A
어 그러다 보니까 여러분들이 힘들어 하는 거예요. 그래서 이번 그 주말이 월요일 또 쉬죠. 대체 휴관인가 휴일인가 그렇지 않아요. 그렇죠. 꼭 복습을 꼭 해 주셔야 라고.
59:06
Speaker A
자 이번에는요. 두 개를 입력했는데 세 개가 출력되는 경우예요. 2 3이죠. 똑같죠?이 세 개니까 컨스턴트가 많은 거죠.
59:18
Speaker A
웨이트. 자, 뭐요? 어떻게 했어요? 0 1 2 초기값 설정할 때 웨이트가 그죠? 세 개니까 이제 근데 변수는 두 개죠.
59:32
Speaker A
0 1 2 세 개 있고 다 가중화 그리고 바이어슨 2하 요렇게 만들어져요. 세 개가.
59:43
Speaker A
그리고 이제 나오는게 이렇게 출력이 나오죠. 다음 커스텀 데이터에 대해서 공부해 볼까요? 자, 우리가 블록을 여러 개로 체계적으로 조립하고 라벨링 해 주는 거예요. 그때 파이썬 클래스죠. 첫 번째 우리 모델 그걸 네트워크라고도 많이 해요. 이게 뉴럴레시니까 입력 데이터를 받아 예측값을
60:09
Speaker A
만들어내는 모델 본체고요. 그다음에 우리가 크리테리언 이걸 손실함수라고 쓰죠. 기준. 예측과 실제 정답을 비교해서 5차 계산하기 위한 어떤 툴를 쓰죠. 항상 뭐 BC라스 뭐 이런 거. 그다음에 최적화. 근데 이제 여기서는 분류 문제가 아니기 때문에 이제 MSE 라스를 쓸 거예요.
60:32
Speaker A
이제 예측 모델이니까. 최적화 함수는 옵티마이저. 그렇죠? 그래서 계산된 5차를 바탕으로 내가 어떤 쪽으로 웨이트를 한 바이어스를 어떻게 조절해야 되는지를 모델의 파라미터를 결정해서 실행해 주는게 옵티마이저.
60:53
Speaker A
그래서 우리 항상 두 가지로 돼 있죠. 모델에는 모든 모델의 시작점인데 인포워드 이렇게 돼 있어요. 왜냐면 입력 모델 만들고 모델이 입력값 넣어서 예측하고 예측한 거랑 실제값 비교해서 5차 구하고 5차를 튜닝하기 위해서 옵티마이즈이 구조잖아요.
61:14
Speaker A
구조가 되겠잖아요. 그렇죠? 그러다 보니까 순전하죠. 순서대로 가니까 그래서 모델이 가는 건 그래서 인이는 뼈대를 고축하는 거예요. 내가 어떤 걸 쓸 거야 하고 선하고 초기하는 거죠. 즉 우리가 건물 지울 때 여러분 건물할 때 건물 지워져라 그랬으면 얼마나 좋겠어요? 뿅 하고
61:38
Speaker A
생겼으면 좋겠는데 나 아파트 필요한데요. 뿅 하면 얼마나 좋겠어요? 그런 생이 있으면 근데 그렇게 안 되죠. 아파트 치유를 하면 어떻게 돼요? 일단 땅부터 파잖아요.
61:51
Speaker A
그러면 어떻게 돼요? 그 기자재 오죠. 시멘트 오고 철골 오고 그거 없이 집 지어지겠냐고요? 그래 가지고 아파트가 무너지고 그런 거 아니에요. 기자재가 없으니까 재료를 재료 빼먹고 그래 가지고 실제 있었잖아요.
62:15
Speaker A
건물이 지어질 때 어떤 재료를 필요할지 모록을 딱 가성하는 걸 갔다 이거야. 얘 갖고 이게 다 클래스니까 클래스를 조립할 수밖에 없죠. 기본 구조가 이자. 그런 다음에 어떻게해요?
62:31
Speaker A
하나씩 만드는 거죠. 아까 그 순대로 흐름대로. 이게 플로우예요. 그래서 여러분들이 나중에 프로젝트 할 때도 중요한게 뭔지 아면 반드시 있어야 되는게 전체 구조도 하고요. 그림은 많이 필요 없어요. 설계 도면으로 우리가 모래 이제 컨셉을 말할 때 서비스 플로 아니면은이 모델의 구조 플로우
62:55
Speaker A
보통 두 개에서 세 개가 있어야 돼요. 그림이라는게 그냥 코드 이겁니다 하고 찍어 가지고 붙이는 경우 있어요. 아무도 안 들어요.
63:05
Speaker A
그냥 우리가 이런 거 했고 나중에 저 궁금하신 분들이 예를 들어 학미 님이 승현님이 동일한 주제를 할 경우가 있거든요. 그러면 어 우리는 이거 좀 힘들었는데 저 팀에서 저걸 구현했네.
63:18
Speaker A
어 어떻게 했는지 궁금하잖아요. 어차피 배우러 온 거니까. 어 그때 이제 만약 질문하면 코드 공개를 한다든가 어펜스로 보여 주는 거예요.
63:30
Speaker A
실제로 여러분들이 발표하거나 할 때는 뭐가 필요하냐? 이런 플로 차트예요. 요게 요렇게 갔고요. 우린 이렇게 모델링해서 이렇게 갔고요. 이렇게 갔고요. 무슨 말인지 아시겠죠?
63:43
Speaker A
그리고 만약 서비스 받는 서비스 개발 웹이나 앱을 개발한다 하면 어떻게해요? 아, 서비스 고객들은요 이렇게 받을 거예요.
63:54
Speaker A
보통 그렇게 하고 시원하죠. 자, 그러면 호드는 흐름을 정의하는 거예요. 내가 입력 데이터가 있으면 어떤 순서로 어떤 계산 연산을 해서 최소 예측값이 어떻게 하는지를 코딩하는 거죠.
64:09
Speaker A
설계도에다가 그냥 하는게 아니라 방 구조도 만든 거예요.이 방은 이렇게 돼 있고 창문 여기 있고 이해되시죠?
64:16
Speaker A
하나씩 여러분이 블록 코딩 하는 거야. 안 되는 클래스 정의 예제를 보시면 뉴럴 네트워크의 모듈입니다. 상속 받아요.
64:29
Speaker A
초기하고 인풋 아웃풋 입고 상속받아요. 그래서 걔를 리니어 통 하죠. 입력 특성수 출력 특성수 그래서 에론을 만들어요.
64:42
Speaker A
그래서 순전파 정의하죠. 요거 좀비물이고 생성자 X 넣어서 X 결국 나온다 이거죠. 그죠? 다시 한번 보면 NM 모드를 상속받아서 파이토스 다 했으니까 그리고 계속 업데이트 되고 있죠.
65:01
Speaker A
걔네가 그냥 하는게 아니라 어떤 논문이 나와서 그거 갖고 그분이 코드를 짜거나 뭘 하던가 어떨 때는 알로 짜요. 그러면은 이런 걸 쓰 메타잖아요. 메타에도 있는 사람들이 거기에 있는 인공지인 팀들이 그거 갖고 만들어요.
65:22
Speaker A
가게들 쓰면서. 그래서 어느 정도 사람들이 많이 다운받고 필요로 하는 기능들을 만든다 이거죠. 그 갖다 쓰는 거 음모 클래스를 초기해요. 슈퍼이.
65:39
Speaker A
그래서 정산적 동작 필요한 기본 설정을 해 주고요. 손접파 정의하는 거죠. 그다음에 우리가 클래스를 갖고 와서 우리가 원하는 형세의 변수로 바꿔 주는 걸 인스턴스라고 했죠. 인스턴스 만드는 거야. 처음에 모르니까 지금 입력 데이터인데 우리 많이 원즈 초기할 때 많이 쓰죠. 제로스만
66:02
Speaker A
얘가 개수죠. n 1인 거죠. 샘플 100개에서 한 개의 특성을 만들어 주겠다. 그래서 그 한 개 특성이 한 개 들어가서 한 개 출력한다는 거죠.
66:14
Speaker A
인풋 아웃풋 네트워크 통과시켜요. 그래서 인풋 넣어서 네트워크 통과시킨 요게 인스턴스죠. 예측 모델을 하는 거죠. 모델이 예측해서 예측하고 그거랑 비교하는 거죠. 그랬더니 처음에 찍으면 토치는 100 1이고요. 각각 찍은 내용들이 나오는 거죠.
66:40
Speaker A
자, 그다음에 우리가 중요한 미인시켜야 돼 이러죠. 실제값 빼기 예측값 제곱 해서 평균 다 더해서 n으로 나눈 평균을 해서 라을 거예요. 정의는 예치값 프레드와 실제값 타겟이라고도 쓰죠. 제곱 평균이죠. 틀린 정도를 얼마나 틀려 이게 못차적 수치화예요.
67:08
Speaker A
특징이 뭐냐? 페널티예요. 반드시 미분이 가능해야 되고요. 경상화법 적용이 0이에요. 5차를 제곱하잖아요. 큰 차가 나 네가 큰 옷차가 벌고 이상치라고 본 거야. 엄청난 벌점을 줘요.
67:24
Speaker A
스케일이 민감합니다. 그래서 어 그래서 얘는 타겟될 단위에 따라 손실 크기가 달라질 수가 있어요. 우리가 느낄 때. 왜 그러냐면 제곱을 하잖아요, 여러분. 그 값이.
67:38
Speaker A
그렇죠. 원래 자체 단위가 170 몸무기에는 km 두 자리 수잖아요. 제곱하면 만 자리가 돼요. 그렇죠?
67:50
Speaker A
그러니까 얘는 단위를 통일시켜야 돼요. 그래서 데이터 표준나 우리 노멀라이즈이 있어야 돼요. 자, 코드 볼까요?
68:02
Speaker A
코드는 되게 간단해요. 토츠 토츠의 뉴럴 네트워크를 NN이라 불러. 그런 다음에 우리가 아는 MS 라스만 딱면 여기 공식 다 들어가 있는데 우리가 엑셀이나 이런 거 쓰면 뭐야?
68:17
Speaker A
함수로 다 저 저장 저장돼 있는 거예요. 그래서 리덕션은 기본적으로 평균을 갖고 써요. 그렇죠? 그래서 라스 펑션을 만들고요.
68:28
Speaker A
손실 계산합니다. 일단은 파이토스럼 텐서로 바꿔 줘야죠. 연파일을 베어를 2.5 0.0 0 1.8인데 얘 훈련용이 쓰려고 require 그래 2 그래서 얘 만들고요.
68:44
Speaker A
정답인 Y죠 이거 y 토치의 텐스로 3.0 -0.5 2.0을 넣어요. 그래서 라스 펑션은요 두 개를 빌려 비교해서 라스 구하고 그러면은 이게 텐서니까 파이썬의 숫자로 만해서 아이템 소수점 네째짜리까지 하게 되면 0.1767라는 1차 6치7라는 답변이 나온 거.
69:18
Speaker A
다음에 우리가 손실 함수와 경사계가 계산을 해 볼게요. 뉴럴 네트워크에 미스케어 에러 놨잖아요. 얘가 크리테리언이죠.
69:28
Speaker A
그렇죠? 자, 그래서 요거 갖고 제로 갖고 제로가 100개 있는 거죠. 00 하나 하나씩 그걸 라벨렉스 1이라고 할게요.
69:40
Speaker A
손실 계산해요. 크리테리언 아웃풋과 라벨 정답인 거죠. 얘는 무시하세요.이 교재에서도 써 있어요. 이제 원래 교재의값과 같게 하기 위해서 나는 일을 했다고 했는데 이게 같이 끼쳐.
69:55
Speaker A
예측값과 정사의 우측을 계산합니다. 그다음에 라스의 백워드 백퍼케이션 하죠. 모든 파라미터 경사를 자동으로 계산해요. 그래서 실제 오래된 데이터긴 한데 어 실 데이터인 보스톤 직값 그렇죠.
70:18
Speaker A
주택 가격입니다. 보스턴 주택 가격 데이터에서 우리가 방해 평균 개수 그렇죠? 주택 가격을 예측하는 걸 풀어 보겠습니다.
70:30
Speaker A
당연히 방해 개수가 많으면 일반적으로는 평수가 높다고 생각하죠. 우리나라는 이제 평수 얘기를 많이 하는데 어 미국 같은 경우는 다 렌탈 아파트는 다 렌탈 개념이다 보니까 어느 식으로 이제 보냐면 방과 배수룸이 몇 개냐 그러면 대충 크기를 진접할 수가 있어요.
70:56
Speaker A
그래서 우리가 이제 방의 평균 개수가 얼마고 주택 가격이 얼마지를 한번 보겠습니다. 그까 506개의 주택 데이터가 있고요. 특성이 13개 있어요.
71:08
Speaker A
그중에 사용 특성 이거 우리 하나만 쓰겠다는 거야. 그렇죠? RM이라는 방의 개수. 그래서 우리가 궁금한 거는 반 개수와 프라이스 어떤 관계가 있느냐? 처음에 모르니까 3포도를 그려 보는 거예요.
71:27
Speaker A
그러니까 해 보니까 결과적으로 관계수가 많을수록 가격이 높아지는 선용관계 있다. 이거 찍어 보니까 관계일수에 따라서 가. 그럼 이걸 어떻게 찍었냐? 뭐 여러분들이 여기 여긴 판다스죠?
71:42
Speaker A
판다스에 리드 CSV를 해서 데이터가 들어와요. 그리고 얘는 공백일 기준으로 이제 분류를 한 거죠. 그다음에 데이터가 이제 갖고 온 데이터 같은 경우는 앞에 설명, 데이터 설명이나 이런 것들이 있거든요. 그 앞에 있는 거를 지우는 코드예요. 처음부터 갖고 올 때 전처리를 해서 갖고 오겠다는 거죠.
72:03
Speaker A
우리가 트랜스폼저런 같아요. 스킵로스 로가 있는데 행이 있는데 어떤 다른 쓸데없는 그냥 데이터가 아닌 어떤 설명이나 어 그런 것들이 있으니까 22개를 날려 버리겠다는 뜻이에요.
72:19
Speaker A
그리고 헤더가 없다. 그렇죠? 헤더는 이제 예를 들어서 우리 한마는 뭐 목록 뭐 이렇게 열 말하는 거예요. 컬럼 네임. 근데 그거를 없애겠다 이거죠.
72:35
Speaker A
그래서 로디 항상 갖고자. 데이터 프레임 형태로 갖고요. 그런 다음에 H스택이죠. 어떻게 H스택 옆으로 붙이죠?로 DF에서 밸류값만 하면 밸류값만 쭉 그러니까 데이터의 속 안에 내용만 바꾸는 거예요. 인덱스가 아니라 거기서 이게 뭐예요?
72:57
Speaker A
0 2 4 6 이렇게 짝수 형태로 인터벌 있는 거죠. 갖고 오고 열을 다져는 거고 얘 얘는 뭐냐면 1 3 5 7 9 이렇게 가겠죠. 그리고 얘는 0 1만 갖고 올 거예요.
73:14
Speaker A
자 그런 다음에 y값은 밸류값에서 1 3 5 7 9 이렇게 가겠죠. 그 얘 두 번째 거죠.
73:25
Speaker A
그래서 x하고 y를 구분한 거예요. 그다음에 피처 이름이 13개죠. 요렇게 가져와요. 배열로. 그래서 얘는 데이터는 다 가져오고 피처 네임은 RM인 것만 가져온다 이거죠.
73:42
Speaker A
이해되시죠? 어, 조건이잖아요. 그래서 x로 만들어서 얘만 갖고 했습니다. 그래서 이제 그다음부터는 모델 정의하고 인스턴스예요.
73:57
Speaker A
자, 네트워크하고 포워드 한데 이제 네트워크 뉴럴 네트워크 모듈을 갖고 오는데 생성자와 포드로 나눠져 있어요.
74:08
Speaker A
생성자는 주미무였어요. 인풋 아웃풋. 자, 처음에 상속 받아요. 그래서 인풋 아웃풋해서 리니어 모델 통과해서 에론을 정의합니다.
74:20
Speaker A
초위값은 다 1로 초기했죠. 웨이트와 바이너스를. 그런 다음에 x를 넣어서를 통과시키는 걸 x1. 그래서 우리가 리턴값은 호출하면 x1이 나오게끔 하는 거죠.
74:33
Speaker A
즉 입력값 하나 받아서 추력 하나를 하는 가장 단순 단순 선형 회계 분석입니다. 손실 함수와 최적 함수를 정의할 건데요. 손실 함수는 가장 대표적인 메인 스케드라스를 써요. 그래서 크리테리언이라 하고 여긴 평균 제곱차를 계산하는 거죠.
74:58
Speaker A
예측가 정답사의 차이를 제곱해서 평균된 거예요. 자, 그런 다음에 러닝 네이트는 우리 배웠으면 0.001 좀 큰 편이에요. 이것도 0.01이라고 놓고 옵티마이즈의 스타캐스 그레이드 디스턴트라는 걸 이용해서 W하고 B죠. 그 네트워크 모델이 갖고 있는 파라미터 학습 대상인 WB를 수정했다 이거죠. 그리고
75:22
Speaker A
에라는 여기 주어진 0.0를 0를 써서 최적하기를 만들어요. 그래서 경상화법을 수행하겠습니다. 학습 0.01로 파라미터를 업데이트해서 어떻게 할 건지 보폭을 결정해요.
75:38
Speaker A
경상관의네 가지 단계죠. 어떻게 하냐? 모델이 입력가를 받아서 예측을 합니다. 왜 손실 계산해요? 매측감 각과 정답 라벨 그거를 MS 라스로 해서 오차 계산하고 그다음에이 오차를 어떻게 했는지 계산해서 백프로게션 손실 줄이기 위한 방향으로 파라미터를 움직여 계산하고 이제 스타 하나씩 수정 가는 거죠.
76:12
Speaker A
스텝 옵티마이저 예운이에서 수정하고 그다음에 다시 초기하는 거. 제로드. 자, 보시면 계산된 기울기를 바탕으로 파라미터를 실제로 수정하고 스텝 밝으면서 다시 경사값을 초기합니다.
76:27
Speaker A
하나씩 하나 했어요. 초기 누적되면 안 되니까 초기하고 여기서부터 저기까지 다시 수정하고 초기하고이 작업을 하는 거죠.
76:40
Speaker A
그다음에 학습가 돕니다. 자, 보시면 전체 보세요. 0.00 0.01로 링레이트 학습률을 한 다음에 인풋 아웃풋 네트워크 통과시키죠. 예측 모델 나와요. 우리가 크리티어는 메인스퀘어 라스 평균 제고쳐 쓰겠다는 거죠. 옵티마이저를 사용해서 스타트 그레드센트로 넷 파라미터스 W하고 B를 수정하겠다. 러닝트는 주어진 0.01을 갖고 최적하기를 만드는
77:11
Speaker A
거죠. 경상법 하겠다 이거죠. 그래서 무려 5천번이나 반목합니다. 다음에 손실값만 기록하기 위해서 제로스의 0이 히스토리를 만들어 놓고 이제 저장해서 이제 나중에 히스토리 호출해서 보기 싶어서 반복합니다.
77:31
Speaker A
전체 5천번이죠. F 하나씩 돌면서 훈련 한 번씩 하는 거예요. 첫 번째는 반드시 경사값을 초기해야 돼요. 옵티마이 제로 그 가장 먼저 수행하셔야 돼요.
77:43
Speaker A
그런 다음에 입력값 넣어서 네트워크 아웃풋 예측 계산합니다. 이제 이거는 나누 2는 여기에서 교재에서만 설명도 돼 있어요.요 하다 보니까 정답지에 나온 거랑 일치하게 하기 위해서 나누기 일을 했다고 의미 없는 거예요. 원래 이거 없습니다.
78:01
Speaker A
아우과 라벨하고 크리티리 비교하는 거죠. 뭐로?에 기준으로. 그래서 라스 계산해요. 그다음에 경사 계산하고 파라미터 수정합니다.
78:18
Speaker A
자,이 전체적인 과정이 무한 반복돼요. 이게 기본이니까.요 그대로 가니까. 그래서 지금 한 눈으로 한 1분간 갖고 우리가 이걸 또 쳐 봐야 돼요.
78:29
Speaker A
오늘은. 어, 왜냐면 쳐 봐야 튜닝이 가능. 그 지금 어 LMM 하고 이러신 제자분들도 하이토치 쪽에 이제 특강 해 달라고 요청이 계시고 온 이유 중에 하나가 요거 몰라 가지고 그래요.
78:51
Speaker A
그냥 갖다 써 가지고 했는데 튜닝을 못 하니까 쭉 읽어 보세요. 1분 드릴게요. 코드 쭉 보면서 지금 편하게 독해 영어 독해하듯이 순서 요거 기억하시면 자,이어서 진행해 보니까.
80:14
Speaker A
그래서 이제 분석 결과에 대해서 해석하거나 하는 법을 좀 볼게요. 얘가 초기 손실값이 결국 154.2인데 우리가 보통 코드에서도 마지막 것만 궁금해하잖아요, 솔직히. 그래서 아, 그리고 이제 처음하고 요거 두 개만 찍어 봐요. 항상 아, 성능이 이렇게 개승됐다고. 5차가 그냥 있을 때는
80:36
Speaker A
154점이었는데 21.8로 확 줄었다고. 그래서 86% 계산됐다. 이제 이런 거 갖고 이제 보고서 하죠. 자, 뭐냐면 학습하면 이렇게 쭉 떨어져요.
80:52
Speaker A
손실이. 그니까 아, 잘 된다이 뜻이죠. 자, 그러면은 이제 코드를 오늘 돌려보면서 왜 그레디언트 폭발이 되고이 학습률이 왜 중요한지를 알 거예요. 발산이 되는 걸 여러분이 보시게 될 텐데 첫 번째 두 개 입력 모델을 확정하면 얘가 반개수하고 레스테 테스트는 뭐냐면 저소득자의
81:18
Speaker A
비율이에요. 제 좀이 두 개의 특성을 이용해서 모델을 확장한 거예요. 그러면은 세 개죠. 왜냐면 웨이트가 두 개죠.
81:31
Speaker A
하나 변속 두 개 저속자 비율 마지막에 바이오스 이해되시죠? 총 세 개 증가해요. 그다음 두 번째는 학습률 이게 지금 이렇게 되는데 0.01이죠.
81:46
Speaker A
요거 하니까 내가 이거 좀 큰 편이라고 그랬잖아요. 인피니티에 무한대란 뜻이죠. 나안으로 발산해 버려요. 학수이 너무 커 버려 가지고 아까 하나 할 때는 문제가 없었는데 두 개 하니까 그냥 정답 근처를 지나가 버려요. 제가 그때 그랬죠. 학습열면 크니까 학습열을 이제 보폭이라고
82:08
Speaker A
그랬어요. 그러면 뭐냐? 내가 자동차를 타고 가는데 내가 저기서 내려야 되는데이 무슨 말인지 알겠죠? 오른쪽으로 가야 되는데 내가 지금 1차선으로 신나게 120km 가. 그 옆에 차가 있어.
82:22
Speaker A
대각선으로 뚫고 와야 돼. 갈 수 있어요. 사고 나죠. 간혹가 저는 그런 걸 칩이 있을 때. 미국의 6차선 도로했거든.
82:34
Speaker A
LA에서. 근데 아무리 스포츠 카여도 어 트럭은 문이더라고. 그렇죠. 트럭도 110km 130 40km 거예. 아마 거기에는 마일이니까.
82:47
Speaker A
그렇죠. 트럭도 내 생각엔 한 140에 150 갈 거 같아. 미국 트럭 장단이 크거든요. 있다만 하거든요.
82:56
Speaker A
어 근데 여기 있던 애가 깜짝 놀랐었어도 제가 이제 그다음에 이제 오른쪽 막 깜빡이 켜고 이제 저기다 아지막 오른쪽으로 차선 붙으려고 하는데 갑자기 우 알잖아. 그런 소리들. 그런 그런 분들 가능 있죠.
83:12
Speaker A
소리 우웅하더니 페라리가 이렇게 하더니 진짜 대각선으로 가더라고. 확 처음에는 벌이었어요. 와. 근데 그다음에 끔찍한게이 차가 저는 날아가는 걸 봤다니까.
83:28
Speaker A
영화로는 멋있는데 실제 장면은 끔찍했어요. 화제가 나는 걸 봤으니까. 얘가 이렇게 가다가 받고 이게 날아가요.
83:38
Speaker A
진짜 뒤집힌다는 걸 처음 봤다니까 날아가더라고. 페라리가. 아마 즉사하셨을 거예요. 불렀어. 어 그럼 지금 같은 현상이에요.
83:56
Speaker A
알았죠? 치다쳐 버린 거예요. 그래서 학습률을 조절을 하는 거예요. 자, 그랬더니 보통 이렇게 줄여요. 10로 0.001로 했더니 최종값이 잘 나와요. 안정적으로.
84:20
Speaker A
그래서 더 나은 성공을 보였습니다. 그래서 여러분이 하이퍼 패라미터라는게 뭐예요? 파라미터는 주어진 거예요. 그리고 우리가 튜닝할 대상이에요. 학습 대상. 하이퍼 파라미터도 우리가 튜닝하는 거 맞는데 뭐냐면 우리가 설정해 준 거예요. 알겠죠? 그래서 러네이트는 중요한 하이퍼파라미터다.
84:47
Speaker A
그래서 요거는 제가 이제 머신에 배울 때 어떻게 수업도 하냐? 우리 음악 보면 음악 여러 개 나오잖아요. 근데 이제 어떤 행사나 DJ들이 와서 어떻게해요? 미싱하잖아요.
85:02
Speaker A
흥분하라고. 그렇죠? 찍찍찍 하면서 변경 막 하잖아요. 크게 하이퍼파라미 초절하잖아요. 거기 맞게 음악도 그 분위기에 맞게 음악 틀어 줘. 이해되시죠? 어 그 그게 화이퍼 판이 내가 튜닝하는 거죠.
85:23
Speaker A
그래서 어 우리가 알레스피 호출했을 때 포 함수하고 포워드 그때도 한번 얘기했었는데 모델의 인스턴트와 함수처럼요 호출하면거든 NL 모듈의 내장 우리가 스마트폰에 앱 아이콘 터치하듯이 이게 그거예요. 콜 요구하다 요청하면 이렇게 했던 거를 포워드가 실행해요. 그래서 이건 구조론으로 이제 궁금해하실 수
85:50
Speaker A
있으니까 책에서 설명이 된 거예요. 그러니까 이걸 뭐 반드시 알아야 되냐. 근데 이제 많이 보게 되니까 다 만들어져 있는 클래스 같은 경우에 이런게 적어 보이거든요. 콜 랜.
86:03
Speaker A
그래서 그걸 볼 때 아 이거는 원래 그 토체에서 제공하는 그런 기본적인 기능이구나 생각하시면 돼요. 그건 뭐냐면 인풋에 어떤 호출할 하면 인스턴스처럼 우리가 쓸 수 있잖아요. 근데 N 모드 자체에서 코디나는 호출해요. 보면은 여기 자동으로 실행된다 이거야. 네가 이걸 하면 얘가 자동으로 호출된다는 거죠.
86:29
Speaker A
그리고 정의된 포워드를 호출해요. 거기에 작성된 포워드 함수가 안전하게 호출한다. 이런 뜻이에요. 그래서 원래 그거 생각하시면 돼요. 여러분이 저게 뭐냐면 스마트폰이나 어떤 걸 실행하면 자동으로 실행되는 것들이 있잖아요. 그걸 말하는 거야.
86:52
Speaker A
어. 자, 그런 다음에 바이어스와 더미 변수와의 관계예요. 바이어스는 더미 변수에 해당하는 가정치가 같다는 뜻이 뭐냐면 자, 이런 것들 있잖아요.
87:04
Speaker A
서울트패시 강남호 테일로 101 이런 거 주소록 요거 분명히 하나는 지본이고 하나는 그 주 뭐죠?고 도로명 주소 그렇죠.
87:17
Speaker A
그거잖아요. 미국시 따라해 가지고 만든 거. 어차피 같은 장소잖아요. 다르게 말할 뿐. 그러니까 바이어스 항을 별도로 두는 방식도 있고 더미변스처럼 그냥 쓰는 방식이 있는데 근본 종류 통이 돼요. 그니까 파이토치는 요런 방식. y는 wx + b 이렇게 해서 별기로 취급해요. 근데 범변
87:42
Speaker A
뭐냐면 요렇게 따로 따로 w1 w1 0 x1 이렇게 바이어스를 더스 1에 곱해 가지고 가정치 w0로 하는 애들 방식이 있거든요. 근데 우파이토치는요 방식을 이용한다.
87:59
Speaker A
별개로 취급하는 거. B는 왜냐면은 바로 이것 때문에 사용자가 입력되 할 때 원래 뭐든지 b가 있잖아요. 0 b가 0이면은 없는 거고. 근데 일단은 뭐 보여 줄 때는 wx + b라고 써야 되거든요. 근데 별도 취급하니까 안 써도 되는 거야.
88:19
Speaker A
편하게. 그렇죠? 어, 만들어 주기 위해서 별도로 지급한다 이거예요. 자, 여러분들에게 했던 아이스퀘어 아시죠? 그 정의와 수식입니다.
88:33
Speaker A
그때도 수식으로 보여줬으니까 정리만 하면 될 거예요. 자, 모델이 데이터 분산인가 데이터가 퍼진 정도잖아요. 실제 데이터가 있는 거죠. 그걸 얼마나 설명하는지를 나타내는 결정 계수다라고 제가 설명을 드렸어요.
88:52
Speaker A
설명력이 뭐야? 파우저 전체 데이터 변동 분산 중에서 모델이 예측을 설명한 비율이에요. 1에 가까울수록 완벽하다 그랬죠.
89:03
Speaker A
상대 성능 기능이야. 어, 제 음수는 평균보다도 못하다는 뜻이겠죠? 설명력이 빵이니까. 빵도 아니고 더 못하니까.
89:13
Speaker A
자 그래서 이게 저번에도 우리가 알 수 있는 건 뭐였죠? 결론부터 말하면 우리가 예측선은 모델을 예측한 선이고 실제로 그 잔차를 비교했을 때 우리는 평균값은 알아요.
89:29
Speaker A
그리고 각각 포인트가 그렇게 되는 것도 알아요. 근데 문제는 왜 예측성과이 포인트가 차이가 나는지는 설명이 안 돼요. 그래서 설명이 되는 부분과 설명이 안 되는 부분이 있어요. 그러면 당연히 여러분 생각해도 설명이 되는 부분이 많을수록 모델이 설명이 높아지겠죠.
89:50
Speaker A
그거예요. 자, 그러면 RCK 스코는 예측값과 실제값과 예측값이 있는데 이게 뭐냐면 타겟 데이터에 내가 실제 데이터 관심 있는 데이터의 총 분산이랑이 뭐예요?
90:07
Speaker A
데이터가 있는 퍼진 정도인 거예요. 그러면 평균을 우리가 항상 얘가 어떻게 움직이는지 궁금하니까 기준이 있어야 되죠. 평균을 기준으로 잡고 얘가 어떻게 변하냐? 변동량을 보는 거예요.
90:20
Speaker A
그래서 y트루값 실제값의 평균을 y민이라고 하고 그렇죠. 우리가 실제값과 평균값을 빼요. 그렇죠? 요게 중요하다 그랬죠.
90:34
Speaker A
요렇게 그 ss tot라고 한 거죠. 그걸 다 토해. 야 자 봐요. y2에다가 평가를 뺀 걸 제곱해서 다 더해 걸트 이렇게 표현하겠어요.
90:49
Speaker A
그런 다음에 내주얼 오브스케스죠. 잔차제곱 얘는 실제값에서 예측값을 뺀 걸 제곱해서 다 더 더해요. 그러면은 얘는 뭐예요?
91:04
Speaker A
전체 잔차에서 요거죠. 설명이 안 되는 부분이거든. 이게 요거를 1의 전체 확률이니까 1에서 빼면 그게 R수표다 이거.
91:24
Speaker A
그래서이 r스퀘어의 의미와 해석이 되게 중요한데 얘는 이렇게 돼 있어요. 마이너스 무한대가 있을 봐요. 자, 그러면 1에 가까울수록 100% 설명하니까 완벽히 설명하는 거겠죠?
91:38
Speaker A
자, 보면 이게 베스트인데 이런 경우는 거의 없고 대신 모델이 데이터의 분산을 대부분 설명한다 이거야. 즉 y핵과 y값이 유사하다.
91:51
Speaker A
베이스 라인은 0이 0이라고 보는 거죠. 일부러 단순히 타겟 평균값만 추적한다 이거죠. 하나도 예측 기억 못 하다 이거. 이러면 최악이죠. 평균만 또 못 해. 그렇죠. 그래서 통계에서 가장 큰 욕이 뭐냐면이 평균만 또 못하네요. 그렇죠? 너의 야치값이 평균 또 못 하요. 최악의
92:15
Speaker A
모욕이에요. 그렇죠? 음. 통계학에서 가장 큰게이 평균만 또 못한 값이야 그러면은 어 망했구나 이렇게 생각했습니다. 어 평균도 안 나오는 기준 미더리면 어디?
92:35
Speaker A
자, 그러면 데이터 역행이라고 해요. 아. 어. 아주 그냥 고급진 언어로 까잖아요. 데이터를 역행하고 있다.
92:45
Speaker A
그렇죠? 용어가. 음. 이거는 모델 구조가 원천적으로 문제가 있거나 아니면 한 아,이 다시 말하면 극시 가족합 의심할 수 있어요. 과합이라는 건 뭐예요? 내가 지금 하고 있는 여기에만 맞고 남들이 하면 다 안 맞는 거야.
93:09
Speaker A
그렇죠? 어, 사람으로 따지면 뭔지 아세요? 자뻑이에요. 아, 내가 최고야. 아무도 인정하네. 이거랑 똑같은 거야. 왜? 했는데 네가 한 방법들 내가 썼는데 하나도 안 맞아. 그러면 안 쓰겠죠.
93:28
Speaker A
이거 똑같아요. 자, 내가 어떤 걸 만들었어요? 이거 아주 기똥 차요. 밥 봐요. 그래서 와 원님도 같이 썼어. 뭐야 이거? 그죠? 시님 썼어. 뭐야 이거? 그죠? 그냥 뭐 알죠? 시을 리을 기억 지급 당하는 거야. 내 제품이나 서비스.
93:47
Speaker A
나는 잘 되는데 너고 너만 갖고 놓아. 이렇게 되는 거야. 가족합이 그런 거야. 일반화가 안 된다고요. 누가 해도 동일한 성능이 나오고 해야 좋은 거잖아요. 그게 일반화잖아.
94:01
Speaker A
어, 성능이 떨어지더라도 누가 여러분 봐봐요. 원래 MP3는요. 성능이 떨어지는 거예요. CD 플레이어가 더 좋은 거였어요.
94:13
Speaker A
그렇죠? CD 음질이 더 좋아요. 옛날에 CD 플레이어 아시죠? 이렇게 휴대형 갖고 다니는 거. 그게 음이 더 좋아요. 근데 사람들의 선호도가 바뀌고 환경이 바뀌니까 성능이 좀 떨어져도 음질이 떨어져도 편하고 아무데나 하고 싶어한 니즈가 더 크니까 웨이트가 더 크니까 MP3가
94:39
Speaker A
1등이 된 거예요. 제 말 이해되시죠? 어 원래 그 MP3 말고 뭐 무슨 무슨 폼인가 그것도 있잖아요. 그 좀 좋은 거 뭐 이렇게 보면은 음질 똑같이 MPC3처럼 그건 따로 받고 다운 받더라도 그런 것도 계속 개선이 되는게 사실 MP3 말고 MD였나 이름이 그
95:06
Speaker A
CD에 되게 조그맣게 만든 거 있었어요. 어 제가 옛날에 군대 있을 때 선님이 저한테 그걸 팔아 가지고 제가 음질이 좋아 가지고 나중에 그냥 버리 버릴 때 너무 아까웠는데 어디 팔 때도 없고 꼬임에 넘어가 가지고 어 그게 뭐냐면 예전에 이제 그 그
95:28
Speaker A
방식으로 일본에서 유행했던 거예요. 뭐냐면 옛날에 지금 넷플릭스 전에 블랙버스터라고 했었어요. 얘네가 어떤 식이었냐면 이제 비디오 렌탈샷된 거죠. 근데 이제 적응적으로 한 거예요. 그죠?
95:42
Speaker A
어, 그래서 DVD나 이런 거 빌려 가지고 대신 걔네들을 또 이제 편하게 한게 미국은 차로가 가지고 이제 비디오 빌려면 자동차로 가야 돼. 걸어가면 20분이야. 그러니까 어떻게 하냐면 집에다 놔두거나 우책 우책 통 있잖아요. 거기 넣으면 자동으로 그쪽으로 반납이 되게끔 좀
96:04
Speaker A
편한 시스템을 그 당시에는 했었어요. 그래서 전국적으로 있었다가 확 끝나 버린게 뭐예요? 실시간이 되죠. 외울타.
96:16
Speaker A
어 그걸로 바뀐 거랑 똑같아요. 그러니까 걔네도 또 MP3 개념이 아니라 일본이 잘하는게 이게 옛날에 소니 워크맨이라고 해가지고 조그맣게 만드는 걸 잘해요. 걔네들이 그래 가지고 CD 음질 의지를들을 수 있다.이 진짜 조금해요.
96:36
Speaker A
이만해요. 여러분 MPC 플레이어보다 한 세 배 세 배 크기는 근데 일반적인 그 폴더 오브 폰만한 거 크게 있죠. 거기에 이제 조그만 시D처럼 있는 것이 유행했었어요.
96:49
Speaker A
일본도 그제 블러버스도 보고 그런 식으로 이제 사업을 했던 거 같아요. 근데 음질이 좋아요. 그래서 사람들이 그렇게 소유하거나 가지고 다니거나 그걸 빌려 가지고 하는 그런 문화가 아니죠.
97:03
Speaker A
시대가 바뀌었는데 그죠? 그런 똑같아요. 그게 뭐냐면 여러 가지 변수가 있는데 웨이트가 틀려진 거야. 통계적으로 얘기하.
97:13
Speaker A
그렇죠. 그걸 놓친 거예요. 지금 그럼 똑같아요. 그래서 여기서 시험에 진짜 많이 나오는 거죠. 정답에서 요게 뭘 의미하냐? 말문제로 알스퀘어가 85%의 의미는 뭐냐 이거예요.
97:35
Speaker A
그러면 토탈 밸런스 분해하고 해석하면 결국 모델의 설명력은 85고 얘는 안 된다 이거죠. 레지널 밸리언스 아까 요거 요거는 설명이 안 돼요. 왜 실제값하고 h값하고 차이가 나냐?
97:52
Speaker A
설명이 안 돼. 그래서 토탈 밸런스 전체 총 변동은 설명이 가능한 변동이 있고 설명이 불가능 내지도 있는데 모델이 설명이 가능한 것만 그러면은 간단해요.
98:13
Speaker A
저 요거에서 요거 나누면 되는 거잖아요. 요것 대비 몇 퍼센트 설명하냐? 이거 그렇죠. 그게 85%예요. 뭐냐면 데이터 가진 전체 변동선 중 85%가 설명이 가능하다. 예측 가능하다.
98:29
Speaker A
15%는 설명할 수 없는 차 노이즈다 이거는. 그렇죠? 어 그러니까 트렌드가 있고 자음이 있다는 거예요. 우리가 실제 이거 실타는 어쩔 수가 없어요.
98:41
Speaker A
그래서 여러분이 그때 어제도 지금 알파 유의 확률을 대부분 다 5%로 하는 거야. 우리가 어디 공장에서 있는 기계가 아니잖아요.
98:54
Speaker A
어 우리 그냥 멀쩡하게 다녀야 되는데 갑자기 이상한 잡병인 코로나가 와 가지고 그곳 생각한 거잖아요.
99:03
Speaker A
코로나에 생길 알았냐고요. 저렇게 유행할 줄 알았냐고요. 그 똑같아요. 노이즈가 엄청나게 많아요. 정상적이지 않잖아요. 어.
99:20
Speaker A
그러니까 요런 주요 경향성 트렌드를 잡아내는 거야. RQ는 그 경향성이 전체 데이터에 분포해서 얼마나 큰 비중을 찾아하는지를 보여 준다 이거죠. 근데 중요한 건 뭐냐면 인가관계 아니에요. R스퀘어가 모델 설명이 높다는 거지 원과 결과는 아니라는 거.
99:40
Speaker A
그냥 데이터 보고 그냥 선형식과 잘 맞아 떨어진다. 데이터가 그냥 한마디로 튼튼하다. 모델 설명력이 우수한 모델이다. 이해되죠? 그걸 인증하는 것뿐이에요.
99:57
Speaker A
자, 계속 나오는 과족합이에요. 내가 훈련할 때 완벽하지만 실전에 약해요. 그러니까 한마디로 이렇게 하시면 돼요. 여러분들이 그렇죠. 발표 준비를 열심히 했는데 발표를 망했어.
100:13
Speaker A
최악이죠. 그때는 여러분들이 최항이라 하지 말고 아 과감하이 이렇게 하는 거야. 나는 정말 답답한게 뭐냐면 7년 정도 그리고 지금 또 이제 여러분 뭐 간접적으로도 멘토 프로젝트들 우리 내부 프로젝트도 하니까 회사에서는 그렇게 노력하고 결과 안 나오면 답답해요. 그래서 여러분도 답답해서
100:41
Speaker A
지켜보면 저도 답답해요. 이서를 안 해. 발표할 때 그냥 어떻게든 개선하려고 발표한 시간 전까지도 막 해 발표가 제대로 되겠나? 자기가 정리가 안 돼 있는데 그건 똑같아. 훈련 데이터가 완벽한데 실전이 약한 거야.
101:07
Speaker A
일반항 안 되는 거야. 그게 뭐냐면 두 가지를 갖고해요. 트레인스 훈련 데이터는 떨어지는게 당연하죠. 여러분 생각하세요. 웬만한 사람들은 만약 여러분에게 열 문제를 주어주고 10일 동안 그 열 문제만 정답도 알고 계속 푼다. 그러면 안 맞을 사람, 100점 안 맞을 사람이
101:27
Speaker A
있겠냐고. 훈련을 계속하면은 5차는 적어져요. 근데 실타인 테스트 데이터를 넣어서 보니까 증가한다고요. 오히려 안 맞기 시작하는 이러면 오버피팅이라고 해요.
101:44
Speaker A
어. 처음엔 떨어지다가 나중에 올라가요. 오히려. 그래서 오버피팅이나 모델의 훈련 데이터를 너무 과도하게 암기해서 새로운 데이터에 일반 성능이 떨어져요. 이런 거 실제 있었죠.
102:01
Speaker A
제가 민간 자격증을 무시하는 것 중에 하나가 그거예요. 민간 자격증을 보면은 예 얘네들이 어떻게든 자격증 장사를 하다 보니까 그 자격 시험부위로 하다 보니까 하다가 뭐냐면 답을 어떤 뭐 모의고사라고 해 놓고 답이 있는데 그걸 달다 외우면 합격할 수 있게끔 만들어 놨어요.
102:25
Speaker A
그죠? 합격률이 70%다. 그거는 누가 해도 따는 거잖아요. 7, 80%라면. 그데 문제가 그러면 어떤 여러분이 알겠어요, 여러분? 한 말을 그거예요.
102:37
Speaker A
족보 있다. 그 여기서 그대로 나온다. 그 달달 외울 거 아니에요. 근데 만약 응용 문제가 나온다. 하나도 못 맞지죠. 그거랑 같은 거야.
102:52
Speaker A
중요한 뭐냐면 텀이 트레이나스는 계속 줄어는데 밸리이션 나스는 오히려 증가해서 격차가 벌어져요. 그때 해결 방법 이거는 과적한 문제는 딥러닝이 지병이라고 그랬어요. 그래서 저 대학원 이렇게 대학원이든 졸업하잖아요.
103:10
Speaker A
그러면 졸업하기 전에 졸업 고사를 봐요. 어 세 과목 정도 보는데 그때 요게 나왔어요. 과적화 방지하는 거 세 가지 이상 쓰시오.
103:26
Speaker A
자 봅시다. 첫 번째는 정교화예요. 리치 라스 규제 L1 규제 L2 규제 기억나시죠? 그리고 또 하나 알려 드릴까요?
103:37
Speaker A
여러분 이미 했어요. 사이킨의 모델 셀렉션의 임포트 트레인 테스트 그 뭐예요? 데이터 그것도 일반화를 해 가지고 하는 방법이에요. 정 이게 오피팅 방지법입니다.
103:54
Speaker A
또 하나 데이터를 추가하는 거죠. 오그멘테이션 N을 늘려야 됩니다. 세 번째 아직 안 배웠는데 바로 종류 조교 종류예요. 조기조 어려운게 아니에요. 이렇게 지금 과적합이 일어나는 지역이 있으면 여기다 끊어 버리는 거. 더 이상 개선이 없으면 끊어 버리는 거야. 이해되시죠?
104:16
Speaker A
성능 개선이 없으면 여러분이 성능 개선 없으면 계속 하겠냐고요? 어떤 거에? 어 그래서 저는 말씀드렸잖아요. 그냥 50 100 이렇게 돌린다고 그냥 폭을 어차피 뭐만 설정하면 돼요. 조기 종류를 설정하면 알아서 끝나요. 그렇죠? 성능 개선 없으면 알아서 끝나니까 자동하고 자 그래서 우리가 또 중요한게
104:47
Speaker A
리치죠. 있지? L2 제일 많이 쓰니까 이게 먼저나 L1부터 L2를 해요. 딱 봐도 알겠죠? L2는 아제곱 L1은 절댓값 알겠죠? 어 L2는 근데 왜 그냐 규제잖아요.
105:06
Speaker A
얘는 요거예요. 제가 여러분들 그 생각했다 저도 그랬잖아요. 그냥 외웠어요. 처음에 대학원에서 석사할 때는 나중에 박사할 때는 이거 논문도 써야 되는데 이건 아닌 거 같은데 계속 나오는데 중요한데 어 에러는 줄여야 되잖아요. 에러는 줄여 가지고 라스 줄이는게 좋은데 왜 더하기를 했지? 저는 잘못 나온 줄
105:28
Speaker A
알았어. 못한 줄 알았어. 그게 아니라고요. 얘가 줄 있는게 목표는 맞는데 전체적인 목표는 오버피팅이 나면 안 되죠.
105:43
Speaker A
그러니까 뭐예요? 과도하게 라스가 암기를 하는 걸 방지하기 위해서 여기까지는 요건 지켜 줄이더라도 이건 지켜 이거예요.
105:57
Speaker A
여러분들이 그거 똑같아요. 엑셀이 있지만 브레이크가 있는 거랑 똑같아요. 그렇죠? 어, 그지? 맞아요. 그래서 플러스 요게 뭐예요?
106:11
Speaker A
웨이트. 여기에 관심사는 웨이트잖아요. 웨이트를 제곱해요. 그리고 람다만큼 곱해 줘요. 그 상황에 많게. 이건 여러분이 설정하는 파이퍼 파라미터예요.
106:24
Speaker A
알겠죠? 어 그래서 브레이크 거는 거야. 직관적인 거는 야 모든 특성을 조금씩 사용하자. 일단은 앞에 있는요 2x + 그 이렇게 나오는 것들 있죠? 그 계수라고 해요. 그걸 0으로 만들지 않아요. 자부 민감도를 감소돼요.
106:50
Speaker A
언제 사용하냐? 아까 제가 설명했죠. 회계 분석이 가장 큰 문제점이 하나가 다중공소성이에요. 여러분이 나름대로 개념이 이걸 명확하겠지. 그건 여러분 생각인 거고 실제 데이터를 만져 보면은 어 이거 내가 분명히 개념적으로는 독립적이라고 생각했는데 같이 까는 경우가 있어요. 생각지도 못하게.
107:11
Speaker A
어 얘하고 얘하고 같이 가네. 이런 경우 있다고 독립 변수끼리. 그러면 안 나와요. 결과가. 왜? 여기 이게 이게 영향이 있는 영향을 받은 건 맞는데 내가 그래서이 영향 주는 요인을 여기 두 개로 나눴는데 얘가 같이 영향을 받아 버리니까 같이 증가하고 그러니까 한마디 이거야 뭐가
107:35
Speaker A
중요한데 이거 된 거예요. 웨이트가 어떻게 해 나눠야 될지 모르는 거야. 어느게 더 중요한지 모르는 거야.
107:47
Speaker A
특성 제가 없이 규제할 때 그래서이 통계학을 공부하거나 이제이 인공진을 공부하잖아요. 그러면 여러분들이 습관이 생겨요. 저도 어떤 습관이 생기냐? 옛날에는 아무런 그 그런게 별로 없었는데 제가 이제 습관 생긴게 뭔지 아세요?
108:07
Speaker A
아침에 일어나잖아요. 그러면 여기 출근할 때 오늘 뭐 해야 되지? 내 일정표를 보고 할 투리스트를 한 다섯 개 그날 그날 누가 그날 그날 미리 다 계획 세우는 사람은 시간 낭비 계획 세우는데 저도 해 봤지만 뭐 두 시간씩 걸려요.
108:27
Speaker A
그렇게 안 해. 그냥 큰 계획만 한 달 이번 달 뭐 하지? 틈틈히 아 실짬이 큰 만들어 놓고 그날 그날 아침 출근할 때 한 2분 정도 생각해요.
108:42
Speaker A
오늘 뭐 해야 되지? 쭉 적어요. 다시 한번. 그런 다음에 우선 순위도요. 이렇게 돼. 몸이 반응을 하더라고.
109:00
Speaker A
왜냐면 어떤 거는 오늘 못 할 수도 있잖아. 그렇죠? 어, 근데 꼭 해야 되는 거를 내가 우선 순위. 왜? 이게 웨이트 준 거예요. 여러분들 봤을 때 여러분이 기준이지만 그게 기준이잖아요.
109:14
Speaker A
여러분이라는게 스트레스 홀죠. 내 기준에 오늘 이거는 반드시 해야 되고 이건 아니고요. 웨이트 그잖아. 그게 이게 중요하다고 생각. 그러니까 전체 확률이 100%면 여기에다 70%는 이거 무조건 오늘 끝내야겠구나. 이런 걸 만들 수 만들어야 되잖아요. 그럼 보면 만들어져요.
109:34
Speaker A
그래서 백날 전는게 하면서 계획하는게 더 좋은 나중에 프로젝트 할 때는. 자 보시면 토치의 옵티마이저를 이용해서 옵티마이즈 해요. 리지라고 해요. L2 웨이트디케이 파라미터로 구해야 해요.
109:52
Speaker A
남다죠. 요거 가정치 감세하는 거예요. 그래서 0.001이죠. 이거는 교재 강도 L2를 줘요. 람다 L2를. 그래서 옵티마이즈의 스타ett 그레디트의 모델 파라미터스하고 LR까지 여러분 봤죠?
110:11
Speaker A
근데 요게 생겨요. 웨이트디케이는 람다 2다. 무슨 말인지 아시겠어? 옵션 하나 더 주는 거예요. 요거 원래 요것만 했죠? 요걸 줘요.
110:25
Speaker A
이해되시죠? 그래서 가중체하고 있어요. L2 규제라고. 이게 아담에서 내장된게 아담 W예요. 이해되시겠어요? 거기 W가 웨이트케더라고요.
110:47
Speaker A
자, 그러니까 그다음에 라소 리그레션을 써요. 에런이죠. 가정치 절댓값 합을 패널티로 사용해서 스파스티 즉 휘서를 유동해요. 뭐냐면 아까처럼 여러 개가 있는데 뭐가 주한데 뽑아 줘요.
111:07
Speaker A
변수를 셀렉션 선택할 수 있어요. 제가 그림 한번 그랬을 거예요. 마른몸볼 꼭짓점에서 만나잖아요. 접선이 바로 클리스요.
111:19
Speaker A
여기는 제곱이 아니니까 웨이트가 절댓값이고 람다만 있어요. 어렵지 않죠? 절댓값 합을 동시에 최소해요. 피처 셀렉션 그냥 덜 중요한 데는 다 0으로 만들어 버려요. 웨이트를 무슨 말인지 아시겠죠? 아, 덜 중요한 건 0으로 만들어요.
111:42
Speaker A
그래서 가정치를 완전히 아까 제가 만약 오늘 1. 오늘 투드리스트에서 했던데 아, 이거 안 해도 돼. 그럼 지울 거 아니에요.
111:51
Speaker A
그렇죠? 그거랑 같은 거. 언제 사용하는가? 입력수가 너무 많거나 모델의 해성력이 중요할 때 써요. 그래서 보시면 자 트레이닝 스텝인데 모델이 있어요.
112:08
Speaker A
XY 남다 L1는 0.01이에요. 그러면 N ms 원래는 펑션해서 프레드 Y 해 가지고 만들겠죠. MS 나스 이제 이게 여기 모델 X를 통해서 예측값 만들고 예측값과 실제값을 해서 MS 라스를 일단 만들어요.
112:30
Speaker A
그다음에 모든 가능 절댓값 계산해요. 바이러스는 당연히 웨이트가 아니니까 빠져야겠죠.요요 자이 코드 잘 보시면 여기서부터 해야죠. 폼부터 자, 모델의 이름들이 파라미터 이름들이 있을 거 아니에요. 거기서 N P 이름하고 파라미터겠죠?
112:49
Speaker A
돌아요. 근데 조건이 걸려요. 웨이트가 그 N에 있을 때. 그렇죠? 그럴 때 그 파라미터를 뭐 해요? A 절댓값에서 다 더하다 이거죠. 여기서 L1 노멀라이즈 L1 노몰라이즈 된 즉 정교화된 에러을 만들어 주고 원래 이거죠. MS다플 L1 페널티잖아요.
113:15
Speaker A
MS 라스에다가 플러스 람다 L1 그렇죠? 곱하기 L1놈 노멀라이즈된 L을 곱해서 나스를 만들고 빼고자 하고 옵티마이 스텝을 한다. 얘는 왜 이러냐면 파이토치에 L1이 직접 지원 L1 이렇게 있지 않아 가지고이 모양인 거야. 근데 직접 계산해야 되니까 우리가 아이식이 어떻게 유도되는지를
113:43
Speaker A
알 수 있죠. 자, 그러면은 reg제이션 즉 모델 정교에 대해서 하면 리지하고 라소 이거는 정말 중요하기 때문에 다뤄요. 어, 대화공원과시면 저 첫 번째 최적화 과제가 리지하고 라소에 대해서 설명하고 로문이고 설명하는 거였어.
114:17
Speaker A
리지에 설명해요. 규제 방식을 어떻게 규제할 거니? 이거예요. 자, 이게 그러니까 기준을 만들어 주는 거죠. 이거 페널티를 맡길 건데 얘는 웨이트에다 제곱해서 람다 밥을 그 상황에 맞게 조절하게끔 하고 조절 변수 쓴 거죠. 얘도 원래 람다라고 하요. 얘는 웨이트에다가 그냥 절댓값
114:41
Speaker A
씌워서 람다 해서 페널티를 주겠다.이 방식이 L2예요. 자 얘는 완전히 0일잖아. 0에 가깝게 그렇죠? 가는 거죠. 모든 변수를 다 활용해요.
115:02
Speaker A
얘는요. 불필요한 변수 제거해요. 0으로 실험해요. 가능해요. 뭘 생긴 것도 이렇게 생겼죠. 스파스 모델 불필요한 거 다 제거해요. 그래서 모델 셀렉션 피처 셀렉션이라는 말을 하는 거예. 중요한 특성만 뽑을 수 있어.
115:21
Speaker A
얘는 스테이블해요. 데이터 변도에 덜하지만 얘는 상각의 높은 변수 중 하나만 임의로 선택하기 때문에 상제적으로 불안해요.
115:32
Speaker A
다중호선 아까 독립 변수가 같이 공부산 같이 가는 경우예요. 그래서 변수한 상관계가 높을 때 유리합니다.
115:46
Speaker A
얘는 아까 말했지만 피처 셀렉션이 필요할 때 해상형이 중요한 데이터블속에 써요. 요거는 시험에 단골 손님이에요. 말로 딱 봐도 말로 나오기 좋죠.
115:59
Speaker A
2분 드릴게요. 쭉 한번 읽어 보세요. 다시 말하지만 7기 시험, 8기 시험 여러분 몰라요. 문제는요.
116:10
Speaker A
8기 시험이 나왔던 걸로 기억해요. 근데 이제 예전처럼 제가 기억이 많이 못 해요. 왜냐면 8기부터 원래 문제은행 검 저 전 제을 내지 않고 검수만 하거든요. 여기 있는 강사님들 다 그러는데 문제가 문제가 있을 때만 추가로 문제를 내던가 아니면 다른 문제로
116:31
Speaker A
대체를 요청하는 거예요. 매니저님한테 공정성 때문에 그런 거 같아요. 근데 어 저 기수부터 갑자기 저 당황했어요.
116:43
Speaker A
여러분처럼 시험 봤어요. 내가 문제를 풀어야 된대. 그 내 점수가 기록 내 이름으로 프로그래머스에 등록돼 있잖아요.
116:53
Speaker A
그 검수할 때 보통 한시간도 안 걸리는데 1한시간 반 저도 문제 풀었어요. 90점 안 나오면은 창피하잖아요.
117:03
Speaker A
근데 문제도 많더만 33개나. 그래. 어. 어. 다행히 100점 나오긴 했는데 체면 치를 했는데 어 그래서 저번 보니까 문제가 좀 평의하더라고요. 그러니까 보니까음 저번 육기 시험은 되게 어려웠었던 거 같아. 그러니까 뭐냐면 기본에서 많이 나와요. 지금 우리 하는 과정에 응용은 아무래도
117:34
Speaker A
프로젝트성이 강하고 내용이 너무 어려우니까 어 일부러 기본 쪽에서 많이내는 편이긴 해요. 한 근데 6제사 비율인 거 같아. 대충 보니까 저도 문제를 기억 안 나요. 내가 문제를 푸니까 기억이 안 나더라고.
117:53
Speaker A
여러분 그러잖아요. 문제 피 풀면 푸는 입장에서는 그렇죠. 다 기억나는게 좀 어렵거나 깐깐한 기억나 몇 개만 기억나잖나요?
118:03
Speaker A
내가 검수할 때는 다 기억났거든. 근데 이제 그렇더라고. 근데 보니까 6기 분들은 문제가 좀 깔했어요.
118:13
Speaker A
왜? 시험 펌어요. 70% 정도. 근데 이번 때는 수업 배운데 그 전날 수업까지 다 나왔어요.
118:28
Speaker A
범위가. 대신 평의했어요. 그러니까 열심히 그때그때마다 공부하셔야 돼요. 알았죠? 물론이 큰 과정이 끝나면 한번 정리는 해 드려요. 제가 기본 그게 좋아하시더라고요. 이제 기본 과정 끝나고 한번 정리해 드리고 마지막 날에 아예 그래도 박아 버렸어요.
118:54
Speaker A
마지막 날에 원래 연동을 했는데 어차피 수업이 여러분 마음이 딴 데가 있어. 수요 시험에. 그래서 차라리 수요 시험 대비해 정리를 한번 해 주는게 더 낫겠더라고. 어.
119:10
Speaker A
그게 낫죠. 아, 오전에는 수업하고 어 그래서 오전에는 신기수 수업하고 그렇게 할 거라고 N이 있다니 어떤 느낌예요?
120:08
Speaker A
에론에서 N이요. 제가 이해를 못 해서 민재님 가중치이 있을 때요. 아 36페이지요? 아, 이게 뭐냐면은 이름이에요.
120:32
Speaker A
이름. 그냥 그 파라미터 이름이 있었을 거 아니에요. 웨이트냐 바이어스냐 그거죠. 어 그거예요. 이거 폼은 돌릴 때 그냥 근데 우리의 관심사는이 P잖아요. 파라미터. 그렇죠? 어 그러니까 그 이름에 웨이트라는 이름이 있을 때만 바이어스는 여기 써 있잖아. 조건이 바이어스는 안 쓰려고
120:56
Speaker A
하니까. 그렇죠? 어 웨이트만가 웨이트만 관련으니까. 공식도 웨이트만 만들기잖아요. 그렇죠? 음. 그러면 이제 이해하신 거 같고 그래서 시험에 그는 말 문제로는 이제 ADSP나 이런 시험에서 이게 한번 나왔었는데 일레스틱나 일레스틱이라 뭐예요? 유연한 거죠. 고무질처럼 그렇죠. 그러니까 일레스틱 내신 뭐냐면 L1과 L2예요.
121:26
Speaker A
휴법으로 왔어갖고 비슷한 개념이죠. 그렇죠? 아, 뭐냐면 어떨 때는 쓰고 어떨 때는에 쓰다 이런 식이에요. 알겠죠? 어, 그래서 요즘 방법이에요. 왜? 두 개 다 좋잖아요.
121:42
Speaker A
막 두 개다 쓰고 싶으면 욕망이 막 꾸물꾸물하죠. 그죠? 그러니까 요것 때 요걸 만들어 놓은 거예요.
121:49
Speaker A
그래서 리지하고 라스도 다 장점이 충분하니까 하이브리드를 만든 거예요. 요즘 차도 제일 잘 나가는게 하이브리드잖아. 그렇죠? 어 그죠 전기차와 그죠 황상시에는 가솔린이 좋은데 이렇게 기름값이 뜨면 전기차로 손하는데 전기차는 서울하고 부산을 한 번에 못 가더만 테슬라가 어 중간에 쉬야 된대 그냥 어차피 뭐
122:18
Speaker A
휴계소에서 쉬지만 한 번에 못 간대 그 내가 보니까 그 트럭이나 이런 거는 이제 힘 만들 수가 없는 이유 같아 아직까지는 배터리가 거기까지 안가 간대요.
122:31
Speaker A
그 그게 이제 아직까지 한 개죠. 하이브리 정 두 개 정. 명확하잖아요. 결합돼서 규제하겠다는 거야. 이렇게 쓰면 돼요. 그리고요 람다를 조절하면 되죠. 제 말 이해되시죠? 어 람다를 조절하는 이게 조절 변수가 있잖아요.
122:48
Speaker A
어 그래서 희소성과 안정성을 다 하겠다. 우리가로는 희소성이죠. 어떤 애가 중요하지. 필요 없는 건 다 0만들어. 메이트를 그러면 다 죽어 버리잖아요. 안정성. 원래 L2는 안정적이죠. 모든 면수를 다 쓰니까.
123:05
Speaker A
라스의 변한 선택으로 만들고 리지의 다중공성 이게 중요하죠. 수치 안정이 분산이 감소되지는 요걸 동시에 달성화하기 위한 거죠. 실무 활용의 최적입니다. 그 실무의 엄청 쓰는 거죠. 그냥요 한 줄 더 하면 되는 거야.
123:25
Speaker A
그렇죠? 어. 습성이 많고 상관리가 높은 실제 데이터셋은 단위 규제보다 우수해요. 그래서요 L2 규제는 옵티마이즈 웨이트 DK로 적용하고 그냥 이렇게 해서 요거 쓰면 되거든.
123:42
Speaker A
0.01 웨이트 D디케 그러면 알아서 적용된 거야. L2 규제. 그렇죠? 그래서 옵티마이저 만들고 여기서 트레이닝 루프 안에서 요거 아까 썼던 거 있죠? 기억나시죠? 에론 놈을 개수해서 모델의 파라미터에서 파라미터를 돌면서 그 파라미터를 절댓값에서 다 더해.
124:05
Speaker A
그런 걸 에런놈이라고 하고 여기다가 에론놈 곱하면 되죠. 0.001에 에런놈 더해 줘. 원래 나스 펑션에 그래서 요거잖아요.
124:19
Speaker A
미인 스퀘 페널티 L2 페널티가 있는 거니까 라스의 백워드 옵티마이즈 스텝 하면 끝이야. 무슨 말인지 아시겠죠?
124:32
Speaker A
네. 자,이 코드 한번 쭉 보시면서 이해하세요. 어, 이제 그리고 30초 후에 어, 쉬었다가 진행을 할 나온게 게요. 기본 중에서 또 이런 시험이나 이런데 많이 나오는 거야.
125:12
Speaker A
기술 면접 때도 기초 중에 기초거든요. 그리고 L1 규제, L2 규제는 정말 중요해요. 그러니까 우리도 그러잖아요. 지병이 있으면 관리하잖아요. 그렇죠?
125:25
Speaker A
그러니까 딥러닝이 지병이 있다 보니까 과정. 자, 쉬다 하겠습니다. 자, 여러분이어서 진행해 볼게요. 목소리 잘 들리시나요?
138:38
Speaker A
네, 좋습니다. 자, 그래서 이제 거기다 끝났어요. 어, 자, 구성 요소 구분하면 오늘 배운 것 중에 제일 중요한게이 세 가지고요.이 세 가지가 다 시험 많이 나와요.
138:51
Speaker A
기술 면적뿐만 아니라. 자, 그래서 아이스퀘어는 설명력이에요. 그래서 모델이 그러니까 아, 이거 설명력이 높은 모델이다. 이렇게 설명하는 거죠. 성능 평가를 할 때 모델이 데이터를 얼마나 잘 설명하는가. 그걸 0과 1로 스캐링이 됐다. 점수로 나타난다.이 뜻이고 학습이 완료된 다음에 검증용으로 많이 써요.
139:15
Speaker A
민스케어드 에러는 가장 획 그죠. 우리가 예측 모델에서 제일 많이 쓰는게 회계 분석이다 보니 MS가 기본적으로 나오죠. 그래서 예측 고체를 최소화하기 위해서 미분 가능한 수치로 에러를 정량하고 여기에 옵티마이저가 가정치를 업데이트 할 때마다 아 볼 수 있다.이 이 뜻이고 일지와 라소 에런 LT 규제 규제
139:39
Speaker A
항상 나오는데 우리가 그냥 오피마이저의 웨이트티케를 설정해 가지고 할 수도 있고 자 그래서 일반 성능 계산을 하는데 페널티를 추가해서 가적합 방지에 가장 효과적인 방법 중에 하나예요. 그래서 학습이 너무 잘 되어 버리는 거를 제어하는 거예요.
140:02
Speaker A
자, 그래서 우리가 다시 한번 정의를 하면 y는 ws + b라는 우리가 기본적인 선형을 갖고 한다.
140:12
Speaker A
똑같아요. 왜 또 선형이 분명히 차와 분명히 잔차가 있는데도 불구하고 가장 기본적인 단순함에서도 강력하기 때문에 그래요. 우리는 뭐냐면 여러 가지를 꼭 다 갖추면 좋죠. 여러분도 그러지 않겠어요? 내가 모든 걸 다 갖추면 좋겠죠. 그렇지만 자원은 한 정도 있잖아요.
140:36
Speaker A
그러니까 우리가 주어진 상황에서 가장 효율적으로 이게 정보에서도 기본이에요. 지금 우리가 주어진 재료들, 환경, 그런 자원이 상황에서 가장 효율적인 방법이 뭐냐?
140:56
Speaker A
예측 모델에서는 선형이라고 하는 거예요. 선형을 하게 된게 과조값도 바돼서 일반화가 잘되니까 자 y는 wx라는이 가장 기본적인 형태로 계속 쓰는 거예요. 지금 그러면이 모델을 학습할 때 민스케 에러 즉 에러가 분명히 존재하는데 얘를 손실을 어떻게든 감소하는 방향으로 간 거죠. 얘를 기준으로.
141:23
Speaker A
그리고 모델의 성 평가할 때 얼마나 서명이 높으냐 그걸 R스퀘어 스코어로 설명력을 확인한다. 환경 모델 대비 개선이 얼마나 되는지를 측정한다 이거죠. 그리고 일반화를 할 때 일반화를 하려면 너무 학습이 잘돼도 문제다는 거야.
141:42
Speaker A
그렇죠? 어 다른 새로운 데이터가 들어왔을 때 잘 맞아야 되잖아요. 그래서 규제 그걸로 과학을 방지한다.
141:52
Speaker A
이게 오늘 배운 내용의 핵심입니다. 자 그러면 일단 여기까지 하고 그다음에 이제 가서 이제 코드를 치면서 진행을 해 보도록 하겠습니다.
142:04
Speaker A
자 오시겠어요? 잠시만요. 화면 지금 잠깐 안돼서 화면 전원 부탁드릴게요. Ja. 어 잠시만요. 이저거 좀 뭐 좀 맞춰 보고 계시는 거 같아요. 그러면은 어 내일을 할 거 내용을 잠깐 설명하고 있을게요.
143:42
Speaker A
그 내일 할 내용이이 분류 내용이에요. 그래서 내일은 바이너리 클래스피케이션에 대해서 같이 공부할 거고 북 데이터에 대해서 같이 소개해 드릴 거예요.
144:01
Speaker A
그리고 이진 로지스틱 회기 모델 구조에 대해서 같이 공부할 겁니다. 이진 두 가지로 표현하는 걸로.
144:09
Speaker A
그다음에 이미 다 아는 내용들이지요. 정확에 대한 내용. 그러면 훈련 데이터와 검증 데이터. 그다음에 중요한게 이제 여러분들이 BC 위드 라스하고 그다음에 시그모 요거에 대해서 공부할 거고 그제 내일의 가장 키워드가 바로이 교차 엔트로피예요.
144:36
Speaker A
그다음에 모델 정의하고 학습 과정 설명을 드릴 겁니다. 그다음에 중요한게 분류 문제에서는여 결정 경계를 잘 긋는게 중요해요.
144:51
Speaker A
그래서 여러분들에게 이제 이게 실제로 시험에도 많이 나와요. 수요 시험에도 나왔던 걸 기억하는데 어 내일 가장 키가 이거예요. 어 PC라스하고 PC로스라스 우리가 한번 봤죠. 요거를 중전적으로 공부를 할 겁니다.
145:10
Speaker A
그리고 마무리가 돼요. 그래서 내일은 코드 단에서 어 준비하는게 좀 많을 거다. 이렇게 생각을 하시면 되겠습니다.
145:34
Speaker A
잠시만요. 어, 잠깐 자리를 비우신 거 같아요. 그래서 그 여러분 잠깐 쉬고 계시면서 예, 지금 저기 뭐 카메라 그 위치나 이런 문제인 거 같아요. 그래서 제가 돌아오실 동안 이제 코드를 찾아야 되니까 어, 오늘 배운 내용에 대해서 궁금한게 있으면 어, 좀 말씀을 해
147:30
Speaker A
주세요. 아니면 뭐 자유롭게 어 지난 거라도 궁금한 거 있으면 보시고 그러시면 면 6차시. 음.
148:09
Speaker A
잠시만요. 그래 해 드릴게요. 비용함수로 말씀하시는 거죠? 예. 50 동안 요거를 복습을 하도록 하겠습니다. 예.
148:36
Speaker A
손시 함수에 대해서 간단하게 할게요. 요거랑 연결된 거니까 다시 말하지만 예측각과 실제 정답 사이의 차이를 수치하는 거라고 그랬죠. 당연히 손실은 작을수록 정확하게 예측한다.
148:51
Speaker A
이렇게 보시면 돼요. 모델의 오류 정도나 학습 방향 요게 중요해요. 그다음에 최적화 알고리즘을 하는데 가이드가 된다. 이렇게 보시면 되고 그래서 손시함은 시험 최점으로 비율를 했죠. 당연히 정답과 답안이 차이가 크면 점수가 낮아지니까 예측과 정답 차이가 클수록 큰 반환 큰 값을 반환하게 해 줘요.
149:17
Speaker A
그래서 결국은 우리의 목표는 손실 함수가 감소하는 방향으로 가는게 목표예요. 가정치를 조종하면서. 그래서 우리의 그 관심사는 웨이트입니다. 그렇죠?
149:31
Speaker A
그래서 왜냐면은 각각 데이터마다 다 고유한 바이어스는 틀리기 때문에 그래요. 그래서 MSE가 또 나오니까 어차피 잘 됐네요. MSE는 실제값하고 예측값하고의 모델이 예측한 값의 차이 각각의 잔차를 제곱해서 다 더해서 뭐예요? n으로 나눈 거죠.
149:56
Speaker A
근데 이게 이제 미분이 가능하다는 것 때문에 우리가 가장 대표적으로 쓰는게 MSE라고 했어요. 근데 단점이 뭐냐면 이상체 임금이에요. 그게 모든 평균을 갖고 쓰는 애들의 단점을 갖고 있어요.
150:14
Speaker A
그래서 이거를 또 다른 지표가 MA이었죠. MA는 실제값과 예측값의 차이를 절댓값을 씌운 거죠. 그래서 다 더해서 나눈 거예요.
150:29
Speaker A
근데 얘는 가장 큰 장점이이 상체 덜 민감하고 또 하나의 장점이 있는 그대로를 하는 거죠. 손실이 난 그대로를 아 보여 줘요. 그게 장점인데 가장 큰 단점이 있다 그랬죠. 미분이 안 돼요. 미분이 안 되기 때문에 역정파가 안 되고 이게 꼬리에 꼬르는
150:50
Speaker A
거죠. 미분이 안 되니까 역정파가 안 돼요. 백플로게션이 우리가 지금 어디요? 항상 나스에서 백워드 했잖아요. 그게 안 된다고요.
151:01
Speaker A
그값 딥러닝이 안 돼요. 그렇죠? 그게 한 개예요. 그근데 어떨 때 쓰냐? 여기 떠 있죠. 0 근처에서 미분이 불가능해요. 그래서 최적화를 못 한다고요. 그래서 간건하고 모든 5차를 동에게 치하니까 이상체 영향 안 받고 평균적으로 우리가 2.67만큼 틀렸어요. 하면 그걸 긋는 그대로 받아들인다고 했죠. 근데
151:27
Speaker A
요게 안 돼서 결국 이인자가 되는 거예요. 그렇죠? 항상 이인자예요. 음. 그래서 사용 권장은 이상치가 많은 데이터 해석 가능하고 공평한 그래서 항상 이제 트렌드가 좀 바뀌었어요.
151:47
Speaker A
항상 옛날에는 MAS MSE를 먼저 하고요. 보조수 필요나 필요하면 메이프 그때 퍼센티지라는 거 요렇게 보통은 보여 줬어요. 보고서나 이런데 메이프는 사실 그렇게 많이 쓰진 않고요.
152:05
Speaker A
근데 이제 휴보라스가 딱 놓으면서 이제 어떻게 보면 휴보라스를 기본적으로 MS하고 휴보라스를 보여 주는 식으로 바뀌고 있어요. 지금은 특히 우리 쪽은 로봇 쪽 공학 쪽은 그리고 오히려 나머지랑 표로 비교하는 MSC, MA 큐브러스 등등 이런 식으로.
152:28
Speaker A
그래서 MS하고 MA의 장점을 결합했어요. 그래서 얘는 5차가 작아. 작을 때는 일반적으로 우리가 기본이 MS잖아요. 얘를 써요. ms의 가장 큰 단점은 뭐였죠? 제곱을 해 버리기 때문에 예를 들어서 5차가 너무 크면 그렇죠? 이상체 민감도 한 것도 있고 그 어때요? 오체가 너무 크면 제곱을
152:52
Speaker A
하면 너무 페널티가 심하게 주잖아요. 그러니까 얘는 큰 오차가 나오면 그냥 MA처럼 하면 있는 그대로 그 그대로 나타나게끔 보여 줄 거예요. 왜냐면 우리는 어차피 5차를 줄이는게 목표인데 굳이 제곱을 해서 더 크게 만들 필요는 없다 이거죠. 너무 크게 평쓸 수라도.
153:14
Speaker A
그래서 우리가 델타라는 기준을 만든 거예요. 그래 이것도 하이퍼 패라미터예요. 여러분이 만드는 거죠. 그래서 요게 그거죠. 실제 5차인데 내가 기준에 대비해서 5차가 작아 그러면 그냥 빨리 수염도 빠르고 이게 기본이니까 MS를 쓰고 5차가 커.
153:35
Speaker A
갓등이나 우리는 5차를 줄여야 되는 미션을 갖고 있는데 기준보다도 커. 아 그러면 그냥 MA를 써라. 있는 그대로 표현해라. 그 뜻이죠. 그래서 기준을 보통 1로 놔요. 델타를.
153:54
Speaker A
그래서 이제 우리 쪽에서 특히 많이 쓴게 휴버라스고 제 강조를 했죠. 그리고 이진불류. 여기서부터가 이제 어떻게 보면 뭐 동주님이 잘 말씀해 주신 것도 있겠죠. 어, 내일 배울.
154:11
Speaker A
그렇죠? 어 거기에 들어가는 거죠. 바이너리 크로세트 그대 잘 생각하는게 손실 함수다 이거죠. 클래스 구간은 그 BC는 0 또는 1 두 가지 클래스를 보유할 때 사용해요.
154:28
Speaker A
그래서 실제 애측한 확률과 실제 레이블라고 차이를 측정합니다. 그때이 BC 공식을 잘 기억하다. 외울 필요는 없지만 아셔야 돼요. 내가 얘 보시면 P는 확률이고요. 얘는 실제 내값이에요.
154:45
Speaker A
이진 분류니까 0 아니면 1이에요. 그 얘는 확률이니까 0과 1 사이고요. 그때 보시면 판별식이라고 해요. y * 로그 p 1 - y 로그 1 - p예요. 알았죠?
155:00
Speaker A
어 상대적이라고요. 하나가 증가하면 하나가 없 감소하는 이런 트레이드오프 관계를 형식으로 만들었는데 보시면 여기다가 0 넣잖아요.이 날아가 버려요.
155:12
Speaker A
실제 레이블이 0이면 요걸 계산하는 거죠. 로그 1 - b를 실제 레블이 1이면 이거 날아가죠.
155:22
Speaker A
1 곱하기 로그니까 로그 p만 계산할게 만족하는 거예. 이해되시죠? 어, 그래서 계산을 하는 거죠. 근데 이게 들어가는게 확률값에다가 로그 치하잖아요. 우리가 다 알아요. 로그 1이 0이잖아요. 그렇죠? 그러니까 마이너스 값이 나와요. 예측 확률이 90%야. 0.105가 나오고요.
155:46
Speaker A
예측 0.2 2.33이 나와요.요 두 개를 보면 네가 확신을 갖고 확률이 90%라고 했잖아. 그런데 확률이 했는데 틀렸어. 그러니까 그래 그럴 수 있어 이거고요. 근데 너는 확률도 작은데 속 이걸 이거라고 네가 예측을 해 가지고 틀렸잖아. 그러니까 손실을 크게 잡아.
156:12
Speaker A
그래서 확신도라는 컨피던스라는 말이 나오는 그래서 정답을 확신할수록 낮은 손실 틀린 답에 확신하면 높은 손실 틀린 답에 확신했거든요.
156:25
Speaker A
이게 답이 아닌데 이거라고 우긴 거예요. 한마디로 무슨 말인지 알겠죠? 이건 분명히 누가 봐도 잘못된 답인데 네가 우겼잖아.
156:35
Speaker A
그러니까 벌는 거야. 이해되시죠? 그래 이걸 수치성으로 만들어 놓은 거야. 그렇게요 마이너스 왜 붙냐? 여기에 실제 나오는 값들이 로그에다가 확률이 0과 1 사이다 보니까 마이너스 값이 나오니까 플러스로 만들어 주겠어 한 거예요.
156:54
Speaker A
수치 안정성의 유의를 하라라는 거죠. p가 0, p가 1일 때 로그 계산이 불안정하기 때문에 이렇게 작은 값을 보통 준다.
157:05
Speaker A
아주 0.001 이런 거죠. 실제로 집어넣은 거죠. 이렇게 p가 0.9일 때 넣으면 작은 손실, 0.1일 때 넣으면 큰 손실이 나겠다고.
157:21
Speaker A
실제 랩이 0이면 0이 나오잖아요. 마이너스 달고 로그 1 - p 나와요. 그러면 얘를 계산하면 0.105 2.35이니까 내가 떠가 틀린 답인데 p가 0.1이잖아요. 1이잖아요. 그때는 작은 손실. 네가 0.9일 때는 큰 손실이 나와.
157:41
Speaker A
한 거예요. 근데 이제 이걸 해 봤더니 아까 점처럼 흔들릴 경우가 있단 말이에요. 왜냐면 시그모이드로 활성한 후에 BC를 적용한단 말이에요. 그럴 때 극단적인 값 0 또는 1에서 수치 불안정이 일어날 수 있어요. 그래서 아예 시그모이드하고 보통 PC를 이렇게 두 개를 합쳐 버린 거죠.
158:07
Speaker A
그래서 나온게 PC로스 나왔어요. 그래서 여기 잘 보시면 공식이 시그모드 통과된 다음에 어 우리가 마지막에 PC를 들어가잖아요.
158:23
Speaker A
그게 여러분들 알다시피 시그모를 통과하면 어떻게 돼요? 원래 그 확률값이잖아요. 그 확률값이 여기 들어가는 거야.
158:32
Speaker A
근데 얘가 보시면 활성화한 다음에 빛이 적용하면 극단적인 0과 1에서 수치성이 일어나니까 얘를 내부적으로 합쳐진게 BC 라스 마스고 이거를 지금 여기도 잠깐 소개했지만 내일 자세히 보는다 이거지. 알았죠?
158:50
Speaker A
이게 최신기법이다 이거지. 그래서 불안정한 반식이 시그모인 넣고 예측값 나온 다음에 그 예측값이랑 타겟하고 BC를 넣으면 흔들려요.
159:06
Speaker A
어 그래서 요걸 안정하게 만들었다. 내부에서. 그다음에 일반적으로 우리가 다중 분류한 때는 BC는 앞에 B가 바이널이에요. 뒤에 똑같 엔트로피인데 엔트로피는 똑같이 나서 줄로 좋죠.
159:23
Speaker A
원래 전체가 왜 모지소도 수치 안전하게 주겠다 이거죠. 크로스 엔트로피는 세 개 이상이에요. 그러니까 다중 클래스 분류할 때 쓴다.
159:36
Speaker A
그래서요 로직을 잘 보시면 모델이 이렇게 예측값이 로직이라 그랬죠. 2.0 1.0.2이라고 했어요. 얘를 확률값으로 바꿔 주는 거죠.
159:49
Speaker A
소프트맥스 통과시키죠. 얘를 로그 계산을 해요. 마이너스 값이 나와요. 근데 아까 마이너스 달고 있었죠? nnl이라고 해서 걔를 통해 가지고 이제 계산이 되는 거예요.
160:07
Speaker A
그래서 실제로 텐서로 한번 넣어 보면 2.0 1.0.1 예측값 나오고 얘를 텐서 근데 이때 얘는 요거다. 가장 큰 값 인덱스를 넣겠다 이거죠. 여기서는 이렇게 만들어 놨다는 거예요. 타겟 정하고 예측값과 타겟을 계산해 가지고 크로스 엔트로피 돌리면 됩니다.
160:31
Speaker A
그다음에 이제 라벨 스무딩이라 하는 거죠. 이게 모델의 관심 때문에 문제인데이 문제는 100% 답이 1번 이제 이런 거는 이제 가장 강요잖아요.
160:43
Speaker A
그래서 여기서는 암기했는데 다른게 나오면 틀리는 거. 즉 일반한 능력이 저화야 되니까. 어느 정도 그래 1번이 답이긴 답이 확률이 높은데 여기다 너무 많이 100% 확신하지 말고 노이즈를 어 노이즈가 있을 수 있으니 변화 변동이 있을 수 있니? 그걸 어느 정도
161:06
Speaker A
감안하라. 그러면 일반한 능력을 높이자. 그렇게 만들어 준 거예요. 그이 수치가 어떻게 나왔냐? 스무스를 한 거죠. 공식은 이거예요.
161:19
Speaker A
자, 우리가 1 - 알파는 우리가 확률 통계해서 여기에 5차 유의 확률이라면 이제 유의 확률을 배웠죠. 요거면 이거 파라미터긴 한데 요거라면 그게 아닌 거 전체 통계 합은 1이니까 이렇게 두 개 나오겠죠. 정답일 거 아니 확률. 그러면 여기 정답의 확률에다가
161:40
Speaker A
y 곱하고 근데 그거를 할당해 주겠다. 정답이 아닐 확률을 클래스별로 할당해 주겠다. 세 개만 세 개로 그 뜻이에요. 공정하게.
161:50
Speaker A
그래서 보통은 0.1을 줘서 계산하면 정답일 확률이 0.933 얘는 0.033 이런 식으로 나타난다. 그랬더니 일반화 성능이 더 향성되고 실제로도 우리가 어제 돌려봤죠. 어, 일반화 성능도 좋으면서도 더 정확도가 높아졌던 걸 확인할 수 있어요.
162:16
Speaker A
가장 큰 문제가 어, 클래스네요. 애큐C가 기본, 정확도가 기본인데 그런데도 불구하고 이런 문제가 생길 수 있어요. 실제로 정상적인 사용 세원이라면 아픈 사람보다 정상인 사람들이 많아. 그렇죠? 그 어떻게요?
162:38
Speaker A
죄를 짓는 사람보다 죄를 안지는 사람이 더 많아야겠죠. 어. 자, 여기 여성분들 있잖아요. 은빈 님. 여성 그렇죠? 여성분 맞죠? 제가 확인해야 돼. 저번에 저 7기 때도 한번 셀 수 있고 8기 때도 했어요. 이름 보고 여성분 맞죠? 이렇게 하지 않고
162:57
Speaker A
여여성분이시죠? 하고 가정하고 말했더니 저 남잔데요. 그래 가지고 제가 너무 당황했는데 그래서 어, 고민 여성분 맞죠?
163:06
Speaker A
네. 만약은 음미 님께서 어 답변을 안 해 가지고 잘 모르겠네. 나중에 하시면 안 돼요.
163:14
Speaker A
어 여성분이 많죠. 어 그러면 그냥 그 예를 들어서 이제 사회 생활을 하는데 한국에 90%가 어 그렇죠. 주변 사람들 90% 갖다 범죄 집단이야. 지금 저기 저기가 그렇죠. 타이티나 막 이런데 생활할 수 있겠어요?
163:43
Speaker A
그죠? 데이터 불균형을 없애면 안 돼. 어떻게 죄 안 사람과 죄진 사람이 똑같을 수 있어? 그래서 옆에 이웃 중에 한 명은 둘 중에 한 명은 죄인이야. 그렇죠? 다 범죄자야. 못 살죠.
163:59
Speaker A
데이터를 균형할게 만나면 절반이 죄인이어야 되잖아요. 그죠? 범죄 집단. 그 거기 사 이제 큰봇이야. 거기 사면 되잖아요. 그렇죠? 절반이 어 실제로 요게 개념이 들어간게 뭐냐면 여러분들 그 이거 통계에서 나온 거야. 지금 제가 한 예제가.
164:22
Speaker A
어 엔더슨 통계일 거야. 아마 제가 찾아봐야 될 텐데. 거책이 나와요. 그거 뭐냐면 실제로 법정에서 어떤 사람을 처벌할 때 고소를 당하면 그 사람을 바로 구속하거나 이러지 않고 뭐예요? 무죄 추정이 없지이라는게 있어요. 미란다 원칙이라고 들어봤어요.
164:47
Speaker A
경찰이 사람을 잡을 때 그냥 잡을자 잡으면 안 돼요. 뭐라고 해요? 당신은 뭐야? 변호사를 선임할 권위가 있고 뭐 이런 식으로 설명하죠.
164:59
Speaker A
그리고 우리가 뭐라고 해요? 그 사람을 범죄자로 안 해요. 죄가 확정될 때까지는 뭐라 그래요? 용이자라고 하죠. 그렇죠? 확률적으로 의심이 간다 이거예요. 범죄가 있을 확률이 되고 의심이 간다고 그러지 범죄자로 가요.
165:18
Speaker A
이해되시죠? 왜냐면 이것 때문에 그래요. 일반적으로 사람은 죄가 없다라고 간주를 하는 거예요. 거기에 써 있어요.
165:28
Speaker A
이해되시죠? 사람은 일단은 죄가 없다. 그 죄를 밝히는 거야. 그렇죠? 어, 일단은 그리고 그래야지. 그래야지 살죠.
165:39
Speaker A
그러자면 여러분 다 의심 할 거 아니에요. 이렇게 가다가 사람이 좀 날 쳐봐. 제 나 어딘가 해서 갑자기 칼이 낮에다가 어머 이러면 어떻게 살아요?
165:52
Speaker A
아까 말한 것처럼 50%가 범죄 집단이면 그렇죠. 그러니까 실제로 그런 걸 가져합니다. 통계도 그래서 이게 진짜 정상적인 사이잖아요.
166:11
Speaker A
우리가 의료 진단을 한다 그러면 정상인 사람이 더 많아야죠. 일반적으로는 9,900개가 99%가 정상이고 100개가 1%가 질병 있는 거라면 모두 정상이라고 말해도 나는 5차율이 1%밖에 안 돼요.
166:33
Speaker A
이거 갖고 사이비 집단이나 교주들이나 이런 사람들이 썩어요. 통계를 악해서. 어, 통계를 모르더라도 그 전에 사이비 교주한테 배워 가지고 터요.
166:49
Speaker A
실제로 지금 여러분들이 그거 나오는 거 보면 다 다른 사이비 집단에 신도였다가 나와서 신 자기가 신이 신이라고 하는 사람들이 많다.
167:00
Speaker A
실제로. 어 저번에 누군가가 어느 교수님이 그거를 통계적으로 이걸 돌려 가지고 대담을 하는 거예요. 어 그 그런 집단이나 이런 것들이 왜 그렇게 되는지 이게 다 통계적으로 어 나는 그거 접근법 되게 특게했어요. 어 좋았어요. 같은 통계 공부하시는 분 사용해서 그 안에 집단에 있으면 모르는 거죠.
167:28
Speaker A
어 그럴 듯 하거든. 정확도 봐 봐. 거기다 수치까지 들리는 거예. 처음에 의심해. 우리도 그러잖아요. 아, 저런 걸 어떻게 전데 빠졌지? 막 그 막 이렇게 생각했는데 거기 상황이 미길 만들어. 막 수치도 보여줘.
167:44
Speaker A
자, 봐요. 99%예요. 여러분 정확도 보고 통계로 99%면 어, 맞네. 이렇게 생각하지 않겠어요? 어, 근데 이런게 그냥 있는게 아니라 이게 수치를 잘못 맹신하는 거에 다 나오거든요. 실제로 확률값인데 이게 비비예요. 여러분들이 생각 없이 AI 써 가지고 그냥 복사에서 붙이는 거랑 똑같은게 어디서
168:11
Speaker A
또 일어나는 줄 아세요? 그냥 일반적인 공무원들도 일어나요. 제가 그걸 어떻게 느꼈냐면 저희 프로젝트 예전거 할 때 모였냐면 별것도 아니야. AI 허브에서 내가 해서 컴플레인 한 적이 있다니까요. 아 이게 말이 되냐?
168:30
Speaker A
이해는 해요. 뭐냐?요 플레이트 있죠? 자동차 너 플레이트 넘버 그거 갖고 학습시켜야 되잖아요. 근데 플레이트 넘버 구하기가 힘드니까 어떻게 했냐면은 그쪽 저희 직원이 AI 허브에 있어요. 여러분 좀 있따가 AI 허브에 플레이트로 자동차 해 가지고 자동차 번호판 인식하는 거 있잖아요.
168:58
Speaker A
그렇죠? 지금 여러분 다 그거 기능이 들어가 있죠. 여러분이 어둠 마트나 이런데 가면 여러분 인식해 가지고 얘가 쭉 올라가고 마지막에 여러분들 주차비 할 때 키우스가 가지고 여러번 번호 누르면 거기에다가 이제 시용카드 넣고 돈 계산하잖아요.
169:17
Speaker A
다 요즘 그렇게 돼 있죠. 어 혼파 인식 그 기술이 다 들어가 있어요. 그래서 그걸 훈련시켜야 되는데 다운 받았거든요. 그랬더니 아하 막 그러는 거야. 비모 소리가 들리는 거야. 왜 그러냐 했더니 다 버려야 된대. 왜?
169:39
Speaker A
모자이크 저기했어. 아니 전업 번호판 인식해야 되는데 모자이크 저기했어. 어이 없죠. 그래서 내가 이거 왜 그러냐고 물어봤어요.
169:51
Speaker A
그랬더니 어 자기네들이 이거 최종사할 때 개인 정보 거기에 의해서 그걸 이승하면 안 된대. 이해되시죠?
170:07
Speaker A
그렇게 해 가지고 그거를 다 가했어. 그리고 돈을 줄 거야. 업체 우리 세금 9억인가가 날아가는 거 그 학습 용도로 쓰는 거잖아요. 그거 그러면은 어떤 그 개인 정보 유출하니까는 어떤 뭐 서약이라도 더 추가로 봤던가 그렇죠. 사용자를 명확하게 서류를 더 내내라고 하던가. 보통 의료 데이터는
170:33
Speaker A
그렇게 하거든. 근데 어이가 없잖아요. 그래서 그때 그 프로젝트 하려고 어떻게 줄 아세요? 여기 가면 여기 선능 서초 여기 강남 쪽은 주차장이 아주 난리예요. 그래 가지고 그냥 더블 파킹, 트리플 파킹 기본이거든요. 그래 가지고 어딜 갔냐? 사우나가 있는 데를 타겟으로
170:56
Speaker A
해 가지고 제가 3세시간 동안 사우나 한층 넌 여기 싸우나 넌 저기 싸우나 넌 황금 싸우나 가서 지하 1층부터 3층까지 주차장 가가지고 찍었어 이렇게 어 그렇게 2천장 모아 가지고 어 데이터 오그멘테이션 해 가지고 했어요. 프로젝트를 여러분 지금 웃죠. 여러분 그렇게 될
171:21
Speaker A
거야. 어 여러분 그렇게 될 거고 아 데이터가 왔는데 쓸모 없는게 그니까 어 주제도 있고 요즘엔 근데 이제 이런 부분이에 왜냐면 그 공무원은 이거 잘 모르는 분야잖아요. 나는 행정하는 사람인데. 근데 여러분들도 그렇지 않겠어요?
171:40
Speaker A
아 이거 저작권법에 위환돼 가지고 당신이 책임져야 돼요. 아니, 그래요? 근데 이거 저희들 납품한 거 맞잖아요. 어, 그래요. 부엌 그냥 도장 찍은 거 아니야.
171:58
Speaker A
무슨 말인지 아시겠죠? 어, 그러니까 그런 경우가 많다고요. 현실적으로는 현실적으로는 모는 사람을 안 쳐놨습니다. 이게 왜 데이터를 인식하려면 왜 번호가 있어야 되고 아니면 차라리 다른 그 법을 피해 가지고 어떤 어떤 것을 서류를 만들거나 어느 절차를 만들었으면 되는 거 아니에요?
172:21
Speaker A
어 그 업체를 잘못선 아니잖아요. 아품했는데 거기서 문제가 된다고 하니까 그 사람들 또 일했을 거 아니야. BC표 한다고. 그니까 BC별의 개념을 제대로 모른 거죠.
172:35
Speaker A
어 그냥 그런 경우가 비슷해요. 현실적이 이렇게 여기도 그냥 요거만 보면 애큐스만 믿으면 빠는 거잖아요.
172:50
Speaker A
어 그런 부분이 있어요. 근데 쓸없는 분들이라고. 그래서 우리가 이거 대체로 뭐라 그랬어요? 데이터 분명히 제일 많이 쓴 거 기억나세요? 이거 맞추는 사람이 점일게요.
173:02
Speaker A
대신 데이터 불경에서 제일 많이 쓰는 건 뭐라고 했죠? 예. 어, 그것도 1종이지만 예. 세교님 2정.
173:19
Speaker A
병진 님 소콩이 뭐예요? 스코어를 한 거죠? 예. 아, 맞어. 알겠어요. 예. 예. 나머지 어 분들 다 1점씩 드릴게요. 예.
173:35
Speaker A
F1 스코어 기억하세요. 시험에도 많이 나오고 중요해요. F1 스코어를 왜 많이 쓰는 보조 지표 많이 쓰냐면 이런 문제가 BBG 하거든요. 데이터 포커라스 틀린 건 아닌데 심각한 금일 때야. 자, 그래서 우리가 일반적으로 가진 교차 엔트로피를 쓴다. 그때 뭐냐면 소스 클래스 몇 개 없는데
173:57
Speaker A
깨졌어. 그러면 큰 가정치 보용하죠. 음. 그렇죠. 전체 샘플수에서 크래스 곱하기 크레스 C 샘플수 9,900개가 있고 얘는 100개인데 얘는 가중 0.5 얘는 50.
174:14
Speaker A
이거 가장 극단적인 예들을 볼까요? 제가 이거 이거 가중 교차 엔트로피 상 어떻게 예를 들는가 좋을까 생각했다가 옛날 요즘에 보면은 케이블 TV 옛날 그런 그 드라마 이런 거 많이 보여 주잖아요. 그중에 옛날에 한동안 그 시트이라는게 유행했어요.
174:38
Speaker A
프렌즈 같이. 그때 우리나라에서 그거 영향 받아서 만든게 순인 건데 거기서 그런게 나와요. 아이가 보통 여러분 집에서 설거지하다가 뭐 깰 수 있잖아요. 그렇죠? 근데 그 깼을 때랑 이게 3대째 내려왔던 어 예를 들어 고려 청자 같은 거야.
175:00
Speaker A
그거 깰 때랑 아빠가 화낸 정도가 같아요 달라요? 생각해 보세요. 그렇죠? 음. 그렇죠. 그리고 거기서 아주 대노를 해요. 그렇죠. 때는데 처음으로 막 아빠의 숨겨진 모습이 막 보여요. 막 화를 내고 그죠? 음.
175:21
Speaker A
웨이트가 틀리다고요. 그렇죠? 음. 자, 포클라스는 뭐냐? 아까 그랬지만 아주 어려운 샘플에 어 집중한다.이 그래서 알파와 감마로 조절하는데 얘도 잘 보면 1 - p죠.
175:41
Speaker A
그래서 얘는 뭐냐? 네가 쉽게 판단하고 누가 봐도 뭐라고 하는 거는 손실을 거의 그냥 무시해고 우리는 저 잘 인식이 안 되고 그런 것들은 집중하겠다. 이런 뜻이야.
175:56
Speaker A
손실을 크게 잡아 가지고 그렇게 공식을 만든 거죠. 그래서 우리 로봇 공항에서선 중요하다. 그리고로 최신로 모델에 이건 디폴트로 들어가 있어요.
176:10
Speaker A
알겠죠? 최신로 모델에. 그래서 일반적으로는 우리가 그냥 이렇게 정답 확률에 따라 어 나오는데 배 포커라스는 그만 불균형 뭐 하나랑 100대 1 뭐 이런 거 있잖아요.
176:27
Speaker A
이럴 때 객체탐이나 의미로 우리가 이제 얘를 불 분리를 해야 되는데 그냥 눈에 보이는게 아니라 의미론 쪽으로 분석할 때 쓰는데 감만은 보통이 알파는 0.2 점이 이렇게 표준 설정을 했습니다.
176:46
Speaker A
어라고 보시면 돼요. 자, 그래서 여기까지 일단 하고 이제 코드를 돌려 볼게요. 자, 그래서 덕분에 어, 복스까지 또 잘했네요.
176:58
Speaker A
그러면 내일 수업이 좀 편할 거예요. 음. 자, 그럼 이쪽으로 보겠습니다. 오시면 갔던데. 오늘 왜 이렇게 미스매칭이 심하지?
177:30
Speaker A
아까 오셨던 거 같은데. 예. 그러면 오늘 것도 복습해야겠네. 그냥 차라리 오늘 것까지 다 복습 합시다. 이런 시간에 자, 회계 문제에 보시면 우리가 연속이라는 거 꼭 기억하세요. 연속 이상 구분하시고 이제 복습이니까 다 할 필요 없이 중요한 것만 포인트로 할게요.
178:17
Speaker A
얘는 예측값이 연습된 실수. 얘는 이산적인 클래스 디스크립트라이 단어도 좀 해요. 어쩔 수 없이 영어 단어도 공부를 하셔야 돼요. 왜냐면 코드가 영어잖아요.
178:33
Speaker A
그래서 리그레션 이런 거 이제 복습하는 거니까. 그래서 우리는 뭐냐면 예측 출력이 예측값인데 예측값과이 연속 중의 수치 프로트예요. 얘는 정확한 수지에 근사하다 이거고 분류는 라빌링이다.
178:53
Speaker A
정답이 라벨링. 근데 어때요? 등급이에요. 클래. 그래서 보통 분류하면요. 많이 코드가 어떻게 나면 CLF 그 용어는 얘를 줄여 가지고 그리고 코드도 CLF 이렇게 많이 나오고 미리 말하지만 요리도 뭐라면 클래스, CLS 이런 코드를 많이 나와요.
179:14
Speaker A
맞죠? 클래스로 구분하니까. 그 그 지금 제가 말하는 건 나중에로 할 때도 로가 특히 그렇게 많이 쓰거든요. 그러니까 꼭 기억하세요.
179:24
Speaker A
그래서 결정 경계 시점 바운드리를 찾는 것이 핵심입니다. 넘어가고 우리가 일반적으로는 y는 wx + b라는 요런 형태를 하고 얘를 파이토치는 텐서잖아요. 그러니까 3,000원 이상의 것을 다루기 위해서 만든게 파이토의 플레임워크니까 여기에서 기본 쓰는 건 요건데 자 우리가 어떤 것이 입력이 있으면
179:53
Speaker A
여기에 여러분 원드를 할 때 우리도 그렇잖아요. 샷 추가 이렇게 생각하시면 돼요. 뭘 뭘 설탕을 추가 그렇죠? 샷 추가하면 웨이트가 증가되는 거고 어떻게 보면은 우리가 설탕이나 연휴를 넣으면은 B가 되겠죠. 이런 식으로 자 뭐냐면 커피를 만는데 원두의 양에 따라 진하게 추출할지 연하게 추출할지
180:18
Speaker A
웨이트 그죠? 그리고 거기다가 어떤 걸 추가할지 이해되시죠? WS + P을 설명하고 있어요. 그래서 여러분 다시 한번 가지만 이게 열개 세 개가 데이터 열개 데이터 세 개가 아니에요.
180:36
Speaker A
여기는 속송 정보가 들어가요. 그렇죠? 그래서 여기 아예 명시했죠. 입력받을 피처들, 출력할 특성, 특성수예요. 열개 입력을 세 개로 출력하는 겁니다.
180:55
Speaker A
제가 이거 농담으로 여러분 남성분들에게 하라고 했잖아요. 오빠 내가 왜 좋아? 좋아하는게 열 개의 나열라 나열를 준비할 수 없잖아요.
181:05
Speaker A
그래서 항상 마음에 준비를 하라 했죠. 세 개 기억하라고. 알겠어요? 어, 삶의 진리예요. 그 제가 또 살아 보니까.
181:14
Speaker A
어. 자, 그래서 y는 wx + b다. 그래서 얘는 입력을 했을 때 가정치가 있고 거기다가 b 편향 갖고 있어요.
181:31
Speaker A
자, 그래서 웨이트라는 건 영향력이 얼마나 크냐. 그거를 우리가 수학에서는 이렇게 되잖아요. 기울기로 표현되잖아요. 여러분이 알다시피 얘가 x값이 왜 뭐야? 2x 3x 4x 더 w가 크면 그걸 이제 수학에서는 개수라고 했죠.
181:52
Speaker A
요게 크면 y축에 가까우니까 이렇게 이쪽으로 기울잖아요. 그게 경사죠. 자, b는 기본적인 값이에요. 그걸 우리가 수학적으로는 절편이라고 배웠죠. y 절편 그걸 이제 마이너스 절편은 0으로 인터셉 이렇게 나와요. 그러니까 그런 용어들이 자꾸 나오니까 여러분들이 헷갈리는 거.
182:17
Speaker A
자, 차원은 디멘션이에요. 입력이 벡터면 가중치도 벡터해야 되죠. 그 뜻이고 우리가 이제 계속 나오는게 요거죠.
182:29
Speaker A
우리는이 최적의이 선을 긋는 건데요.요 잔차하고 얘가 예측선 기대값이 선이거든요. 요거를 비효해서 나오는 걸 잔차라고 하고이 잔차가 플러스 마이너스가 있기 때문에 실제로 무한대로 이게 지금 관측이 몇 개 왔서 그렇지 1이 여기에 연속적이니까 다 해 가지고 더하면 더하거나 이제 빼면 0이 나와요.
182:59
Speaker A
분명히 눈에도 5차가 보이는데 틀린게 보이는데 0이 나오니까 이걸 해결하기 위해서 나온게 제곱하거나 그렇죠. 크기니까 절댓값을 실되는 두 가지 방법이 있었죠. 그중에 우리는 절대 절 그 제곱을 하는 방법을 써요. 그게 바로 미니스퀘지.
183:24
Speaker A
자, 그래서 y는 mx + 2 이게 슬로프고. 그래서이 5차 제곱항을 최소화하는게 우리의 목표예요. 실제값과 h값을 각각 하나의 포인트에서선 전차 값이고 그죠?이 이 제곱의 합을 가장 작게 만드는 선을 찾는 거예요. 근데 뒤에도 아까 R퀘어 때문에 말씀드렸지만 요걸 선을 었어요. 근데 이게 왜 최적의
183:50
Speaker A
선인지는 딱 하나예요. 요거거든요. 제곱의 합을 가장 작게 만드는 거거든요. 결과는 알아요. 원인을 모르겠다는 거예요.
184:03
Speaker A
왜 이게이 선 이렇게 슬로프나 이게 이렇게 선을 그었는지 이해되시죠? 그러니까 뭐하고 뭐하고 차이냐? 우리가 실제 이게 관측이니까 요거의 평균은 여기 더 y값 하면 되잖아요.
184:20
Speaker A
열 개면 요거 다 더해서 y값을 n으로 나누면 되잖아요. 그니까 평균치는 알아요. 알겠죠? 그리고 실제적 관측치도 있으니까 알아.
184:32
Speaker A
근데이 예측값하고 얘하고 차이가 나는 건 설명이 안 돼. 알겠죠? 그게 RSS야. 그래서 그걸 빼 준 거야. 아까.
184:44
Speaker A
자, 그래서 제곱의 효과는 5차를 제곱했기 때문에 5차가 커요. 그러면 이상체죠. 훨씬 많은 패널티를 준다라고 했고 보통 우리가 이렇게 되는 거죠. 선용 회기는 활성할수가 없는 한계가 수학적으로 동일하다. 단일은 이렇게 쓰고 역전파가 된대 역전파가 되려면 반드시 뭐가 돼야 된다? 미분이 돼야 된다.
185:15
Speaker A
이게 미분이 안 되기 때문에 ma가 힘을 붙다는 거죠. 자, 여기 보시면 2에서 3으로 가는 거죠. 리뉴어가.
185:29
Speaker A
그래서 2차원, 3차원이라는 말을 하는 거예요. 그리고 이거 바스. 자, 우리 간단하게 이제이 코드단을 안 하고 큰 것만 설명을 드릴게요.
185:42
Speaker A
y는 wx + b 회기해서 파라미 또 확인하고 초기가 설정했던 거고 나머지 입력해서 결과 나왔죠.
185:54
Speaker A
이제 다중액이라고 하면 입력값이 벌써 차원이 두 개가 들어가는 거예요. 두 개의 변수가 들어가는 거죠.
186:03
Speaker A
그래서 했던 거 기억하시고 넘어갈게요. 그래서 우리는 어떤 모델이 x값을 받아서 예측값을 내고 손실 크리티리언이라고 하죠. 예측값과 실제값 비교해서 5차 계산하고 그 계산된 5차를 바탕으로 모델의 파라미터를 어느 방향으로 갈까 수정하고 실행하는게 최적화요.
186:29
Speaker A
옵티마에서요. 그리고 우리는 Nm 모듈을 갈 때 할 때는 항상 생성자와 포워드가 있어요. 생성자는 한마디로이 고격을 만드는 거죠. 준비물이고 그 준비물을 갖고 우리가 어떻게 모델링해서 갈 건지 훈련을 시킬 건지 설계 실제로 하는 거 건물이라 하면 건물지 짓는 거 그
186:58
Speaker A
플로를 만드는게 포워드 메소드예요. 넘어가고 이제 미숙 수행하던 에러를 다시 한번 보시면 실제값하고 예측값의 차이를 제곱해서 평균된게 낫데 즉 틀린 정도를 수치한 거죠. 그때 페널티를 줘야 미분이 가능하고 경상화법을 적용할 수 있으니까.
187:22
Speaker A
그래서 근데 중요한 건 노멀라이즈를 꼭 해야 된다이 뜻이고이 코드에서 요것만 좀 확인하시면 나중에 이거 왔다 갔다 하거든요. 민스퀘어 에러스인데 기본적으로 리덕션은 민을 써요. 이게 디폴트입니다.
187:40
Speaker A
그 우리가 훈련을 할 때는 텐스로 바꿔 주면서 리퀘트로라는게 있죠. 그 부분 좀 한번 눈여 보시고요.
187:50
Speaker A
그래서 여기 똑같이요 코드 보시면 NN.Mse라스를 크리티넘하고 손실 함수 정의한 다음에 요거 두 개를 크리티넘 비교하는 거죠. 계산하고요 라스점 백워드를 해야 되는데 미분이 안 되면 이게 불가능한다는 거야.
188:10
Speaker A
경사 계산이 안 된다는 거예. 그래서 나머지는 넘어가고요. 자, 학습률이 중요한 거 말씀드렸죠? 발산이 낼 수 있어요.
188:29
Speaker A
그래서 학습 0.01 0 했더니 발산 이거 나오면 발산이에요. 코드 했는데 난이 뱉어지면 그러면 학승률을 줄여야 돼요.
188:43
Speaker A
넘어가고 자 R스퀘어들 볼게요. 얘는 설명이라고 했어요. 전체 데이터 변동 변동성이 바로 분산 데이터가 있는 정도.
188:56
Speaker A
거기에 1에 가까울수 완벽해요.이 r스퀘어 0의 개선도 뜨죠. 0보다 음수가 나오면 평균보다 못한 모델이 있고요. 그때 여기 다시 보시면 코드로 한번 이해해 보면 y트롤를 평균낸게 y니에요.
189:15
Speaker A
그래서 평균값하고 비교를 해서 요거는 우리가 알 수 있어요. 평균을 낼 수 있으니까 실제값하고. 근데 SS레지얼 그죠?요 레지얼 서버 스퀘어는 몰라요. 설명이 안 돼요. 왜 실제값과 저 우리가 예측선에 저 값이 저렇게 나왔는지 저 차이가 왜 나는지를 몰라요. 설명이 안 돼요. 그냥 수치상은 계산이
189:44
Speaker A
되니까 그런가다 하죠. 근데 왜 그런지를 모른다고. 설명이 안 된다. 어 그래서 그걸 빼 주는 거예요.
189:55
Speaker A
확률값에서 0과 1에서 그랬더니 요렇게 나와요. 1에 가까울 당연히 모델 설명이 좋죠. S 베스트예요. 0이면 베이스라인이고요. 이거보다 더 크면 평균만 또 못한 A가 되는 거예요.
190:14
Speaker A
그래서요 의미가 뭐냐? 실제로 이게 이제 어떻게 나오냐면 R스퀘어가 85%까지 0.85 이렇게 나오거든요. 그러면 요거의 의미에 설명하시오.
190:25
Speaker A
그러면 뭐예요? 얘는 전체 총 변동이라고 해요. 총 변동당은 설명 가능한 변동이 있고 설명이 불가능한 변동이 있는데이 네지수 잔차 변동성은 오른다.
190:41
Speaker A
얘가 성형력이 있다. 그래서 85%라는 건 전체 변동수 총 변동이에요. 거기에 85%가 예측 가능하다. 설명이 가능하니까.
190:55
Speaker A
그렇다고 해서 중요한 건 시험 문제도 이렇게 나와요. 인과 관계냐? 아니다. 그래서 실제로도 시험 문제의 단골 이제 틀린 어 문항이 상관계는 인간계를 설명한다. 아니에요. 그 상관이 있을 뿐이에요. 그래서 상관이 있는 것들만 뽑아 가지고 1차적으로 뽑아서 우리가 모델링을 돌리는 거예요. 회기 분석을 한다든가
191:24
Speaker A
인관계를. 그러면 인관계는 원인과 결과지를잖아요. 그거 자체가 회기분선이에요. 회기분선는 원인 그래서 시험에 많이 나와요. 상관관계도 인관계를 하기 위해서 상관관계를 한다. 아니에요.
191:40
Speaker A
상관이 있을 뿐이에요. 그러니까 의심되는 용이자예요. 알겠죠? 얘하고 얘하고 상관이 있으니까 관계가 있으니까 얘가 원인일까? 얘가 결과일까?
191:52
Speaker A
이해되시죠? 어. 그래도 똑같이 설명이 높다고 해서 얘가 원인과 결과 아니에요. 그냥 모델이 아무래도 설명이 높으니까 예측 가능하다 이거지. 그러니까 설명이 높은 애를 갖고 이제 우리가 그 어떻게 보면 평가한 거예요. 아, 당신이 만든이 모델이 아이스퀘어가 90%가 나왔으니까 설명력이 꽤
192:22
Speaker A
있네요. 이제 이렇게 말하는 거예요. 자, 우리가 딥한테 가장 그 큰 문제가 과학이라고 그랬죠. 훈련돼 있다. 훈련할 때는 작전에는이 문제요. 오피팅돼요.
192:43
Speaker A
모델이 훈련 데이터를 과도하게 암기해서 내가 검증셋이나 우리가 실제 테스트 데이터에서 일반 성이 확 떨어지는 거죠.
192:55
Speaker A
그래서 우리가 확인할 수 있는게 그래프를 그리는 거예요. 그래서 히스트를 히스토리를 만들어서 그래프를 그리는 건데 트레이너스이 계속 줄었어요.
193:04
Speaker A
근데 밸런스는 오히려 증가해요.요 부분이 있어요. 얘를 이제 보 보통은 우리가 기법으로 조기 종료라는 기법으로 어 훈련할 때 쓴다. 필수로 쓰셔야 돼요. 그래야지 밥 먹으러 가요.
193:22
Speaker A
돌려 놓고 이게 언제 끝날지 모르는데 과조값 되면 처음부터 다시 해야 되잖아요. 그 어떻게해요? 조기 종류의 조건을 만들어 놓고 100번이든 1,000번이든 알아서 돌려놓고 밥 먹고 오면 끝나 있어요. 저도 서서 넘었을 때 200번 돌려 놓는데 학교 컴퓨터 그냥 24시간 켜 놓고 다음날 아침
193:44
Speaker A
9시에 갔는데 그때까지도 CPU로 돌려 놨더니 하고 있더라고. 그렇죠? 그렇게 많지도 않은데 10만 개 정도 되는데 데이터 측면서 이미지는 그래요. GPU 설정 안 하면 근데 이제 가서 이제 점심 먹고 딱 가니까 결과가 나왔는데 20번에서 끝났어.
194:06
Speaker A
음. 정교와 우리 배웠던 리지아우 라소를 요거의 해결 방안으로 쓴다 이거예요. 그리고 데이터를 추가하면 일반적으로 데이터 우리가 그렇잖아요. 샘플의 개념을 통계를 생각하시면 돼요. 천만 명이나 되는 서울 시민을 다 인터뷰하기 힘들어서 1천명을 갖고 인터뷰를 했어요. 그 그리고 그 결과를 갖고 예측을 만드는 거예.
194:38
Speaker A
근데 아무래도 천명이 골고로 우리가 N으로 했다고 해도 보통 일반적으로 특히 사람을 상대로 하는 사회과학 논문들은 항상 일반화가 잘 안 돼요. 그럴 수밖에 없는게 내가 데이터 분석을 할 때 일반적으로 한 지역에서만 하는 경우가 많거든요.
195:01
Speaker A
물리적으로. 그렇지 않겠어요? 어 서울 식민을 한다고 걸 해도 어떻게해요? 우리가 아마 9가 20개구인가 그럴 거예요. 20 몇 개구를 다 돌라가서 뽑아야죠.
195:18
Speaker A
그게 그런 방식으로 좀 엄격하게 하는게 바로 계층적 추출이에요. 통계분석할 때 데이터를 추출할 때 계층적으로 하는 거 그게 우리 분리 문제에서 사이클론에서 우리가 했던 거예요.
195:35
Speaker A
스트라이 스트레트파이 Y 이해되시죠? 비율을 갖고 뽑겠다는 거예요. 나름대로 더 시간이 조금 더 걸리죠. 근데 뭐 우리가 시험 걸리는 거고 이제 컴퓨터가 하는 거지. 그래서 그 방법을 불 문제할 때 많이 쓰는 것 중에 하나요. 데이터 추출할 때. 왜 그러냐면
195:58
Speaker A
한 곳에 편양될 수가 있잖아. 어 어떻게든 조금이나 주저 보려고 하는 거야. 일반화를 하려고 노력하는 거예요.
196:09
Speaker A
그래서 데이터를 증강시켜요. 아무래도 다 그런 건 아니에요. 천명에서 만 명. 근데 이게 사람이 사람가를 하면 실수가 있기 때문에 어 이게 조사할 때 조사 방법론이라는 데서 나온 거는요.
196:28
Speaker A
그 비체계적 오차가 생길 수가 있어요. 왜냐면 저번에도 제가 그랬잖아요. 사람이 실수한다고 잘못해 가지고 이상치가 그냥 이상한게 아니라 내가 0을 잘못 눌러 가지고 그죠.
196:41
Speaker A
100인데 1천이라고 하면 걔가 이상치가 돼 버리잖아요. 그런 것처럼 하는 경우가 있어요. 근데 일반적인 우리가 만들어져 있는 데이터 어 공 특히 공장 데이터라는 그런게 좀 높죠. 아무래도 일반적으로는 어 그래서 그런 것들을 어 우리가 볼 수가 있어요. 실제로 통계 기법이나
197:06
Speaker A
아 그럼요. 그걸 조사 방법에 있어요. 뭐냐면 설문질를 하는 사람들이 우리가 다 못 하잖아요. 여러분들이 천명 조사한다고 내가 하지 않고 보통 알바생들을 쓸 거 아니에요. 설문해 주고. 근데 그 친구들 교육을 잘못하면 안 돼요. 어, 그리고 실제로 그런 경우가 전 대놓고
197:27
Speaker A
봤어요. 옛날에 보면 저희 있을 때. 그래서 솔직히 석사 논문을 잘 안 믿는 이유 중에 하나기도 하고. 어, 대부분 뭐냐면 저 옛날에 그 학교 보면 조교님들 있잖아요. 조교님이 석사였는데 부탁을 한 거지.
197:45
Speaker A
아는 선배고 뭐 그러니까 해 주긴 하는데 귀찮잖아요. 그래서 설문 같은 경우에 3번을 찍는 경우가 되게 많죠. 그죠? 어 봤는데 어 해 줄게 그랬는데 한 한 두 장일 줄 알았더니 막 12두 장면 귀찮죠.
198:01
Speaker A
어 그래서 그런 오류들이 많아요. 어 특히 사회가 논문에서 그래서 특히 사회가학에서는 여러분들 나중에 연구 팁인데요.
198:19
Speaker A
여러분이 이제 회사나 공공 기관에서 납품할 때요. 이거 좀 우리나라 좀 이게 좀 그러긴 한데 석사 논문은 취급 안 해요.
198:31
Speaker A
석사 논문을 출초에다가 여러분이 밝히잖아요. 어 빼라고 해요. 그것 아시겠죠? 어 그래서 그걸 좀 알아주세요. 어 박사 논 그래서 박사는 어찌 됐든 어 저는 그걸 생각해요. 박사 받기는 진짜 힘들어요. 왠줄 아세요? 교수들이 자기 이름 들어가거든요 거기에.
198:57
Speaker A
근데 잘못하면 그 어 여러분 보시잖아요. 요즘에 어 예전 영부인 사건도 학교 자체가 그냥 피틀렸죠. 실제로 그래요. 지금 엄 진짜 그 학교 알죠? K로 시작하는 우리 김건희 여성님 나오셨는데 그 학교 요즘에 논문 빡세기로 유명해요.
199:21
Speaker A
왜 징계를 많이 받았거든요. 교수님들이 거기 이름 들어간 분들 무슨 말인지 아시죠? 어 왜냐면 자기 이름이 심사면 자기 이름 들어갔잖아요. 사인이 이게 박사는 어떻게 주냐면 다 보통 다섯 명이야.
199:40
Speaker A
다섯 명이고 외부에서 세 명이 와야 돼요. 어 그래서 거기서 평가해 가지고 다섯 명이 다 사인에 들어가거든요.
199:51
Speaker A
어 그 자기 이름 모니까 어떤 개념을 갖고 있냐면 나랑 동급이 된 거잖아요. 내가 교수라는 회사의 직업이지 나랑 같은 박사라는 돈급이 있기 때문에 돈급이 되는 거예요.
200:04
Speaker A
박사는. 그러니까 거기는 자기 이름을 걸고 하기 때문에 한 보증 쓴다고 생각하세요. 실제로 내가 거기 사인다는 거 내가 보증이 들어가는데 이따위로 제가 그렇게 해서 어 1년을 늦게 경영업 박사를 받았어요.
200:21
Speaker A
예. 대충 해 가지고 안 돼요. 근데 석사는 그냥 해 줘요. 거의 그냥 좀 해 줍시다.지도 특히 랩실에 그 교수님이 어떤 거에 따라 좀 많이 작용을 해요. 아직까지 거의 폐쇄적인 사회잖아요. 학교는.
200:40
Speaker A
근데 특히 교수님이 통계 교수다 그러면 아무 안 해요. 거의 통과해요. 그죠? 어. 제가 이쪽 공부하게 된 것도 경영학 공부하는데 저희 교수님이 카리스트학 박사님이셨거든요.
200:56
Speaker A
어 그냥 좀 편하게 박스 받았어요. 다 커버를 해 주시는 거야. 교수님이 지적을 하는데지도 교수님이 커버를 해 줘요. 이거 내가 이렇게 하라고 했는데 그건 꼭 그러지 않아도 돼.
201:11
Speaker A
그러니까 아 예. 무슨 말인지 알죠. 홍기 교수님이 말하니까 그냥 아예 알겠습니다. 그래도 요거 좀 계산하세요. 이렇게 되는 거야. 어 그렇게 그래서 아 그래서 옛날에 실제 한 사역가 있습니다. 제가 저희 학교 있다가 경희대 교수님으로 가신 분이 있는데 나중에 만났어요. 통계 특강할 때.
201:36
Speaker A
어 근데 그분이 안식년이라고 있잖아요. 교주님들은 1년씩 10년. 그때 박사를 또 하셨더라고. 원래 경영학 박사인데 연대 응용 통계학과 통계학 박사를 하셨어요. 그래서 그쪽 그 학과에서는 아 왜 그러냐면 통계는 수학의 일종이잖아요. 수학의 수학자들에게는 통계학이 그 한마디로 그 종교계에서 얘기하는 이단이에요. 그죠? 그래서 그래서
202:14
Speaker A
그렇지만 치로 말을 하잖아요. 모든 걸 증명을 확률값이에요. 왜냐면 저도 이게 그런지 몰랐거든요. 그러니까 수학은 공리라고 해서 진리를 가는 거거든요.
202:28
Speaker A
철학하고 같이 있어. 그 옛날 보면 수학자가 철학자고 막 이러잖아요. 제가 그거를 어떻게 한 줄 아세요?
202:36
Speaker A
제 예전에 8년 전에 처음 이쪽 수업을 시작했을 때 그때 인공지는 한참 떴잖아요. 그때 저도 몰랐죠. 어 이제 학생들 면담은 제가 A투 Z를 다 했기 때문에 일부 감옥만 빼고 그때 이제 면접 면담을 했는데 어떤 친구가 있었는줄 아세요?
202:57
Speaker A
어, 지금 거기 다니고 있어요. 호항공대 한양대 물리학과 나오고 호항공대 수학과 석사한 애가 왔어요. 어, 그래서 제가 선형대수 특강을 걔한테 오히려 맡겼어요. 학생이 학생 가르치기. 나보다 선형대수 더 잘할 거 아니에요. 그죠? 어 근데 그 친구한테 물어봤는데 수학가가 이제 취업은 학부는 잘되는데
203:25
Speaker A
석사부터는 그냥 교수님 다니는 거래요. 그 왜 그러냐면 똑같아요. 여기 통계도 그러거든요. 내가 회기 분석 맡았다 그러면 회기 조금만 쭉들이다 파요.
203:37
Speaker A
진리를 찾기 위해서 더 정확한 이론을 만들기 위해서 어 그래서 자기네들이 갈 수 있는 건 수학 무슨 그런 협회나 학회나 교수님의 연구자밖에 안 된대.
203:53
Speaker A
어 근데 이제 지금은 제가 알기로는 저 그때 끝났을 때 그 취업은 잘 되더라. 확실히 호스팅 나와서 그런지 그니까 현대시가 들어가서 1년이 있다가 전액 장학금으로 그다음에 포함대가 처음에 안 되고 포항공대가 2년 혼가 인공지능 대학원 생겼잖아요. 그래서 인공지능 대학원 박사로 간 걸로 알고
204:19
Speaker A
있어요. 어 그래서 그런 경우 많이 써요. 왜냐면은 법종에서도 인정이 돼요. 아까 제가 그랬잖아요. 통계의 개념이 들어가 있다고 그죠. 얘기가. 그래서 법정에서도 통계를 법정 근거자료로 받아요. 판단자로.
204:43
Speaker A
어, 왜냐면 수치만 믿기 때문에 그래요. 왜냐면 기본적으로 뭐냐면 정보랑 뭐랑 하는 거는 사람들이 필요에 의해서 선택한 건데 데이터 자체는 팩트라고 정의를 했거든요. 그러기 때문에 산업 의견이나 이런 건 개인적인 생각이잖아요. 근데 데이터는 숫자로 편이 되죠. 그래서 믿는 거야. 그리고 기업의 언어가
205:11
Speaker A
회개예요.이 이익지다니까 숫자로 얘기해요. 그리고 왜 수학이 크냐면 이건 나중에 자연호 처리할 때도 제가 말씀드릴 텐데 저도 자연호 공부하면서요 딥이닝 공부하면서 깨 깨달은 거예요.
205:32
Speaker A
왜 숫자냐? 언어가 숫자로 통일돼 있잖아. 전 세계 언어는 다 틀린데 숫자는 다 쓰잖아요. 수학.
205:44
Speaker A
그러면은 근데 이게 컴퓨터의 언어예요. 수학 숫자잖아요.이 숫자만 인식하잖아요. 어 그렇진 않죠. 동시님 통계로 의견을 통로 백업 자료로 늦쳐. 다 강력하죠.
206:09
Speaker A
강력하죠. 여러분 그 법 같은 거 국회의원들이 만들 때도 통계를 많이 쓰죠. 왜냐면은 사례 조사하잖아요. 요거 미국에서 이런 법이 쓰고 있고 여기는 이런 거 쓰이고 있고. 그렇죠.
206:24
Speaker A
그것도 통계잖아요. 어느 나라에서는 여기에 몇 퍼센트 그게 그거죠. 결국 신뢰성을 더해 주는 거죠. 어떤 사람의 의견을 통계자로가.
206:35
Speaker A
근데 그 통계는 확률값이고 또 조작이 가능해요. 그래서 그걸 보려면 그 상대방 또 통계를 볼 줄 알아야 돼요. 이게 실제로 그 정보의 비대칭이라고 보면 돼요.
206:54
Speaker A
실제로 우리가 많이 하죠. 우리 그 예를 많이든게 보험회사거든요. 보험회사 지고는 보험에 대해서 빠삭하잖아요. 우리는 뭐 잘 모르잖아요.
207:03
Speaker A
어 그래서 가입을 하죠. 그런 거랑 똑같아요. 그래서 그래서 아까 아침에 지금 제가 공무원 얘기도 했었잖아요. 그 공무원 잘못 없어요. 거기에 통계 전문가나요 데이터를 볼 줄 아는 사람을 안 한친 행정부의 잘못이 있는 거죠. 어떻게 보면 그렇지 않겠어요?
207:25
Speaker A
어, 그분은 그냥 행정하는 거잖아요. 그 규칙, 공무원 규칙에 어긋나는 행동만 안 하고 거기에 따르면 되는 거잖아요. 근데 그 사람은 법적으로 법은 더 엄격하잖아요. 기준이니까.
207:42
Speaker A
어, 그러니까 이제 거기에 맞추면 그게 맞긴 맞아요. 왜냐면 실제로 통계도 중요하지만 통계는 확률값이란 말이에요. 근데 옛날에 제가 부산시 과정 할 때 어떤게 있었냐면 애들이 어떤 프로젝트하냐면 로로 테션해 가지고 뭐였냐면 그때 화두가 뭐였냐면 중국 그 불법 어선이 잡아가는데 산란기대 잡아가니면 어떻게 돼요?
208:07
Speaker A
씨가 마르는 거죠. 그 어종이. 그러니까 그거를 방지하기 위해서 어쩔 수 없이 어구에 그냥 망을 치니까 산란이 있는 산란데 배 알을 베고 있는 고기도 잡힐 거 아니에요. 어 그러니까 그런 애가 잡히면 알람이 울려서 거기서 통해 어통해서 걔 어 그 애들을 어이나어나
208:36
Speaker A
애나 이런 애 이런 애들은 보내 줘야 될 거 아니에요. 다시 방류해야 될 거 아니에요. 어부들이 이제 그런 시스템을 애들이 만든 거예요. 그걸 만들려고 이제 알람에 올리고 사물 인터넷 이용해서 이해되시죠?
208:50
Speaker A
그런 거를 이제 프로젝트를 했는데 그때 제가 물어봤어요. 이거 무슨 근고로요 했냐? 어치 어치를 기술정을 해야 될 거 아니에요. 근데 법에 있대요. 할 말 없더라고. 그 어 잘했어.
209:06
Speaker A
그죠? 법으로 어가 규정돼 있어요. 그죠? 그러면 할 말 없잖아요. 어 그래 이게 최고예요.음 그죠? 근데 그 법을 만들 때 그냥 만들었겠냐면 다 통계 자료나 기존의 사례 조사는 다 이렇게 해서 만들겠죠. 그렇죠? 어 그러니까 그래서 오히려 통계는 설명력을 높여
209:31
Speaker A
줘요. 설득력을 높여줘요. 그래서 회사에서 통계를 제가 신입성 교육가 가지고 많이 하는 얘기예요. 어 뭐 파워비나 뭐 이런게 통계 분석하는 간단한 거 있잖아요.
209:46
Speaker A
어 요즘엔 또 채치T에다가 그냥 엑셀 놓으면 통계도 다 해 주니까 분석까지. 근데 왜 이런 걸 배워야 되냐? 자, 알려 줘요. 제가 이제 MBA 하고 어, 석사하고 취업한 데가 이제 저쪽 롯데 호텔하고 세종 호텔 이렇게 왔다 갔다 했는데 잠깐 롯데 호텔에 있다가 세종 호텔에
210:08
Speaker A
있었는데 거기에 이제 저가 프론트 업무를 해 본 적도 없었거든요. 거기 거기서 집배일을 했어요. 그랬때 프론트 업무 이게 영어 하나만 할 줄 알지 프론트 업무 할 줄도 몰랐죠. 근데이 하다가 갑자기 이제 프로젝트 팀에 합류하게 됩니다. 그 뭐였냐면은 그때 한참
210:31
Speaker A
중국인 광기들 넘어와 가지고 호텔을 더 지을 거냐이 이런 문제였어요. 제 제 사례를 알려 드린 거예요.
210:39
Speaker A
그렇죠. 그랬는데 뭐가 있었냐면 저기 세운상가 쪽 그 기금속 있는데 있죠. 종로 2강인가 3관인가? 거기에 그 세종 호텔이 세종대학교 거거든요.
210:53
Speaker A
거기에 그 주차 빌딩이 큰게 하나 있었어요. 근데 한 1년에 30억 정도 주차비로만 이제 버는 거예요. 어 그 거기에 주차 아주 거기가 보시면 종로 쪽 그 기금속 있는데가 보시면 주차할 때 없잖아요. 그죠? 어 그쪽 다 옛날 도시다. 여기서 이제 그 뒤쪽이
211:19
Speaker A
다 모텔촌이고 약간 그랬어요. 그러니까 그때 객시를 차라리 특급 호텔 30층짜리를 하나 거리상 또 가까우니까 거기다 하나 그 비즈니스 호텔을 짓는 프로젝트. 그때 여러분들 제가 그때 또 뭘 공부를 했었냐면 프로젝트 파이낸싱이라고 해 가지고 이제 프로젝트를 딱 해 가지고 투자를
211:41
Speaker A
받아 가지고 거기다 하는 거 있죠. 그래 가지고 어 200억 거기가 250억짜리 프로젝트였어요. 근데 이제 우리 총집에 있는 그걸 하고 싶어 했어요. 처음에는. 근데 이제 프로젝트 타당성 검사를 해야 되잖아요. 사업 타당성. 거기에 제가 투입된 거예요. 프로젝냐면 통계 SS를 돌릴 줄 아는 사람이
212:05
Speaker A
저밖에 없었어요. 그니까 저는 조금 미운살 바뀌었지. 출근해 가지고 4시간 네시간은 프로젝트하러 간 거야. 이해되시죠? 바쁠 때만 어 거기 도와주고 밥 먹으러 가야 되니까. 어 그래서 이제 3개월 동안 프로젝트 들어갔는데 거기서 이제 결론이 나온게 뭐였냐면 어 그러니까 이런 것들 알아. 그
212:29
Speaker A
숫자로 믿는 거예요. 통계를 돌려봤더니 프로젝션을 쫙 했어요. 시계 분석으로 폐기물석이랑 시계 분석 같이 했거든요. 어 그랬더니 왜냐면은 지금 지어지고 있는 호텔들이 있으니까 프로젝션이 3년 후에 어떻게 될 건지 프로젝션을 했잖아요. 그러니까 갱단가가 지금은 지금은 20 몇만 원씩 한 객실 받고 있는데 그 명동에
212:53
Speaker A
있으니까 종로 쪽은 좀 떨어지더라고요. 14만 원이었나? 근데 8만 원까지 지금 8만 원이에요. 평일에. 어, 지금 근데 다시 명동이 좀 떠 가지고 종료 쪽이 지금 케 때문에 떠 가지고 지금 한 10만 원 넘는 걸로 알고 있는데 제가 프로젝션 하니까
213:12
Speaker A
8만5,000원인가 그 떨어지더라고요. 그 제가 이러면은 우리가 대출받는 은행에서 대출받는 보이자 보상 비용이라는게 있어요. 그거보도 안 나올 거 같다고 제가 통계로 이제 돌린 걸을 보여 줬어요.
213:27
Speaker A
그래서 의사 결정이 바뀌었어요. 실제 사례입니다. 그 250억을 어떻게 하기로 했냐? 그래서 그 세종대학교 그 돈이 어디로 갔냐면 세종대학교 안에 인공지능 센터가 있어요. 그걸 짓는 걸로 120억을 대출 안 받고 자체 원래 갖고 있던 100억을 재단의 돈 100 120억인가 그거 갖고 인공지능
213:52
Speaker A
센터를 지었습니다.음 그걸 바뀐 거예요. 어떻게 보면 130억이 나오고 있는 주차 필딩을 차라리 개선하는게 더 낫다. 그 그래서 거기를 좀 개선하고 있을 걸로 알고 있어요. 그 당시에 그 프로젝트를 했잖아요. 그리고 제가 재단 이사장한테 회장한테 직접 보고 했단 말이에요. 그래서 그때 이후로 제가
214:17
Speaker A
승진이 됐고 6 취업한지 1년 만에 주임을 달 어 그리고 이제 대기업에 갈 수 있었죠.
214:26
Speaker A
그걸로 구형의 과정으로 갈 수 있었죠. 그 플렉트로. 그리고 그다음부터 그 보고서를 이제 제가 그걸 만들었더 총지배이 그걸 맞뜨인 거예요. 어, 제 보고서 SS로 이렇게 통계 그래프 그린 거. 근데 그걸 할 수 있는 사람 저밖에 없잖아요. 그러니까 제가 이런 말 하면 그런데
214:48
Speaker A
딱 이게 출근하잖아요. 그러면 저는 8시간 중에 6여시간만 일했어요. 두시간은 총집인실 앞에서 비서 있어요. 그러니까 데이터 분석 설명해 주고 전략 보고서 그러니까 이렇게 가잖아요. 저 주임인데 과장님이 아유 양주님 오셨으니까 이리 와 봐 이리 와 봐.
215:08
Speaker A
그 가고 저는 이제 과장님 시에서 앉아 가지고 데이터 분석하라. 그래 여러분들 이게 학습 효과라는게 있잖아요. 처음에는 보고서 만들 때 진짜 두 시간 넘게 걸렸어요.
215:20
Speaker A
야금까지 했어요. 근데 하나 품에 만들었잖아. 매일 날 반복되잖아요. 댓글 보서 고객 의견 뭐 이해되시죠?
215:28
Speaker A
VOC 뭐 이런 거 있어요. 고객의 소리. 그러면 나는 어찌 됐든 두시간 과장님 책상에 앉아 가지고 갖고 있잖아요. 근데 실제로는 30분이면 끝나.서 한시간 반 동안 6시분 채팅하고 또 있어. 어 그러면 딱 오면은 보고서 딱 만들면 장님이 웃으면서 통집에 가고
215:52
Speaker A
이게 통계의 힘이에요. 그러면 설명이 됐나요? 동님 그래서 그 여러분들이 개발직이어도 이제는 기발자였단 말이에요. 그러니까 뭐냐면 지금 하나씩 공부하면서 한번 생각해 보세요. 지금 우리가 프로젝트 하는 것들이 나중을 생각해서 아 내가 아직 모르잖아요. 그러면 협동 로봇이라는 걸 할 거고 슬램이라는 것도 한번 찾아보세요.
216:24
Speaker A
슬라임이라고 인터넷 찾아보거나 여러분 채집때 물어보세요. 그런 거 그 디지털 트위 이런 거 찾아보시고 그리고 이제 우리가 엔비디아의 아이로 아마 가상환경 구축해 가지고 하는 걸로 알고 있는데 그런 거 한번 이론적인 거 한번 찾아보시라고요.
216:42
Speaker A
그렇죠? 그러 찾아봐서 어 이런 주제네 관심이 있으면 보여요. 그 이런 주제로 요즘에 프로젝트 뭐 해 물어봐요. 저도 그렇게 했어요. 박사 가지고 처음에 저는 아예 만져 보지도 못했으니까 논몸을 산십천이 일어났어요.
216:57
Speaker A
그러면은 그걸 보고 프로젝트 주제 이런 거 이런 거 하면 좋겠다. 지금 배우는 거는 여기에 한번 써먹으면 좋겠다. 이런 생각을 하시는 분과 그냥 막연하게 어 이쪽으로 전공을 나갈 건데 업계 현황이 어떤지 아니면 내가 어떤 걸 이걸 왜 배우는지 이런 목적 없이 있는 거랑은
217:20
Speaker A
다르죠. 근데 그렇게 준비를 하다 보면 어 이거 여기다 썩은 걸 수 있겠네 이런게 보일 거예요. 코드나 이런 것들.
217:29
Speaker A
어, 그리고 봐봐요. 여러분들이 회의를 나중에 프로젝트 회의를 할 때 다를 거예요. 그 해 때 야, 제가 그동안 이런 이런 걸 했는데 그러니까 아예 난 뭐 하고 싶어요. 딱 주제를 좋아하면은 싸움 나요. 그냥 어찌됐든 내가 혼자 그 짧은 2주 동안 한%당
217:53
Speaker A
2주잖아요. 그 짧은 기간 동안에 어떻게든 완성을 하는게 중요하잖아요. 어차피 여러분이 하는 거 상용 안 돼요. 그죠? 이주하는데 무슨 연습인지 근데 그때 내가 그래도 목표한데 A투까지 해야 되는데 나 혼자는 못 하잖아요. 다섯 명이 같이 도와서 하는 거니까 내가 대신 이거 하나 내가 관심
218:16
Speaker A
있었던 거 요거 코드 요거 요거 사용해서 뭐 만들고 싶은 거 제대로 한번 하고 싶다. 결과 한번 내고 싶다. 이렇게 생각하시고 주제를 각 내가 2번법 써요. 그러면 2번법 쓸 거예요. 정주님의이 방법, 세교님의이 방법 이런게 어 그러면 이거 갖고 주제가 현실적으로
218:36
Speaker A
또 한정돼 있어요. 일반적인 인공지능보다는 주제 폭이 그냥 소프트웨어로 다 아무거나 만드는게 아니라 로봇에 이식해 가지고 하는 거니까 어느 정도는 한정돼 있단 말이에요. 그러면은 그 한정된 주제에서 우리가 이거 합시다. 원데 대신 기획을 요렇게 요렇게 렇게 해 가지고 기존에 있던 거 보니까 이런
218:56
Speaker A
건데 요즘에 이런게 핫타니까 요거를 구현이 가능한지 제가 확인해 봤고 요거랑요 데이터는 요거 쓰고 어 그리고 아까 처음에 말하는 뭐 세교님이 말한 이런 걸 여기다 같이 쓰면 요거 하면 좋겠어요.
219:11
Speaker A
그렇게 대화를 어떤 자료나 데이터를 보고 얘기하잖아요. 그 시간이 안 아까워요. 3일 안에 3일 안에 데이터 수집까지 다 끝나요. 제가 어차피 시간이 애매한 밥 먹을 때 되니까 오늘 어떻게 왔다 갔다 이렇게 하다 보니 보고 싶습 시간이 길었는데 요거 얘기하고 밥 먹고 와서 코드
219:34
Speaker A
치는 걸로 하고 실내 여러분 사례를 알려 줄게요. 제가 그것 때문에 이제 멀티 캠퍼스에서 제가 홍보 모델까지 절 홍보 모델까지 만들어 준 그래서 전 다른 거 안 받아요. 여러분이 정말 잘되고 그냥 딱 한 마디야. 인공지능 누구한테 배웠어? 양진이요. 딱 그거 한
219:55
Speaker A
마디만 해 주면 돼요. 알았죠? 저 많은 걸 별하지 않아요. 자, 그러니까 여러분이 잘 돼야 돼.
220:02
Speaker A
알았죠? 어, 근데 거기서 어떤 거였냐면 그 한 팀이에요. 한 팀에 한 명이 어떤 거였냐면 물리학과 나온 친구였는데 얘는 뭐냐면 무조건 빨리빨리 딱 딱 옛날 스타일이야. 일 잘러 딱 특징 내가 알아.
220:22
Speaker A
프로젝트가 여기서 제가 그랬죠. 여기서부터 우리 일정이 그때 6주였데 1주일 때 무조건 기회 끝내야 되고요. 데이터 끝내야 되고요. 두 번째 쯤 전처리 끝나야 되고요. 예를 들어 데이터니까 주근이니까 이렇게 착착착 W베이스를 만들려고 했어요.
220:39
Speaker A
그러면 걔는 어떻게든 커접해도 만들더라고요. 그 수업할 때도 그 친구가 이제 리더가 되면서 애들 읽는데 잘 읽고 었어요. 근데 얘네들가 어떻게 하냐면데 다른 데는 데이터 뭐 크롤링하고 막 막 이거 하고 싶어 가지고 막 주제는 주제는 창대해. 그 내가 봐도 이거
221:04
Speaker A
기간 내에 못 끝내는 거야. 딱 보니까 주제가 데이터 하나 어떻게 하겠냐고 물어보는데. 근데이 친구들은 어떻게 날로 먹었는지 아세요?
221:13
Speaker A
캐그에도 있고 다른데 다 있는 거야. 우리 우리도 했어요. 개하고 울프 개의 데이터만 모은 거예요.
221:25
Speaker A
뭐였냐면 우리가 이제 나중에 스타일 트랜스퍼 배울 건데 뭐였냐면 얘네들이 요즘에 애견이 뜨잖아요. 저도가 애견적 애견 주고 십사고 그러면 대완 반려 동물을 많이 이용하는데 그 중에 이제 강아지를 딱 봐 가지고 강아지 사랑하는 강아지를 사진을 못면 스타일 트랜스퍼를 이용해서 어떻게해요? 만 원 우리가 이미
221:58
Speaker A
화두가 됐던 거죠. 걔네들이 미리 한 거예요. 어때요? 많아. 지브릿 스타일처럼 그런 스타일로 만들어 주는 우리 강아지. 그걸 갖고 굿주로 만들어서 팔 수 있대. 그런 프로젝트를 한 거야.
222:14
Speaker A
이해되시죠? 그래서 데이터는 퇴글에 널려 있잖아요. AI 허브에 이틀 만에 끝났어요. 데이터 몇 개? 30만 개. 데이터 증강해서 50만 개. 그리고 나머지 일주일당 그거 돌 학습시키는데 바꾼 거야.
222:28
Speaker A
그렇죠? 그리고 각자 나눠 가지고 구현을 2차 구현할 때 이미 얘네들은 웹구연까지 다 끝났어요. 그 팀장에는 자기는 딥러닝 잘 어렵다. 그래서 저 제가 저보고 제가 그러면 앞에 좀 가르쳐 줬어요. 세시간씩. 어 그냥 특강처럼 해 가지고 프로젝트 리액트 리액트 전에 자바스크립트까지만
222:52
Speaker A
밝혀줬어요. 그랬더니 얘가 혼자 오라클 DB까지 다 공부해 가지고 어떻게 보면 풀스틱처럼 그래서 혼자서 독학해서 어 그 무 인플론이나 이런 온라인 강의 봐서 그걸 완성한 거예요.
223:09
Speaker A
그런데 그때 제 아는 분이 전화 봤어요. 그 버캠에서 그 VRAR 강의하는 분이었는데 자기가 그 VRAR 하면서 거기에 그 협력 그 교수가 아니라 그런 거 있잖아요. 이렇게 지도해 주는 그런 연구진 않은 거기 속해 있는 회사에 그까 바 뭐냐면 유명한 회사고
223:36
Speaker A
그러니까 인공지능으로 초등학교 중학교 애들 그 만화 같은 거 만들어 주는 거죠. 만화 이미지 스타일 그 회사예요.
223:45
Speaker A
그 사당 쪽에 있어요. 그랬더니 어 연락이 왔어요. 그 혹시 인공지능 그 신입사원 중에 좀 추천할 만한에요. 어 우리 애들 프로젝트 하라 애 있는데 거기 회사보랑 좀 잘 맞는 거 같아. 거기가 이름이 무슨 아 치면 나오세요. 툰스퀘어라.
224:05
Speaker A
툰스퀘어일 거예요. 이름이 회사 이름이 외툰 그렇죠. 툰스퀘어. 어 그래 가지고 그 회사에 이제 저희가 했던 애들이 하고 있는 거를 네가 실현 영상을 좀 만들어 봐 내가 그랬어요.
224:19
Speaker A
그래서 그거를 제 유튜브 채널에 링크로 해 가지고 보내 줬어요. 그랬더니 갑자기 그 팀장이 여기 그때 멀티캠퍼에 전화가 와 가지고 메니저한테 우리가 그 어떻게 애들 와 가지고 시원할 수 없네. 직접 직원들 앞에서. 그래서 친구들이 그 다섯 명 갔어요. 양제 쪽에 있구나. 생각해
224:40
Speaker A
보니까 그 선능해요. 그리고 마치 면접 보는 거죠. 면접서 발금하면 되니까. 그 다섯 명에서 시현했어요.
224:49
Speaker A
그중에네 명이 동시에 인턴 합격 받았어. 그래서네 명이 다 합격했어요. 그래서 그 친구들이 인터뷰하고 대체 어떤 관사님이 애들이 추어도 하기도 전에 취업을네 명이나 시킵니까 뭐 그렇죠.
225:03
Speaker A
그렇게 돼서 어 제가 좀 떴어요. 제 얼굴이 갑자기 막 제주도나 막 그런 데서 오는 거예요.이 유튜브에 막 제 얼굴이 떠다녀 가지고 그래서 그때 후에 있죠. 살 뺄 걸. 그렇죠.
225:18
Speaker A
진짜로. 어. 어 진짜 뚱뚱하게 나오더라고 얼굴이. 그래가지고. 그래서 제가 여러분이 그 지금 좀 연락요. 그중에 한 명이 결혼해 가지고 제가 이제 가지는 못했고 강의 때문에 그 청조장 보내주고 뭐 그리고 한동안은 2년 동안에는 저한테 생일 때도 생기고 감사하다고 그랬던 친구들이 있어요. 좋은 경험이
225:44
Speaker A
있었던 그게 뭐냐면 그 친구들이 뭐예요? 그게 그 운도 있는 거죠. 그 프로젝트가 그 팀에서 원했던 거야.
225:53
Speaker A
얼마나 그 대표가 마음에 들었냐면 신일상으로 나 한 명 뽑고 왜 한 명 뽑으려고 해. 두 명 최대 두 명 뽑으라는 걸 그냥 다 뽑고 내년도에 두 명 안 뽑으면 되지. 이런 식으로 여러분들이 미래에 그렇게 될 거라고 저는 확신합니다.
226:14
Speaker A
밥 맛있게 먹고 열심히 따라오세요. 고 자, 여러분 실상 아시겠나요? 자, 이제 보기선으로 코드를 쳐 볼게요.
288:56
Speaker A
자, 우리 오늘 같이 잠깐 소개하면 그 커스텀 모델 정의해서요인 그 이익과 포드 역할이 뭔지 그다음에요 세 개고 하나의 선형 선형 함수 만드는 거 간단해요.
289:11
Speaker A
그다음에 마이 리그레이션 모델 한번 정의해 보시고 그다음에 여기 모델의 소시장 옵티마이저 정의하는 거 한번 코드 해 보시면 되겠고이 경사강법요네 단계 한번 잘 해 보세요. 그래서 뭐 예측 어떻게 하고 손실 변사 초기와 변사 계산 파라미터 튜닝 자 그렇게 보시면 될 거 같고
289:58
Speaker A
자 여기서 자, 첫 번째 거 한번 열어 보시면 되겠습니다. 습니다. 자, 똑같이 뭐 한글 폰트 하시고 여기까지 돌리시면 되죠.
290:49
Speaker A
자, 됐으면 런타임 세션 다 시작하시고 예, 여기까지 그냥 돌리시면 되겠습니다. 습니다. 이거의 설정까지. 자, 우리 오늘 나왔던 내용이죠.
291:05
Speaker A
2차원 출력의 상차원 선형 함수고 이거는 x1 아 wx와 x1 + wx 2 + p 이거랑 했죠. 수가 두 개 들어가는 거.
291:20
Speaker A
그래서 3,000원을 넘는 겁니다. 그까 시드값 성각 동일한 재원성이라고 했죠. 동일한 결과를 어 먹기 위해서 매뉴얼 시트 하고 얘는 하나죠. wx + p예요. 하나니까.
291:39
Speaker A
자, 쳐 보시면 인풋 피처는 하나, 아웃 피처스 하나 이렇게 나와요. 자, 파라미터 웨이트하고 바이오스입니다. 그래서 여기가 그거든요.
291:58
Speaker A
네임드 파라미터 아까 MP가 그거예요. 여기서 파라미터만 가져와서 네임은 파라미터 액제로 텐서 1 셰이프 파라미터 1의 10 이렇게 해서 이름 추록해 보고 텐스값 출하고 모양 출력해 보시면 실제로 얘가 네임미트 이렇게 아까 이걸 이제 하나만 얘는 했는데 네임하고 파라미터하고 아까 나눴던
292:24
Speaker A
거고요. 자 여기 보시면 텐서는 어떤게 요거가 나오는 거죠. 근데 잘 보시면 컬트루예요. 지금 포츠 사이즈 나오고요. 1 2죠.
292:37
Speaker A
그다음에 하나는 바이어스죠. 왜냐면은 두 개가 있죠. 파라미터 쓰니까 여기 두 개의 파라미터가 있어요. 웨이트와 바이어스가 있으니까 얘는 0.331이고요.
292:50
Speaker A
얘도 리컬스 2고 사이즈는 하나죠. 자, 그런 다음에 여기에 초기값을 설정하는 걸 해 볼게요. 자, 그 n의 인의 컨스턴트의 n1의 웨이트 그다음에 2.0 0 즉 모든 값을 웨이트를 2.0으로 설정하겠다는 뜻이고요. 이제 우리 교재했던 거 이제 코드로 다시 보는 거죠. 니
293:33
Speaker A
컨스턴스의 바이어스는 1. 그러니까 바이어스 텐스의 모델값을 1로 설정할 때 이렇게 컨스턴트 언더바예요. 상수라는 뜻이죠. 상수 만들어 주겠다는 거죠. 고정값으로. 그래서 웨이트하고 바이스 한번 쳐 보시면 얘는 2고요. 얘는 1인 걸로 나오죠. 그리고 얘는 지금 하이그레드 2루예요.
293:56
Speaker A
그리고이 어레인지 한번 써서 한번 마시면 이렇게 되죠. -2와 스타트 엔드 2.1까지 해서 1씩 증강하는 걸로 만들어서 얘를 MP라고 하고 프린트 찍으면 요거 얘를 받아서 텐서로 바꿔 준 거죠.
294:14
Speaker A
프로트 텐스로 바꿔서 프린트 찍으면 요렇게 돼요. 자, 그런 다음에 얘를 우리가 n 1로 만들어죠. 사이즈 변경. N은 배치단이죠. 그 데이터 캐스죠.
294:28
Speaker A
우리가 선형 함수인 기본적으로 배치 묶음 단위로 한다고 했어. 그래서 2,000원 텐서 입력을 가정합니다. 그래서 여기에 힐 만들어 놓고 알아서 네가 맞춰 줘 하니까 실제로 이거 다섯 개가 있으니까 5 1이 되는 거야. 이해되시죠? 해 봤잖아요. 5마에서 5 1 배열이
294:50
Speaker A
되는 매트릭스가 되죠. 여기서 프린트 찍고 여기 이게 나오죠. 지금 이거고 값은 텐서로 나오고 그 이걸 이해하셔야 돼요. 어 요가 1차원이고 얘는 2차원이죠.
295:07
Speaker A
5콤마고요. 5 1이에요. 알겠죠? 자 그래서 거기다 집어넣은 거죠. 이제 x를 집어넣어서 프린트 y를 찍어 보면 찍으면 얘가 일단 아직 안 돌렸지만 결과 나와 있으니까 5 1로 이렇게 나오고요.
295:28
Speaker A
FF를 찍으면 5 1이고 요거에 해당하는 데이터가 잘 나오죠. 입력이 이제 두 개고요. 출력이 하나인 겁니다.
295:41
Speaker A
여기에 입력은 데이터가 아니에요. 속성 정보, 특성 정보예요. 자, 웨이트는 다 1로 만들고 바이스는 2인데 얘는 결국 뭐냐면 요거죠.
295:53
Speaker A
그러니까 1이니까 1 * 1, + 2 이렇게 되는 거죠. 네. 이거 x1이에요. x2고 이거 이제 좀 이렇게 하시면 좀 잘 보이겠죠? 음. 자, 그래서 이거 하시면 1 두 개 나와 있고 얘는 2 요거죠.
296:16
Speaker A
자, 이게 2차원 데이터죠. 이제 몇 개요?네 네 개의 배열이 있고 두 개씩 4짜리잖아요. 이렇게이 차황이에요. 듣고 나서 플로테서 바꿔 준 거죠. 셰프 찍으면 4 2고 이렇게 두 개가 있네요.
296:39
Speaker A
얘를 L2에다 집어넣어서 Y2를 만들고 셰어 보고 데이터 보시면 데이터 하면 데이터 내용이 나오는 거죠. 지금 보면 2.0 3.0 3.4마 한 개씩 있네. 4 1짜리가 나왔어요.
297:07
Speaker A
자, 그런 다음에 우리가 이제 입력이 두 개고 출력이 세 개인 선형 함수를 정의할게요. 2 3인데 s이라고 하고요. 자, 얘는 각 행을 다른 값으로 설정을 해 본 거예요.
297:25
Speaker A
초위값을 0 1 2 2 1이죠. 1 2 3이라는 거예요. 그리고 2 아까 다 똑같았잖아요. 근데 이제 틀리게 열면 다 똑같고 행은 행은 틀리게 나오는 거죠. 각 배열마다 틀린 점수를 웨이트를 주겠다는 거죠. 자, 그런 다음에 바이스는 2를 준 거죠.
297:47
Speaker A
웨이트를 찍고 보시면 자 1 2 2가 나오죠. 그래서 마지막에 이제 요건 2 세 개니까 이렇게 나옵니다. 얘를 다시 쓰시고 셰프랑 데이터를 넣으시면 4 3짜리가 나오고 4마에 세 개씩 들어 있죠.
298:18
Speaker A
제 원리니까 그만 어 이런 때도 했으니 이해되셨을 거라 보고 여기 커스텀 클래스로 넘어가 보도록 하겠습니다. 아까 말했던 것처럼 우리가 뉴럴 네트워크의 모듈을 드러나서 상속받는 거죠. 생성자와 순종파로 이루어져 있어요.
298:40
Speaker A
두 개 받죠. 수로 인풋 아웃풋 그다음에 상속 받고 인풋 아웃풋 들어가서 에론 만들고요. x 들어가서 x1 나오는 거죠.
298:53
Speaker A
그래서 내가 한번 원즈 하면 여러분 알겠 1짜리 이렇게 나와요. 자 그래서 여기엔 100 100개의 샘플이고 하나 특성 하나 들어간죠.
299:05
Speaker A
다 원으로 1이라는 어 숫자의 값을 갖고 있어요. 인풋 넣고 예 하나하나 하는 거죠. 속성 조문들 가니까 한 개의 속성 들어가서 한 개의 속성으로 나오는 거죠. 그래서 인스턴스 만들어요.
299:21
Speaker A
네라고. 그에다가 인풋 넣겠어요. 아웃풋 나오죠. 예측값이죠. F 찍고 그중에 앞 다섯 개만 출 1이고요. 각각 텐서로 마이너스 값 갖고 있는 값이 나와요.
299:38
Speaker A
똑같이 이거 하면 다 0으로만 갖고 있는 거죠. 100 1을. 자, 그다음에 우리가 손실 함수 정의를 해 보도록 하겠습니다.
299:52
Speaker A
손실함수. 자, 그래서 여기서 평균제곱 5차 민스퀘어드 에러를 구하는데 nn, ms 라스를 해서 크리티리얼 만들고요.
300:10
Speaker A
토치에 제로 쓰죠. 정답이 모두 0이라고 가정을 할게요. 자, 그래서 제로스에서 라벨 1원 만들어서 얘 한번 열어 보시면 이렇게 해서 예 프린트 자 이거 같이 돌려 보시면 얘가 이렇게 나오네.
300:31
Speaker A
100콤마 1니까 일단 빼고. 자, 그래서 얘 라벨이고요. 얘를 넣어성. 이게 정답이죠. 00이라고 가정 있으니까. 그다음에 아웃풋.
300:46
Speaker A
그렇죠? 그 두 개를 라스트를 해서 백워드를 하겠다는 거죠. 그래서 계산된 가정치를 계산할 때 라스의 아이템이라고 하면 파스 숫자로 바꿔 줘요. 여기가 텐서니까.
301:00
Speaker A
그래서 거기에 웨이트에 그레이드 하면 각각 경사에 갖고 있는 값이죠. 그래서 그거의 에론의 웨이트에 갖고 있는 그레이드 어떻게 되냐 찍어 보시면 지금 백고 돌았기 때문에 그런 잠깐만요.
301:22
Speaker A
여기서부터 다시 돌려 볼게요. 보인 거 같아 여기. 그죠? 자 보시면 톤실드는 0.01이고요. 거기에 그 텐스는 -0.2167 이게 기울기죠. 그렇죠? 기울기가 저장된 거예요.
301:48
Speaker A
자, 그런 다음에이 예측 계산해요. 인풋을 넣어서 아웃풋 예측 만들고 그 아웃풋과 라벨 2 라벨 1 두 개의 손실을 계산해서 아이템 구해 보면 요렇게 합성수 결과 웨이트가 바뀌어는 걸 확인할 수 있어요. 스값이 변경됐어랑 같죠?
302:15
Speaker A
자, 그래서 실제로이 보시면 음, 여기 지금 아직도 있을지 모르겠는데 그죠? 보스턴 하우징 데이터고요. 이렇게 설명이 나와 있고 어 데이터 보시면 여기에 14개 원래 14개가 돼 있네요. 그래서 이게 뭐 범죄율 아무래도 퍼 캐피타잖아요. 한 사람 땅 그 얼마나 크레임이 있는지.
302:40
Speaker A
그다음에 이게 이제 찰스가 우리로 따지면 여기 써 있죠. 이런 걸 더미 변수라고 해요. 더미 변수. 뭐냐면 한강이 있냐 없냐 한강 보이는 아파트 비싸잖아요. 1. 한강 안 보인다.
302:53
Speaker A
0 그거예요. 그다음에이 RM 아까 했던게 뭐냐면 number of rooms foring 그 거주지의 평균 살고 있는 거죠. 업드 그 방 개수 뭐 텍스 뭐 이런 거죠. 어, 이런 내용들이 다양하게 남겨져 있어요.
303:19
Speaker A
그래서 여기에 원본 데이터은 17개 입력값으로부터 하는 거지만 우리는 하나만 받겠다. 이런 뜻이에요. 그래서 요거 가져와서 데이터 URL을 하고 자, 그다음에 걔를 가져온 데이터를 파일로 갖고 와서 바로 만들어 주는 거죠.
303:38
Speaker A
익숙했습니다. 시스 파일이 있는데 얘는 공백 기준으로 분리돼 있고 전체 22개가 날아가죠. 요게 아마 어 이게 요거랑 틀릴 거예요. 요거 이런 거거든요. 요거든요. 보이세요?
303:58
Speaker A
자, 여기에 이렇게 만약 다이어타가 있을 때 여러분이 다운 맞는 방법이 오른쪽 마우스에서 다른 이름으로서 그런 다음에 여기 텍스트잖아요.
304:11
Speaker A
얘를 모든 파일로 바꾼 다음에 cscv 이렇게 하면 cs 파일로 어 이렇게 바뀌어요. 음. 제가 지금 이게 엑셀이 안 깔려 있어. 그 여기 이렇게 보이죠? 그럼 여기 22개까지 자 없애겠다.
304:33
Speaker A
스킬로스가 그 뜻이에요. 여기까지가 설명이잖아요. 변수 설명. 그리고 실제 데이터가 여기 있죠. 그리고 얘는 헤더가 없죠, 지금. 이게 뭘 의미하는지 컬러명이 없잖아요, 지금. 이해돼요?
304:47
Speaker A
그래서 어 해도 없다 이렇게 표현하는 거예요. 자, 그래서요 내용들입니다. 자, 그래서 거고 이해 이해됐을 거예요. 패턴 없다.
305:06
Speaker A
그래서 로우 DF는 이렇게 생겼고 걔를 H스택 H스택으로 요거는 뭐예요? 로우 DF의 밸류성 지금 어떻게 했죠? 아까 좀 설명을 드렸지만 앞에 콤마를 기준 행렬이죠. 밸류값만 갖고 오는데 0 2 4 6 8 이렇게 가져오는 거지. 이해되시죠? 어, 그리고 얘는 어 다 가지고 있고 얘는
305:40
Speaker A
1 3 5 79예요. 그리고 얘는 0과 1만 이렇게 두 개를 시스템으로 붙이시는 거야. 자, 그런 다음에 그래서 요걸 한번 찍어 보시면 자, 이렇게 나온다 이거죠. 옆에 시스템이야.
306:20
Speaker A
자, 그래서 얘 빼고 그리고 얘는 1 3 5 7하고 얘는 딱 2로 고정하겠다. 얘 이렇게 빼 볼게요.
306:30
Speaker A
주석 빼고 돌려 보시면 이렇게 간만 1차원으로 쭉 나오죠. 자, 그런 다음에 이제 이름을 없으니까 이름을 넣어 주는 거예요.
306:48
Speaker A
원래 아까 범죄율 뭐 그렇죠. 찰스강 이런 거예요. 보스에 흐르는 강의 이름이 찰스강인가 봐요. 어, 원본 데이터의 셰이프와 YT 셰이프 적은 거고 퓨처 이름을 찍으시면 일단 그죠? 이런 식으로 나오죠. X지는 이거 그렇죠.
307:15
Speaker A
여기에는 프라임 이렇게 나오고 원본 데이터는 13개의 속성이 있는데 얘는 506개만 데이터만 있죠. 그렇죠? y값은.
307:26
Speaker A
자, 그래서 그중에서 네가 데이터는 다 가져오고 피처는 하나만 쓰겠다. RM이라고 방기 방 몇 개 있냐?
307:35
Speaker A
그죠? 요거를 수출해서 X라 하고이 CF 찍어 보고 앞에 다섯 개 데이터 그 열은 다 가져와 그거죠. 500 6이고 다 506개고 하나만 속성은 하나만 쓰겠죠. 이렇게 나와요. 다섯 개만 찍으니까 정답도 다섯 개 찍으니까 이렇게 나오네요.
307:57
Speaker A
얘를 처음에 뭘 해야 될지 모르니까 보통 뭘 해야 될지 모르면 상관계항 그렇죠. 상환 분석과 그다음에 3포도예요.
308:07
Speaker A
제일 첫 번째 하는게 3포도입니다. 그래서 X YT를 사이즈 10에 컬러는 블루로 스케트플라 하면 X축은 반계수, y축은 가격이죠. 방 개수단 가격이 어떻게 되냐? 여러분이 딱 봐도 이렇게 갖고 싶죠?
308:25
Speaker A
어, 상승 같이 상관이가 있는 것처럼 보이죠? 증가하는 것처럼. 네. 그래서이 x가 문제 궁금하면 이렇게 나오고요. 하나니까 루크.
308:54
Speaker A
그다음에 CF는 506이고 1 하면 하나죠. 왜냐면이 셰프 이게 그거예요. X셰이프에 0 하면 요거 0 하면 506이고요. 1이면 1이죠. 요거.
309:09
Speaker A
자, 여러분 알다시피 인덱싱은 어떻게 가능해요? 어, 리스트나 튜플 가능하죠. 자, 그래서 여기 요게 이해되시죠?
309:24
Speaker A
코드 X셰이프이 셰이프로 해 가지고 0일 많이 접근해요. 접근할 때 데이터에서 얘를 입력값을 넣겠다는 거야.
309:33
Speaker A
하나죠. 그래서 하나 나오게 하였다. 출력은 왜 하나냐? 프라이스잖아요. 그렇죠? 아, 그래서 입력 청원수와 초록 청원수가 한 같은 거야. 1씩 이제 알겠죠? 데이터의 개수가 들어가는게 아니라 차원이 들어간다고.
309:52
Speaker A
오케이. 자, 그래서이 머신 러닝 모델에 클래스를 정의하는데 클래스의 정의가 NM 모듈에서 네트워크라고 하고 생성자와 그다음에 호드 순전파죠.
310:12
Speaker A
얘는 인풋 아웃풋 들어가고 상소 받고 인풋 아웃풋 해서 에론 만들고 컨스턴스 고정으로 초기값 설정해 다 1로 초기하겠다 이거지.
310:23
Speaker A
그래서 그 x에다가 집어넣어서 1 통과시켜서 여기에서 정의한 x1이 만약에 그 리턴에서 갖고 있겠다. 여기서 선용액기 계산이 되는 거죠. 인풋 거치는 걸 이제 x값을 넣었으니까.
310:40
Speaker A
자, 우리 다 아는요 내용이죠. 디바이스 설정을 할 때 토치 디바이스하고 후다를 사용 가능하면 if 토치 후다 is avilable 후다를 쓰고 아니 써라.
310:55
Speaker A
그리고 그래서 우리가 늘 때는 모델점 2 몸으로라는 뜻이잖아요. 디바이스에다 저장해 줘. 그러니까 여기 디바이스가 GPU가 있으면 GPU에 설치해라 이렇게 하는 거고 그런 다음에 여러분이 많이 쓰니까 라벨즈 뷰 -1 피처 2 디바이스 이렇게 코드들이 많이 나온다고요.
311:20
Speaker A
이해되시죠? 근데 어 자 근데 중요한게 뭐냐면 얘를 plt나 우리가 아는 메플라 라이브러리나 연산을 할게 반드시 CPU 넘파로 바꿔 줘야 돼요.
311:39
Speaker A
알았죠? 넌 파일로 바꿔 줘야 돼. 자 그래서 네, 인풋 아웃풋투 디바이ice 이렇게 설정해 줘요.
311:51
Speaker A
제가 아마 이거를 일부러 L4를 설정해 놓습니다. 가 디바이스 때문에 설정해 가지고 결과 보기 위해서 트 자 그러면은요 넷 네임드 패라미터스에서 하나씩 파라미터 돌면서 첫 번째 거 웨이트죠. 파라미터에서 두 번째 거 바이어스죠. 파라미터 두 개 있으니까 거기 데이터를 여러분이
312:22
Speaker A
1일 후다 쓰고 있다. 이렇게 나올 거예요. 여러분 CP 이거 안 나오겠죠? 아니면 디바이스 CPU라 거야.
312:35
Speaker A
자, 그래서 여기에다 다시 파라미터 보면 이렇게 보죠. -0.235다 235다 뭐리quire to 이런 식으로 나오고 이제 모델 확인을 예 여러분들은 T4어요. 지금은 T4해도 충분해요. 기본 과정 사실은. 근데 언제부터냐? 마지막 주 때 하면 될 거 같아.
312:57
Speaker A
제 생각에는. 마지막 주 일주일이죠. 셋 넷 다 일곱 여덟. 음. 음. 그래요. 마지막 주 때부터 필요하면 쓰시면 돼요. 여기서부터 그 여기까지는 지금 우리 7번이잖아요.
313:19
Speaker A
어, 사실 사전 학습 튜닝 과학 여기까지는 티퍼로 쓰시고요. 제 생각하는 13차이 필요하시면 어, 그때 티로 써도 그리고 웬만하면 티로 그 지금 지표에서 별로 안 써도 돼요. 어, 하나씩 돌리고 있잖아요.
313:39
Speaker A
설명하면서 어 근데 이제 학습 딥러닝 학습량이 좀 많아지는게 사전학습 모델이 무거운 모델을 갖고 오니까 자 프린트 네를 하시면 하나에서 하나 가는 거잖아. 어. 자, 그래서 이제 또 하나가 여러분 할게 토치 인포로 서머리라고 임포트 하시면 어, 얘를 가져와서 서머리하고 넷 1마 이렇게 해요.
314:10
Speaker A
그래서 여기에 이런 옵션들이 있어서 제가 좀 설명을 해 놨어요. 자, 여기서 1 건 셰프예요.
314:18
Speaker A
하나죠. 사이즈 콤마 1이거든요. 자, 이미지는 엠니스트는 1 28이에요. 자, 이게 CHW로 간다고 했죠. 28 원래는 한 장이라는 뜻이죠.
314:33
Speaker A
근데이 앞에 온다고 했어요. CHW 꼭 기억하세요. 흑백 컬러는 여기 3이에요. 자, 그래서 이렇게 설명을 드렸고 그래서 여기 보면이 요약이 잘 돼 있죠. N11로 돼 있고 웨이트 바이어스가 파라미터 두 개 두 개고 당신이 뭐냐면 토탈 파라미터는 두 갠데 얘 훈 가능합니다.
315:03
Speaker A
왜 이런 말이 나오냐면 나중에 이미 만들어 사전 훈련되는 애를 갖고 오면 트레이닝 할 이유가 없잖아요. 근데 파라미터 수는 난 계산도 안 했는데 엄청나게 많을 거예요.
315:16
Speaker A
그죠? 왜? 이미 훈련되 있는 파라미터 엄청난 양을 웨이트를 갖고 있으니까 그렇죠? 그러면 이게 나눠져 있어요.
315:25
Speaker A
파라미터 할 거 내가 십죠 학습할 거 얘는 학습하지 않을 거. 자, 그래서 민스퀘어 라스를 크리티언 기준으로 잡고 러인 0.01로 영로 해서 자 우리가 정상법을 보냐면 스타캐스틱 그 레디언트 디센트라고 해요. 그래서 SGD입니다.네 파라미터스는 모델점 파라미터스 같죠?
315:53
Speaker A
우리가 모델 대신 내시라 썼으니 파라미터를 조종하는 거예요. 파라미터란 학습 대상이라고 했어. WB 그 스케네 파라미터하고 러리네이트만큼해서 옵티마이저 구성합니다.
316:09
Speaker A
자 이게 지금 돌아갔는데 시간이 걸리죠? 자 여러분들이 그 눈으로만 보면 안 돼요. 이제 쭉 보더라도 필요하면 쳐 보는 시간을 좀 가질게요.
316:19
Speaker A
어 이게 어쩔 수 없이 코드가 길고 그래서 넘어가긴 하지만 첫 번째 그거 과제 때문에 원래는 이거 이거 뭐 할 때 있어요? 어 저번 칠기는 요거 다 코를 쳤어요. 어 근데 일부러 제가 지금 일단은 드리고 다른 머신 러닝 딥러닝 모델링 그 코드를 쳐 보려고
316:39
Speaker A
해요. 자 그래서 과제는 요거 갖고 하고 여기까지 일단 어 3분 드릴게요. 그래서 쭉 이해하는 시간 가졌어요. 일단 아정 이렇게 모델 순서 기억하시면서 모델 갖고 와서 크러스 만들어서 여기까지 어디서부터 보냐면 데이터 처리 어떻게 했는지 한번 그냥 여기는 쭉 보시고음
317:14
Speaker A
그다음에요 모델 정의부터 잘 보세요. 그래서 우리가 모델을 정의했고 손실 함수, 최적 함수까지 한 거예요.
320:08
Speaker A
잠시만요. 네. 아, 요거는 옵티마이저 최적화하고는 좀 죠. 옵티마이저는 튜닝 웨이트하고 처음에 어 한번 다르요. 저거는 초기값을 선정하는 거예요. 아까 그랬잖니 초기값을 내가 그냥 원래 그냥 3x + 2 원래 실타랑 이렇게 하게 되면 당연히 상관없는데 앞에 그냥 해 본 거잖아요. 1 X일
320:36
Speaker A
때 그거고 옵티마이저라는 거는 어떤 것이 나왔는데 한번 돌 때마다이 백 프로포케이션 하잖아요. 한번 돌 때마다 내가 어만큼 갔어. 기울기를 이거예요. 자, 여기서부터 내가 여기에 있는 걸 가려면 이만큼 기울기를 수정해서 쏘고 여기서부터는 다시 초기화해서 0으로 놓고 다시 여기서 이렇게 쏴야 되잖아요.
321:00
Speaker A
단계별로 거꾸로 은익층 돌아가면서 그게 명이에요. 그러면이 정의가 됐나요? 왜냐면 이게 여러 개인데이 가운데 블랙박스라서 우리가 모르잖아요. 그러니까 끝에서부터 출력에서부터 거꾸로 웨이트를 계산한단 말이에요.
321:20
Speaker A
여기서부터 기울기랑 이런 걸 조절해 WB를 기 제어 여기 갔어요. 여기서부터 다시 초 0으로 초기한 다음에 다시 가야죠. 누적되면 안 되잖아요.
321:32
Speaker A
음. 그래서 일반적으로 nn이니 컨스턴트라는 함수는 일반적인 코드에서 안 나와요. 지금 여기는 이해를 하기 위해서 초기값을 다 1로 초기했습니다. 이제 이런 걸 보여 주는 거죠. 그렇죠? 어, 앞에 부분은 이론을 이해하기 위한 그거 개념이니까. 예.
322:04
Speaker A
자, 그러면 이제 진행을 해 볼게요. 중요한 경사관법부터. 자, 그 다시 한번 어 좀 정의를 조금 하고 어, 가면은 이미 어, 여러분 여기 이건 한번 쳐 쳐 드는게 나을지 모르겠다. 자, 여기 한번 쳐 드릴게요. 음.
322:28
Speaker A
우리 저번에 한번 대학교 설명은 들렸지만 스타캐스 그레이디언트하고 아담 W하고 잠깐 좀 정리를 해 드릴게요.
322:39
Speaker A
얘는 스타캐스틱 정면 확률적 금 방법들 여기도 확률적이 더 스타캐스트 확률적 이렇게 써. 얘는 말 그대로 적응이라는 뜻이잖아요. 어 아담 W라는 건 그냥 아담이라고 해요. 얘는 나 왜면 어댑티브 그죠? 이런 식이에요. 앞에가.
323:11
Speaker A
그리고 DFM은 모멘트고이 웨이트는 웨이트를 조절하겠다. 이렇게 합쳐진 거예요. 그러니까 뭐냐면 얘는 기본적으로 가장 기본인가요?
323:29
Speaker A
이렇게 보세요. 그리고 여러분이 기억해게 얘는네 번 한 번 할 때마다 전체 데이터 기울기를 사용해요. 그러다 보니 출렁이는 거예요. 자, 이만큼에서 이만큼 갔어요. 전체 보고 쏘고 여기까지 왔죠? 전체 보고 쏘고 그러니까이 그때 내려갈 때 어떻게 해요? 이렇게 내려가는 것처럼 보이죠. 출렁이었죠.
324:00
Speaker A
근데 얘는 처음에 적응용이에요. 그리고 모멘트라는 관성 표현하시죠? 그리고 웨이트를 조절해 줘요. 이해되시죠? 음. 그 참고하시고 뒤에 또 아담법 더블 나오니까.
324:35
Speaker A
자, 그래서 경상법을 해 보겠습니다. 여기에 뭐예요? 텐서로 바꿔 주는 거죠. 그런 다음에 어디예요? GPU에 넣어요. 인풋 넣고 얘는 정답진을 포트로 넣어서 넣어야죠.
324:48
Speaker A
얘는 학습형이 아니게 GPU 안 넣어요. 어, 그냥 넣어요. 차이 아시겠죠? 그냥 학습하지 않잖아요. 그게 있는 그대로 갑 정답이니까.
325:00
Speaker A
그래서 넣으면 506에 1 506 506이죠. 자, 라벨 찍어 보시면 이거거든요. 그냥 하나의 단 스칼라탑들이 몸 베타잖아요.
325:10
Speaker A
근데 텐로 돼 있죠. 자, 여기에 라벨스 뷰 -1 2 그죠? 그러면 여기에 차온이 바뀌겠죠? 506 1이라고 나오죠? 지금 디바이스 넣고 하면 506에서 506 1로 바뀌었어.
325:32
Speaker A
그래서 인풋을 넣어서 네트워크에서 아웃풋이 나오겠죠. 그게 바로 모델의 예측값이죠. 얘 한번 찍어 봤다가 지어 볼게요.
325:43
Speaker A
이렇게 나온다 그죠? 자. 자, 그래서 크리티언 아웃포츠와 라벨하고 비교해서 손실 계산하는 거죠. 라스 나고 그 라스의 아이템 다섯째짜을 표현하면 얘가 왜냐면 이렇게 나오거든요. 여러분 라스라고 찍으면 604.96인데 디바이스는 쿠다고 얘는 MAC 라스로 백퍼게이션 한 거다. 미분하고 있다.
326:14
Speaker A
이런 뜻이에요. 여러분 백워드다는게 뭐예요? 미분했다 이거예요. 0.8파이즈. 어 그래서 647.9460 60 이것만 갖꾸고 싶으면요 아이템으로 빼면 되죠.
326:29
Speaker A
그리고 얘는 맥크닷으로이 라스에 대해서 어떻게 됐는지를 보는데 내 파라미터 이름 파라미터 어떻게 이름 있고 얘를 디셔너리를 세팅했으니까 이름 땡땡 파라미터 뭐 이렇게 나오겠죠.
326:45
Speaker A
웨이트는 얼마 이런 식으로. 그래서 이렇게 된 거죠. 웨이트 아까 다 초기 요거 초기값으로 앞에 계수를 만들어 준 거니까 1 x + x2 그거죠. 어 그리고 얘는 바이어스 b도 1이었죠. 근데 얘네들을 각각 그레이디를 어큐ate 누적해서 다시 얘를 합쳐 애죠.
327:09
Speaker A
그런 다음에 미스 라스 백워드로 만들었다 이거예요. 자, 경사에서는 라스점 백워드에서 그리고 얘 웨이트의 그레이드 하면은 각각 그레디언트 변화의 변동량을 저장했다 보여주죠.
327:26
Speaker A
그랬더니 여기는 쿠다에 지금 흐르고 있고 -307.0167이고 0167에 -47이에요. 얘를 이제 하나씩 수정하겠습니다. 옵티마이저를 위해서 스텝하는 거야.
327:41
Speaker A
웨이트하우 바이어스를 보면 봐봐요. 수정됐죠? 여기서 2.83으로 -4.7에서 0.754 여러분이 파라미터에 의해서 얘가 지금 했더니 -1이 나왔죠.
327:57
Speaker A
조종된 걸 볼 수 있어요. 이해되시나요? 그리고 아까 질문에 대한 답변이 이거예요. 제로 그래도 0.
328:18
Speaker A
왜냐면 우리 공식을 한번 기억하시나요? 지금 그까 옵티마저 초기하랑 헷갈리면 안 된다는 거. 어디지? 지금 얘는 한마디로 지금 이거거든요.
328:37
Speaker A
여기 있잖아요. 그러면 얘는 기울기가 원래 2도 큰 거 봤잖아요. 미분하면 이러잖아요. 이게 y는 3x제곱이다. 그러면 미분하면 어떻게 돼요?요 요 선은 결국 6x잖아.
328:58
Speaker A
맞죠? 한 칸씩 내려가니까 여기에 내려와서 곱하고 여기는 하나 차수 하나 떨어지잖아요. 자, 그러면 여기에 갔어요. 근데 지금 여기를 향해 가야 되잖아요.
329:13
Speaker A
그렇죠? 우리가 이렇게 미분해서 0이 되는 곳이 전체 라스에서 라스로 하게 되면 최소값 아금이잖아요. 그래서 얘가 우리 공식 어떻게 됐어요? 여기에서 마이너스 반대 방향으로 알파 러닝 레이트죠.요 요 레이트만큼만큼 내려갈 건데 그죠? 여기가 어떻게 미분돼요?
329:49
Speaker A
편미분 있어. W 웨이트에 대해서 미분하는 거죠. 그래서 편미분해서 얘가 요쪽으로 왔어요. 요렇게 그러면 당연히 기울기 달라지죠? B도 달라져요 사실.
330:02
Speaker A
자, 근데 이제 웨이트만 보겠다는 거죠. 웨이트 변화만. 여기 바뀌어요. 그럼 바뀌었으면 여기에 이게 웨이트가 이게 누적되면 안 되잖아요.
330:14
Speaker A
여기에서 기울기가 변한 걸 앞에 걸 더해 가지고 좀 더해진단 말이에요. 여기서는 여기서부터 이제 새로 또 내려가기 시작할테니까 여기서부터는 초기하는 거죠. 0으로. 어, 이해되시죠?
330:28
Speaker A
다음 칸 가기 전에 여기서부터이 자, 여기서부터 다 이렇게 내려갈 거니까 여기서 초기하라는 거야. 예. 그렇죠. 우리가 그거예요. 그 달리게 할 때 어떻게해요? 내가 한 번 할 때 두족하는게 아니라 여기서부터 여기 달리고 다음 경기 할 때 어떻게 다시 타이머 영으로 놓고
330:49
Speaker A
다시 달리잖아. 그렇죠? 어. 그렇게 보시면 되는 거야. 어, 여기서부터 저기 조절해 가지고 기울기가 기울기가 누족되는게 안 되 안 되니까.
331:00
Speaker A
그래서 내가 이제 왜냐면 수정하려고 말 그죠? 위치가 바뀌었잖아요. 자, 내가 이렇게 막 예를 들어서 요렇게 해가지고 렇게 갔어. 자, 여기서부터 이제 이쪽 가야 돼. 그러면은 그 전까지 왔던 거를 하는게 아니라 자, 여기서 초기 딱 여기서 다시 초기 놓고 자, 이쪽 가서 이렇게 싸
331:22
Speaker A
이렇게 가야죠. 이해돼요? 우리가 뭘 왜 리셋한다고 그랬잖아. 자, 여기서부터 여기까지 왔어. 그래. 자, 여기서부터 시작할게.
331:30
Speaker A
자, 여기에 0점이면 이렇게 가서 이렇게 이해되시죠? 지금 그거야. 음. 그래서 얘가 여기 2.8로 수정됐고 여기서는 다시 초과 제로 그레드 했기 때문에 요가 안 되게 0으로 초기되는지 확인했다. 그거죠? 웨이트 그레이드. 얘는 각각 변화했던 거를 저장 하게 하는 곳이잖아요.
331:56
Speaker A
점그래드. 네. 이해되셨죠? 예. 그래서 이제 그런 다음부터 반복하는 거죠. 러닝레이트가 0.01이죠. 인풋 아웃풋에서 디바이스 넣고 미스퀘어 에러라스에서 크리테리얼 만들죠. 얘가 기준인 거죠.
332:24
Speaker A
그래서 아까 스타캐스 그리트를 했는데 이제 아담 W 바꿔 본 거야. 그래서 얘 지금 넘버오브 F 5초이면 이거 하루 종일 걸려서 일단은 50번만 할게요.
332:41
Speaker A
그다음에 여기에 히스토리 만들고 자 요거 기억하세요. 일단 돌려 놓을게요. 시간 거리니까 여기서는 히스토리 해야지.
332:54
Speaker A
어, 한 번으로 끝났네. 돌려야죠. 5,000원으로 그냥 할게요. 금방 되네. 데이터가 없어 가지고 없구나. 그죠?
333:09
Speaker A
아, 마지막에 천. 왜 그러냐면 이게 금방 되는 이유가이 데이터가 너무 호접하니까 5천000번 해도 금방 끝나는 거예요. 거기다 저는 L4잖아요. 그죠? 어,이 이렇게 달라요. 이게 느끼죠. L4 가진 사람이여 그죠? 어 이게 달라요. 어 시간이 그냥 어 아담 W 이게 뭐냐면 웨이트 디티케를
333:37
Speaker A
갖고 있다 이거죠. 어 그래서 내 패라 필요 없어. 여러분 들어오면 지운지는 거야 되겠지. 언제까지 제가 그래서 여러분한테 강조하어 그 공부만하고 스펙만 살까요?
333:55
Speaker A
그렇죠? 어 이게 여러분들이 어딜 가도 어딜 가서 연봉 360짜리예요. 그렇죠? 어 그렇지 않아요? 평의점 알바해도 많이 받지 않아요? 평의점 알바 저녁에 하면 많이 받죠. 여러분 그 포기하고 지금 앉아 있었잖아요. 그때 이거 과정하고 또 다른 과정 또 짓는 분들이 있어요. 여기서 이제 못
334:19
Speaker A
하니까 서울시 과정. 어 빨리 해서 들어가야지. 아까 칠자님한테들은 건데 뭐 저번에도 일곱 명 올래 초에면 일곱 명 인턴 갔다고 들어왔는데 조선에 그렇죠.
334:42
Speaker A
여러분이 그래야지. 자 봐요. 아담 W디킹 여러분이 될 거예요. 이제 딴 사람들이 여러분 어, LR 해서 옵티마이죠. 그래서 5천번 하고 자 이거 중요해요. 이거 꼭 기억하시고 이거 좀 있다 그래서 쳐 보셔야 돼요. 여기는 반드시 뭐냐면 시간 충분히 들테니까 10분
335:13
Speaker A
들테니까요 앞에 경사업법부터 필요한 것만 여러분 다칠 필요도 없어요. 꼭 필요한 거 이거 근데 여기는 미리 말하지만 꼭 쳐야 돼요. 알았죠? 어 자 뭐냐?
335:27
Speaker A
전체 넘버오브만큼 5,000번이죠. 볼 때 첫 번째 총이야. 가장 먼저 수정이 이해되시죠? 반드 이거 반드시 안개해야 돼요.
335:39
Speaker A
옵티마 제로는이 항상 이거거든요. 세트거든. 초기하고 넣어서 모델 넣어서 예측하고 예측과 정답 비교해서 라스 구하고 백프로버 이게 오토미분이었죠.
335:57
Speaker A
라스 백워드 그렇죠. 백프로포션 미분해서 가는 거 0.8. 그리고 얘가 튜닝이 줬죠. 아까 아까 봤잖아요. 원리 튜닝하는 거.
336:09
Speaker A
그래서 천번마다 쌓는데 스스택이야. 쌓는 거죠. 쭉 위에서부터 쭉 행 기준으로 뭐예요? 원래 갖고 있던 히스토리에다가 내가 에폭별 라스가 나오죠. 누적해 가지고 얘는 싹했다 보겠다는 거죠.
336:27
Speaker A
그래서 라스가 어떻게 변하는지를 보여 줘 그랬더니 0부터 4천만 원이죠. 그때 360에서 55까지 여러 라스가 떨어지는 걸 볼 수 있어요.
336:40
Speaker A
그래서 히스토리만 치면 이렇게 나오죠. 그래서 여러분들이 알게이 코드가 많이 나온다고요. 얘 뭐예요? 0 -1 이해되죠? 제일 첫 번째이 히스토리의 첫 번째 값들 이해되시죠? 마지막 그때 1 똑같죠. 라스값. 그러니까 초기 손실값은 얘랑 요거잖아요.
337:05
Speaker A
얘는요 값이 출록되는 거예요. 자, 그런 다음에 요걸 그림 그리기 위해서 아까 얘는 뭐예요? 0 1 이해되시죠?
337:21
Speaker A
그래서 얘는 1부 2 이상부터 얘는 1 이상부터 보여 달라는 거죠. 반복 횟수가 증가될 때마다 손실이 누적되는 이렇게 나와요.
337:37
Speaker A
이게 좀 이거랑 달라질 거야. 비슷하죠? 그리고 여러분이 알다시피 배열에서 자 요거 이렇게 해야죠. 요거 민맥스 x에 민맥스 하면 이거 나오죠.
337:54
Speaker A
얘를 요거 1로 리셰프 하면 이렇게 나오죠. 자, 그런 다음에 그래서 이렇게 표현을 하는 거죠. 폐기 직선을 내가 긋고 싶어요. 그럴 때 평균 여기 보면 미맥스에서 형태 바꿔 주고요.
338:16
Speaker A
뭘로? 이어로. 그런 다음에 토치의 텐서 여기다 프로트러 해서 지표 태운 다음에 위드 토치도 그래. 더 이상 그레디언트 흐르면 안 되니까 여기다가 집어넣은 거죠.
338:31
Speaker A
그리고 얘를 CPU 넘파이로 바꿔야 이렇게 나오죠. 그래서 스케터 플락 그려 보겠다는 거예요. X하고 YT의 사이즈 10으로 블루로 반개수에 대한 가격이 어떻게 변하나? 근데 얘는 반드시 CPU 다 있어야 돼요. 플라 쓰려면 지금 GPU 흐고 있기 때문에 그 블랙으로 했더니 찍어져요.
339:01
Speaker A
자, 일단 요런 거 여기 코드만 이해해도 되는데 자, 여기까지. 제가 충분히 시간 드릴게요. 어, 여기까지.
339:11
Speaker A
어, 지금 6분이니까 20 25분까지 지금 쭉 쳐 보시고 지금 근데 다섯 가지 꼭 이어세요. 학습도 다섯 가지. 얘는 외우셔야 돼요. 외워야 될 걸. 시험에 저번에 나왔던 거 같은데. 하세 다섯 달네. 처음에 뭐예요? 옵티마이저 제로 그레드 인풋 모델에서 아웃풋 크리티에서
339:38
Speaker A
아웃풋과 라벨 해서 라스 구하고 그 라스를 백워드 그다음에 옵티마이즈 스텝이에요. 여러분이 많이 틀리는게 뭔지 알아요? 라스 스텝 하면 틀려요.
339:50
Speaker A
이게 안혀 보면 그럴 거야. 머릿속에 응 그런가요? 했는데 시험에 나오면 틀려. 안쳐 보면 그래요.
340:00
Speaker A
해 보세요. 딱 25분 되면 진행할 거. 회사에 질문 있으면 하시고요. 어나세요. CP. 왜냐면은 우리가 넘파이나 왜 넘파이랑 포환이 되게 만들어 놨냐면 GPU는 뭐예요? GPU의 최적화 하나만 하는 거거든요. 그래픽 카드랑.
340:53
Speaker A
이해되시죠? 어, 하나씩. 근데 CPU는 원래 전체 연산하는 거예요. 근데 우리가 쓰고 있는 파이썬과 넘파인는 메플라 라이브러리는 CPU의 연산을 도와주게 만들어 놨어요.
341:08
Speaker A
그전에 GPU가 없었으니까. 이해되시죠? 그니까 뭐랑 봤냐면 민재님 그 여러분 개소리인 차에 전기차 충전기 놓으면 안 되죠.
341:21
Speaker A
그거랑 같은 거야. 알겠어요? 어 그래서 빼야 되는 거야. 거기 맞춤 서비스. 그러니까 이게 좀 짜증나긴 하죠. 그러니까 예를 들어서 차여도 여러분 그 주주의소에서 만약 넣을 때 노란 줄로 넣어야지 가슴 넣으면 경유 넣으면 녹색 줄 넣으면 안 되잖아요.
341:40
Speaker A
그런 같은 거예요. 어 그러니까 떴다 떴다 뺐다 떳떳 해야 돼요. 그게 다른 데는 없어요.이 토치만 있어요.
341:47
Speaker A
그 처음에 이게 귀찮아요. 하긴 저도 그랬어요. 그 이게 제 강사님이 한번 제직자 과정에서 컴플레인을 크게 한번 받았었거든요. 아니 코드를 돌려보고 왔어야 될 거 아니야? 막 그러면서 아니 근데 강사님들 중에 진짜 어 아무런 준비 안하고 그런 사람이 있겠어요. 근데 왜 그러냐면 얘는
342:11
Speaker A
날고 봤더니 강사님이 VS 코드로 집에서 vs 코드 그냥 CPU로 그냥 돌려 보신 거야. 이해되시죠? 근데 이제 여기서 GPU로 하는데요 투 디바이스 설정을 해 놨으면 문제가 없는데 투 디바이스 설정하고 투 디바이스를 코드에 넣었으면 상관이 없는데 그냥 보통 일반적인 그 교재 코드브에서 제공하는
342:37
Speaker A
거 CPU로 그냥 돌릴 수 있게끔 다 그냥 돼 있거든요. 그냥 그걸 튜닝 안 하시는 거. 그러니까 GPU로 설정을 해 가지고 애들이 GPU로 돌려 주세요. 그랬더니 그 늘어 터지니까 너무 그렇죠. 그러니까 GPU 안 하했는데 그걸 깜빡하신 거죠. 그 계속 에러가 나는 거예요.
342:56
Speaker A
근데 그 애를 못 잡으셨어요. 그 컴플이 나온 거죠. 이제 처음 파이토스 강의할 때 그 컴플레인을 제가 받은 적이 있어요.
343:04
Speaker A
그 원래 다 내용을 아시는데 집에서는 그냥 vs 코드로 안 돌리죠. 그러니까 안 해서 설정을 안 했어 가지고 보통 집에 지표가 있어도 설정을 해 좀 해야 되거든요. 좀 짜증나거든.
343:21
Speaker A
여기 설정하신 분 있어요? 혹시 지금 여기 중에 저번 기수 보니까 본인 컴퓨터에 GPU가 빠방한게 있어서 어 오락을 조로하셔 가지고 그전에 4080 딱 구매하셔 가지고 GPU 딱 설정해 놓으신 분 있던데 그래서 VS 코드로 어 처음에 MB 설정을 해야 되거든요.
344:02
Speaker A
아, 원호님이 말씀하신 것처럼 5,1번으로 하게 되면 5천번대까지 가잖아요. 전까지 가니까 이거 말씀하시는 거잖아요. 예.
344:15
Speaker A
하시면 돼요. 그냥 임의로 넣었어요. 근데 실제로 5,1까지 넣는게 맞아요. 예. 5,000번 대까지. 왜? 1천000단위로 끝니까 5천번 대까지 나오는 거죠. 예.
344:35
Speaker A
예. 왜냐면 이거는 원래는 학습을 5,000번 다 한 거예요. 근데 내가 출력만 프린트 출력만 해 달라는 거지. 원래는 내부적으로는 다 가고 있는 거지. 그렇죠?
345:10
Speaker A
그렇죠. 실제로 5천번 수행한게 많죠. 예. 한번 0인데 0에서는 이제 한 번 갔다 오면 이제 1 이렇게 되니까 수행한 건 0부터 5천이면은 5,000번까지 간 거긴 맞지. 네.
345:28
Speaker A
이제 출력 때문에 말씀하신 거 원호님도 잘 하신 거예요. 어, 출력 때문에 일부러 5,1일 이렇게 많이 해요. 5천만까지 출력을 보고 싶어.
347:39
Speaker A
음. 됐어요. 뭐 일단은 계속 인공지능 쪽을 이용해서 뭔가를 하신다 그러면 아무튼 저는 뭐 여건이 되면 그래픽 카드는 사는게 좋다고 생각을 해요.
348:03
Speaker A
근데 요즘 너무 비싸서 좀 그렇긴 한데음 계속 쓸 거면 사는게 낫죠. 뭐든지 이제 실제로 여러분도 알다시피 지금 클라우드나 이런 것들이 지금 데이터 센터 지워지는 것 때문에 지금 슈퍼사이클 만나 가지고 더 지금 엄청나게 우리나라 두 개의 업체가 잘 나가는
348:31
Speaker A
거잖아요. 특별한 이유 없이 가격이 뛰니까. 그래 이제 여러분들이 계속 이쪽으로 공부하고 할 거면 인공지능은 없어서 안 되니까 취업 본인 그런 거 많이 하잖아요.
348:50
Speaker A
카카오 톡에서 지네들 선물 자기 자신에게 선물하. 여러분 첫 월굴 받고 제일 뿌듯한 건 부모님께 용돈 드리고 여러분 자신에게 선물을 하세요. 그래픽 카드로.
349:06
Speaker A
그렇죠? 어. 음. 근데 좀 저는 어 또 회사도 운영하고 그러고 있어서 그런지 몰라도 블랙플라이 데이 때 꼭 하나씩 사요.
349:30
Speaker A
일단 쓰든. 네. 예. 직구로. 어. 근데 지금 하나 잘했다고 생각하는게 이번엔 좀 무리해서 두 개 샀거든요. 오픈클로라고 해 가지고 어 때문에 그래서 맥민이 하나 샀는데 많이 올랐더라고요. 제가 직구를 살 때가 70만 원 M4거든요. 75만 원 정도 지금 120만 원 간다고.
350:04
Speaker A
음. 그러니까 예 좋아요. 개발용으로 좋고 AI도 좋아요. 그리고 개발자가 민주님이 어떤 걸로 가냐에 따라 선택지는 다양한 거 같아요. 그 회사가 어떤 거에다?
350:29
Speaker A
AI 업체들은 대부분 맵써요. 어, 근데 또 반드시 그런 거. 그러니까 일반적인 글로벌 그러니까 제가 아는 뭐 시스코 아시죠? 어, 거기대 윈도우 써요.
350:46
Speaker A
윈도우로 충분하니까 요즘에 WSL이 좋아져 가지고 옛날에는 애가 잘 깨졌거든요. 그러니까 뭐냐면 깔아도 최적화가 잘 안 된 거죠. 이렇게 하다가 했는데 깨져 가지고 천 깨진다는 뭐냐면 딱 충돌이 가지고 얘가 벅 자기 원래 시스템이 아니잖아요. 보조 시스템이니까 깨지면 다시 여러분 제일 짜증나
351:10
Speaker A
있잖아요. 지웠다가 전지 다 지웠다가 다시 까는 거 이제 그걸 반복해야 돼. 깨져 가지고. 음. 근데 이제 그래 나중에 하다 보면 아이 그냥 가상 머신 버추얼 머신 아죠.
351:25
Speaker A
VMO라고 했어요.가 그거 설치 그거 설치하는 순간 컴퓨터가 무거워요. 느려 터져. 환경 OS 환경이 두 개가 돼 버리니까. 자기 컴퓨터는 하난데 자원을 같이 쓰는 거거든요. 그러니까 어 윈도우하고 맥 리누스하고 같이 쓰는 거.
351:42
Speaker A
어 그렇게 돼. 현장에 가면 그래서 실제로는 컴퓨터 저도 이렇게 사는 이유 중에 하나가 외국거는 한글 패치가 안 돼 있잖아요.
351:56
Speaker A
그니까 그러니까 흔히 말하는 깡통으로 쓰게 좋아요. 그냥 리스만 써 가지고 서버 구동하던가 이해되시죠? 그런 용도로 좀 괜찮아요. 그런 용도로 써요. 공통 컴퓨터 용도나 예 아니면 리누스. 근데 요즘엔 저도 그니까 본인이 하는 일이 다른 거예요. 저도 이제 로스나 이런 것들은 그
352:17
Speaker A
까통이잖아요. 그러니까 그 성능 좋은 거 샀으니까. 그러니까 애 저는 애수 거 샀거든요. 게이밍 노트북이 가성명 좋아요.
352:26
Speaker A
무슨 말인지 알겠죠? 어 그리고 깡통을 사면은 여러분 로봇 개발자한테는 깡통이 더 낫죠. 처음부터가 로스 가면 리누스니까.
352:38
Speaker A
어 장단점이 있어요. 나노가 쓰면은 대신 뭐냐면 내가 파일을 귀찮잖아. 여기다가 했다가 여기다가 했다가 여기다 했다가 이제이 크기 좀 귀찮을 수 있고 그러니까 본인이 어떤 걸 할 거냐에다 다른 거 같아.
352:57
Speaker A
내가 인공지능이나 가상 가상화 있잖아요. 여러분이 이제 여기에 프로젝트 프로젝트를 해 봐야 한다니까. 내가 이걸 프로젝트한 결과물에 내가 한게 여러분의 주특기가 돼요.
353:13
Speaker A
특기가 아까 제가 그 인턴으로 간 친구들 얘기 실제 취업한 친구네 명이 인턴으로 갔다가 세 명이 정식 직원들과 한 명은 다른데 이직한 걸로 알는데 그 한 명 그 팀장이었던 애는 머신까지는 딥러닝은 기초하지 말고 응용 한마디로 응용 우리 과정에 응용은 자기 모르겠다 도저히 그리고
353:35
Speaker A
대신 혼자서 프론트 엔드 백건드를이 프로젝트 하면서 배워 가지고 갔잖아요 지금 프론트엔드 하고 있어요. 인공지능 회사에 프론트엔드 하고 있다.
353:48
Speaker A
어 그러니까 주특기가 자기가 프로젝트 때 뭐 있냐가 이제 자기 주특기가 돼요. 어 대부분. 네. 그니까 아무래도 협동 로봇스 많쓴다. 그러면 뭐 컴퓨터는 윈도우가 최고죠. 어 그냥 우리나라 환경에서 윈도우에 이제 게이밍 노트북이 최고예요.
354:13
Speaker A
추천하면 에이서나 아 에시스 그다음에 IBM 이런 추청합니다. 아 에스가 제일 저는 써요. 사실음 그 갓성비라서 자 그러면 진행하면 되겠죠 그다음에 중에기로 이제 해 볼게요.
354:40
Speaker A
자 이제 뭐냐면 여기에서 데이터는 다가져온다는 뜻이죠. 이게 그렇죠. 대신 LS 그렇죠. 이게 저소자 비율 얘를 애드라고 해 가지고 스스텍으로 합친 거예요. 이해되시죠?
354:53
Speaker A
옆에 붙인 거예요. 열이 있는데 하나 더 열하나 붙였죠? 자, 그래서 프린트에 CF 찍으면 요것만 있었는데 하나 더 붙은 거죠.
355:05
Speaker A
이렇게 2가 됐어요. 506은 데이터 개수고 부동산 가격, 아파트 가격. 요거는 두 개의 속성이죠. 하나는 뭐였어요?
355:17
Speaker A
여기 반개수. 요건 반개수고 요거는 4.9.14은 저소득속착 비율. 그래서 어 이렇게 해도 되고요. 음. 그렇죠. 그래서 셰프를 하면 두 개 되는 거죠. 셰프.
355:36
Speaker A
그리고 요것도 한번 이렇게 쳐 보시면 이렇게 나오거든요. 1.8 4.5. 그 비율이에요. 이거. 자, 그런 다음에 그래서 여기에 1이 임의하는 말 이해되죠? 셰프 0 1 정말 많이 써요. 그래서 얘는 입력 차원수를 2죠. 2로요 이미 알아요. 2라는 거. 그걸 두 개를
356:01
Speaker A
넣어서 인풋 두 개 넣고 아웃풋 나오겠다 이거죠. 그니까 지금 보시면 알겠지만이 교재는 그냥이 이론에 하나 하나 이론에 대해서 하나씩 보여주고 증명하고 이런 책을 돼 있어요. 그래서 이때 잘 해 놔둬야 돼요. 왜냐면 응용 코드 한번 보여 드렸잖아요. 못 한다니까. 다
356:25
Speaker A
함수에 들어가 있으 어 자 넷 네임드 패라미터에서 파라미터를 하면 파라미터가 두 개 있죠 1 데이터 그러면 웨이트와 바이러스 차원이 다르죠 1차원 맞죠 그리고 네트 하면 인풋한인 피처는 두 개고 아웃 아웃트 한번 프라스잖아요. 그러니까 뭐냐? 우리가 알고 싶은게 그거예요. 방 개수와
357:03
Speaker A
저숫자 비율이 과연 가격에 아파트 가격에 영향을 끼칠까? 여러분 관심 있지 않아요? 맞잖아요. 아파트 주민들 보면 여러분 한강 이쪽에 가다 보면 아니면 어디 가다 보면 막 플랫카드 이만큼 거치잖아.
357:20
Speaker A
거칠죠. 저번에 제가 의게 본게 아파트에 무슨 뭐 쓰레기 소각장이 웬말인가 저 상암동 쪽 가니까 막 그렇죠. 막 그렇게 붙어 있잖아.
357:31
Speaker A
투쟁 막 어 아파트 주민들도 투쟁해요 지금. 그렇죠. 음. 그게 써 있다고요. 이렇게 플래카드 왜 집값이랑 연결돼 있으니까 이거이 요게 그러니까 얼마나 관심 있는 거예요. 그죠? 어 어떤게 영향을 끼치냐 이거야.
357:53
Speaker A
여러분은 그 우리나라가 좀 특히 교육열 때문에 대치동 같은 경우나 학군 있잖아요. 학교 개수 집값에 엄청나게 영향 미치잖아.
358:08
Speaker A
그렇죠? 그런 거랑 똑같단 거야. 그 실제로 그런 것들 요인들 있잖아요. 이런 거 비가격적 요인 그런 것들 갖고 모델링을 해요.
358:20
Speaker A
통계를 이용해서 누가 여러분 혹시 아세요? 감정 평가사라고 감정하시는 분 있죠? 부동산 감정. 그분들 하는 거 제가 박사 너무 설 때 그 감정 평가사들이랑 부동산 논문 쓰신 분들 있잖아.
358:35
Speaker A
통계로. 그거 봐요. 그러면 거기에 영향가 뭔줄 아세요, 여러분? 그것도 느끼죠? 남양이냐? 햇빛이 어디서 빛이냐?
358:49
Speaker A
그렇죠? 그것도 가격이 엄청 영향을 미쳐요. 지하철 개수 가격이 미쳐요. 우리 그래서 선전한 역세권 이러잖아요.
359:00
Speaker A
어, 그리고 여러분 그 건물 로얄층 상가는 더 크게 미쳐요. 아파트하고 틀리게. 이제 좀 올해 제가 저도 뭐 박사 경향 박사 하는지가 꽤 됐으니까.
359:15
Speaker A
그때 아직도 부동산 논문 중에 뭐가 있었냐면 그 우리나라 전체이 사람은 좀 그래도 그 품파리를 했어요. 왜냐면 보니까 자기 개인으로 한게 회사 프로젝트를 부동산 회사는 다 아닌 거 같아. 그래서 왜냐면 리테일이니까 어 그 리테일 전문하는 그런데 다녔던 거. 그래서 보면
359:42
Speaker A
여러분 상가지역 있잖아요. 어디가 제일 비쌀까요? 1층이 비쌀까요? 2층이 비쌀까요? 3층이 비쌀까요? 지하가 비쌀까요? 그렇죠. 여러분 다 1층이 비싸.
359:55
Speaker A
그러면 이제 제일 궁금한게 2층의 -1층이에요. 어디가 비싸요? 그게 되게 애매해요. 업종마다 다른데 2층이고요. 그다음에 -1층이 3층이 더 싸요. -1층.
360:15
Speaker A
우리 아파트면 최악이죠. 반지가 어떻게 더 비싸요? 이럴 수 있잖아요. 근데 어 왜냐면 계단 있는 거랑 그리고 또 하나 계단 있는 거랑 엘리베이터에 있는 거랑 아파트 가격 틀려요.
360:34
Speaker A
엄청나게 사요. 그러니까 그런 것들을 해요. 아까 제가 더미 변수 말씀했죠. 찰스 한강 있냐 없냐 1되시죠?
360:45
Speaker A
이렇게 코딩 되잖아요. L베타 2 없냐? 1 엄청나게 해요. 그래서 그런 것들을 통계를 통해서 이렇게 만들어 가지고 회기분석을 여러분들이 알 수가 있어.
361:04
Speaker A
그래서 얘 지금 두 개의 속성값이고 1이잖아. 데이터가 아니잖아. 여러분 봐도 중요한 속성이잖아요. 우리가 알고 싶은 건 그 줄 중에 또 뭘 알고 싶어요? 그래.
361:15
Speaker A
왜 W가 중요하냐? 그걸 회계수라고 하거든요. 왜 중요하냐? 아니 그러면 지금 방 두 방 두 개냐 세 개냐 아니면 주변에 한마디로 이제 솔직히 아파트에 내가 자가냐 자가가 하냐 임대 아파트냐 이거예요.
361:33
Speaker A
어떻게 보면 지금 얘기를 하면 저속자 비이니까 그러면은 갈등 많거든요. 실제로 임대 아파트끼리 있으면 갈등이 없는데 원래 여기 자가들이 있고 여기에 일부 단지가 임대 아파트 있잖아요.
361:49
Speaker A
그러면은 여기를 진짜 갈등 많아요. 여기 무시하고 막 이런 거. 왜냐면 아파트 가격이 떨어지거든요. 임대부터 같이 했으면. 이제 그런 부분이에요.
362:04
Speaker A
그래서 참 그렇죠. 사람을. 어, 근데 가격은 거 통계는 거짓말 안 하니까 어쩔 수 없잖아요. 현성이니까.
362:16
Speaker A
그런 부분을 이제 통계로 증명이 된다고요. 그리고 이제 그러면 여러분이 가보고 싶은게 그래 두 개가 다 영향을 끼죠. 근데 또 얼마 누가 더 중요한지 그거 궁금하잖아요.
362:29
Speaker A
얼마나 영향을 낄 수 있는지 궁금하잖아요. 그게 웨이트예요. 두 개가 그래. 너 말대로 하나 방 개수 영향이 미쳐. 또 하나 그래 주변에 임대 아파트가 많은게 가격을 떨어뜨릴 수도 있겠네. 근데 근데 그 영향력 연기 어느게 더 중요해.
362:47
Speaker A
궁금하잖아요. 지금요요 지금이 우리가 지금 다루는 코드는 지금 그 얘기를 하는 거예요. 자, 그래서 요걸 치시면 요게 나오고 파라미터는 세 개로 늘어났죠. 왜?
363:02
Speaker A
변수가 두 개고 바이어스 하나 있잖아. 이거 지금 보여 주는 거죠? 그리고 나중에 여러분이이 코드를 그래도 한번 쳐봐야 되는 이유 중에 하나가 뭔지 아세요?
363:13
Speaker A
이거예요. 파라미터. 내가 트레이너블 파라미터 얼만지 이거. 그리고 여기 보시면 요거 나와요. 이게 MB죠. 이게 나중에는 이게 중요해요. 요랑 같이 내가 이걸 돌렸을 때 감당이 됐을까를 확인할 수 있어요. 나중에 안 찍어 보고 그냥 돌리다가 비명지르지 말고 학습이 중단돼. 그죠? 어.
363:41
Speaker A
뭐냐면 아까 그런 거 내가 테슬라 샀어. 아. 그리고 충전 한 번만 하고 중간에 충전해야 되는데 그냥 갔다가 부산까지 가려다가 대구에서 차 퍼진 거랑 똑같은 상황이에요.
363:55
Speaker A
무슨 말인지 아시겠죠? 신나게 달리다 요걸 보고 아 대충이 웨이트가이 정도면요 정도를 막가 없네. 얘를 훈련시킬 때 과연 콜랩이나 뭐가 감당이 됐을까?
364:11
Speaker A
콜랩은 예제 돌리는 걸로 최적하지만 얘도 용량이 충분하지 않아요. 학습할 때는. 그래서 여러분들 그 해결책을 근데 저희 로키에서 해 놨더라고. 왜냐?
364:27
Speaker A
그래도 이번 정부가 우리 입장에서선 땡큐예요. 뭐냐면 이번에 엄청나게 그 엔비디아에서 GPU 샀잖아요. 그죠? 그래 가지고 쓰라고 원격으로 요즘에는 옛날엔가 가지고 데이터 들고가 가지고 USB 검사 받고 돌렸거든요. 저 같은 경우도 저기 맞고에 있을 때 거기 있어요. 서울 무슨 빅데이터
364:53
Speaker A
무슨 그 공기업 하나 있거든요. 거기에서 제공하는 신청을 일주일 전 최소 일주일 전에 하면은 오케이 있으면 나무면 가서 돌리고 이제 근데 돌리러 갔는데 또 그 당시는 제가 리누스를 할 줄 몰라 가지고 아니 갔는데 코세웠거 머셔 5천만 원짜리네 그때 USB배고
365:17
Speaker A
돌리려는데 리누스야 그래서 리누스 배우러 와야 돼 가지고 못 돌렸던 기 있어요 근데 지금은 클라우드로 도 연결해 가지고 해요. 근데 그거를 신청을 받아 받는데요. 나중에 팀장님이 물어보니까 그 7개, 8기 이렇게 돌렸대. 그렇죠? 신청만 하면 된대요. 어 그러면은 여러분들이 어
365:42
Speaker A
특정 시간에 돌리면 돼요. 알았죠? 원격으로 집에서 편하게 좋죠? 어 그러니까 그 꼭 신청하세요. 예. 근데 내가 데이터도 몇 개 안 되는데 그거 신청해 가지고 보통 안 하는 사람도 있어요.
365:58
Speaker A
데이터가. 그러니까 데이터가 풍부하고 빨리 어떤 주제를 정할 때 데이터가 충분한지를 우리가 지금 하려는 거랑 연관돼서 우리 그게 충분한지를 해야 돼요.
366:12
Speaker A
다시 말하지만 개인이 하고 싶어 하는 주제는 취업해 가지고 하시는 거. 알았죠? 기간 내 끝내서 데이터를 충분히 써서 기간 내에 내 결과가 잘 나올 수 있는 주제를 택하시라고요.
366:29
Speaker A
그게 제일 중요해요. 알았죠? 어, 그걸 팀분들하고 나중에. 자 그래서 토치의 텐서 X2를 텐서로 변화시켜서 디바이스는 거죠. 그래서이 바른 거예요. 자, 반복 계선네요. 요거 디바이스 설정한 거고 0.01이죠.
366:51
Speaker A
네. 하고 얘를 반드시 디바이스에 가야 돼요. 이거 7기 때는 CPU로 돌렸다가 8기분들이 어 GPU를 돌리고 싶어 해 가지고 본 거예요. 보린 거예요.
367:07
Speaker A
투 디바이스 설정해서 투 디바이스 넣은 거라고요. 알겠죠? 그러니까 여러분들 또 어디에 투 디바이스를 넣어야 되는지 잘 보셔야 돼요. 어 그런 다음에 NN 미스 에러에 디바이스 넣어야죠. 시험스 개스가 되니까 그리고 옵티 스타켓 그레디스넷 패라미터스 뭐예요? WB죠. 러닝터에서 옵티마이즈하고 5천 뭐 원하면 5천
367:33
Speaker A
1번 그래서 평가 손실 그래 가지고 지금 또 반복하는 거죠. 이걸 이제 아까랑 같은게 코드 지금 복세에서 붙인 거예요.
367:46
Speaker A
그렇죠? 똑같죠? 자, 이거 뭔 일이 나왔어요? 뭔 일이 나왔어요? 결과 안 나오네요. 발산 그지?
368:09
Speaker A
라스 여기 발산이라 하신 분들은 예, 1점씩 드릴게요. 자, 뭐예요? 나더 넘버라는 뜻이거든요. 답 없대요.
368:21
Speaker A
답 없대요. 망한 거잖아요. 지금 여러분지 돌렸잖아요. 그 돈 시간 돈 걸려 가지고 돌렸는데 갑 안 나오잖아요.
368:35
Speaker A
너무 학습률이 커져 그래. 그래서 얘가 우리가 여기에 가야 되는데 점핑 점핑해 가지고 지나친 거야 지금.
368:49
Speaker A
그렇죠? 그래서 얘는 요것만 0.00로 바꿔 주고 나머지 코도 똑같아요. 돌리시고 돌리시면 돼요. 거 내가 똑같이 썼는데 얘가 이제 지우면 되죠.
369:11
Speaker A
나오죠. 그래서 구하고 어렵지 않죠? 또 정리하는 시간 5분 드릴게요. 그리고 나서 50분에 새로운 거 같이 어 라이브 코딩 해 보도록 하겠습니다.
369:34
Speaker A
정리하세요. 존재한 경우를 보긴 했어요. 거의 0에 가깝게. 그거는 데이터에 하나 틀려요.데 거의 힘들어요. 그건 우리의 이상이죠.
370:27
Speaker A
그렇죠? 어 근데 거의 0의 각각이 가는 걸 보긴 했다. 0.00 근데 0은 안 나와요.
370:41
Speaker A
그리고 학습할 때 0으로 딱 나온다는게 이게 문제가 있을 수도 있어. 투 디바이스를 설정 디바이스가 뭐죠?지 쓰겠다는 거잖아요.
371:04
Speaker A
그렇죠? 학습할 때만 쓰죠. 투 디바이스. 왜냐면은 내가 이걸 CPU로 돌리면 오래 걸리니까 GPU에 쓰고 싶다는 거죠.
371:14
Speaker A
이해되시죠? 어, 그래서 GPU에 태워야죠. 예. 근데 여러분이 지금 제가 시간 드리는게 그냥 웅하는게 아니라 하다 못해 지금 디바이스 나온 데를 GPU를 쓰려면 어디에 써야지? 저거 잘못 쓰시면 계속 러나거든요.
371:35
Speaker A
그러니까 집 어디에 지금 디바이스를 썼는지를 잘 보세요. 어디에 썼죠? 자. 자, 여기 봐요. 설정하고 모델했었죠.
371:53
Speaker A
그죠? 인풋 데이터 크리티리얼. 그렇죠? 그다음에 네. 손시함수 만들었었죠. 아니지만 학습할 때였쓰죠. 그리고 왜 훨씬 빠른 줄 아세요?
372:36
Speaker A
생각해 보세요. 우리가 토치의 텐서로 만들어 준 이유가 뭐예요? GPU에 태우려고. GPU에 최소하다입니다. 음. 우리가 지금 넘파이하고 왜 틀린 줄 아세요?
372:59
Speaker A
왜 아까에 왜 CPO가 다 틀리냐? 왜 에러가 나냐? 분명히 코드는요. 당신이 CPU, GPU라고 안 나와요. 사이즈가 안 만든다고 나와요. 셰이프가 안 맞는다고. 왜?
373:11
Speaker A
넘파이나 유메 얘 파이썬이잖아요. 유메리카 파이썬 이름 자체가 얘는 HC예요. 구조가 틀리죠. HC라고요. 근데 토치는 텐서는 구조가 틀리다고요?
373:32
Speaker A
병렬 연산이고 얘 직렬 연산이에요. 방식이 틀려요. 얘는 왜 이걸로 했냐고요? RGB 나중에 컬러일 때 얘 하나씩 따로따로 태우려고 하는 거 GPU에.
373:51
Speaker A
그러니까 여러분들이 투 디바이스를 그죠? 처음부터 아까 우리가 옵션이잖아요. 내가 CPU 지금 여기 CPU면 얘가이 L스가 돼 있기 때문에 자동 조절을 해 주네요. 얘가 알아서 당신이 요투 디바이스를 해 놓으면 뭐가 좋았다 그랬어요? 이거 배웠잖아요. 적어도 너 당신이 CPU를 쓰든 GPU를 쓰든 에러 안
374:17
Speaker A
나요.지가 알아서 어 보고 자동으로 자동 변속기예요. 한마디로 차로 하면 오토가 어떻게요? 저걸 설정해 놓으면 CPU 환경에서 CPU를 그냥 보내고 아이 사람 GPU 안 쓰나 보구만. 아니면 요걸 바꿔.
374:37
Speaker A
그 GPU를 태할 때 안에 내부 구조가 다르게 돌 로직이 돌이하죠. 어떻해? 어, CH 맞으니까 어,이 사람 이렇게 해 놨네. 이렇게 GP 여기다 이쪽으로 보내 가지고 병력 처리 시작하는 거야.
374:57
Speaker A
그래서 지금 CHW 나중에 바꿔 주고 우리가 첫날 했기 때문에 여러분들이 가물가물 할 거예요. 배우지도 않았는데 맛보기로 저렇게 빡센 걸 그거 조만간 나와요. 다시 그때 아 그럴 거예요. 그러면 HWC 씌었는데 포인트 통해서 CHW를 바꿔 줘서 태우고 결과 나왔잖아요. 다시
375:21
Speaker A
원복하고 그다음에 넘파일 이용해서 변환시킨 다음에 연산하고 어 모델 성능 평평가하고 보고서 쓰고 그런 식이야.
375:37
Speaker A
그까이 저차가 왔다 갔다 하거든요. 그래서 요거를 닫을 힘들어요. 처음에는. 근데 여러분도 그렇지 봐. 어떤 이게 루팅이 되면 아이 봐요. 지금 제가 여기서 처보라고 한 이유가 그거거든.
375:55
Speaker A
여기서부터 여기까지 다 복부해 한 번 해 놨더니 내용을 다 알고 복부해서 지금 쓰고 있잖아요.
376:03
Speaker A
그러니까 뒤에는 다 내용이 아 다 절차가 똑같으니까. 그러니까 나중에는 처음엔 힘든데 장벽했는데 그다음부터는 쉬워요. 근데 그다음부터는 여러분이 기득권이네요. 이게 회사에랑 똑같다니까요. 여러분이 치생일 때는 지금 다들 배 100%죠. 3전 하이닉스 야 손가금한 6. 근데 이런 말 하면 그런데 여러분이 거기에
376:29
Speaker A
멤버가 되잖아요. 그러니까 그렇게 고생했으니까 내가 그런 거죠. 너네들 갔니? 마인드가 바뀐다고요. 기득권 생각이 돼 버리면 사람이 그렇다고요.
376:44
Speaker A
근데 왜 그러냐? 진장명이세요. 누구나 들어올 수 있으면 똑같아요. 그러면 여러분 대체될 수 있어요. 근데 여러분이 이렇게 어려워도 요걸 토치를 해 가지고 나중에 로봇까지 한다. 남이 배우기 힘든 과정을 로봇 과정 보세요. 몇 개 없어요. 그리고 제대로 된데 몇 개 없어요. 제가
377:07
Speaker A
컬이 다 봤기 때문에. 왜냐면 저도 공부하는 사람이잖아요. 로봇 쪽을. 어. 그래서 그렇게 생각을 하세요.
377:23
Speaker A
그러니까 여러분이 확실히 그러니까 이거예요. 알아보기 위해서 온 사람도 있을 거야. 근데 그거는 사실 저는 7개에서 끝났다고 생각을 해요.
377:34
Speaker A
왜냐? 여러분들은 돈까지 내면서 왔다 어 그러면은 아 이거 아이가 이거 해야 되지 않을까? 뭐 되든 안 되든 이런 생각으로 왔을 거라고 생각해요.
377:46
Speaker A
최소한 제가 그렇게 느끼는 건 팔기분이 한 명도 중이 없다는 거 취업한 사람 두 명 빼고 103명인가 3명 어 근데 그 마인드를 갖고 있다면 뭔간 된다 이거예요.
378:12
Speaker A
례를 알려 드리면 제 서울 강동했을 때 한 여성 분이 있었거든요. 근데 이제 취업 다게 원하는 대로 데이터 회사 다녀 있는 걸로 알고 있는데 그 친구는 경력을 있었어요. 근데 저 내가 또 어떻게 다시 왔냐고 물어봤는데 3년 전에 이런 과정 그니까 한마디로
378:32
Speaker A
그때는 인공지능 과정이죠. 어떤 데이터 분석 과정을 어제서 했어요. 근데 그때 어려워서 포기하고 어 다른 회사 생활 했는데 자기 주변 친구들도 그렇고 또 계속 인공지 뭐 해야 된다 이러니까 또 회사 그만두고 온 거야.
378:51
Speaker A
회사에서는 버나웃 오고 그러니까 그렇게 다시 오는 경우도 있었어. 어 그때 이제 철 들어가지고 힘들어 하긴 해. 그렇게 잘하진 못했는데 솔직히 그래도 끝까지 버텨 가지고 결과내고 취업했잖아요.
379:11
Speaker A
어 그러니까 그런 시행 착오를 겪지 마시고 끝까지 버티시기만 제가 해 줄 수 있는만은 저야 뭐 여러분들 지나가는 사람 중에 하나잖아요. 좀 부담은 좀 덜 하긴 하죠. 예전엔처럼 한 번에 다 맞는 것보다는. 근데 그래도이 말은 꼭 하고 싶었어요. 어 여러분들이
379:32
Speaker A
기왕이 이렇게 왔으니까. 자 그러면요 7차시의 두 번째는어요 코드를 드리는 걸로 하고 저번에 못 했던 거가 하나 있었죠.
379:49
Speaker A
그 투비 컨티뉴한 거. 그거는 이제 코드를 드이면서 똑같이 빨리 끝내는 걸로 할게요. 어 3시에 쉬는 시간이죠? 그러면 잠깐만요. 요거 악소장 만들어 드리고 제목이랑 기초 세팅만 하고 쉬었다 할게요.
380:21
Speaker A
이거요. 그래서 여기 앞에가 좀 이론이 많아서 그렇긴 한데 막목하고 자 코드를 요거 앞에 내용을 좀 설명하고 넘어갈게요. 도 요걸 그냥 바로 틀리는게 낫겠죠.
380:58
Speaker A
이렇게 만들었네. 자, 우리도 했던 거니까 이렇게 했고 여기다가 다시 한번 정리하는 건가요? 라이브 코딩 하려고 그러니까 코드 두 번째 거에 줬어 이렇게 치세요. 음.
381:29
Speaker A
자 보시면 이거죠. 인공지능 뭐냐? 인공지능은 다시 말하면 인간의 지능을 모방하는 컴퓨터 시스템이에요. 자, 그리고 또 멋있는게 요게 이제 한번 해 보는게 나을 것 같아서 지금 시간상 잡으세요. 그래서 보시면 우리가 이거 다 배우니까 자 머신닝이란 인공진의 하위 분야인데 우리 배운 것처럼 지도학습 답이
382:04
Speaker A
있어요. 키 몸무게 데이터 특징 출력은 성별 의사 결정 서포트 벡터 머신 합성 이제 이게 다음 주에 계속 배우는 거예요.
382:19
Speaker A
그 학습 단계는 모델이 입력 데이터를 학습해서 예측하는데 정답에 가깝게 그래서 실제 학습 모듈을 이용해서 새로운 데이터 할 때도 그 결과가 비슷하냐 이걸 보는 거고 얜 답이 없어요.
382:37
Speaker A
패턴을 인식한다든가 집을 한다든가 차원을 축소하는 러스트링이나 차원 축소 자 강화수 우리 마지막날 배우는데 에이전트가 환경과 상호 작용해서 보상을 하면 좋워요.
382:55
Speaker A
장기적인 최대 보상 우리의 목표는 리워드를 받는 거죠. 자, 그런 다음에 여기까지만 이제 한번 쳐 보시면 될 거요.
383:13
Speaker A
차이가 뭐냐? 이제 사이킨 코드가 있고 파이토치 코드가 있잖아요. 얘는 그냥 페라스랑 똑같아요. 그냥 직관적 예.
383:29
Speaker A
근데 지도학습에만 쓸 수 있어요. 그러니까 정용돼 있다. 그것도 파이토치는 GPU 환경에 최적화되 있다. 자, 그리고 코드를 1부 드릴게요.
383:50
Speaker A
자, 사이킨원 모델 셀렉션에서 트레인 테스트 하는 거죠. 자, 그런 다음에 우리가 뭐냐면 데이터 아이스라는 데이터 셋 우리가 할 거고 거기에 제가 설명이 드렸죠.
384:04
Speaker A
로지스 리그레션 그때 범주용 데이터. 그렇죠? 근데 요거는 회기 분석이에요. 그다음에 우리가 평가 지표로 애어를 쓰였다는 거죠.
384:22
Speaker A
자, 여기서부터 칠까요? 데이터로 데이터를 가져오게 할게요. 지금은 저도 T4로 혹시 모르니까 T4로 설정할게요. 이렇게 하시면 돼요. 그래서 얘를 데이터 가져오는 거예요. 만들어져 있으니까 그냥 가져오면 아스 안 돌렸구나.
385:03
Speaker A
아 제가 T4로 바꾼다면 안 돌렸구나. 나오죠. 이렇게네 개. 정확하게 보면 이렇게 데이터가 나오고이 지금 잘 안 보여요. 그래서 이거를 어떻게 되냐면 사실 이게 나눠져 있어요. 데이터의 데이터가 있고요.
385:27
Speaker A
그렇죠? 그런 다음에 얘를 그래서 우리가 뭐냐면 x 라지 x 거예요. 독립수네 개라는 거죠. 지금 저기 안 보이는데 이거는 어떻게 보면 데이터에 타겟하시면 나와요. 데이터가 엄청 많았거든요. 그 뭐냐면 데이터의 품종이에요. 0 1 2 코드로 돼 있는 거야.
385:51
Speaker A
L라고 넣게요. 그러면은 얘는 동의수죠. 인류 데이터고요. 외계의 특성지. 얘는 홍종이죠. 종이 변수고요. 얘는 종속 변수고요.
386:21
Speaker A
데이터죠. 총 세 개의 품종입니다. 012. 그래서 총 150개에서 템플 중에서네 개의 특성 꽃받침의 길이 꽃받침의 폭 꽃잎의 길이 꽃잎 폭의 클래스로 그래서 여기서는 클래스라고 합니다.
386:46
Speaker A
자 그래서 특성 입력 데이터를 갖고 있고 클래스 레이블이에요. 여기다 프린트 찍고 마지 X 한 칸 끼고 루트 Y 하면 되는데 이게 좀 150개나 되니까 좀 양이 많죠.
387:12
Speaker A
음.이 쭉 내리시면 마지막이 여기 있죠? 쉬었다 보세요. 자, 파이팅 한번 하고 합시다. 자, 파이팅 하시고. 예.
398:18
Speaker A
어차피 이건 오늘 끝내야 되니까. 자, 이제 데이터 분할을 할 거예요. 데이터 분할 코드는 드릴게요. 어, 아시는 거죠니까. 시간 관계상 요거.
398:33
Speaker A
자 뭐예요? 자, 여기 보시면 트레인 테스트 플릿해서 XY 뭐 했죠? 테스트 20% 80%는 트레인 데이터로네 개로 구분하는 거 기억하시죠?
398:50
Speaker A
자, 그다음에 우리가 쓰게 뭐냐면 로지스틱 리그레이션을 쓸까? 요거는 이렇게 써요. 뭐냐면 원인과 결과를 보는 인과계를 보는 리그레이션의 일종인데 끝이 우린 지금까지 연속형을 봤죠. 얘는 검조형이에요.
399:20
Speaker A
합격이냐 아니냐 그 차이예요. 근데 그 안에 그걸 몇 번 반복해. 맥스 아이토는 200번 200번 반복해요.
399:32
Speaker A
그렇죠? 코드의 기본적인 건 똑같죠. 이걸 모델이라고 할 거예요. 그니까 반복 횟수가 200번이다 이거요. 돌릴게요.
399:48
Speaker A
얜 더 쉬워요. 보시면 모델 그다음 어떻게요? 프레딕트 예측은 뭘로 해 갖고 해요? X 테스트 데이터로 해요.
400:01
Speaker A
그래서 얘를 프레딕션스라고 할게요. 그래서프레딕트는 영어로도 미리 예언하다 이런 뜻이잖아요. 미리 얘기하니까. 프레딕션 하면 패션 모델 프레스터 응 왜 뭘 안 냈을까? 피팅을 안 했죠.
400:26
Speaker A
훈련을 안 했으니까. 그래서 훈련을 해야 돼요. 훈련할 때는 어떻게 하냐면 간단해요. 하시면 돼요. 근데은 스트레인 데이터야.
400:56
Speaker A
그지? 끝. 프레딕션이 뭔지 궁금하잖아요. 얘가 복사해서 사이너는 되게 간단해요. 끝난 거 이렇게 예측한 거.
401:11
Speaker A
그 실제 데이스 타고 미리 쳐 보면 여러분 머신이 안 배웠기 때문에 지금 여기 가르쳐 놓는 거예요.
401:18
Speaker A
이거거든요. X 테스트는 이거고 여기에 프레딕션 넣어서 10이 됐죠? 그러면 실제 정답은 Y죠. Y 테스트가 정답이에요. 이게 정답이거든요.
401:34
Speaker A
얘가 정답 라벨. 그렇죠? 그리고 얘는 계측칼로죠. 그러면 지금 거의 얼추 맞았네요. 딱 봐도. 그렇죠.
401:53
Speaker A
그러면 이제 정확도를 평가해야죠. 스포티스트와 프레딕션 요거하고 비교하면 돼서 걸 액큐러스라고 할 거고요. 보통 이렇게 하셔야 되죠.
402:37
Speaker A
근데 지금 이거 뭐냐면 F 스트링을 해 써야 되는데 뭐냐면 F하고 이렇게 하시면 그리고는 이렇게 나와야죠.
403:00
Speaker A
100% 모델 정도 100%네요. 왠지 간단하니까 잘 나왔네요. 프레딕트에 테스트 데이터 넣어요. 예를 들어서 훈련은 트레인이고요.
403:33
Speaker A
프레도 트레인 요거 테스트 데이터 X 보세요. 얘는 쿨러는 트레인 데이터는 쿨러용은 다 트레인 데이터로 해요.
403:47
Speaker A
예측 모델일 때는 테스트 데이터로 해서 와이트스트 즉 새로운 데이터 했을 때 제내 잘 만든 모델을 맞아야겠죠.
403:56
Speaker A
근데 요건 최종인 거고 사실은 더 머신닝을 이제 심화되게 보면 Y의 여기 X의 테스트 데이터 트레인 데이터로 예측하진 않아요. 그니까 하긴 해요. 뭐냐면 한번 중간 점검합니다. 말씀하신 것처럼 트레인 데이터로 한번 돌려서 Y트레인하고 같은지 한번 보고 그렇게 하기도 해요. 그렇지만 결론적으로
404:27
Speaker A
말씀드리면 우리가 모델을 만들었으면 그 모델이 새로운 데이터에도 잘 맞는지를 확인하는게 중요하죠. 그래서 일단 일반적인 사이킹론의 머신러닝 할 때는 얘는 지금 사이킹론이에요.
404:42
Speaker A
일반적인 머신닝 둘이에요. 화이토치가 아니라 어 그걸 갖고 어 데이터를 할 때는 훈련은 이렇게 코드를 치고 얘는 프레딕해서 테스트 데이터로 예측해서 정답지와 비교해서 정확도를 한다.
404:59
Speaker A
이렇게 보시면 되겠습니다. 그러다가 이제 이제 토치로 이걸 한번 해 볼게요. 뉴트 NN 옵티마이저 여기는 이제 일부러 우리가 데이터를 만들어 주는 거죠. 트렌트 스플리트 합니다.
405:38
Speaker A
그리고 요걸 또 코드는 드릴게요. 지금 꼭 필요한 것만 칠테니까 돌려 보시면 우리가 일부러 데이터 생성하는 거죠. 1천000개 생성하고 열개는 자 우리가 지금 다루려고 하는 특성이 열개예요.
405:58
Speaker A
그리고 크래슨 두 개예요. 이분죠. 맨 스테이츠 40일 해 가지고 이제 잘 만든 거죠. 어, 일반화시키기 위해서.
406:09
Speaker A
자, 여기서부터는 쳐가야죠. 뭐예요? 첫 번째 이게 데이터를 만들었어요. 데이터 생성했어요. 그다음에 뭐예요? 데이터를 펜서로 변화시켜야죠.
406:24
Speaker A
그래서 학습용 데이터, 테스트 데이터 나눠 줘야죠. 코츠의 해서 엑스트레인 데이터 타입도 정해 줘야죠. 로트 포츠 로트 32 X 텐 이제 좀 대문자 쓰기 귀찮아서 그냥 제 스타일로 할게요. 어 여러분은 그렇게 해도 되고.
407:07
Speaker A
자, 그런 다음에 트레인 텐서라고 할 건데 얘는 잘 보시면 포츠의 텐서 y트레인이 타입 동일하거든요. 포치의 32까지 똑같은데 제 여기 지금 잘 완성되 있죠? -1 1 코드가 제일 많이 나와요.
407:32
Speaker A
리시퍼를 써도 되고요. 뷰를 써도 되고 하나는 뭐야? 하나씩 그렇죠. 행렬 구조로 맞춰서 틀리니까. 자, 그래서 예, 복사하셔 가지고 테스트 데이터도 만드면 되죠.
408:04
Speaker A
얘를 요걸로 바꾸면 되죠. 얘를 테스트를 복스를 할게요. 그래서 얘는 테스트셋 텐서로 바꿔. Y도 y 텍스트 바꿔 주면 되죠.
408:29
Speaker A
지금 뷰로 써 가지고 어떻게요? 네이블을 마이너스 레이블 데이터를 만들어 준 거죠. 아, 방식은 여러 개가 있어요.
408:39
Speaker A
어, 그러니까 지금 뭐예요? 차원을 늘려 가지고 하는 경우 비율 해도 똑같죠. 지금 -1 해도 하나씩 만들어지잖아요. 리셰프가 같잖아요.
408:50
Speaker A
맞아요. 음. 다음에 데이터 문제 해결됐네요. 신경만 모델 정의할게요. 모양 좀 잘 됐네. 이거죠. 자,이 생선자인데 심플 뉴럴 네트워크 상속받아서 초교한다.
409:38
Speaker A
해석하려면 어떻게 하시면 되죠? 열 개 열 개 만들었잖아요. 걔를 하나로 가. 자, 선형인데 선형 레이어인데 입력은 열 개. 얘가 뭐예요? 출력은 하나.
410:04
Speaker A
맞죠? 아주 간단한 거죠. 셋 X 충전파죠. 리턴 포츠인데 근데 얘가 한번 보시면 어떻게 할 거냐?
410:29
Speaker A
자, 얘를 셀프 레이어잖아요. 얘를 x가 들어가면 통과시켜 가지고 그다음에 얘를 또 뭐예요? 토치의 시그모이드를 통과시키게 만든 거죠.
410:39
Speaker A
즉 활성화 함수록 시그모드를 사용하겠다라는 뜻이에요. 자, 이제 모델 만들면 되죠. 모델 이러면 인스턴스 만들어지는 거지.
411:04
Speaker A
자, 그리고 그다음 뭐예요? 손실함수죠. C써서 이진 분류할 거니까 얘를 그냥 크리테리언이라 하면 되죠. 뭐 한 거야? 시간 이부 그다음에 옵티마이저 하시면 되죠.
411:40
Speaker A
옵티 SGD 써 가지고 스타캐스 그레이드 확률적 현상 방법 모델의 파라미터스 러닝 레이트는 0.01셔 01 가지고 얘를 최적하게 오트마이저 이렇게 하시면 자 이제 모델 학습하겠습니다.
412:18
Speaker A
에폭 정리 줘요. 에폭스 4 에폭인레인지 에폭스 100번 반복하겠다는 거죠. 자 모델 트레인이라고 선언해요. 학스 모드.
412:41
Speaker A
자 여기서 중요한 거 뭐예요? 어 뭘 초기야? 경진 뭔 초기 코드 코드 예 초기아 일정 옵티마이 제로 그레이트 옵티마일 제로 그레이트 세교님이 동중 2점 노그레이드 제 5월 그레이드 틀렸어요 원어님 아까워라 윤선 님 1점님 2점 오승현님 2점 알겠죠 옵티마이저로 해요 이거 국가 카복지
413:17
Speaker A
말라 제로 브레이크로 충 이거 계속 반복하게 돌잖아요. 이게 학습하잖아. 이해되죠? 누적되면 안 되니까. 이해되죠? 얘가 한 번 돌 때 초기 리셋하고 다시 돌리고 리셋하고 다시 돌리고 알겠죠? 어 그러려고 그다음에 뭐야? 모델의 엑스트레인데 자 요거 엑스트레인 그래 넣으면 돼요.
414:19
Speaker A
뭘 넣어야 돼요? 텐를 넣어야죠. 요거 엑스n인 넣으면 안 돼요. 지금 요거는 xn이 왜 나왔냐? 아까 처음에 저 아이리스 데이터예요.
414:32
Speaker A
요거죠. 텐사로 바뀌는죠. 코치니까 아까 엑스 이렇게 나눈 다음에 텐서로 바꿨잖아요. 그렇죠? 텐서를 넣어야 돼요.
414:57
Speaker A
그래서 뭘 만들어요? 만들 그다음에 크리트 뭐요? Y프레드 하는 거 누구하고 비교해야 돼요? Y 자, 여기서는 예측값과 실제값을 본 거잖아요. 라스를 구하기 위해서 그서 이것서 헷갈린 거 같아. Y트레인 텐서죠. 그죠? 여기서 와이트레인 텐서를 하는 거야.
415:35
Speaker A
어 학습하니까 학습이잖아. 학습. 그니까 아까 헷갈렸던게 요것 때문에 헷갈렸던 거. 요것 때문에 헷갈리신 거죠.
415:51
Speaker A
라스. 방식이 틀리니까. 그렇죠. 여기서는 학습을 하잖아요. 그다음에 우리가 지금 모델점 트레인 모드잖아요. 모델점 평가 모드로 갈 때는 또 다르죠. 누구랑 비교해요?
416:03
Speaker A
라스할 때. 어, 근데 얘는 특이한게 뭐예요? 평가에서 기울기를 사용하지 않으니까. 그래서 어, 아까쯤에 거 안 했는데.
416:17
Speaker A
근데 예측할 때는요. 테스트 데이터로 예측했어요. 좀 있다 보시겠지만 x 테스트 데이터로 해서 y 테스트 예측값을 만나 봐요.
416:28
Speaker A
어 그 얘는 지금 훌륭하니까 와이프레이드와 와이트링 텐서랑 그 어떻게 되는지를 봐야 되는지 두 개를 비교해야 되니까요 두 개를 다 집어 넣는 거예요.
416:44
Speaker A
그죠? H값과 실제값이잖아요. 여기에서 훈련을 할 때 데이터를 해서 그 라스를 이건 뭐야? 손실에 따른 기울기를 계산하죠. 그다음 뭐예요?
417:16
Speaker A
중요한 거 옵티마인 점 스텝트 가중체와 편양을 업데이트 니다. 아 점사 현재 각각과 손실을 내가 보여 줘.
418:23
Speaker A
이렇게 할게. 매트리스가 틀리다. 어디 보자. 어, 잠깐만요. 빠진게 있나? 자, XY 나고. 아, X트레인. 어, 그걸 안 했네.
418:52
Speaker A
여기 왜 아까 지웠다 지웠나 보다. 아까 트렌 테스트 나눈 거 여러분한테 주고 나했나? 뭐 안 했어요? 트레인 테스트를 안 나눴잖아요.
419:03
Speaker A
제가 이거 안 줬어요. 아 근데 여기에이 이거가 나와 있었구나. 메이크 클리ci피케이션이 나왔네. 자 요거 메이크하고 이거 안 들었나 봐요. 어 요걸 줬어야 되는데 요거 하세요. 밑에 어 당연히 이걸 했어 줬는데 이걸 해서 돌렸어야죠.
419:21
Speaker A
XY를 나누고 이제 만든 거 생성이에요. 제가 여기다 적어 놓을게요. 헷갈리실 수 있으니까. 자, 처음에 다시 보면 데이터 생성한 거죠. 그 실제 데이터 갖고게 아니니까 그 데이터를 가지고 트랜 테스트 나눠서 요걸 해야죠. 요거랑 방식이 틀려요. 어, 얘는 그 정도
419:40
Speaker A
있죠. 그래서 트레인 테스트 나눠야죠. 일반하기 위해서. 그래서 이거는 뭐예요? 데이터 분할력 쓰게요. 학습용 데이터 분할 했죠.
419:55
Speaker A
여기서부터 이렇게 그다음에 요걸 하는 거죠. 얘를 텐서로 바꿔 주고 그다음에 하시고 어 잠시만 이거 다시 돌려야 돼. 어 여기까지 돌죠.
420:11
Speaker A
자, 보시면 어 보면은 여기 보시면 100번 도는데 트레인하고 예측치하고 비교해서 손실이 나는 걸 볼 수 있어요. 몇 번 안 돌아서 좀 그렇긴 하네요. 한 1천000번 할까?
420:33
Speaker A
L데 어 확 그래도 0.1 1 정도는 10%는 죽네요. 음. 자, 요거 두 개 하셨죠? 어, 순서. 그리고 뭐 굳이 남기자면 얘는 모델로 인스턴스.
421:02
Speaker A
자, 이거는 이제 모델 정리하는 거죠. 그리고 얘는 뭐예요? 아까 손시 함수 이렇게 할게요. 좀 조속 제대로 이렇게 어 저 이렇게 하시면 되겠죠?
421:30
Speaker A
그다음에 얘는 옵티마이저 최적하기 이렇게 하시면 되고 학습 대상의 모델 학습 이렇게까지 하시면 되겠습니다. 그다음에 이제 중요한 건 이제 테스트하는 거예요.
421:57
Speaker A
우리가 봤듯이 모델적 evalu이션 선언하고요. 제일 중요한 거죠. with no grade 선언해야 돼. 다시 말했지만 평가할 때는 기울기 계속 하지 않아요.
422:25
Speaker A
그래서 모델에 여기에 드디어 엑세스트 텐서를 넣는 거죠. 그러면 얘가 반명이 y 테스트의 예측값이죠. 그리고이 y 테스트에 예측감 시그모이기 때문에 그래요.
422:54
Speaker A
0.5보다 크다면 그리고 그게 프로트예요. 0.5 모해야 되니까 이해돼야 돼요. 큰 것만 프로트로 0.5를 기준 또는 1로 분류하기 때문에 그래요. 알겠어요?
423:38
Speaker A
아웃풋은 1로 나와요. 하나를 선택하면 자동은이 불릴 때는 그래요. 1로 선택이. 왜냐면 하나를 하나가 얘가 개고 개냐 고양이냐 하면 고양이 하면 끝 얘는 나머지는 자동으로 개가 되잖아요.
423:52
Speaker A
그렇죠? 어 그래서 두 가지 방법이 있어요. 이진 분류일 때 보통은 그걸 제가 시험에 냈다가 저희 대학공분들이 컴플레인을 했거든요. 아 왜 그렇게 되냐고 헷갈리게요. 그럼 그렇게 하는데 앞에 뒷닝 기초 가르치신 분이 그렇게 안 가르쳐서 무조건 외웠더라고. 이게 암기 바로
424:21
Speaker A
어 우리 뭐라고 할까요? 과합의 얘죠. 어떻게 보셨냐면 시그모이드는 이진 분류 그렇죠? 소프트 맥스는 자중 분류 이렇게 외우셨더라고요.
424:37
Speaker A
막 원래는 맞아요. 근데 지금 아까 1일 이렇게 나오신 거 있죠? 1. 왜냐면 시그모이 될 때 1이에요. 다 종물 때가 뭐 3이면 4 이렇게 해요. 왜? 왜냐면 소프트맥스는 확률값으로 하거든요. 전체이 나올 수 있는 그 자연 상수에서 나와요.
425:00
Speaker A
계산할 때는 전체 나올 수 있는 중에 얘가 뭐 개가 나올 수 있는 몇 퍼센트냐?
425:08
Speaker A
이제 이렇게 확률 분포로 나오는 거고 얘는 하나를 선택하면 다른 거는 자동으로 선택이 안 되는 거죠.
425:16
Speaker A
0.5를 기준으로 0.5에서 0.7다. 아, 그러면은 개다. 그러면 자영도로 나머지는 고양이 이렇게 되는 거예요. 그래서 하나로 빠져요. 알겠죠?
425:30
Speaker A
근데 이진일 때 소프트맥 쓸 수 있어요. 제가 이거를 트릭으로 시험을 냈더니 성적 이시청이 한 세네 명이 오는 거예요. 왜 이렇게 시험 문제가 더럽냐고 그죠? 컴플레 하셨더라고.
425:45
Speaker A
어, 왜 그때는이 가능해요? 무슨 말인지 알겠죠? 이분류잖아요. 무슨 말인지 알죠? 소프트맥스니까 퍼센트니까 맞죠? 2죠?
425:58
Speaker A
그러면 어떻게 나요? 개가 될 확률이 0.6. 고양이가 나온 걸 0.4. 그러면 어떻게 돼요? 우리 개라고 하겠죠?
426:07
Speaker A
모델이 제 말 무슨 말인지 아시겠어요? 예. 그까 확률로 계산하냐 하나 그냥 딱 하냐. 근데 거기 그래서이 출력값이 달라져요.
426:20
Speaker A
그 제가 이걸 시험에 냈었어요. 이분류 하는데 소프트맥스인데 여기 답이 2였거든요. 근데 왜이 안냐? 우리는 그렇게 안 배웠다.
426:31
Speaker A
그래서 내가 소프트맥스인데요. 되는데요. 코드 치니까 나오거든. 어 그죠? 어. 그래서 상세하게 남겨 드렸죠. 아 이거 왜 이러는지 어 그게 왜 그러냐면 특히 케라스로 하게 된 모드로 되니까 거의 암기식으로 가거든요.
427:01
Speaker A
그 이게 과정 뭐예요? 과합이죠. 암기한 거에서 안 나왔으니까 지금 그런 거 아니에요. 무조건 이건 1 그렇죠. 어 그렇게 했으니까 그죠.
427:21
Speaker A
자 이게 뭐냐면 0.5를 기준으로 0 또는 1로 이거예요. Y 테스트의 프레드잖아요. 와 테스트의 프레드가 0.5보다 큰게 트루이잖아. 1이잖아요.
427:40
Speaker A
어 그래서 그냥 정확도를 다시 할게요. 와이테스트 프레디잖아요. 실제 정답. 자 우리가는 이렇게 봤죠. 이런 이거 많이 나오거든요. 외국 코드들. 이거 외국 코드여서 그래요.
428:04
Speaker A
저 이퀄이 뭐냐면 equizer 예요. 아 아니 이퀄라이저는 그거 equ오밸런트 그래서 이큐밸런트가 뭐냐면 저희가 그걸 어디서 봤냐면요.
428:19
Speaker A
그 지D라는 시험이 있더라고. 내 아내가 지D 시험을 막 보길래. 그럼 뭐 하냐 그랬더니 지D지 시험을 봐야 대학을 갈 수 있대.
428:29
Speaker A
이게 알고 버리니까 우리나라의 그거죠. 학교 중퇴하신 분들이 그죠. 뭐 검정고시 고등학교 그렇죠. 그게 GED라는 시간은 뭐냐면 미국에 고등학교랑 동등한 그렇죠. 어 수준을 나타내는 그래서 요게 아마 스펠링이 제가 기억이 너무 우리가 막 이키벌런트인가 동등한 이런 거 그렇죠. 그래서 요거든요. 그냥 이거예요.
429:00
Speaker A
어 그래서 Y 테스트하고 Yens서의 텐서가 같으냐 이해되시죠?음 가 막 이런 코드들이 나와요. 어 썸 그다음에 하이선 숫자니까 아이템 그래서 보통은 여기까지 가야죠.
429:25
Speaker A
펜서고 아이템 요렇게 가야 돼요. 여기까지 이렇게 이해되시죠? 맞을까요? Yens서의 Yens서 맞죠? Y서와 이퀄라이저가 요거랑 같고 그다음에 다 더해서 아이템으로 바꾸는 거 요런 코드 CF 0이 뭐예요? 데이터를 대수잖아요.
430:00
Speaker A
맞죠? 음. 애플스 애플은 빼먹 최고 애플 빼먹 곱하기 100 그런 다음에 서울짜리까지 퍼센트 84 됐나요?
431:01
Speaker A
음. 그다음에음 또이어서 해 볼게요. 또 이론적인게 좀 이게 있어서 그다음에 이제 얘가 이제 설명한게 김로님죠.
431:28
Speaker A
자, 이렇게 텍스트에다 들게요. 여기에 써보시고 이거죠. 머신 러닝 중에 하나예요. 이쪽이에요. 최적화 기술이에요. 그러니까 다시 말하지만 딥러닝은 딱 떨어진 답이 구할 수가 없어요. 이름 자체가 근사하다. 목표가 근사한 거야. 라스가 양 0에 가깝게 근사하는 거야. 알겠죠?
432:03
Speaker A
왜냐면 최적화 이름이 34% 나온다고요? 어 그건 아닐 텐데 지금 뭔가 잘못하신 거 같은데. 코드 드릴까요?
432:16
Speaker A
승민이 여기 어디서부터 코드 드릴까요? 요거 요거 거 같은데. 모델 평가 보여다 드릴게요. 어 이건 말이 안 되거든요. 아무리 차이나도 34 뭐가 인트나 여기 한번 요게 좀 요걸 안 하실 거는 그랬을 것 같아. 예.
432:42
Speaker A
예. 일단 참고는 여기 있으니까 하세요. 아 자 보면 머신 러닝 최적화 기술의 인공지능 기반 학습 기법인데 다층신 연망이라 하죠.
432:52
Speaker A
대규모 데이터고 이미지나 우리 채봇 엔 이런 식입니다. 유런값에 전달된 신호값들을 모두 합하고 활성화하는 0보다 크면 1, 0보다 4면 0을 추적해요.
433:11
Speaker A
자, 여기도 또 드릴게요. 우리가 일반적으로 지금까지 우리가 지금 계속 공부하는게 이번 주에 공부하는게 내일까지 다 DNA이에요.
433:21
Speaker A
딥러크 얘는 그림으로 그리면이 세 가지로 이루어져 있죠. 입력층, 은닉층. 근데 은익층이 여러 기가 있는 거야. 어 뭐 두 기 이게 이것도 옛날에 성균관대학교인가 거기서 시험 나왔던 거 같아요. 인공지능 대학원 시험에 딥러닝에서 말하는 디비 가르키는게 뭐냐? 은익층이 두 개
433:47
Speaker A
이상 있으면 딥러닝이라고요. 알았죠? 어 자 그래서 요게 인풋이고 요걸 이제 은닉층이니까 히든이라고 하고 히든 레이어라고 붙어요.
434:02
Speaker A
그다음에 아웃풋 출력증이에요. 근데 얘 특징은 전체 어떤 이미지든 모든 다 뭐예요? 1차원 벡터로 만는 거예요.
434:13
Speaker A
여기서 출력해 가지고 이렇게 하고 또 여기에 노드라고 했죠. 요렇게 그래서 완전 연결하는 플릭커넥티드 완전 연결증이에요.
434:31
Speaker A
다. 그러기 때문에 계산량이 복잡한 거예요. 얘도 여기서 갈 때 노드가 여섯 개면 다 연결하는 거예요.
434:38
Speaker A
각각. 그니까 계산형이 폭증하죠. 예를 들어서 여기가 64이에요. 여기가 32개고 만약 뭐 그렇지 않고 보통 32개 64 뭐 128 그러면 개선형이 어려요. 32 * 64 64 * 128 얘 다 곱하기에요.
435:03
Speaker A
알겠죠? 어, 그러니까 계산이 폭증하는 거예요. 자, 그래서 입력층은 모델에 전달되는 데이터가 처음으로 오는 거고 이때이 노드라는 건 데이터의 특성 정보가 들어간다. 이게 중요해요. 데이터가 들어가는게 아니라 특성 정보가 들어가는 거예요. 알겠죠? 어, 뭐 키냐 몸무게냐 이거예요. 그러면 키에 대해서 데이터가 쭉 달려 있을
435:31
Speaker A
거 아니에요. 그렇죠? 어. 이거죠. 예를 들어서 여기 1번 우리 이제 파란색이 쓸 수 있어요. 승민 님 2번 저 그러면 여기 다 키 몸무게 각자 다 있을 거 요거 데이터에 여기 키 쭉쭉 있을 거 아니에요? 여기는 이게 100명이면 100명 데이터이
435:53
Speaker A
들어간다는 거예요. 통으로 속성 별로 들어간다는 거야. 노드로. 그런 다음에 은익층을 통과되면 하나 이상의 은층을 처리되는데 실제로 두 개 이상이죠. 그래서 은닉층은 근데 얘가 여기 갈 때 요거를 확장하면 w1 x1 + w2x2 이런 식으로 간다 이거죠. 지금 키 만약 몸무게를 말한다. 각각 웨이트가
436:19
Speaker A
있다는 거. 마지막에 바이어스 하나 이렇게 y는 해서요 한 칸이 요렇게예요. 근데 또 얘가 또 여기로 가잖아요.
436:30
Speaker A
그래서 사실은 얘가 어떻게 요거를 확대해서 쓰면 어떻게 하냐면 여기 1번이고 여기 1번이잖아요. 이렇게 써요. w1 x1 w1 여기 2잖아요. 요게 x2잖아요.
436:46
Speaker A
1에서 1 x2 이런 식으로 써요. 어. 그다음에 B. 그다음에 여기서부터 1에서 요거 두 번째 노드 가잖아요.
437:06
Speaker A
이런 식으로 한참 써요. 실제로 쓰나 보면 만약 하면 얘가 32개니까 32개에서 64 이렇게 나와요.
437:15
Speaker A
그런 식으로.이 이 또 여기서는 이제 뭐겠어요? 두 번째니까 W21 X1 W21 X2 이런 식으로 여기서부터 여기 간다고 완전 연결이니까 그 계산량이 많죠. 여기 자체 여기서만 또 그래서 웨이트하고이 가중치와 편양 원래 갖고 있는가? 요것들을 이용해서 입력 데이터를 변형해서 하는데 자 여기에 1번만 지울게요.
437:55
Speaker A
자 wx + b 요거는 이제 하셨을 거고 변형에서 활성 함수 그러면 얘가 여기 갔어요. 그요 노드의 상황을 확대해 볼게요.요 노드는 여러 가지를 지금 갔잖아요. 걔를 다 더해 줘요. 그러다음에 나갈 때는 시그모이드로 나가는 알겠죠?
438:17
Speaker A
아, 시그모이드가 아니라 뭐예요? 우리 관 렐루죠? 은닉층에서 은닉층에서는 렐루죠? 렐루 그죠? 근데 렐루인데 여러분이 어 저번에도 그죠? 비선용성이 추가된다.
438:31
Speaker A
어디? 여기 꺾이는 점. 자, 우리가 사람 얼굴 그릴 때 자, 원래 제가 이렇게 그리지만 원래대로 선형으로 그린다 그러면 이렇게 하나 이렇게 할 수 있잖아요. 맞아요?
438:56
Speaker A
어, 그러면이 꺾이는 점 있기 때문에 이렇게 꺾으니까 그림이 그려지죠. 그러면은 요렇게 되는 거 아니에요.
439:07
Speaker A
자, 그렇게 비서형성이 추가돼서 더 복잡한 패턴을 할 수합니다. 그래서 여러 개의 은익층을 사용해서 더 고차원적인 표현을 하는 거예요. 그런 다음에 마지막에 얘가 여기로 가요.
439:20
Speaker A
출력으로 뭐 최종 예측값을 계산한다 이거죠. 요런 단순한 구조예요. 뒷론이 기본 구조. 그래서 마지막에 불일 때 소프트맥스를 쓴다.
439:43
Speaker A
그래서 어 여기서 요거를 하자. 미리 봅시다. 아, 어차피 우리 다음 주에 CNN 하니까 미리 맛보기로 합시다. 자, 뭐냐면 합성공식 경방이 있어요.
440:09
Speaker A
CNN이죠. 요거예요. 저번에 한번 말했죠. 이미지 데이터 처리해 서역 어디 분류할 때. 순환 신경만 우리 배워요. 하루밖에 안 배우게 하지마. 아래는 레시템을 배워.
440:26
Speaker A
순차 왜냐면 어우순이 생각하시면 돼요. 나는 너를 사랑해. 사랑해라는 말이 나오기 전에는 내가 이미 예전에 말했어요.
440:40
Speaker A
제이 시점에서 여기에 지금 내가 너 하고 뜸들인다고 할게요. 고백할 때. 여기 지금이 시점이에요. 사랑이가 나올 거는 우리가 어떻게 표현하냐?
440:51
Speaker A
t + 1 미래 시점을 이렇게 표현하고요. 나라고 수출게 고백하기 위해서 말 때 t - 1 시점이죠.
441:01
Speaker A
과거에 이렇게 표현하고 이런 걸 우리가 뭐라고 하냐면 타임 스탬프라고 해요. 타임 도장 찍는 거. 그렇죠? 어.
441:13
Speaker A
자, 그래서 순차적인 데이터 시계열 데이터 처리를 하기 위해서 나와요. 자, 트랜스포머는 자연어 처리에 순차 처리를 안 해요. 병렬 처리를 여기 큰 특징이 두 개다 자연어인데 원래 나온 건 병렬 처리를 하기 위해서 그래서 모든 임단을 동시 처리하기 위해서 이게 이제 나중에 우리도 배워요. 거
441:42
Speaker A
겐 겐은 두 가지를 만들어요. 하나는 막 이미지를 생성해요. 가짜 이미지를 생성합니다. 그러면이 판별하는 애가 나와요.
441:57
Speaker A
디스크리미네이터예요. 얘가 얘가 한마디로 이거예요. 가짜 이미지를 딱 갔는데 얘가 이제 판별하는 거. 어 이거 진짜다 가짜다 페이크다 판별하는 거 이해되시죠?
442:12
Speaker A
자, 제가 요즘에 그림 실력을 여러분들하고 같이 하면서 늘고 있어요. 그래서 제가 점점 나아지죠. 그게 누구예요?
442:29
Speaker A
카리나. 자, 그러면 제가 누구예요? 판별자를 속인 거야. 그렇죠? 판별자이 여러분을 속인 거라고. I윈. 그죠? 가짜 이미지를 생성해서 카리나라고 판별을 받은 거잖아요. 그렇죠? 예. 바로이 게임이에요. 무슨 말인지 알겠죠?
442:54
Speaker A
이해되시죠? 맞잖아요. 자, 그래서 그게 뭐냐? 내가 정말 카리나 같이 너무 똑같이 그리니까 여러분 내밀 카리나라고 한 거잖아요.
443:09
Speaker A
그걸 목표로 하는 거예요. 무슨 말인지 알겠죠? 그걸 목표로 하는 거예요. 생성자는 얘는 왜 그러냐면 얘하고 얘하고 다른 입장이죠.
443:21
Speaker A
얘는 진짜를 진짜라고 하고 가짜를 가짜라고 해야 되네고 얘는 진짜를 깜쪽같이 섞인 거. 그렇죠? 어 이해되시죠?
443:33
Speaker A
카리나가 아닌데 카리나처럼 그렸기 너무 똑같아서 여러분들이 카리나요 했잖아요. 라빌링을 바로 그게 나의 목표인 거예요. 생성하는 이미지를 생성하는 사람 그 똑같다 이런 거죠. 여러분들이 뭐냐면 캐릭터 같은 거 어디 놀이 공원이나 어디가 가지고 연인들끼리 소 잡고 저희 캐릭터 그려 주세요. 딱
443:57
Speaker A
그렸는데 딱 보았을 때 방능이 두 가지일 거 아니야. 오 진짜 똑같아. 그렇죠? 그거가 목표인 거야. 그 그림 그리시는 분은. 근데 그림 누구야? 그러면이 사람은 나의 특징을 못 잡을 거야.
444:17
Speaker A
무슨 말인지 알겠죠? 그림으로 해 주시는 분이 저도 전주 한옥마을가 가지고 와이프 지금 와이프하고 연애할 때 갔거든요.
444:30
Speaker A
어 그래서 찍었어요. 한복 입고 찍었는데 날 무슨 머음처럼 그려놨어. 와이프는 잘 그려놓고 와이프한테 허락 받고 치셨어요.
444:42
Speaker A
너무 열 받아 가서 그걸 걸어 놓기해도 그렇고 그래서 어 다음에 어 다시 에버랜드 가서 다시 그리자 그랬습니다. 그래서 저는 뭐 그렇다고 일반화 제가 그렇다고 해서 여러분들께 전주 한옥발 가서 그림 그리지 마세요 하면 일반화용죠.
445:01
Speaker A
어 근데 조심을 하라라는 말하고 싶어요. 그러나 캐릭터를 못 잡더라. 특징. 그 뭐예요? 특징을 못 잡으는 거야. 무슨 말인지 알겠죠? 어.
445:14
Speaker A
자, 이해되시죠? 그래서 요렇게 하는게 알고리즘. 음. 그렇죠. 이게 이제 생성모 이미지 생성. 그리고 이미지 생성 모델은 더 많이 나왔죠. 여러분이 많이 문제가 됐던게 뭐예요? 디페이크 그죠? 디페이크 문제 있었잖아요.
445:34
Speaker A
어, 그래서 연예인들이 많이 피해를 봐 가지고 고소하고 그랬잖아요. 그렇죠? 어, 특히 좀 심각한 거죠. 인격은 그거는 진짜 그 명예선도 될 거 같아요. 막 이상한 성인물의이 그것도 여자 연예인의 얼굴을 막 합성하고 그렇죠. 그런 식으로 팔고 이을 취하고 근데 그것도 해외 서버에 있어 가지고
446:01
Speaker A
못 잡고 그래서 막 인터폴 수 그 수색도 하고 그랬잖아요. 어 그러니까 이게 이제 한때 그러니까 그게 결국 근데 인공지능이 문제 다 생각해 보면 인공지능의 문제가 아니라 인공지능을 활용하는 사람의 문제지 않나요? 그래서 이게 그래서 인공지능 윤리를 항상 가르치는 거예요. 그
446:22
Speaker A
사람들이 인공지능 유리하면은 좋는데 사실 중요한 내용이긴 해요. 근데 이제 요즘에 근데 말이 인공증이 유리지 가서 들어보면 옛날하고 좀 틀려요. 저작권법 뭐 이런 거 가르쳐요. 그래서 필수 과목이네요.
446:38
Speaker A
그렇죠? 거기가 가르쳐요. 윤리인데. 그죠? 어. 그러니까 왜냐면이 중요하잖아요. 실제로 관련돼 있어요. 여러분 저작권법 어 엄마하기 때문에 5천만 원인가 3천만 원인가 벌금이잖아요.
446:54
Speaker A
빨간 생겨요. 그래서 그래서 그렇죠. 여러분 그거 벌금용이 있잖아요. 이게 감옥만 간다고 해서 빨간줄이 생기는게 아니에요. 벌금용인가? 그렇죠. 어 그러면은 생겨요. 기록에. 어 그래서 여러분 프로젝트 할 때도 그거 잘 생각하셔야 돼요. 왜냐면은 예전에 한 친구가 그러니까 우리 토이 프로젝터로
447:22
Speaker A
만드는 건 좋아. 저처럼 뭐 강의용으로 한다고 그냥 하지. 또이 강의가 팔리는 것도 아니잖아요. 그 우리끼 온 건데 그 친구가 어떤 걸 하려고 그러면 그때 한참 그런 그런 거 유행했죠.
447:36
Speaker A
이거 그 뭐라 그러지? 누구 선호하는 거? 그 밸런스 게임 이런 거. 그렇죠? 어떤 노래면 어떤 거 좋아하고 그런 게임을 만들고 싶대.
447:49
Speaker A
어, 좋아. 근데 그건 상용하면 안 돼. 여러분 아시잖아요. 유튜버들 많이 당하시잖아요. 특히 디즈니 디즈니 같은 경우는 엄청나게 저권이 세거든요.
448:05
Speaker A
그래서 디즈니 캐릭터 같은거나 음악 같은 걸 허락 안 받고 쓰면은 아예 그것만 고소하는 회사들이 있어요.
448:16
Speaker A
그래 가지고 어 어 나는 그런 의도가 아니었는데 어 많이 당해요. 변검은 바로 날라오거든요. 그래서 여러분들 그 나중에 프로젝트를 혹시라도 뭐 생성을 한다. 그럴 때 가장 먼저 봐야 될게 관련 법령이에요.
448:34
Speaker A
어, 그렇죠. 그리고 요게 저작권이 어디 있는가? 혹시 이슈가 있는가? 그런 거를 좀 아셔야 됩니다. 그리고 여러분들은 뭐 상용화가 아닌 경우에는 명시를 해 주면 돼요. 그래서 출차를 밝히려고 하는 거.이 이 이미지는 AI로 생성한 이미지입니다. 아니면요 이미지는 우리가 학습 목표로 어 어떤
448:58
Speaker A
거 자료를 갖고 섰습니다. 어 그러면은 면책돼요. 출차 밝히면. 어, 그러니까 그런 부분 좀 잘 알아두세요.
449:09
Speaker A
자, 그러면 여기까지 설명 까고 다음 우리가 실제로 내일 다음 주에 배울 내용이지만 여기서 잠깐 나왔으니까이 예제를 CNN을 써서 그런 거 같아요.
449:20
Speaker A
그래서 합성 연산이라는 걸 잠깐 해 드릴게요. 이걸 봤을 필요는 없고 드릴 테니까. 자, 이거죠. CN의 합성 연사는 우리가 커널 또는 필터라고 하는 걸 듣다 돼요. 나중에 다음 주에 이거 할 때 여러분들이 정말 헷갈려요. 6기부터 지금까지 다 헷갈려했어. 왜냐면은 다시 말하지만
449:51
Speaker A
아, 다시 아, 처음이구나. 중요한게 뭐냐면 필터로 이제 CNN는 내 이미지를 학습하는게 아니에요. 미리 말씀드리지만 필터를 학습하 다시 CNN은이 모델은 이미지를 갖고 필터를대 가지고 막 하거든요.
450:15
Speaker A
근데 이미지를 학습하는게 아니에요. 필터를 학습해. 이해됐어요? 자, 일단 필터를 가중치가 갖고 있는 필터를 갖고 와요. 그래서 내 입력 데이터라는 건 이미지예요. 이미지에 계속 반복적으로 정유해요.
450:36
Speaker A
그래서이 필터를 적응해서 나온 결과물이 특징 매라고 했어요. 그때 한번 말씀드렸죠. 그래서 컨볼루션 레이어라고 해서 나오고 그 특징을 한마디로 차원을 줄이는게 풀링 레이어고요.
450:51
Speaker A
얘네들 완전 연결해서 만든다라고 돼 있어요. 다음 주에 또 열심히 하겠지만 간단하게 다시 한번 그림을 뭐 한 번 해 가지고 되는 사람 없으니까. 자, 다시 우리 주인공 카리나를게요.
451:20
Speaker A
칼이나죠. 자, 아, 경렬한 춤을 치고 있네요. 자 그러면 자, 여기에 뭘 되냐? 이만한 필터를 되겠다 이거예요.
451:31
Speaker A
필터. 그래서 얘가 필터가 움직이면서 이렇게 이렇게 움직이면서 뭘 한다는 거야? 여기에 지금 요거 같으면요 검청세는 요거이 지역의 특징값 요거 한 칸 움직이면서요 지역의 특징값요 지역의 특징값요 지역의 특징값을 뽑겠다는 거야.
451:55
Speaker A
이해되시죠? 그래서 나온 값이 뭐라고요? 피처 맵이라고 특징을 뽑은 근데 몇 형태다. 2,000원의 몇평태다 이거예요.
452:13
Speaker A
자, 근데 중요한게 뭐냐면 자, 생각해 보세요. 제가 필터가 열 개가 있어요. 이미지는 하나죠. 한 장이죠. 카리너 사진 한 장.
452:27
Speaker A
맞아요. 필터는 10개고 이미 사상 한 장이에요. 그러면은 필터 10열 개 되면 키면 몇 개 나와요?
452:40
Speaker A
한 개요. 열 개 나오죠. 자, 이거를 헷갈리면 안 돼. 자, 지금 여러분 제 사진이 지금 이렇게 있어요. 근데 여러분들이 많이 장난하잖아요. 여기다 코털도 막 그리고 그렇죠. 눈도 여기 이렇게 하고 그 그런다고 하도 필터가 그런 애들이 여기 있어. 스티커
453:08
Speaker A
찍었어. 여러분들이 이렇게 했다고 해서 이미지는 그대로죠. 터만 나오는 거예요. 뭐냐면 여러분들 얼굴이 있는데 얼굴에 내가 이제 여러분들 뭐 그런 거 하잖아요.
453:23
Speaker A
여기 특징 여기 본 뜬다고 해요.이 여러 여성분들은 하신 경험이 있을 텐데 저 옛날에 10년 전인가 여자 친구 따라갔다가 죽을 뻔했는데 그냥 총 막혀 가지고 여성분들 대단한 거 같아. 그거 어떻게 참지? 그 섞고 뜯는 거 있었어요. 요즘도 그런 거
453:41
Speaker A
해요. 얼굴을 섞고 뜨더라고. 이렇게 뭐 붙여 흙 같은 걸로. 어 그래서 따라갔다가 피부명이 좋대.
453:49
Speaker A
근데과 같은나 비염이 있어 가지고 숨을 못 시켜 가지고 살려 달라고 해 가지고 저는 중간에 한 30분에다가 뛴 기억이 있어요. 다시는 안 할 거예요. 너무 고통스러웠는데 그걸 역시 아름다움 위해서 참더라고.
454:06
Speaker A
아니 흙 같은 거 있어요. 속도 패든가 핵인가 뭐 있어요. 이렇게 얼굴이 막 딱딱해죠. 이렇게. 근데 잘 보세요. 제 얼굴은 그대로 있잖아요. 근데 제가 이렇게 하게 되면 누르면 흑이니까 뭐예요?
454:23
Speaker A
제 눈 형태 나올 것이고 털 나올 것이고 눈수럽 나올 거 아니에요. 제 말 이해되시나요? 여기까지.
454:33
Speaker A
예. 그러면 각각의 특징들을 뽑아주잖아요. 이렇게 분절하면. 자, 이건 뭐냐면 이미지는 가만히 있는데 내가 저 이미지가 어떻게 생겼는지 궁금하잖아요.
454:49
Speaker A
그죠? 저의 특징이 뭘까? 분명히 특징이 있죠. 컴퓨터도 알아요. 가만히 있는 하얀색 도야지에. 얘는 어떻게 인식할까요?
455:03
Speaker A
갑자기 난데 없는 이상한 지느 지렁이 같은 애가 머리가 이렇게 세이 있고 그렇지 않아요? 얘 입장에서는 직선 직선 곡선 직선 직선 곡선 이렇게 인식하죠.
455:20
Speaker A
컴퓨터 입장에서는 안 그래요? 우리가이 전체적 우리는 홀리한 존재니까 전체적인 이미지를 보고 우리는 뭐라고 해요? 아, 여성 사진이다.
455:33
Speaker A
라벨 보니까 가리나 이렇게 하는 거지. 의미를 부여하는 거지. 라벨링을 하는 거지. 이미지 데이터 자체는 그냥 하얀색에 빨간색으로 그냥 성금은 거예요.
455:52
Speaker A
맞죠? 그러니까 뭐냐면 피처 맵은 어떤 개념이냐면이 이미지를이 부분적으로 얘를 이해하기 위해서 하나씩 하나씩 특징을 뽑겠다는 거야. 이렇게. 근데 뭘 뽑냐?
456:13
Speaker A
2차원을 뽑고 있죠. 2차원이 이미지 그대로 2차원을 꽂고 있죠. 이게 특징이야. DNA하고 틀린게 DNA는 무조건 1차원으로 바꾸죠.
456:27
Speaker A
자, 1차원으로 바꾸면 어떤 문제가 생겨요? 그니까 여러분들하고 이제 공감대가 조금 한게 세대 차이가 나는게 저희 때는 제가 부족합하더라고. 6기 때도 해 보니까. 6기 때는 제가 뭐냐면 옛날에는 카메라를 해 가지고 사진을 추록했거든요. 그러면은 여자친구한테 차일 경우 어떻게해요? 다 똑같죠.
456:53
Speaker A
과거 사진을 난도지를 해요. 가위로 그렇죠. 이렇게 찔러 잘라요. 그죠? 헤어졌으니까. 근데 지금 그냥 삭제해서 그 얘가 안 맞아요. 그렇죠? 어, 근데 뭐냐면 1차원으로 만든다는 건 뭐예요?
457:11
Speaker A
DNA 우리가 지금 배운 DNA는 요렇게 하고 지금 정보가 이렇게 있죠. 근데 얘가 이쪽으로 가는 거 아니에요. 맞아요. 1차원으로 이렇게 늘려야 되니까 컴퓨터에 들려면 DNA는 여기까지 이해되세요? 그러면 어떤 정보가 없어져요? 위치 정보가 없어지잖아요.
457:35
Speaker A
맞아요. 그러면은 사실은 이거는 굉장히 끔찍한 일이거든요. 이게 토박된 거든. 우리 카리나를 코토막낸 거예요. 지금 요렇게 자랐잖아요.
457:48
Speaker A
눈이 여기 있고.이 끔찍하죠, 지금 생각하니까. 그렇죠. 이렇게 이렇게 들어간 거예요. 이미지가 1차원으로 됐으니까. 그러니까 분류는 어느 정도 되는데 위치 정보 파악이 안 돼요. 다 잃어요.
458:12
Speaker A
이해되시죠? 그래서 이미지에는 2차원을 2차원으로 특징을 뽑는 CNN을 쓰는 거야. 오케이? 어, 그래서요 부분을 여러분이 기억하셔야 돼.
458:29
Speaker A
자 그러면 이제 코드로 볼게요. 뭐예요? 토치 뉴럴 네트워크 옵티죠. 그다음에 뭐 시간이 없네. 어,이 설명을 하다 보니 여기 똑같은데 이제네 개 준 거죠. 이게 뭐예요?
458:59
Speaker A
하나 둘 셋 넷 이제 우리는 이러니까 실이 왜요? 봐봐요. 2차원이고 배열 4 안에 4 2구만 하루 나오죠. 셰이프를 안 찍어도 어 제가 하는게 맞나?
459:16
Speaker A
보시면 인풋 1 이거 1.0이니까 2.0 그렇죠? 자, 그러면은 각각네 개가 데이터네 개고 하나씩 원소를 갖고 있는 거죠. 특성 정보를.
459:34
Speaker A
그러니까 이제 얘는 뭐예요? 단순 선형이에요. 얘는 단순 선형 모델이라고. 뭔가요 단순 선형. Y는 wx + b예요. 맞죠?
459:49
Speaker A
속성은 하나밖에 없잖아요. 지금 데이터가네 개인 거지. 여기까지 이해되셨으면 1번 쳐 주세요. 그러면 얘는 모델 만들 때 어떻게 하면 돼요?
460:04
Speaker A
모델 모델은 nn점리니어 1 1 이렇게 하면 되잖아요. 이거잖아요. 그다음에 손실 함수 옵티마이저 하면 되죠.
460:40
Speaker A
얘를 크리페리어 옵티 모델의 파라미터스 0.01 영 옵티마이즈 이러면 되잖아요. 그다음에 시간이 없는 관계로 여러분 학습은 드릴게요. 코드 했으니까. 그다음에 뭐야? 학습하면 되죠.
461:23
Speaker A
이거 요거죠. 100번을 돌라가. 저 모델 인풋에서 아웃풋 나와. 요거 하잖아요. 라스트에 초기화해. 백프로게이션에 기울기에 의해서 가중 평양 업데이트해. 그래서 나오니까 학습 가중지 평행 나오죠.
462:02
Speaker A
자 그러면은 예지 한번 어 그냥 엠니스트 갖고 해 볼게요. 수양 강의에서 들어 볼게요. 자, 실전 예제.
462:25
Speaker A
일단 돌려 보세요. 시간이 걸리니까. 자, 뭐냐면 그까 보통 딥러닝은 기본이이 정도 길어요. 그 보통 4, 500주이 기본이니까.
462:36
Speaker A
자, 근데 하나씩 보여요. 토치 NN 옵티 데이터셋 트랜스포먼스 데이터 로더죠. 자, 여러분이 딱 이것만 봐도 이제 안다 그랬죠? 아, 토치하려구나.
462:51
Speaker A
텐서로 만들려네. 옵티마이저 만들겠군. 데이터 셋 어 아, 전처리. 로더넷. 아, 배치. 알았죠? 그다음에 뭐예요? 데이터 전체 트랜스폼은 데이터를 텐서 데이터로 변형해서 노몰라에 차다 이거잖아요.
463:09
Speaker A
트랜스폼s 전처리를 할 거야. 순차적으로 뭐 그러니까 리스트 형식이고 트랜스폼의 서al 0과 1사로 만들어 주죠.
463:20
Speaker A
그런 다음에 트랜스포 노멀라즈 0.5 0.5 얘는 -1과 1 사이로 만들어 줘. 그래서 전처리 도구를 만들어 놓고 자 이제 우리가 뭐냐면 이제 엠리스트는 0과 9까지 돼 있는데 그게 아니라 옷과 관련된 거 구두 이제 지금 이런 반팔 티셔츠 이런 걸로 아홉 열 개를
463:42
Speaker A
구분하는 또 엠니스트 흑백 사진의 모형이 있어요. 데이터 학습하는 게. 그래서 그 패션 엠니스트라는 것을 내가 데이터에다가 넣고 우리 이거 배웠죠. 트레 트루 하면 갖고 트레인 데이터하고 다운로드 트루 하면 다운 받는 거죠. 없으면 다운 받고 전 처리 도구는 내가 설정한 요걸 트레인
464:07
Speaker A
데이터 테스트 등 동일한데 얘가 중요한 건 트레인 데이터 아니라는 거죠. 그렇죠? 어 그런 다음에 데이터로드에 적제하죠. 이제 배치 사이즈 64 둘 다 동일하게 얘는 했네요. 아니면 얘를 128 늘린다고 그랬죠? 테스트 데이터는 얘가 중요한 거는 얜 셔플 홀스가 중요하죠. 테스트 데이터는
464:30
Speaker A
트레인 데이터는 셔플해서 트레인 로더를 만든 다음에 심플 NN을 만들겠어. 아, 클래스네. 생성자와 순전파가 있겠구나.
464:42
Speaker A
그래서 얘는 상속 받고 얘가 왜 28이에요? 1차원으로 들어가니까. 지금 얘는 1차원으로 들어간 거예요. DN이에요. 알았어요? CNN 아니에요. DN이에요.
464:56
Speaker A
1천 아까맨처럼 제 얼굴 요게 내 알을 이제 난지 이제 구분하기 위해서요 속성 정보를 여기서부터 여기까지 임지가 있으면 잘라내고 여기를 다음으로 붙이고 한 그래서 28바 28인 거야.
465:13
Speaker A
이미지는 원래 이렇게 요렇게 생긴 거겠죠? 크기 안 맞네. 어 28짜리였어요. 이거 안 맞죠? 안 맞는데. 그래서 얘가 원래 얘가 이렇게 찢져 가지고 여기에 가서 1 * 748 74 783 그래서 28 * 28짜리가 들어가서 입력값으로 들어가고 걔가 128로는 우리가 빼 주는 거예요. 그건 이제
465:49
Speaker A
여러분들이 요거 빼 주는 거는 그 여러분 여러분이 설정하는 거 나름대로 그래서 하나로 그냥 빼버린 거지.
466:00
Speaker A
플레이커넥트 1이라고 해서 즉 784,000원에서 128이에요. 왜냐 생각해 보세요. 이미지도이 이미지가 있으면 지금 봐봐요. 제 얼굴 보시면 요거 이미지와 눈쪽과 이쪽이랑 다 값이 틀리잖아요.
466:21
Speaker A
한 셀마다. 그러니까 한 픽셀이죠. 픽셀마다 다르니까 차원이에요. 다 다른 변수라고. 자, 근데 그다음에는 뭐예요?
466:32
Speaker A
128에서 패션 아이템 10열 개로 나오니까 10열개예요. 자, 그다음에 여기다가는 다시 여기 뭐예요? 이미지를 원디 벡터로 변환하겠다는 거예요. 뭐예요?
466:45
Speaker A
784죠. 근데 여기 몇 개인지 모르겠어. 그러니까 마이너스 때리는 거예요. 어, 그리고 렐루 요거가 들어갔죠.
466:55
Speaker A
근데 걔를 여기에 플래이터 원에다가 집어 놓고 어 그런 다음에 얘를 레를 통과시켜서 X 나오고 그 X를 넣어서 출력을 하겠다는 자 모델 설정했고요. 크로스 엔트로피라고 다중. 왜냐면 열 개를 다중하니까 열 개 크리테리언을 다중 클래스 분류를 하고 아담을 써서 WB를
467:27
Speaker A
파스 대상이죠. 러네이트에서 옵티마이즈 만들고 훈련하겠다. 요건 여러분들이 설정하죠. 기본으로 다섯 번 훈련하죠. 모델 트레인 설정하고 에폭만큼 돌면서 초기값 이건 뭐냐면 라스 초기값은 0이죠. 아무것도 없으니까 초기 손실하고 트레인 로드에서 배치단이죠. 요거 데이터는 배치예요.
467:53
Speaker A
데이터를 타게 그죠? 요거를 하게 되는데 기울기를 초기하고 데이터요 이미지 정확하게 말하면 트레인 로더의 요거가 데이터라는 그 이미지고 얘 타겟은 라벨이에요.
468:09
Speaker A
자, 그래서 처음에 기울기 초기하고 데이터자 예측하고 그 예측한 각과 실제값을 분류해서 라스마하고 역전파하고 가중 적이 하죠. 그런 다음에이 라스는 텐서잖아요. 파이썬의 숫자로 바꿔서 닝 라스 여기다가 이제 라스값을 계속 누적하겠죠.
468:33
Speaker A
그래서 f은 0부터 하니까 1이라 해서 쭉 가면서 전체 트레인 중에서 지금 러닝 라스가 몇 번입니다.
468:43
Speaker A
얼마큼 됐습니다라고 추억하기끔 그랬더니 지금 이렇게 폭이 돌면서 0.5부터 0.28 28까지 나와요. 자, 그런 다음에 모델 평가를 하죠.
468:56
Speaker A
테스트라 하고 모델 넣고 테스트로드를 넣어서 자, 평가 모드로 모델. 이벨이라고 평가 모드로 설정한 다음에 맞은 개수 이렇게 전체 개수 해야 나중에 애큐레러스가 나오니까.
469:11
Speaker A
자, 여기서 중요한게 이거였죠. 위드 토치 노그에 대해서 똑같죠? 테스트로드에서 이미지와 라벨을 갖고 오는 거죠.
469:19
Speaker A
그래서 모델 데이터 넣어서 예측하고 자 이게 여기가 밸류값 이게 원래 나오는데 얘는 안 쓰겠다 이런 뜻이죠. 포치의 맥스 아웃풋 결과물에 대해 h값에서 1인 거는 같죠. 뭐예요?
469:34
Speaker A
클래스별로. 그러니까 인덱스를 반해요. 인덱스 그니까 디밀이니까 이게 디밀션 1이란 뜻이죠. 프레비트 예측된 인덱스예요. 그래서 가장 높은 확률을 가진 클래스다 이거죠. 0번 클래스입니다.
469:52
Speaker A
얘가 인덱스가 0 1 2 이렇게 나올 거 아니에요. 그러면 얘는 0번 클래스입니다. 얘는 1번 클래스입니다.
469:58
Speaker A
총 열 개 클래스니까 0부터 9까지 클래스 네임이 있을 거야. 인덱스가. 그러니까 그 프레딕트가 나오고 타겟요 사이즈 0이라는 건 사이즈 치면은 우리가 두 가지로 나오죠. 하나는 낸 데이터와 그다음에 속성 종목 배치 사이즈를 말하는 거. 그러니까 사이즈 0 하면요 타겟의 실제값이죠.
470:23
Speaker A
실제값의 사이즈 0에 즉 n개를 토탈로 더 더해 줘야죠. 그리고 이게 아까 이퀄라이 같죠. 예측된 것과 타겟이 일치해.
470:34
Speaker A
그러면 트루잖아요. 1 걔를 다 더해서 아이템 파이 숫자로 바꿔서 코렉트를 증강시키죠. 100분로 나타내기 위해서 전체 토탈에서 코렉트 비율이 애스죠.
470:50
Speaker A
토수점 줄자라니까 8.3 성사가 나왔어. 여기까지 이해되시죠? 자, 마지막 코드인데 어쩔 수 없이 시간왕에서 라이브 코딩은 불가능하겠네요.
471:12
Speaker A
자, 돌려 보세요. 시각하니까 이렇게 나와요. 자 보시면 라이브를 이용해서 visualiz predictions라고 한 다음에 모델과 중요한 건 테스트로드죠. 테스트 데이터라는 배치도 돼 있는 테스트 데이터죠. 전체 이미지는 10개예요.
471:40
Speaker A
그래서 모델 이별이라고 선언하고 자 이거 유명한 거죠. 여러분 배웠죠? 하나씩 반복해서 배치단으로 던질 때 쓰는 거예요.
471:51
Speaker A
아이터레이션을 한 이터러블 객체를 넥스트 하면은 배치단으로 갖고 와요. 알죠? 이거 배우셨죠? 파이썬에서. 자, 테스트 데이터 로더를 아이터 이터러블 객체를 만들어서 얘를 넥스트하면 얘가 어떤 시 배치단이로 갖고 오는데 걔는 두 가지로 이루어져 있잖아요. 이미지와 라벨, 카리나 이미지, 카리나 맞죠?
472:23
Speaker A
그래서 모델로 예측 수행해요. 이미지 얘를 가져와서 모델로 하면 아웃풋이 예측이 나오고 여기서 코드 똑같죠.
472:33
Speaker A
예측 가장 높은 확률 여기 확률값이 나오는데 안 쓰겠다는 거예요. 인덱스 그 클래스를 선택하면 된데 클래스 이름을 내가 정의해 준 거죠. 티셔츠 트라우저 풀로버 드레스 코트 샌더 셔츠 스니커 이게 스니커즈가 그거죠.
472:55
Speaker A
그 운동화 그다음 백 앵클부트 이런 것들로 열 개가 돼 있는 거예요. 맞춤면. 그래서 전체 그림판 그려서 이미지를 하나씩 돌면서 그림을이 콤마 그 이미지에서 이게 몫시죠.
473:12
Speaker A
그리고 인덱스는 0부터 하니까 1 하나씩 가서 아쇼해서 각각 이미지의 인덱스에 해당된 애를 잘 보세요. 넌 파일로 바꾸 왜 시각화해야 되니까 지금 여기 텐서잖아요.
473:26
Speaker A
너 파일로 변경해서 스퀴즈 하면은 차원 하나 줄 줄여서 컬러맵은 그레이예요. 그레이 스케일로 바꿔죠. 그리고 자 보시면 클래스에 예측한 거에서 인덱스죠. 그러니까 그걸 풀이고 실제감은 클래세스에서 라벨이 돼 있는 인덱스죠. 그리고 여기에 각각 엑시스가 있어요. 원래 축이 있는데 그 축을 제거하고 그려 달라고
473:53
Speaker A
하니까이 우리가 원하는 삶은 이거죠. 함수만 호출하면 나오는 거. 모델에다 테스트로드 얻었더니 예측과 앵크보도 잘 맞고 폴로보가 이거 좀 긴 옷 있잖아요. 스웨터 우리나라 말로는 스웨터 같은 거죠 이거.
474:09
Speaker A
그다음에 트라우저. 어, 근데 이거 영광스러운데 이거 니 아니에요. 우리나라 브랜드인데. 자, 트라우저 셔트 트라우저 포트 셔트 샌드 스니커트 맞추죠.
474:34
Speaker A
여기까지 이해됐어. 아, 여러분들이 그래서 지금 쳐 봐야 될 것들이 있어요. 여기 내가 다치라면은 시간이 없어서 그랬는데 지금 남은 10분 동안 어 뭐 새로운 하기도 그렇죠. 여러분들이 제일 중요한게 요거 할 줄 알아야 돼.
474:58
Speaker A
알겠죠? 그리고 요것도 한 번만 쳐 보세요. 트루냐 폴스냐. 잘 보시고. 요것은 이제 아직은 안 해도 되는데 뷰에 대해서 다시 한번 고민해 보시고 어떻게 하는지 헷갈리시면 안 됩니다.
475:13
Speaker A
그다음에요 절차들 잘 보시고 항상 까먹지 마세요. 처음에 포분 올려 가지고 훈련할 때 옵티마제로 그죠.
475:24
Speaker A
어 그런 다음에 여기 테스트했다. 모델점 이별에서는 토치노죠. 그다음에 요거 또 설명하거나 그럴 때 되게 많아요.
475:38
Speaker A
쳐 보면 뭐 어차피 또 할 거니까 할 거긴 하지만 저 앞에 나오는 값은 밸류값 확률값이 나오고 0.7 저기 개가 근데 그게 뭐야? 개가 0.7 그게 뭔 말이야? 개가 될 확률이야.
475:54
Speaker A
개라고 예측된 확률이요. 개는 뭐야? 0번이요. 근데 정답 뭐야? 0번이요. 이런 거예요. 자, 그래서 요거 이해하셔야 되고.
476:10
Speaker A
그다음에 시각화 여기서 보시면 요렇게 가져오는 거 간혹 까먹으신 파이썬이에요. 그 여기 또 나오잖아요. 그리고 여기서는 시각화에서는 요것만 조금 해보 다시 한번 쳐 보시면 좋겠어요. 내가 이미지인데 얘는 뭐예요?
476:36
Speaker A
토치니까 넘지만 나와요. 아니면 안 나와요. 스킬즈 하면 차원이 1인 것들을 제거하는 거요. 그다음에 컬러면 자 마무리 잘 부탁하세요. 부탁해요.
476:50
Speaker A
자 마무리하고 계세요. 그러면 저는 그동안 여러분들 그 정산 작업 좀 할게요.음 음 순서대로 부르세요. 어 오늘까지 그러면서 여러분 다 나 다른 분들은 그 쭉 복습하세요. 고 아이고 풀 뻔했네.
477:58
Speaker A
안 막겠지? 어. 음. 또 새로운 분이 오셨군요. 어 환영님도 어요. 네. 좋습니다. 없으시죠? 우리 여러분들이 인원 대비원 맞네요.
480:31
Speaker A
이 좀 이번에는 적은 걸로 알고 있는데 어네 질문 있으면 남은 4분 정도 남았으 하시고 그 보통은 커피 나중에 여기 세 번 3단에 드린 분들은 커피폰을 드리긴 하는데 저번 기수분들은 뭐 이런 저도 인형을 원해 가지고 인형 원하시는 분 혹시 있으면 어 짱 오라 오락시에서이
481:03
Speaker A
기어를 받고 있어요. 아시는 분이 거기서 맨날 1등을 하셔 가지고 어 할 기분 드릴 거 보여 드려요?
481:15
Speaker A
너무 커 가지고 보여 드릴게요. 잠깐 기다리세요. 이러니까 무슨 성급 파는 사람 같잖아. 그죠?이 정도 크게 돼요.
481:40
Speaker A
에, 또 한 분은 일본 제품인 피규어. 어, 예. 이런 거 그래서 뭐 참고하실 거예요. 음.
481:57
Speaker A
이게 뭐냐면 그 저랑 같이 개발 회사 같이 하시는 분께서 시미가 그분은 그걸로 운동해요. 점심 먹고 강남년 가면 그 짱 거기가 신령이 있거든요. 저희께 말씀이 그 강남역년 가면 짱오락실이 세 개 있어요. 거기서 다 블랙리스트 거기에 인형 다 싹스해 가지고 전국
482:20
Speaker A
2등이에요. 그 농구 같은 거 있거든요. 어 그니까 사 그러니까 건강을 위해서 그분 해요. 그 직원들이 좋아해. 밥 먹고 사장님이 두 시간 사라져 있으니까.
482:34
Speaker A
가서 오후 2시까지 그 2두시간 동안 농구를 하시는 거예요. 근데 나 저도 한번 해봤는데 전 한 꼴도 못 들어갔어요.
482:45
Speaker A
그까 어떻게 그렇게 잘하게 됐냐 그랬더니 아이가 어렸을 때 어린이 집 가는데 어린이 그 놀이터 있잖아요. 거기에 그 농구 던지는게 있대요. 그래서 그거를 심심하시니까 애 보면서 그걸 매번 하셔 가지고 이제 그게 이제 제 2회 그래서 이분은 이걸로 영업하세요.
483:09
Speaker A
어 항상 전화가 그래요. 어떤 분 대표님 만나면 혹시 따님이나 아님 있으세요? 어 그러면은 인형 들고 가세요.
483:19
Speaker A
좋아하시죠? 어 근데 이거 꽤 비싸요. 그 그 미미소인가 마미소인가 그 좀 다위소 비슷한 그 중국 중국가 있더라고요.
483:37
Speaker A
강남역에. 근데이 지금 보여 드린게 54,000원돼 있던데. 그 아무튼 그렇게 알고 계시고 어 원하시는 분은 나중에 여기에 대신 열심히 해서 등수 들어와야 돼요. 어 다시 너에게 힘 어 일단은 그 뭐가 될지 몰라요. 그분이 이제 뭐 해 달라고 하면 제가 물어놓을
484:08
Speaker A
볼게요. 나중에. 자, 여기까지에서 또 궁금한 거 있으면 또 질문하시고 뭐 설명이 너무 완벽했나요? 질문이 없네. 아, 그래요? 아시죠?
484:25
Speaker A
그럼 50초년. 자, 오늘 수고 말하셨습니다. 자, 내일 어 또 즐겁게 공부해 보도록 할게요.
Topics:선형 회귀기초 통계회귀 분석최소 제곱법딥러닝가중치편향다중 공선성역전파파이토치

Frequently Asked Questions

선형 회귀와 분류 문제의 차이는 무엇인가요?

선형 회귀는 출력값이 연속적인 실수형 데이터로 수치를 예측하는 문제이며, 분류 문제는 출력값이 카테고리로 구분되는 이산적인 문제입니다.

최소 제곱법(OLS)은 어떻게 작동하나요?

OLS는 실제 관측값과 예측값의 차이인 잔차를 제곱하여 모두 더한 값을 최소화하는 회귀선을 찾는 방법으로, 잔차 제곱합을 최소화하는 것이 목표입니다.

딥러닝에서 선형 회귀가 어떻게 확장되나요?

딥러닝은 여러 층의 뉴런을 쌓아 선형 회귀를 확장하며, 미분과 역전파 알고리즘을 통해 가중치와 편향을 반복적으로 업데이트하여 모델을 학습합니다.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →