YouTube Video — Transcript

라벨 스무딩과 크로스 엔트로피를 활용한 모델 학습 및 평가, 확신도와 정확도 분석, 시각화 방법을 다룹니다.

Key Takeaways

  • 라벨 스무딩은 모델의 과신을 줄이고 일반화 성능을 향상시킬 수 있다.
  • 적절한 스무딩 값(alpha)을 선택하는 것이 중요하며, 0.1 정도가 보통 최적이다.
  • 테스트 정확도와 확신도는 스무딩 강도에 따라 다르게 변화하며, 무조건 감소하지 않는다.
  • 모델 평가 결과는 표와 그래프로 명확하게 정리하여 보고서와 발표에 활용해야 한다.
  • 캘리브레이션은 모델의 신뢰도와 실제 정답 확률을 일치시키는 중요한 과정이다.

Summary

  • 라벨 스무딩과 크로스 엔트로피 개념 및 적용 방법 설명
  • PyTorch를 이용한 학습 및 테스트 과정에서의 아그맥스, 넘파이 변환 등 코드 구현 설명
  • 훈련 및 테스트 데이터에 대한 정확도와 확신도 계산 방법 소개
  • 스무딩 값(alpha)에 따른 모델 성능 변화 및 최적값 탐색 과정 설명
  • 결과를 표와 그래프로 시각화하여 비교 분석하는 방법 제시
  • 라벨 스무딩이 모델 과신 방지와 캘리브레이션에 미치는 영향 설명
  • 스무딩 강도에 따른 테스트 정확도 및 확신도 변화 관찰
  • 모델 평가 시 표준화된 보고서 작성과 발표 시 유의점 안내
  • 캘리브레이션 개념과 3D 렌더링과의 연관성 간략 소개
  • 실제 실험 결과를 바탕으로 한 관찰과 해석 방법 강조

Full Transcript — Download SRT & Markdown

12:11
Speaker A
자, 여러분 파이팅 한번 하고 시작합시다. 파이팅 한번 하고 수세요. 네. 좋아요. 자, 이제 여기까지 다실 이해되셨죠?
12:26
Speaker A
여기까지는 뭐 트럭 어려운 거 없죠? 그냥 스무딩이 0이면 없는 거고 그러니까 크로스 엔트로피라고 아니면 라벨 스무딩을 쓴다 그 뜻이니까 특별히 어려움은 없을 거예요. 그다음에 코드가 좀 긴 것뿐이지만 계속 보시면 반복돼요.
12:46
Speaker A
리드 코치 노래드 코치에 자 이게 중요해요 아그맥스 나오죠 아웃풋 디멘션 1 이제 따로 이거 설명 안 해도 되죠 아그맥스 하면 두 개가 나와요. 밸류값과 인덱스가 나오는데 올리티 1 자 뭐예요? 뭐만 갖고 와요? 어 인덱스만 가져오겠죠.
13:19
Speaker A
그래서 트레인이 예측한 거죠. 자, 큐스코 할게요. 에큐스. 그래서 y트레인하고 트레인의 레트 요거 요거랑 실제 내가 했던 와이프레드 한 값이랑 잘 비교해서 하는데 주의할게 있어요.
13:58
Speaker A
얜 토치란 말이에요. 포츠 아그맥스의 디멘션에서 트냈으니까 이 액스코는 사이키논이에요. 그기 때문에 뭐로 바꿔 줘야 돼요? 넘파이로 바꿔 줘야 돼요.
14:14
Speaker A
이런 것들이 적 있어요. 보시면 얘가 테스트 데이터로 어 잠깐만요. 얘는 훈련도니까 트레인의 글쓰죠. Y 트레이닝과 예측값 y 프레드 같은 게 지금 트레인 프레드잖아요.
14:42
Speaker A
그걸 넘은 거죠. 자, 그런 다음에 트레인의 ACS에다가 업드해서 뭘로 트레인 ACS 이렇게 하시면 되죠.
14:57
Speaker A
자, 그런 다음에 이거 좀 조심해야 될 게요 트레인하고 같이 이제는 테스트 이밸루에이션 여기 학습이니까 여기 테스트 여기에다 봐야 되고 여기에 우리가 그래서 이렇게 코드가 길어지면 좀 명식적으로 표시해 줘야죠. 아, 모델 점이밸루에이션 이제 평가할 거구나.
15:20
Speaker A
그래서 위드 푸치로 노래드 이렇게 하셔야 돼요. 그래서 모델에다가 X의 테스트 데이터를 넣는 거야. 근데 포칭이니까 t죠.
15:38
Speaker A
펜서하니까 테스트 아웃풋이 나옵니다. 포츠에 똑같이 아그맥스 테스트 아웃풋에서요 테스트 아웃풋이 예측값이잖아요. 여기서 1을 한 거를 여기가 테스트 프레드라고 만들어 주시고 자 여기서 좀 조심할게요. 소프트맥스 쓰는 거죠.
16:13
Speaker A
테스트 아웃풋과 걸 디멘션 1로 클래스 1로 서프트맥스를 해요. 커브를. 그러니까 얘는 테스트 프스가 되는 프로바빌리티 큐스코어 요걸 이용해서 Y 테스트와 테스트 프로파를 얘가 테스트 ACC라고 하고 쓸모 없는 게 저기 나왔네.
17:00
Speaker A
일단 여기까지 이해되시는지 잘 보세요. 토시라도 이해 안 되면 질문하시고 한 1분 정도 드릴게요. 테스트 아웃스 요거 그런 다음에 우리가 뭐 해야 되냐?
17:30
Speaker A
예측 정확도를 해야 돼요. 정확도보다는 예측 확신도 그 확신 그러면 뭐야? 최대 확률 확변 합니다.
17:41
Speaker A
코치에서 맥스 테스트 왜냐면 여기 프로빌리티니까 평용값이 제일 높은 건 요거 갔을 때 가장 큰 값에 각각했을 때 0.7 0.2 0.2 나왔잖아요. 그 중에 제일 큰가?
18:07
Speaker A
맥스 프러스 평용값이 제일 높은 거 확실 그리고 맥스플러스의 평균 있는 그걸 파이썬을 숫자로 바꾼 것이 토치니까 아이템 얘를 에버리지 퓨터스 츠 확신을 합리트가 나올 건데 얘를 스무딩한 겁니다.
19:03
Speaker A
다라고 이렇게 만들어 놓고요 스무딩에 이제 키값이 설정할 수 있죠. 트레인 마시스 얘는 트레인 마시스 레인 ACCS 마 패스트 ACC 그다음에 너스 베스트 이렇게 키밸류 만들어요.
20:11
Speaker A
자, 그러면서 페인트에서 최종 훈련 손실을 보종입니다. 그걸 잘 보셔야 돼요. 이렇게죠. 페인 라스죠. 여기에 마지막 거 쭉 라스랑 액큐러스가 쉽게 나오잖아요. 그게 마지막 거 최종 훈련 저도가 있겠죠.
20:52
Speaker A
얘는죠. 어 이게 이걸 리저트 왜 이게 왜 컨텐트 S가 빠져가지고 음. 자, 그래도 또 복사해서 여기다가는 이제 뭐 할 거냐면 음 테스트 종합도 제일 중요한 원인 패스트 얘는 뭐 훈련한 게 아니라 마지막 나온 거니까 이렇게 하이스 이렇게 돼.
22:27
Speaker A
복사하고 아까 마방에 했던 확신도 있죠. 평균 확신도 에리지 컴피스 음 음. 음. 점 4 렐루가 없다고.
23:20
Speaker A
아 이거 유조 잘못 썼네요. 렐루에서 여기에 이제 에러스 층이 뭐냐면 아까로 어디 갔어? 뭘까? 음 여기 있죠.
23:47
Speaker A
멜로를 어떻게 써야 되죠? 여기 보시면 자 R 예 이렇게 써야 이게 없다고. 예규님 어 뭐야 레 그 사이에 어 왜 이렇게 잘 알지? 네 네. 이렇게 한번 꼬이잖아요. 그럴 때는 여기서부터 다시 쭉 돌 쭉 돌 이제 나오죠.
24:34
Speaker A
로라고 하신 분들 1점 드릴게요. 다. 자, 이 일단 마블 스무딩해 가지고 지금 보면 처음에 없고 없을 때는 어 이게 최종 훈련 손실 0.38의 최종 정확도 0.87 0.86 86 정도 이게 이제 제일 중요해요. 86% 성경 시승 83이에요.
25:03
Speaker A
어 그다음에 이제 스무딩이 됐을 때 이거를 어 출력할 때 좀 이쁘게 출력해야 일단은 뭐 이렇게 지금 나왔죠. 각각 이제 F스트 더 이쁘게 쓸 거고 일단은 없을 땐 이러고 스무딩이 하나씩 하니까 0.05일 때는 이제 그다음 여기 근데 이제 구분이
25:32
Speaker A
안 되죠. 어 그래서 좀 이쁘게 좀 있다가 대각을 해 봐야겠네. 주되게. 그래서 지금 여기 86개고요.
25:43
Speaker A
라벨스무딩 했을 때는 어 좀 떨어질 거예요. 항상 85 커지죠. 어 태도가 887 어 오히려 안 떨어지고 괜찮네.
26:00
Speaker A
이렇게 나왔습니다. 나중에 이게 분석 보고서 쓰는 형식으로 이제 출력이 되니까 여러분들에게 여기다 한번 쓸게요.
26:45
Speaker A
자, 이제 보면 성능 이제 여러분들이 이런 거 보고 성능 요약을 좀 하셔야 돼요. 원래는.
26:53
Speaker A
그래서 꼭 스무딩 즉 스무딩에서인 스무딩 밸류 있죠. 여러분이 스무디 밸류스 이렇게 가요. 근데 이제 이게 잘 모르겠으면 요거를 먼저 쳐보시나요?
27:19
Speaker A
이렇게 나오죠. 네 네 개잖아요. 이 중에서 어느 게 좋냐 이거예요. 하나씩 돌면서 리트에 쓰면 자 이것도 잘 모르시겠으면 이거잖아요.
27:38
Speaker A
이렇게 나오죠. 각각에 대해서. 그래서 여기서 이제 하나씩 돌겠죠? 요거를 리트라고 할게요. 하나씩 돌았으니까. 그래서 한번 찍어 보겠습니다. 어떤 게 더 좋은지.
28:05
Speaker A
F스트 내가 스무디인데 이렇게 스트인데 내가 이렇게 있었나? 이렇게 하면 지금 말씀할 거예요. 이렇게. 그리고 하나 더 붙일게요.
29:19
Speaker A
패스트 에큐스 이렇게 하시고 그러다가 12.4 4 정도 이렇게 하시면 되겠습니다. 그다음에 리트에 여기는 에버리지 컴플러스요.
29:55
Speaker A
그러면 요게 지금 아 요걸 하나 쳐야겠다. 이렇게 하시죠. 넣쳐서 이렇게 나오잖아요. 유라인이란 뜻이군요. 칸대 이렇게 돼요.
30:30
Speaker A
차에 얘기 한 칸 띄워 줘야. 그리고 프린트를 해서 F스이 미세 조정하는 방법인데 나중에 갖다가 복자했어서 조금씩 조정해 쓰시면 돼요. 여기 알파요.
30:51
Speaker A
방법 알아두면 좋으시니까 이게 알파거든요. 근데 이제요 포맷에 요렇게 가잖아요. 여기 이게 글씨가 나오게 하려면 열 칸 정도 이어요. 많치 웃는 거 같죠?
31:13
Speaker A
찍혀 나오죠. 이 스트 안 해야 돼요. 총 네 개 나올 거니까 여기다가 이제 조금씩 해 볼게요. 음 얘만 좀 독서해 놓으시면 돼.
31:31
Speaker A
옆으로 띄어 가지고 그래 가지고 여기다가는 트레인큐. 그리고 이렇게 아 얘가 이걸 찍어 보죠. 이렇게 나오죠. 아 얘 좀 더 해야겠네.
31:53
Speaker A
한 열 칸. 여기 칸 옮기는 거예요. 어 맞죠? 응. 미세 조석 나와 찍어 가지고 이해되시죠? 얘는 지금 알파값이 네 개고 트레이리스 변하고 그다음에 F해서 테스트 얘는 한 10 2 정도래 그죠?
32:31
Speaker A
그다음에 컨피던스 확신도 얘도 대문자 알파로 하는 게 좀 호이 나겠네. 됐죠? 그래서 이렇게 만들어 놓고 자 여러분들이 어디냐?
33:07
Speaker A
재미 아이가 이런 건 잘해요. 어 재미한테 도와줘 하시면 돼요. 그래서 재미 아이한테 요거 이렇게 복수한 다음에 표 만들어 줘. 이렇게 하시면 돼요.
33:34
Speaker A
보기 좋게 만들어 주죠. 어, 그 복사해서 어, 만들어 주시면 돼요. 알겠죠? 뭐지? 보고서 쓰는 법 가르치는 거 같아요. 그죠? 자, 그래서 요거 요렇게 정리를 하셔야 돼. 항상 여러분들이 어 논문 쓸 때뿐만 아니라 회사에서도 그렇고 보고서 쓸 때도 그렇고 그
33:59
Speaker A
발표할 때도 그렇고 항상 표로 정리가 돼 있어요. 마지막은 모델 비교표 아니면 지금 한 것들에 대한 비교표 그리고 여러분 주장을 왜냐면은 숫자만 믿거든요.
34:15
Speaker A
데이터는 거짓말을 안 한다고 보니까 일단 있는 그대로니까 원래 정의가 어 그런 다음에 얘를 갖고 이제 이제 직관적으로 할 때는 여러분들이 그림을 그리는데 이제 그 그림은 어펜스 여러 개를 뒤에다가 보여 주는 상관없지만 실제로 여러분 발표할 때는 너무 많아도 안
34:37
Speaker A
좋 가장 임팩트 있는 거 한 두 개 어 그렇게 생각하시면 되겠습니다. 표는 반드시 정리해야 돼요. 자, 그러면 지금 우리 지금 한 내용을 보고 우리가 어떤 걸 했냐?
34:55
Speaker A
여기 지금 테스트 데이터가 오히려 상승됐어요. 스무딩을 했는데 스무딩 하면 원래는 에큐레스가 떨어져야 정상이잖아요. 그죠?
35:07
Speaker A
식적으로 노이즈가 섞였으니까. 왜 라벨 스무딩 한대요? 모델이 자기가 그걸 정답이라고 모델이 과신하는 걸 막기 위해서 노이즈를 좀 넣어서 조종해 준 거죠.
35:22
Speaker A
맞잖아요. 근데 오히려 테스트 에큐레스의 정확도가 현상이 가다 그래서 여기 제가 그랬죠. 올라와라. 왜요? 첫 번째 스무디를 찾았는데 관찰. 자, 이게 뭐냐면 관찰이에요.
35:43
Speaker A
관찰은 그냥 팩트 그대로 여러분 보고서는 자기 의견이 들어가면 안 돼요. 원래는. 그래서 요거에 대한 나중에 분석은 여러분 의견이 들어가지만 분석한 결과물에 대한 해석 걸 써야 돼요. 해석이라고 여러분 의견 넣을 거면 마지막에 넣는 거고 처음에 관찰은 그냥 있는 팩트예요. 그래서 실제로 뭐 논문
36:05
Speaker A
같은 데 뭐예요? 팩트 이렇게 써 있어요. 그래서 라벨 스무딩을 하니까 테스트 종목가 올라가네. 반응 이렇게 써요.
36:25
Speaker A
상승이 됐죠. 오히려 여기는 떨어졌는데 알파 값을 0.1을 했는데 어 오히려 향상 내고 0.1인데 있는데 향상 내는 걸 발견해요.
36:37
Speaker A
확신도가 중요하다고 그랬잖아요. 이 평균 확신도죠. 평균 확신도는 감소했죠. 지금 보면 64까지 72 여기 써 있죠. 알파 값이 너무 크죠.
37:08
Speaker A
제가 여기 0.05 0.2로 했더니 테스트 액스가 오히려 0.10이 좋았고 0.20을 하니까 다시 감소했어요. 여기는 그림 공부인데 사실 중요한 게 있어서 쳐 보면 좋은데 이거 결과 나올 때까지 이제 거의 한 20분 넘게 쳐야 될 것 같아서 시간화 코드를 드릴게요.
38:03
Speaker A
그리고 설명을 할게요. 그리고 여기다가 plt 쇼하세요. 그리고 그림 보면서 하는 게 더 빠르니까. 자, 시각합니다. 2네 개죠.
38:38
Speaker A
14 4짜리에다 그리고요. 10짜리에 첫 번째는 첫 번째 학습 곡선을 구해야 해요. 0 x의 첫 번째죠. 자, 이런 식으로 할 수 있구나. X 0 그래서 행렬 구조처럼 0 1 1 0 0 그렇죠? 11 이렇게 컬러들을 준비하고 집합수로 스무스 밸류스와 컬러들을 하나씩 포문으로
39:07
Speaker A
묶어서 아까 리트 스무등의 트레인라스만 접근해서 라시스라 해서 그 라시스에 따라서 라벨 알파 그죠? 스무딩 값 라인 컬러 그래서 앱이 변할 때 트레이스가 어떻게 변했는지 보겠다는 거예요.
39:28
Speaker A
디퍼런트 즉 다른 네 가지였잖아요. 네 가지 스무딩이 있었죠. 알파 값 거기에 대한 트레이닝이 어떻게 변하는지를 보여 줘. 자 그랬더니 이렇게 변했어요.
39:40
Speaker A
지금 여러분들 말듯이 요렇게 변하고 있죠. 알파 값은 0일 때 올라가는데 얘 너무 크게 가니까 트레이너스는 요렇게 하고 있습니다.
39:55
Speaker A
자, 두 번째는 에시를 보겠다는 거죠. 정확 2네. 자, 이걸 잘 보셔야죠. 뭐냐면 스무딩 밸류가 네 개잖아요.
40:07
Speaker A
하나씩 도면서 그 리절치에 해당하는 스무딩 거기에 트레인 액큐레스의 제일 마지막 거 마지막 값을 다 리스트로 묶어서 트레인 액시에 파이널을 하고 자 또 하나 테스트 액시는 똑같이 수문의 밸리드 하나씩 돌면서 거기에 해당하는 테스트 에큐C를 리스트로 담아 리스트 컴플레이션 제가 왜 클래스 리스트 컴플레이션
40:35
Speaker A
강조한지 알겠죠 어 핵심 코드는 다 이렇게 나오잖아요. 음. 자, 그래서 넘파이의 배열로 스무딩 밸류를 그 전체 길이죠. 거기를 어레인지 한번 써서 범위를 정의해서 X의 포지션하고 위드는 이제 옆에는 이제 0.35고 그래프를 두 개 여기 하면 동시에 그려지죠.
41:03
Speaker A
x 그래프는 x의 포지션에서 빼기 위드 2로 나눈 거기에 트레이닝 파이널과 테스트 두 개를 비교하겠다는 거죠. 나머지는.
41:17
Speaker A
자, 그래서 이건 트렌이고 이건 테스트고 결국 액큐리스 따라 액큐리스가 어떻게 변하는지를 보겠다. 그리고 틱은 X의 포지션이고 스무싱 밸루에 하나씩 스무싱 가면서 개 S를 표현해 달라. 팁 라벨를. 그래서 스무딩 알파라고 X에다가 라벨링을 해 주고 레전드 만들어 줘. 법리 만들어 주고 그
41:43
Speaker A
그리드라고 해서 격자위를 y는 x에다만 그래서 거기는 그 리미트 정한 거죠. 0.5에서 1.5에서 4까지. 그런 다음에 이 두 개에 대해서 하나씩 돌 빠을 돌면서 그 빠들에서 빠을 돌면서 어떻게 돼요? 하이트 가져와. 제가 원래 갖고 있던 높이를 가져와서 하이트를 하고 텍스트는 똑같죠. 지금 보시면
42:10
Speaker A
자, 그래서 그림 보시면 이렇게 그려줬어요. 그랬더니 어 정확도나 테스트인데 제일 중요한 게 어 여기 제일 좋지 않아요?
42:21
Speaker A
더 높으니까 아니요. 요 녹색 테스트 데이터가 가장 높은 게 제일 좋은 거예요. 알았죠? 어 실제 남이 와 가지고 해도 똑같은 성능을 어 내야지 되잖아요.
42:38
Speaker A
그래서 자 세 번째는 확신도 비구예요. 컨피던스인데 어떻게 했어요? 스무스 밸류에서 하나씩 스무스 밸류 가면서 그거에 해당하는 에버리지 컨피던스를 리스트로 묶어서 컨피런스라고 했죠.
42:55
Speaker A
그러면 거기에 하나씩 스무시 도면서 S라고 빠래프를 그려주고 여기에 여기에 해당하는 컨피
43:09
Speaker A
그거는 블랙 그다음에 0.7만큼 친 거 라빌링은 스무스 알파에 따라서 에버리지 컨피던스가 어떻게 변하느냐 그걸 알고 싶으니까 그 모델 컨피던스 모델 확신도라고 하고 션 이게 확신이 점점 줄어지는 걸 볼 수 있어요. 그렇죠? 알파값이 증가할수록 어차피 왜 그 당연한 거예요? 알파
43:41
Speaker A
1 - 알파가 컴퓨터 그죠? 어. 자, 그런 다음에네 번째는 확률 분포예요. 첫 열 개만 갖고겠다 이런 거죠. 그니까 0과 0.1의 차이를 보고 싶다는 거야.
43:58
Speaker A
리절트 여기가 올해 그 알파값 들어가는 데다가 집어넣고 테스트 프로빌리티 실제 넣고 열개까지만 넌 파일 바꿔서 하나는 스무스가 없는 거고 하나는 있는 거잖아요. 그래서 열 번을 레인지 0부터 1 9까지겠죠. 샘플 인다이스이라고 해서 얘가 리스트 0부터 9까지. 그래서 하나씩 돌겠죠. 그때 가장 큰가?
44:26
Speaker A
요때 가장 큰가? 하나는 스무스가 없는 거, 하나는 스무스가 있는 거 임의로 뽑아서 집어넣었죠. 그런 다음에 그림을 그려 달라는 거야. 이거 두 가지를 가지고.
44:39
Speaker A
자, 그런 다음에 얘는 동굴뱅이에 이렇게 어 돼 있는 거고 이제 선의 두께 마커 사이즈. 그런 다음에 여기 어디가 중요한지 모르니까 H 하면 호라이징 이렇게 빨간색으로 1내 이제 기준선을 만들어 주고 샘플 인덱스에 따라서 가장 최대의 확률 그다음에 이거를 두 가지죠. 왼쪽에는 스무스가 없는
45:09
Speaker A
거 있는 거 그렇게 샘플당 컴퓨터가 얼마나 되는지 보여주고 아 나머지는 그냥 보시면 돼요. 이렇게 열 개만 뽑았더니 여기서 나오는 결과가 뭔줄 아세요?
45:40
Speaker A
거예요. 이렇게 이거 결과 해석 어떻게 해요? 몇 설명할 수 있죠? 자, 그래서 요걸 최종 요약한 거를 드리겠습니다.
48:01
Speaker A
보시면 이거죠. 패싱 개념은 라벨 쓰면요. 정답 라벨을 부드럽게 만들어 준다 이죠. 1을 실제로 이렇게 0.93 0.03.03 3 오버컨 conf컨피던스를 방지 국가는 일반 성능이 항상 과저가 방지하고 어 그다음에 모델 캘리게이션이라고 해 가지고요 이제 모델이 깨지거나 그런 것들을 방지해 주는 거예요.
48:33
Speaker A
어 하이퍼 파라미터는 0 스무딩 없고 이게 표준이 0.1이고 강한 스무딩이 0.2인데 인데 별로 좋지 않아요.
48:59
Speaker A
그래서 대규모 때는 알파 0.1 하고 작은 데이터는 사용 안 합니다. 보통 0.05. 그냥 그렇게 보시면 되겠습니다.
49:19
Speaker A
그래서이 이게 이제 어디서 나오냐? 캘리브레이션이 우리가 이제 3D 렌더링에서 나와요. 그니까 조화롭게 잘 만들어 주겠다는 뜻이야. 잘 정교 작업이란 뜻이거든요. 그가 뭐냐면 이거는 그때 또 나오니까 개념만 설명을 잠깐 드리면 모델이 확률 신뢰도가 있죠.
49:43
Speaker A
프로티 뭐라고 하는 그것이 실제 정답 확률과 일차하도록 교정하겠다. 이런 뜻이에요. 알겠죠? 캘리브레이션의 뜻이. 어 그래서 이제 실제로 뭐 우리가 나중에 스트리 랜더링 가면 2D로 사진을 찍는데 그 사진에 있는 것이랑 그걸 이제 확장해 가지고 렌더링 해 가지고 마치 우리가 보지도 않았는데 다른 것들을
50:13
Speaker A
한 것처럼 이제 볼륨룸 렌더링이라는 기술으로 만들어요. 그때 실제로 내가 짓진 않았지만 보 지금 여기서는 보이지? 사진에는 보이지 않는 것 내용이지만 마치 진짜처럼 정교하게 하는 작업들을 캘리브레이션이라고 합니다.
50:36
Speaker A
그 기술이 어디에 들어가냐면 나중에 제일 아예 내장돼 가지고 들어가 있는게 VRAR 할 때 버추얼 리얼리티 그렇게 되는 거죠.
50:50
Speaker A
실제로 근데 우리 쪽에서는 어떻게 되냐? 시뮬레이션을 돌리잖아요. 마치 사물에 있는 것들을 그대로 시뮬레이터를 통해서 우리이 안으로 가져와 가지고 테스트하는 것을 어 그런 개념을 갖고 있는게 디지털 트윈이에요.
51:08
Speaker A
어 그래서 그것을 여러분이 해요. 프로젝트. 어 그니까 그래서 저희 프로젝트를 하면 취업이 안 될 수가 없어요. 그만큼 어 빡세겠죠.
51:24
Speaker A
기간에 너무 많은게 들어간다고 생각하시면 돼요. 그렇죠? 어 근데 그래야 추업이 돼요. 그니까 왜냐 여기 수요생 중에 진짜 끝까지 남아 가지고 프로젝트를 끝낸 친구들은 취업이 잘하더라고.
51:42
Speaker A
왜냐면 이런 거지. 원호님이 왔어. 이거 할 수 있어요? 어, 이것도 할 줄 알아요. 이것도요. 이렇게 되는 거예요. 그렇죠? 어. 아유, 제가 막고 제 인간이 포기했어요. 3개월 동안 이제 이렇게 되는 거죠. 어, 그래서 버텨야 돼요.
52:05
Speaker A
버티시라고. 음. 자, 그 3번이에요. 아, 여기까지 했고. 자, 4번 돌려 볼게요. 음. 4번이 준비가 된다고.
52:29
Speaker A
예. 또 해 볼까요? 예. 좀 많이 들어야겠네요. 시간 관계사 이거 오늘 못 끝낼 거 같긴 한데 일단은 그래도 최대한 해 볼게요.
52:50
Speaker A
어 6기 이후에 처음으로 어 4번을 돌려보네. 아 7기 때 돌렸어. 플래스 불용 대응과 어 고민입니다.
53:24
Speaker A
일단은 계속 하나씩 줄게요. 고기 때문에 한글지 때문에 여기까지 하시고 여기서 레이션 자 시작하셔야 돼요. Ah.
55:00
Speaker A
자, 이겁니다. 우리가 파트 3 4 5인데 요거죠. 얘를 다 보는 거예요. 할 수밖에 없어요.
55:11
Speaker A
옵티마이저 넘파 PLT 다 만들어는 거야. 데이터셋이션과 리그레션 그다음 모델 셀렉션 트레인 테스트 테스트리it트 그다음에 스탠더 스킬러 우리 표준화 그다음에 평가 기준 평가 지표죠. QS와 F1와 MA요 제성 뭐예요? 다시 반복해가 쓸 수 있게 CD값 설정해야죠.
55:42
Speaker A
자, 처음에가 회기 손실 함수예요. Ja. 네개까지 합시다. 얘가 정답이라는 거야. 예제. 그 예측값이 있겠죠?
56:41
Speaker A
얘도 만들어 드릴게요. 얘는 한 12 19 어 얘 35 얘는 한 38 이런 여러분이 원하는 대로 만들어 돼요.
57:01
Speaker A
C 라스에서 와이트로 하고 와이프레드 이렇게 하면 이렇게 나오거든요. 이게 뭐냐면 MS죠. 각각의 차이 아까 그다음에 여러분지 L1 브라스 이렇게 Na은 큐버 이렇게 그래서 이렇게 세 가지는 나중에 요거는 여러분이 넣으면 되고 요거는 항상 각 코드 복색에서 붙이시면 돼요.
57:55
Speaker A
그래서 각각 똑같이 한 번에 여기다 붙게요. 이렇게면 한 번에도 채워 나오거든요. 어 근데 지금 여기 보면 다 텐스로 나오잖아요. 그러니까 어떻게 해야 돼요? 아이템 이렇게 하시면 되죠. 그때 어 여기 컨트롤 C 점 아이템 그러면 지금이 휴보다스가 제일 어
58:33
Speaker A
적게 나오는 거 볼 거예요. 근데 여기다가 지금 어떻게 복습하는 건 똑같죠? 이상치를 포함하게 될 경우에 여기다가 조금 요거잖아요. 요건 요건데 아까 했던 것때 교재에서 요건데 얘를 100 하나가 큰 온차가 나온 거죠.
59:15
Speaker A
Y프레의 아웃라이언 이렇게 해서 요거 세 개 요거 그대로 다 복사하셔 가지고 보면 되죠. 뭐만 바꾸면 돼요. 트루 대신요 와이프드 대신 요걸로 바꿔 주면 되죠.
59:39
Speaker A
도망 아 ma는 나 갖고 왔나? 어 아 MS를 내가 안 했네요. 아 난리났죠. 하나 잘못했더니 음.
60:12
Speaker A
리스큐에는 8.5인데 1200. 그렇죠. 이상치 하나 때문에 이렇게 크게 여러분들 생각해 너무 그죠? 어. 아 거꾸해야지.
60:43
Speaker A
8.5. 몇 배예요? 예, 144배에 그냥 가혹 행위를 하고 있어. 그렇죠? 어 페널티. 그래서 MS는 여기 이제 너무 심하단 말이에요.
61:01
Speaker A
이렇게 5차의 이상치 하나 때문에 흔들려 버려요. 어 그래서 2.5 8전이죠. 얘 18전이요. 아 어찌됐든 얘 때문에 얘가 지금 단위가 틀릴 정도잖아요. 공이 하나 더 있으니까 당연히이 정도는 건 그럼 너무 잘 나오는 거죠.
61:23
Speaker A
모두 농차가 동등하게 나오는 거. 실제로 18.75가 나온 거죠. 그래서 정리를 해 드리면 자 뭐라 그랬어요? 144 이렇게 정리할 수 있고 여기에다가 정리한다는 거 결국 뭐예요?
61:54
Speaker A
할까요? 자, 여기다 이제 뭐 할 거냐면 분류 손실 함수를 말해. BC까? 해소로네 실제 다 정답인 거야.
63:29
Speaker A
Y 근데 이제 빈이라고 바이너리 이렇게 쓸게요. 그래서 얘를 좀 복소해서 두 개 복소하세요. 숫자를 좀 바꿔 볼게요.
63:58
Speaker A
0.9 0.N 0.85 0.15이 정도. 그러면 지금 뭐예요? 확신이 있는 거죠. 얘는 H피던스라고 할는 0점 확신이 좀 없는 애 0.4 0.55 0.45 이렇게 풀어낼게요.
65:00
Speaker A
컴퓨터 사이즈니까 언설트 이런 식이죠. 이렇게 했으면 끝이야. BC 왔어. 얘를 우리가 BC라고 그 보통 인사스 만 쓰고이 BC를 이용해서 와이프레드의 컨피던스 Y트비로 두 개를 비유해야잖아요.
65:37
Speaker A
얘가 라스피스 얘는 불락 UNC 갖고 라스 UNC라고 만들 아 이거 트루라고 했네. 어 아직 안 돌렸죠?에 빼 찍어 볼까요?
66:26
Speaker A
이렇게 해야 되죠. 얘하고 두 가지겠죠? 그러면은 얘는 확신이 있는 얘는 확신이 없으니까 확 늘어나죠. 손실이. 그래서 여기서 하고 싶은 말은 여기까지 괜찮나요?
67:20
Speaker A
음. 이해되시죠? 아, 이게 특이가 좀 힘들어. 잠시만요. 요거든요. 예. 지 이거잖아요. 두 개를 비교할 뭐가 좋아요?
68:10
Speaker A
이거 이거예요. BC with logic L 알았죠? 어 스라고 하면 왜요? 아예 시그모이드를 바꿔 버렸죠. 예.
68:42
Speaker A
모이드가 글단값에서는 폭파하고 그런 경향이 있으니까 수치가 불안되는 수치적 안정성을 위해서 비스로 logic스라스를 쓴다. 자, 그다음에 라메스 열심히 했으니까 아까 했던 거랑 코드가 비슷해서 어, 요거는 코드를 들리면서 여기 내장 돼 있거든요. 파이썬 이제 요건 최신 버전이니까 어 그다음에 계속 라벨 쓰 한 번 더
69:34
Speaker A
하는게 의미 없어서 여기다가는 이렇게는 했는데 코드가 우리가 했던 예적 코드는 거의 유사해서 드릴게요. 자, 보려 보시면 다 했던 거예요. 아까 500개를 샘플에서 20개를 휘처죠. 세 개 클래스예요. 그중에 15개가 의미 있고요. 랜덤하게 스테이치로 해서 뽑아요. 같이 만들어 줘요. 데이터
70:14
Speaker A
생성이죠. 데이터한 다음에 데이터 분할이죠. XY 테스터 0.2% 80% 너스티 40에서 엑스트레인 엑테스트 와이트레인 whit스트네 개로 구분해요.
70:30
Speaker A
자 그다음에 스케일링 해서 뭐예요? 표 정교화시켜 주는 거죠. 근데 저는 여기는 이제 표준화하는 방법을 써요.
70:38
Speaker A
스탠 스케일을 갖고해서 스케일로 만들어 주고 다시 말하지만 얘는 트레인 데이터는 퀵트 훈련시키고 얘는 그대로 그냥 스케링 했으니까 변환을 시켜 줘야죠.
70:51
Speaker A
그다음에 얘는 그냥 일반적인 그 형태 CPU를 쓰는 값들이고이 값들을 뭐로 바꿔야 돼요? 텐서 바꿔 줘야 돼요. 그래서 포치의 포텐서 저기 실수형 텐서로 바꿔 주는 거죠.
71:08
Speaker A
그다음에 스플레 우리가 아까 했으니까 탄소 받아서 시퀀시 20개 64가 3두근이 우리가 클래스가 세 개면 세 개로 다섯 개면 다섯 개로 가게끔 해요.
71:22
Speaker A
그때 심플넷을 내가 세 개를 하겠다는 거죠. 이제 그러면은 모델 노크로스 쓰면 쓰고요. 여기 크로스 엔트로피 써서이이 손실 함수 정의해 주고 아담을 써서 요걸 넣어 가지고 거기에 해당되는 WB를 그 러리네이트 0.01로 최적하게 만들어서 30번 반복해요.
71:45
Speaker A
제로 그래드 만들고 여기에 텐로 돼 있는 엑스트레인 데이터를 넣어. 스무드가 없는 모델에 그러면 얘 체감이 나올 거고 얘는 실제 트레인의 토치로 아 테서로 만든 어 데이터죠. 그게 두 개를 비교해요. 얘가 한마디로 정답. 얘는 예측값. 여기에 기준으로. 그래서 라스트하고 라스백
72:14
Speaker A
워드 옵티마이즈 해요.데 파이토치 1.10 이상에서는 요거 에러가 안 났을 거예요. 그렇죠? 어 심플넷트 3 넣어서 모델 스무스 만들고요 크로스 엔터에 요게 이제 들어가 있어요. 라베 스무디 뭐뭐 그렇죠? 좀 편해졌죠? 그래서 0.1 옵션으로 들어갔다는 거예요. 그 크리테리언 스무스가 되고요. 그 모델
72:44
Speaker A
스무스한의 파라미터스를 즉 WP를 러인트 0.01로 01로 옵티마이저에 아담을 써서 옵티마이저 최적하게 만들고 그냥 아무것도 추적 탈당하지 말고 30 반복해서 어 제로 그레이드 하고 그리고 여기 트레인 데이터에 다 텐트 형태로 넣어야죠. 그니까 스무스로 돼 있는 애를 가서 라스트를 쓰고 나무해요.
73:12
Speaker A
했더니 어 앞에 알파 0.1의 이래 적용 가능하고 어 좋더라. 일단은 지금 다 어 클래스로 정의됐기 때문에 어떤게 나온 건 없어요.
73:49
Speaker A
자, 그다음에 어, 예, 10편이 7시간 이거 그래도 코드를 끝내는게 나을 것 같은데. 잠시만요. 차리 코드를 좀 정리해서 드릴게요.
74:07
Speaker A
음. 좀 쫓쳐야 되겠네. 앞에는 그냥 좀 일부 일부 드리고 1부 안 쳐 보는 걸로 해 볼게요.
74:26
Speaker A
어 일단 하나씩 드립시다. 그냥 자 이렇게 드릴게요.네 개념 그냥 막드리는게 의미가 없어요 여러분들이. 자, 이거 봐요.
74:43
Speaker A
쳐오시면 자, 이건 거예요. 메이크 클래시피케이션. 여기는 지금 500개에서 20개인데 비율이 정리 있어요. 하나는 95%고 하나는 5% 완전 극단적이죠.
74:57
Speaker A
어 42에서 인밸런스 약자요. y x y 인밸런스를 가져와서 플레스 0번일 때는 여러분도 알다시피 넘파이의 썸 기준이 y의 인밸런스가 0일 때 그렇죠. 어 이렇게 쓸 수 있어요. y가 인밸런스가 1일 때 나와야죠. 0 1이겠죠.
75:24
Speaker A
그다음에 요걸 갖고 나누기 전체 인밸런스 각 곱하기 100 그렇게 했더니 95% 5% 잘 나왔어요.
75:34
Speaker A
그랬더니 어 전체 데이터 500개에서 95%는 413 그다음에 27개 이렇게 되겠죠. 그 다음에 우리가 데이터 분할해야죠.
75:51
Speaker A
데이터를 드릴게요. 오늘 쳐봤으니까 트레인 테스트 스프릿 나눠요. 트인테 스플리농요 두 개죠. 인밸런스 데이터 80%는 트레일 데이터고 테스트 데이터 20% 똑같아요.
76:13
Speaker A
반복되고 있죠. 그다음에 정교와 뭐죠? 방 쳤죠. 스케일러를 바꿔 주는 거죠. 그죠? 어, 그렇죠. 병진 님, 세균님 1점 이거죠. 스탠더 스케일러를 해서 스케일러 한 만들어 주고 피트랜스포인은 트레인 데이터 테스트 데이터는 트 하면 안 되죠.
76:51
Speaker A
그다음 뭐 해 줘야 될 거야? 그다음 뭐 해 줘야 돼요? 지금 계속 자금만 참으시면 집에 가요. 아 원래 집인가? 그렇죠? 뭐 책상에서 떠나요. 자 뭐예요? 뭐 해 줘야 돼요?
77:11
Speaker A
어 빨리 스케일러 해 가지고 뭐 해 줘야 돼? 텐서 그치 병진 님 민주님 어우 잘하고 있어요. 텐서로 병해 줘야죠.
77:25
Speaker A
토치로 만들어야 되잖아요. 어차피 저 데이터잖아. 저때 이서 이해돼 있죠? 얘를 각각을 하고 얘 언스키지 1 y트레링 요거 맞 y가 차원이 다르잖아요 항상 어 자 요건 쳐 봅시다. 처음 나오니까 계산해야 파이썸에 y트레인 지금 i라고 돼 있죠. 인밸런스니까.
78:13
Speaker A
자 요건데 0인 거 조건이죠. 0로 라벨링 돼 있는 거 그거를 더해. 그래서 내가 된 영어 두 가지가 있겠죠. N1도 있겠죠.
78:50
Speaker A
자, 그러면 웨이츠라는 거는 상대적인 거잖아요. n0에서 1빼 나누면 되죠. 기울이니까 몇대 몇? 95대 5. 맞죠? 몇대 몇?
79:04
Speaker A
4대 2. 뭐 그죠? 몇 분의 몇? 지플레스가치죠. 아 15절로 자, 그러면 우리가 뭐냐면 웨이트가 있는 BC를 할게요.
80:13
Speaker A
스 그 있죠? 바이너리 이즈 무료하는 클래스예요. 인바이너리 클래스 뉴럴 네트워크 상수 받고 하시 20에서 24 64 24 32 31 각각 은익층에서 레를 통과시키고요.
80:40
Speaker A
아까도 쳐 봤던 거잖아요. 자, 그러면 요거를 갖고 와서 클래스를 갖고 와서 인스턴스 만들겠어요. 모델인데 이제 웨이트 된 걸 활용을 해야 합니다. 얘를 가져와서 인스턴스로 만든 거죠.
81:16
Speaker A
자, BC with 여기 해 줘요. 포이트 얘는 고체 펜서로 만들어서 웨이트 괜찮나요? 여기까지. 자, 그러면 요거가 뭐냐? 일단 한번 돌려 볼까요? 요거 요렇게 나와요.
82:32
Speaker A
모델 웨이트가 가중치를 준 거예요. 왜냐면요 포스웨이트라는 개념은 좀이 필요한데 쓰면 이렇게 쓰거든요. 일제선 트 이런 식으로 이렇게 하면 더 헷갈릴 수 있으니까 내려서 예어 똑같은데 가주세요. 소스 클래스가 틀리면 큰 페널티 주겠다는 뜻이거든요.이 이 말은 뭐냐면 내가 예를 들어서 y가 1이에요.
83:39
Speaker A
그때 얘 공식이 어떻게 되냐면요. wt브 곱하기 마너스 로그 어 p의라고 할 h 이렇게 돼 있어요. 즉 뭐냐면 여기다가 공식을 잠깐 써 드릴게요.
84:03
Speaker A
예. 조금 요거 요직 라스는 처음 볼테니까 공식을 봐야 좀 이해. 이게 공식이에요. 이렇게 할게요.
84:17
Speaker A
자 마이너스 이게 포스웨트. 그데 파지티브라는 뜻이야. 파지티브는 양성 이정원에 그렇죠. 네가티브는 음성이고 어 그래서 양성의 1 거기에 대한 가솔치가 포지티브 웨이트 포스웨이트예요.
84:49
Speaker A
자, 그래서 요거에다가 곱하기 y *하기 로그 h 플러스 판별식으로 됐어요. y 1 - y 로그 1 -티 이렇게 돼 있어요.
85:14
Speaker A
그래서 잘 보고 있으면요 가정치를 어떻게 줄 거냐? 로그 y에다가 이거 곱하기 로그 얘가 예측한 거잖아요.
85:31
Speaker A
이게 어차피 여기 플러스니까 마이너스로 들어갔잖아요. 그러니까 어떻게 되냐? 이렇게식이 되는 거죠. 이해되시죠? 요게 여기에 들어가니까 곱하기 그니까 - W파지티브 웨이트이 웨이트고요. y 로그 p의 프리티죠.
85:52
Speaker A
예측값이 여기 들어가는 거죠. 자, 그랬을 때 이게 그래서 이렇게 쓴 거예요 제가. 그 이게 뭐냐? 소스클를 쓰잖아요.
86:01
Speaker A
너티가 엄청 커요. 계산하면 y는 1일 때 어떻게 돼요? y 1 넣어요. 날아가잖아요. 맞아요. 얘만 계산하잖아요.
86:13
Speaker A
여기까지 이해되시면 1번 쳐 주세요. 그래서 y는 0일 때 그러면 y가 0이면 어떻게 돼요? 0 날라가죠.
86:53
Speaker A
0 1이죠. 얘만 남네요. 맞아요. 그때 여기가 마이너스가 있어요. 여기 각각 할당이니까. 그러면 얘는 뭐가 나와요?
87:09
Speaker A
마이너스 로그 1 - px죠. 이렇게 돼 있어. 그래서 얘는 조금 넣어 보는게 조금 낫게 나요. 근데 지금 아 이거는 뭐 코드를 알고 그냥 예제를 그냥 여기 그래도 어려워했으니까 남은 시간 동안 계산해 볼게요.
87:53
Speaker A
자 시가 가중치가 있다고 할게요. 어 가정치. 자 일반적으로 정답이 1이야. 그죠? Y가 1이에요. 소스클래스예요.
88:14
Speaker A
별로 없어. 예측 확률은요. 이게 예측 확률이에요. 와, 요거죠. 요거 0.1이에요. 완전히 틀리죠? 그죠? 완전히 틀린 거예요. 10%도 못 맞췄어. 그렇죠, 여러분들? 내가 그냥 찍어도 50%잖아요. 그렇죠?
88:38
Speaker A
10%야. 처참하자. 완전 틀렸어. 자, BC를 쓰면 어떻게 돼요? BC 마스 로그 0.1이 1이 돼요.
88:51
Speaker A
그래서 2.30 이게 지금 제가 그 여러분 없고요. 대학원 교재 그 계산 문제 있잖아요. 그거 지금 계산 지금 죽고 있어요. 요거예요.
89:10
Speaker A
근데 가중 지금이 웨이티드잖아요.요 가중돼 있는 BC를 썼잖아요. 그러니까 그냥 눈으로 보시면 돼요. 아, 이런 거구나.
89:20
Speaker A
15.7 뭐냐면 여기에 지금 예를 들어서 가중치가 15.7이 있다. 이거예요. 15배 아까 나왔잖아. 웨이트 여기에 있을 때 요거죠. 웨이트니까 이게 파지티브 웨이트잖아요. 요거 15.7 7 여기에 2.303 이거 하잖아요.
89:48
Speaker A
36.16이에요. 예. 예. 자연구예. 그 베레이라고 하죠. 어, 표시할 때. 예. 그걸 써요. 그럼 여러분들이 BC나 손실 함수 다 자연로그예요.
90:51
Speaker A
프레임크에서 딥러닝에서 쓰는 것들. 혹시 자연로그하고 상형로그는 차이 아시나요? 아 예. 오케이. 오늘 연장 수업해야 되겠는데 이동.
91:14
Speaker A
음. 알겠어요. 요거 설명. 자, 그러면 일단은 여기까지 눈으로 찍으세요. 알았죠? 이거 하고 자연 설명드릴게요.
91:25
Speaker A
예. 뭐 그죠. 10이냐 2냐 그거긴 한데. 예. 제가 그거 아는 것도 어디야? 그거 대단한 거야. 훌륭해요. 저도 자연로그에 자연로그라는 걸 병업 박사할 때까지도 몰랐어요. 맞죠? 어 여러분이 더 짱이야. 알았죠?
91:43
Speaker A
여러분이 더 짱이라. 나는 자연놈무라는 거를 그때까지도 몰랐다고요. 안 배웠으니까. 알았죠? 문과 책에 따로 있었어.
91:52
Speaker A
어. 자, 여기까지 이해됐으면 됐어요. 여기 이해되시죠? 가중치 곱하기요 BC의 2점 가중치 준 거잖아요. 가중치 곱한 거니까 2.3 나왔는데 여기까지 됐어요.
92:12
Speaker A
일단 계산해 본 거야. 여기까지. 어 오케이. 근데 만약 정답이 여기다 어 지금 내 얼굴이 가렸는데요 계산한 결과가 얼마냐면요 지금 2.303이잖아요.
92:31
Speaker A
여기까지 보이시죠? 15.7에다가 얘 더 곱한 거예요. 그게 그 정답 1 y인데 소수클레스면은 얼마냐면 36.
92:45
Speaker A
1독이 나와요. 알겠죠? 그냥 어찌됐든 15.7배를 지금 페널티를 가한 거잖아요. 가정치. 자, 근데 만약 y가 정답 0이에요.
93:02
Speaker A
얘가 다수클스예요. 이게 의미를 이해하셔야 된다는 거. 근데 예측 확률이 0.9예요. 요게. 얘가 그렇죠. 그러면은 마이너스 로그에 얘도 틀린 거예요. 완전히 틀린 거죠.
93:21
Speaker A
어, y가 0일 때는 공식을 보세요. y가 0일 때는 0일 때는 얘잖아. 1 - y 로그 1 - p인데 0.9 0.1이잖아요.
93:34
Speaker A
1이잖아요. 그러니까 아 얘는 완전 틀린 거예요. 로그의 0.1이에요. 그러면은 얘 2.303이거든요. 그때 가정치는 얼마 존졌어요? 1 줘요.
93:54
Speaker A
페널티 그대로 가요. 그래서 실제로 1 * 2.303이 돼서 페널티 그대로 1.303 그대로 갑니다. 자, 뭐냐면 그 아까 강의할 때 이런 설명할 때 이미 말을 하했어요. 그걸 이제 여기 수식으로 지금 설명을 한 두 가족을 하는 거예요. 결론 좀 하면 소수 병이 몇 개 없는데 야
94:23
Speaker A
지금이 귀한 거를 어 열명밖에 지금 우리 연구 대상이 10열 개밖에 없는데 그렇죠. 근데 막 두 개를 소시했어.
94:34
Speaker A
아 그냥 페널티 확 주죠. 그렇게 만들어 놓은 거예요. 수직으로 모델이 소수 클래스를 주의깊게 학습하게 만들어 놨습니다.
94:47
Speaker A
그거 얘 지금 계산한 거예요. 자, 우리 2분밖에 안 남아서 자연 로그에 대해서만 잠깐 설명하고 끝낼게요.
95:09
Speaker A
요거는 이제 아무래도 그거 내일 다시 하는게 더 낫겠죠, 여러분? 정신 건강에도. 예. 여기서 여기서부터 다시 할게요. 어.
95:18
Speaker A
자, 요거 또 나와요. 럭비c. 어, 응용때 이거 응용때 이거 모르면 응용때 힘들어요. 응용 때 제대로 또 못 하면 이제 프로젝트 때 힘들어요. 어, 그리고 그렇게 해서 취업해도 취업해서 힘들어요. 그렇죠?
95:37
Speaker A
취업했는데 이거 몰라 이러면은 선님이 몰라요. 집에가 이래요. 자, lnx 뭐냐면 자연로그 미분하면 이렇게 돼요. ln ln이라고 쓰거든요.
95:53
Speaker A
그러면 얘 어떻게 돼요? 아시는 분? 1이에요. 그렇죠? 그 상용 로그가 10 뭐냐면 로그 10 이거예요. 우리가 보는 이진법일 때는 로그 2 이렇게 쓰죠.
96:15
Speaker A
어 아마 이거를 문과생은 본 적이 없을 거야. 그 대학 들어가면서부터 요거 10은 많이 받겠죠.
96:25
Speaker A
얘는 미분하잖아요. 미분이 돼야 할지 뒷론이 돼기 때문에 그래요. 로그 10의 x잖아요. 어떻게 되냐면 x ln 10 1이 이렇게 돼 버려요.
96:47
Speaker A
아주 지적은 해져요. ln이 ln 귀신부터야. 그 미분할 할 때마다 그래서 상형 로그를 안 쓰는 거.
97:02
Speaker A
여기까지 이해되시나요? 계속 우리가 0.8을 해 가지고 미분해서 가정치 업데이트 해야 되잖아요. 그때 이렇게 깔끔하게 나와야 되는데 무슨 LN 귀신이 붙어. 계속 그렇죠. 계속 붙어요.
97:18
Speaker A
어 그래서 자연로그를 씁니다. 그러면 자연로그는 뭐죠? 자연 로그는 내일 할 30번인 자 공부하고 오세요. 자연은 뭔지.
97:44
Speaker A
그래서 내일 자연로그가 뭔지 설명하시는 분은 5점을 드릴게요. 저요 조요 하셔야 돼요. 알았죠? 어 안 하면 제가 하고. 자, 그러면 오늘 여기까지 할게요.
Topics:라벨 스무딩크로스 엔트로피모델 평가PyTorch아그맥스확신도정확도캘리브레이션시각화머신러닝

Frequently Asked Questions

라벨 스무딩이란 무엇인가요?

라벨 스무딩은 정답 라벨을 부드럽게 만들어 모델이 정답에 과도하게 확신하지 않도록 하는 기법입니다. 이를 통해 모델의 일반화 성능과 캘리브레이션을 개선할 수 있습니다.

스무딩 값(alpha)은 어떻게 설정하나요?

스무딩 값은 보통 0에서 0.2 사이에서 설정하며, 0.1 정도가 표준으로 많이 사용됩니다. 너무 크면 성능이 떨어질 수 있으므로 실험을 통해 최적값을 찾아야 합니다.

모델 평가 시 확신도(confidence)는 어떻게 계산하나요?

확신도는 소프트맥스 출력에서 가장 높은 확률 값을 의미하며, 평균 확신도를 통해 모델이 얼마나 확신하는지 평가합니다. 확신도는 스무딩 강도에 따라 변할 수 있습니다.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →