분류 전체보기

카테고리 없음

VAE (Variational autoencoder)

변분 오토인코더(Variational Autoencoder, VAE)는 2013년 Kingma와 Welling이 발표한 생성 모델로, 잠재변수 기반 생성 모델 계열의 출발점이 된 연구입니다. 이 글에서는 VAE의 수식이 왜 그렇게 구성되는지를 데이터 분포 정의부터 ELBO 유도, 재파라미터화 트릭까지 순서대로 정리합니다. 생성 모델과 데이터 분포생성 모델의 목표는 데이터 분포 \(p(x)\)를 학습하는 것입니다. 256×256 RGB 이미지의 경우 \(x\)는 약 19만 6천 차원의 벡터 한 개이고, \(p(x)\)는 그 점에서의 확률밀도값입니다. 함수 \(p(\cdot)\) 자체는 가능한 모든 이미지가 위치하는 고차원 공간 위에 정의된 분포입니다. 이 분포를 고차원 공간의 산맥으로 시각화할 수 있..

개인공부/CV

SuperPADL: Scaling Language-Directed Physics-Based Control with Progressive Supervised Distillation

[논문리뷰] SuperPADL: Scaling Language-Directed Physics-Based Control with Progressive Supervised DistillationSIGGRAPH 2024. PaperJordan Juravsky, Yunrong Guo, Sanja Fidler, Xue Bin PengNVIDIA | Stanford University | University of Toronto | Simon Fraser UniversityJuly 2024 IntroductionPhysics-Based Character Animation의 확장성 문제Physics-based character animation에서 강화학습(RL)을 활용한 제어 policy는 locomotion부터 ..

학교공부/무인이동체개론

[무인이동체개론] 무인이동체 제어

비행 제어 개론항공기가 하늘을 나는 것과 그 항공기를 원하는 대로 조종하는 것은 전혀 다른 문제입니다. 1903년 라이트 형제가 동력 비행에 성공한 이래, 어떻게 하면 항공기를 더 정확하고 안정적으로 제어할 수 있는가에 대한 연구가 100년 넘게 이어져 왔습니다. 오늘은 비행 제어의 역사와 원리, 항공기에 작용하는 힘, 조종면의 작동 방식, 멀티콥터 비행 원리, 비행 제어 하드웨어와 센서, 항법과 유도 알고리즘, 지상 통제 시스템까지 전체 그림을 살펴봅니다. 비행 제어의 역사라이트 형제와 조종력의 발견1903년 라이트 형제의 첫 동력 비행이 성공할 수 있었던 결정적인 이유는 강력한 엔진만이 아니었습니다. 플라이어호의 날개를 비틀어 조종력을 확보한다는 개념, 즉 날개 형상의 변화를 통해 항공기를 제어한..

개인공부/CV

AMP: Adversarial Motion Priors for Stylized Physics-Based CharacterControl

[논문리뷰] AMP: Adversarial Motion Priors for Stylized Physics-Based Character ControlSIGGRAPH 2021. Paper PageXue Bin Peng, Ze Ma, Pieter Abbeel, Sergey Levine, Angjoo KanazawaUniversity of California, Berkeley | Shanghai Jiao Tong UniversityAugust 2021 Introduction 물리 시뮬레이션 환경에서 캐릭터가 자연스럽게 움직이도록 만드는 것은 컴퓨터 애니메이션 분야의 핵심 과제입니다. 기존에는 크게 두 가지 접근 방식이 사용되어 왔습니다. 첫 번째는 사람이 직접 "자연스러운 동작"의 조건을 수식으로 정의하는 방..

학교공부/딥러닝

[딥러닝] 딥러닝 최적화(1)

경사 하강법의 두 가지 문제지금까지 경사 하강법으로 파라미터를 업데이트하는 방법을 배웠습니다. 그런데 실제로 써보면 두 가지 골치 아픈 문제가 생겨요. 하나는 미니배치에서 생기는 그래디언트 잡음 문제고, 다른 하나는 오버슈팅 문제입니다.그래디언트 잡음부터 얘기하면, 전체 데이터가 아닌 일부 샘플만 가지고 그래디언트를 추정하다 보니까 그 그래디언트에 잡음이 낄 수밖에 없어요. 잡음이 끼면 어떤 일이 생기냐 하면, 원래는 직진으로 쭉 가야 되는데 들쭉날쭉하게 업데이트가 되어서 수렴 속도가 매우 느려집니다.오버슈팅은 loss landscape 모양 때문에 생겨요. loss landscape가 동그란 게 아니라 타원형으로 찌그러져 있으면 한 방향으로는 기울기가 굉장히 크고 다른 방향으로는 기울기가 작습니다. 결..

카테고리 없음

[딥러닝] 딥러닝 기초

딥러닝 성공의 이유CNN으로 넘어가기 전에 짚고 가야 할 이야기가 있습니다. 딥러닝이 성공한 이유를 흔히 더 좋은 알고리즘 덕분이라고 생각하기 쉽지만, 사실 훨씬 더 결정적인 요인은 하드웨어의 발전입니다. GPU가 등장해 수천 개의 코어로 행렬 곱셈을 동시다발적으로 수행할 수 있게 됐고, 네트워크 기술의 발전으로 인터넷을 통해 대량의 데이터를 모을 수 있게 됐습니다. ReLU 사용이나 최적화 개선도 물론 중요했지만, 그보다 하드웨어 발전이 훨씬 더 큰 견인차 역할을 했습니다. 합성곱 신경망 (CNN)딥 MLP의 한계완전 연결 구조(Fully Connected, FC)에는 두 가지 근본적인 문제가 있습니다. 첫째는 높은 계산 복잡도입니다. 입력이 D차원이면 노드 하나를 만드는 데 D번의 곱셈이 필요하고..

학교공부/딥러닝

[딥러닝] 다층 퍼셉트론

오류 역전파 알고리즘의 설계2층 퍼셉트론의 파라미터는 θ = {U¹, U²}로 표현합니다. U¹은 입력층 → 은닉층 가중치 행렬, U²는 은닉층 → 출력층 가중치 행렬입니다. 목적함수 J(θ)는 정답 y와 예측값 o 사이의 L2 노름 제곱에 1/2을 곱한 형태이고, 1/2을 붙이는 이유는 나중에 미분할 때 내려오는 2와 약분되어 식이 깔끔해지기 때문입니다.이 목적함수의 최저점을 찾기 위해 경사 하강법을 적용합니다. U¹과 U²를 각각의 편미분 방향 반대로 업데이트하는 것이 핵심이고, ρ는 한 걸음의 크기인 학습률입니다. 그렇다면 이 편미분을 실제로 어떻게 계산할까요? 그게 오류 역전파 알고리즘의 전부입니다.학습 알고리즘의 흐름알고리즘의 흐름은 단순합니다. U¹과 U²를 초기화한 뒤, 매 에폭마다 샘플 순..

학교공부/딥러닝

[딥러닝] 퍼셉트론

뉴런과 퍼셉트론의 탄생딥러닝의 가장 작은 단위인 퍼셉트론은 사람의 뇌에 있는 뉴런을 수학적으로 모방한 것입니다. 뇌에는 약 10의 11승 개의 뉴런이 있고, 하나의 뉴런이 다른 뉴런과 약 천 개의 연결을 가지고 있어 전체 연결 수는 10의 14승 개에 달합니다. 이 뉴런들이 전기 신호를 주고받으며 빠른 속도로 정보를 처리하는 구조가 신경망의 원형입니다.뉴런을 수학으로 표현하면 간단합니다. 인접한 뉴런에서 오는 전기 신호를 특징 x1, x2, x3로 보고, 각 연결의 강도를 가중치 W로 표현합니다. 자주 쓰는 연결일수록 강한 가중치를 가지고, 거의 안 쓰는 연결은 약한 가중치를 가집니다. 이 가중치 합을 구한 다음 활성 함수를 통과시켜 다음 뉴런으로 신호를 전달하는 것이 퍼셉트론의 기본 구조입니다.1950..

학교공부/딥러닝

[딥러닝] 기계학습과 수학(2)

코사인 유사도와 LP 노름코사인 유사도는 두 특징 벡터가 얼마나 같은 방향을 가리키고 있는지를 재는 척도입니다. 두 벡터의 각도가 같으면 1, 90도면 0, 180도면 -1이 됩니다. 특징 공간에서 코사인 유사도가 높다는 건 두 특징이 의미론적으로 비슷하다는 뜻이에요. 예를 들어 고양이의 눈과 강아지의 눈은 서로 다른 눈이지만, 둘 다 '눈'이라는 같은 의미를 가지기 때문에 높은 코사인 유사도를 가질 수 있습니다.LP 노름은 원점과의 거리를 재는 방법입니다. p가 1이면 격자 세계에서의 거리, 즉 x축으로 몇 칸, y축으로 몇 칸처럼 더하는 방식이고, p가 2면 우리가 자로 실제로 잰 유클리디안 거리가 됩니다. p 값에 따라 거리를 측정하는 특성이 조금씩 달라집니다. 결정 직선과 결정 초평면특징이 두 ..

학교공부/딥러닝

[딥러닝] 기계학습과 수학(1)

선형 모델의 매개변수선형 모델 y = Wx + b에서 매개변수는 W(가중치)와 b(바이어스) 두 가지입니다. 특징이 d개라면 총 d+1개의 매개변수가 존재합니다.W는 각 특징이 출력값 y에 미치는 영향, 즉 중요도를 나타냅니다. 키와 몸무게의 관계를 모델링한다면, 키에 해당하는 W는 크게 학습되고 혈액형에 해당하는 W는 0에 가깝게 학습되는 식이죠.b(바이어스)는 y절편 값으로, 전자공학의 직류 오프셋처럼 신호를 위아래로 이동시켜주는 역할을 합니다.직선으로 표현이 안 되는 데이터도 있습니다. 앞으로 가다가 다시 뒤로 돌아오는 운동 궤적 같은 경우죠. 이럴 때는 2차 이상의 모델이 필요한데, x², 교차항 x₁x₂ 같은 항들이 추가되면서 매개변수 수가 d²에 비례해 급격히 늘어납니다. 모델이 복잡할수록 표..

Dev_Camp
'분류 전체보기' 카테고리의 글 목록