728x90
반응형
아무래도 구현에 있어 loss function을 구성하는 것이 가장 까다롭지 않았나 생각한다.
우선 람다는 모두 가중치이다.
논문에 나온 로스 식엔 coord에 대한 가중치와 noobj에 대한 가중치가 표시되어있다. coord는 bounding box의 좌표에 대한 것으로 이에 대한 가중치를 더 주고싶다면, 1보다 큰 값을 주도록 하자.
noobj는 후에도 서술하겠지만, 모델이 객체로 인식하지 않은 bounding box를 의미한다.
다음은 저 이상한 1 표시다.
논문에는 다음과 같이 적혀있다.
$1^{obj}_{i}$ 은 객체가 i번째 셀에 나타났다는 것을 의미하고, $1^{obj}_{ij}$ 는 i번째 셀에 대한 j번째 bounding box 예측이 합리적이라는 것을 의미한다.
저 합리적이라는 말이 참 어렵다.
나는 셀을 순회하는 i라는 변수와 bounding box를 순회하는 j라는 변수가 있을 때 i 번째 셀에 대해 j번째 bounding box가 잘 맞았는지 알아서 정의하라는 것이라고 해석했다.
Object detection에서 합리적인 bounding box란 IOU가 특정 퍼센트 이상일 때를 의미한다고 알고있다. 따라서 나는 구현 시, IOU가 50% 이상인 bounding box들을 골랐다.
Loss function에 대한 나머지 부분들은 모두 True와 Prediction을 뺀 값의 제곱이다. 이걸 IOU가 50% 이상인 bounding box에 대해서만 수행했다.
논문을 전부 읽어본것이 아니라, 정확히 이 논문이 나오던 시점(2016년)에 왜 이런 아이디어가 제시되었는 가를 완벽히 이해하지 못했다. 따라서 다음주에는 논문에 대한 전체적인 내용을 정리해보려 한다.
'기타 > 모각코' 카테고리의 다른 글
[2022 동계 모각코 2회차] 회고 (0) | 2023.01.05 |
---|---|
[2022 동계 모각코 2회차] 목표 (0) | 2023.01.05 |
[2022 동계 모각코 - 1회차] 목표 (0) | 2022.12.29 |
[2022 하계 모각코] 6회차 결과 (0) | 2022.08.07 |
[2022 하계 모각코] 6회차 목표 (0) | 2022.08.07 |