[논문 정리] FocalFormer3D: Focusing on Hard Instance for 3D Object Detection
·
논문 정리/3D Object Detection
Abstract문제False Negative (FN)- 객체가 있는데 모델이 놓친것을 의미- 즉, 모델이 탐지하지 못한 객체자율주행에서 어떤 객체든 모델이 탐지하지 못한다는건 굉장히 큰 문제다.- 교통사고로 이어질 수 있기 때문  해결FocalFormer3D는 다음 방법들을 통해 false negative들을 줄이고자 한다.- HIP (Hard Instance Probing)        - FN을 줄이는 pipeline 제시- Multi-stage query generation        - 탐지하기 어려운 객체를 multi-stage로 해결- Box-level transformer decoder        - 방대한 객체 후보로부터 객체를 효과적으로 구별          Introduction3D..
[논문 정리] TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers
·
논문 정리/3D Object Detection
개인 생각Object query에 대한 접근과 활용을 진짜 기가막히게 해버린 논문. 2D domain과 3D domain을 fusing하기 위해 진짜 다양한 논문들을 참고하고, 녹여냈다는 것을 느낄 수 있었다.           Abstract 문제- Image condition을 고려한 fusion 방법이 없음        - Bad illumination        - Sensor misalignment- 존재하는 fusion 방법들은 calibration matrix에 크게 의존        - 카메라가 다르거나, calibration이 정교하지 않거나 하면 성능이 낮아짐        - 이를 hard association이라고 표현   해결- Transformer decoder 구조 사용    ..
[논문 정리] VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking
·
논문 정리/3D Object Detection
개인 생각Dense한 feature라는 것이 두가지 의미를 가지고 있다고 이해했다.    1. Feature들이 오밀조밀 모여있다는 것을 의미    2. Sparse voxel feature에 공간적인 특성을 부여했다는 의미 저자는 2번째 의미에서의 dense한 feature를 피했다는 것을 강조한다.    - 이를 확신하는 이유는 backbone adaptation 부분에서 설명할 예정이다.     Sparse voxel feature를 input부터 output까지 유지했다는 점이 VoxelNeXt의 특징이며, 진짜 sparse함을 극한까지 활용했다는 것을 알 수 있다.     추가로 언급되는 query voxel은 어떻게 찾아야하는지, 코드 상에서 어떻게 구현됐는지 저자가 밝히지 않았다. 그래서 ..
[논문 정리] Center-based 3D Object Detection and Tracking
·
논문 정리/3D Object Detection
개인 생각2D object detection에서 쓰이던 기술들이 대거 3D에서도 쓰이는 것 같다.이름만 봐도 2D에 사용됐었던 모델이 보인다. 제시된 CenterPoint는 3D만의 방법을 찾아내는 과도기에 있는 것 같다는 생각이 들었다.       Abstract문제- 3차원 세계의 객체들은  특별한 방향을 갖지 않음- Box-based detector 들은 axis-aligned bounding box를 rotated object들로 fitting하는걸 어려워함해결- 3차원 객체들을 point의 형태로 표현하고, detect하고 track- 3d object tracking을 greedy closest-point matching 문제로 단순화        Introduction잘 알려진 2D dete..