Sparsh: Self-supervised touch representations for vision-based tactile sensing

BSPK
2024.11.05조회수 22회

BSPK
구독자 496명구독중 9명
전자전기공학 박사, AI 연구자를 거쳐 전략기획 업무를 합니다.
기술의 발전이 가져올 세상의 변화를 먼저 포착하고 전달하고자 합니다.


Meta의 Sparsh는 비전 기반 촉각 센서를 위한 자기 지도 학습(Self-supervised Learning, SSL) 모델을 제안하는 연구입니다.
촉각센서 정보를 이미지화 -> 이미지 자기지도학습 방식을 촉각에 적용 -> 촉각 자기지도학습
생성형 AI를 촉각 영역까지 확장하여 로봇의 인지 및 조작 능력을 대폭 향상 했다는 점에서 의의를 지닙니다.
LLM: 언어 자기지도학습
JEPA: 영상 자기지도학습
Sparsh: 촉각 자기지도학습
촉각 센서(DIGIT, GelSight 등)는 로봇이 물체를 다룰 때 시각 정보만으로는 얻기 어려운 촉각 피드백을 제공하여 로봇 조작 능력을 크게 향상시킵니다. 그러나 기존의 접근 방식은 특정 작업과 센서에 맞춘 모델을 사용하며, 이러한 모델을 학습시키기 위해서는 많은 양의 라벨링된 데이터가 필요합니다. 이는 데이터 수집 비용이 높고 시간이 많이 ...