DEPO 어려운 샘플을 미리 감지하면 RL이 빨라질까