기존 3개 선택지 외에 무작위 카드를 하나 제시해줘야 하지 않을까요
그리고 그 무작위 카드가 선택된 상황을 학습을 하고
같은 카드가 선택되는 상황이 충분히 학습되면 비슷한 상황에서 가장 픽률 낮은 카드를 대체하고 반복하는 식으로?