펜케이크 던지기 : 펜케이크의 체공 시간이 길수록 높은 보상을 부여하자 수직으로만 던짐


이미지 분류 : 이미지를 보고 파악하게 지시하자 이미지 설치 경로를 보고 이미지를 분류함


버섯분류 : 식용 버섯과 독버섯을 교대로 보여주면서 독버섯을 학습시키자 교대로 보여주는 패턴에 대해 파악함


소닉 : 게임을 하던 인공지능은 맵 뚫 버그를 발견하곤 그 버그만 사용


축구 : 공을 터치할수록 높은 보상을 부여하자 가장 반동을 최소화하는 진동터치 방법을 익힘


데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움


자율주행 : 사고를 일으키지 않고 멀리 갈수록 높은 보상을 부여하자 제자리에서 빙빙 돔


큐버트 : 큐버트 게임을 시켜 고득점을 지시하자 인공지능은 버그를 찾아내고 2라운드로 넘어가지 않는 상황에서 1라운드에서 포인트를 무한히 얻음


상자들기 : 상자를 높게 들어올릴수록 높은 보상을 부여함, 인공지능은 점수 체점이 상자 밑면 좌표의 높이인걸 알아낸 뒤 상자를 들지않고 뒤집음


미니타우러 : 사족보행 인공지능에게 등에 공을 얹고 떨어트리지 않고 움직이도록 시켰더니 다리사이에 공을 끼고 움직임


로드러너 : 패배하지 않기 위해 인공지능은 스테이지1이 끝나기 직전 자살함


전략 시뮬레이션 : 버그로 게임이 터지면 인공지능이 죽음을 당하지 않게된다는걸 알게되고 게임 터트리는 방법을 익힘


테트리스 : 패배하기 직전 무한 일시중지를 함


블록 옮기기 : 테이블 위 블록을 옆으로 옮길때마다 점수를 부여함. 인공지능은 테이블을 옮김


진화 : 빠른 속도를 가지도록 진화를 시키자 자신의 키를 키우는 방향으로 진화함, 그리고 넘어져서 최고 속도를 냄