벽돌깨기를 통한 구글 딥마인드의 딥 Q-러닝 - 여러 이야기 - ITCM

벽돌깨기 학습과정

단지 점수를 최대로 높이라는 명령 외엔 아무런 정보도 주지 않음
딥마인드는 '공' 이 뭔지 어떻게 막대기를 조종하는지도 모른다. 그냥 무작정 시작

1. 처음 10분 동안은 딥마인드가 막대기를 움직여서 공을 쳐보려고 하지만 컨트롤 능력이 떨어져서 헤맨다.

2. 120분 지나자 능숙한 플레이가 가능해진다.

3. 대단한 일이 240분째 발생한다.

터널을 파는게 고득점을 위한 효과적인 방법이란걸 딥마인드가 알게 되는거다
게임을 반복하면서 처음 받은 명령인 '최대 점수를 내라' 를 이루는 방법을 찾아냈다는 것이다.
볼 컨트롤을 터득하는걸 넘어서 효과적인 전략을 스스로 찾아낸거다.

http://www.clien.net/cs2/bbs/board.php?bo_table=park&wr_id=44989088

글쓴이 님의 최신글

2020-06-30 22:17 요청게시판 > 문의
2020-06-30 20:44 여러 이야기 > ITCM 떠나기 전 인사드립니다. *68
2020-06-30 04:47 여러 이야기 > 스압)아이마스 원포올 오늘 플레이 *2
2020-06-30 02:23 여러 이야기 > 콘솔겜 가격정보 사이트 (PS,스위치,엑박 등) *11
2020-06-30 00:36 여러 이야기 > 아; 출석 하루 빠졌었네요. *9

이 글을 3 명이 추천합니다 더보기

벌러덩콩콩
dona

벌러덩콩콩
dona

Who's RuTel

[시스템정보]

Samsung Odyssey Gaming Laptop NT800G5S-XD71A

I7-7700HQ, 16G RAM, GTX 1060

~~Intel E3-1230 V2, ZOTAC GTX 1070 Mini~~

~~ASRock Z77 Extreme4, Memory 8G (4G X 2)~~

64-bit Windows 8.1, Antec VP650P V2
Samuel 17 @ COUGAR DUAL-X 120mm White LED FAN

~~SSD Crucial MX100 256GB @ SanDisk X110 128GB @ SanDisk U110 32GB~~

~~Corsair Carbide Series Air 540, Samsung U32h850 , Razer Marauder, XENICS STORMX M2~~

▼ 펼쳐 보기

Prev 건축시뮬 "Block'Hood" 앞서해보기 게임 건축시뮬 "Block'Hood" 앞서해보기 게임 2016.03.11by RuTel 무료 DEADBREED Next 무료 DEADBREED 2016.03.11by 볼로냐

위로 아래로 댓글로 가기 인쇄

Articles

2211 2212 2213 2214 2215 2216 2217 2218 2219 2220

-->