'에이전트' 태그의 글 목록

Notice

ReLU 함수

Recent Posts

Recent Comments

Link

250x250

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록에이전트 (2)

sliver__

강화학습 - 강화학습 문제

안녕하세요~~ 디벨로퍼입니다. 오늘은 강화학습의 기본적인 개념에 대해서 다뤄볼 예정입니다. ===================================================================== 순차적 행동 결정 문제 MDP(Markov Decision Proccess) 위 개념은 순차적으로 행동을 결정하는 문제를 정의할 때 사용하는 방법입니다. 사용하기 위해서 구성 요소들을 알아보겠습니다. 1. 상태 (state) 에이전트의 정적/동적인 요소를 표현 상태의 정의가 중요합니다. 그 이유는 학습하는 에이전트가 상태를 통해 상황을 판단하고 행동을 결정하기 때문입니다. 2. 행동 (action) 에이전트가 어떠한 상태에서 취할 수 있는 행동 에이전트는 어떤 행동이 좋은 행동인지 알 수 없..

CS/강화학습 2021. 10. 4. 00:06

바닥부터 배우는 강화학습 : 강화학습이란 (1장)

안녕하세요~ 디벨로퍼가 돌아왔습니다~~~ 오늘은 제가 개인적으로 공부하고 싶어하는 강화학습에 대해서 써볼려고해요. 저는 현업에서 C/C++(14/17)을 사용한 시스템 소프트웨어를 개발하고 있어요. 이 분야도 다양한 분야가 있고 폭 넓게 공부해야 할 부분이 꽤 많이있어요. 그런데 예전부터 인공지능에 관심을 가지고 있었고 꼭 한번쯤은 해보고 싶었어요. 그리고 이제서야 시작하게 되었습니다~~ 제가 가볍게 시작할 수 있는 책들을 찾아보는 도중에 바닥부터 배우는 강화학습 위 책이 눈에 들어오더라구요. 그래서 도서관에서 바로 빌리고 공부를 하기로 다짐했어요. http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=97889..

CS/강화학습 2021. 9. 17. 09:00

Prev 1 Next

목록에이전트 (2)

sliver__

티스토리툴바