싸니까 믿으니까 인터파크도서

북스클럽 추가i-포인트 적립안내
1. 대상:	매월 10일 선정되는 북스클럽 등급에 따라 상품금액의 4%, 2%, 1%의 추가i-포인트를 지급해드립니다. (단, 배송비, 쿠폰 할인금액, 비구매성 i-포인트/상품권 결제금액, OK캐쉬백 결제금액은 제외됩니다)

희망도서 신청안내

고객님 거주지역 공공도서관이나 본인이
소속된 학교, 대학도서관등에 희망도서를
신청하실 수 있는 기능입니다.


책내용

“데이터 분석에 의존한 머신러닝은 이제 그만!” 『강화학습 이론&실습』이 책은 아직도 인공지능이 적용되지 못 한 산업에서 기술을 적용할 가능성을 제안하는 도서이다. 이 책이면 인간보다 주어진 환경에 더 잘 적응하는 인공지능의 개념을 공부하여 나만의 인공지능을 만드는 기술에 대해서 배울 수 있다.

목차

프롤로그 1. 환경 설정 1.1 윈도우 버전 1.2 리눅스 버전 2. 강화 학습을 위한 사전 지식 2.1 머신 러닝과 강화 학습 2.1.1 머신 러닝 2.1.2 강화 학습 2.2 기초 수학 2.2.1 기초 선형 대수 2.2.2 기초 미분과 적분 2.2.3 기초 확률 통계 2.3 최적화 2.3.1 뉴턴-랩슨법(Newton-Raphson method) 2.3.2 경사 하강법(Gradient descent method) 2.4 목적 함수 2.4.1 최소 제곱 2.4.2 확률 엔트로피와 쿨백-라이블러 발산 2.5 인공 신경망 2.5.1 신호 전·후 처리 2.5.2 순방향 전파 2.5.3 역방향 전파 2.6 초간단 파이토치 튜토리얼 2.6.1 MNIST 2.6.2 회귀 분석 2.7 매개 변수 탐색법 2.7.1 격자 탐색법(Grid search) 2.7.2 베이지안 탐색법(Bayesian optimization) 3. 마르코프 의사 결정과 동적 계획법 풀이 전략 3.1 마르코프 의사 결정 3.2 동적 계획법 3.3 [실습] 잭의 렌터카 업체 운영 전략 - 동적 계획법을 이용한 마르코프 의사 결정 4. 밸만 방정식부터 강화 학습까지 4.1 몬테-카를로 추정법 4.2 시간차 학습 4.2.1 TD(0) 4.2.2 TD(λ) 4.3 Monte-Carlo vs Temporal Difference 4.4 에이전트 학습 4.4.1 SARSA 4.4.2 Q-learning 4.4.3 실습 5. Q-함수는 신경망에 맡긴다 - DQN 5.1 DQN 208 5.1.1 이론 209 5.1.2 실습 219 5.2 파생 알고리즘 256 5.2.1 DDQN 256 5.2.2 PER 260 6. 즉각적인 학습이 필요할 때 - Policy gradient 6.1 Actor-Critic 6.1.1 이론 6.1.2 실습 6.2 파생 알고리즘 6.2.1 Asynchronous Advantage Actor-Critic 6.2.2 LSTM-Based Advantage Actor-Critic 6.2.3 [고급] Trust Region Policy Optimization 6.2.4 [고급] Proximal Policy Optimization 7. 탐험의 전략 - Model based learning 7.1 사전 지식 - 밴딧 모델 7.2 이론 - Monte-Carlo Tree Search 7.3 실습 7.3.1 CartPole 7.3.2 Tic-Tac-Toe 찾아보기

저자

황현석

부산대학교에서 자연과학을 공부하고 서울대학교에서 계산과학 분야로 전공을 바꾸어 공학석사 학위를 취득했다. 공식 교과과정에서 편미분 방정식을 푸는 방식을 배울 때 대학원 시절 동안 옆자리에 앉았던 동기가 인공지능을 공부하는 것을 보고 따라서 머신러닝을 조금씩 독학하기 시작했다. 머신러닝 분야 중 게임을 스스로 플레이 하는 인공지능을 보고 강화학습에 가장 큰 흥미를 느낀 뒤 취미 삼아 이론을 공부하고 개념을 구현하는 데 시간을 많이 보냈다. 어쩌다 보니 현재 인공지능 알고리즘을 적용하는 반도체 모델링을 타겟으로 하는 회사에서 인공지능을 전자회로 시뮬레이터에 접목하는 업무를 맡고 있다.

이 출판사의 관련상품

	가장 빠른 풀스택을 위한 Flask & FastAPI \| Dave Lee \| 비제이퍼블릭
	줄리아 프로그래밍 \| 전기현,류대식 \| 비제이퍼블릭
	콘텐츠가 돋보이는 SNS 디자인 with 미리캔버스 \| 김유선 \| 비제이퍼블릭
	창작자를 위한 옵시디언 마스터북 \| 조지훈 \| 비제이퍼블릭
	노션 덕후의 놀라운 꿀팁 아카이브 \| 전소라 \| 비제이퍼블릭
이 분야 신간 관련상품

	그림으로 이해하는 알고리즘 \| 미야자키 슈이치,이시다 모리테루,이동규 \| 길벗

도서를 구입하신 고객 여러분들의 서평입니다.
자유로운 의견 교환이 가능합니다만, 서평의 성격에 맞지 않는 글은 삭제될 수 있습니다.

등록된 서평중 분야와 상관없이 매주 목요일 5편의 우수작을 선정하여, S-Money 3만원을 적립해드립니다.

총 0개의 서평이 있습니다.

출고안내

	출고란 인터파크 물류창고에서 도서가 포장되어 나가는 시점을 말하며, 실제 고객님께서 수령하시는 시간은 상품준비완료해 출고한 날짜 + 택배사 배송일입니다.
	인터파크 도서는 모든 상품의 재고가 충족할 시에 일괄 출고를 합니다.
	일부 재고에 대한 출고가 필요할 시에는 담당자에게 직접 연락하시거나, 고객센터(고객센터(1577-2555)로 연락주시기 바랍니다.

배송비 안내

	인터파크 도서 대량구매는 배송료가 무료입니다.
	단, 1개의 상품을 다수의 배송지로 일괄 발송시에는 1개의 배송지당 2,000원의 배송비가 부과됩니다.

알아두세요!

	고객님께서 주문하신 도서라도 도매상 및 출판사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
	택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다. (단, 토/일요일 제외)

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있습니다.
정확한 환불 방법 및 환불이 지연될 경우 1:1문의 게시판 또는 고객센터(1577-2555)로 연락 주시기 바랍니다.
소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있습니다.

교환 및 반품이 가능한 경우

	상품을 공급 받으신 날로부터 7일이내 가능합니다.
	공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월이내, 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일이내 가능합니다.
	상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능합니다.

교환 및 반품이 불가능한 경우

	고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우는 불가능합니다. (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
	시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우는 불가능합니다.
	포장 개봉되어 상품 가치가 훼손된 경우는 불가능합니다.

다배송지의 경우 반품 환불

	다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
	1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.