본문 바로가기
Blog/세미나

AWS Community Day 참관 사진

by NAMP 2019. 1. 26.

AWS Community Day 참관 사진

2019년 1월 25일(금) 오후 1시~6시 세종대 컨벤션 광개토홀에서 진행되었습니다.

세부일정은 이곳에서 확인할 수 있습니다.

행사 세부 일정

인사말

AWS re:Invent 2018를 통해 본 개발자들이 원하는 4가지 클라우드 동향

  1. 컴퓨팅 - 다양한 선택의 폭낮은 개발 비용
  2. 요구사항에 맞는 데이터베이스 선택의 자유
  3. 좀 더 자동 및 실용적 AI 플랫폼 제공
  4. 미래 산업에 대한 진입 창벽 철폐

AWS 서비스 특징 및 트렌드

  • PRIMITIVES
  • FULLY-MANAGED
  • SERVERLESS

AWS 서비스 특징 및 트렌드

점점 Serverless 쪽으로 이동하고 있다.

마이크로 서비스를 위한 다양한 컨테이너 선택 옵션 제공

사용자 요구에 따라 다양한 옵션을 제공한다.

서버리스 및 컨테이너 구현을 위한 두가지 접근법

Firecracker 아키텍처 및 이점

  • Firecracker 마이크로 VM은 KVM과 동일한 보안 기능 제공
  • 불필요한 기능을 줄이고 빠른 시작 시간을 위해 설계
  • 컨테이너 및 람다 함수 최적화로 125ms 이내
  • 초당 150개 부터 수 천개까지 동시에 VM 생성 가능

다양한 데이터베이스 선택 옵션 제공

진정한 데이터베이스 자유를 위한 시점 도래

모든 개발자를 위한 인공 지능 도구 제공

Amazon SageMaker - 손쉬운 기계 학습 모델 생성, 훈련 및 서비스 배포 완전 관리 서비스

인공지능/딥러닝 세션을 들었는데, 거의 SageMaker에 대한 이야기였습니다.

Amazon SageMaker Ground Truth

Amazon SageMaker RL

AWS RoboMaker - 지능형 어플리케이션 손쉽게 개발, 테스트 및 배포 서비스

AWS Ground Station - 우주 산업 서비스

딥러닝@EDM페스티발, 누가누가 잘노나?

AWS DeepLens 소개

Amazon SageMaker 소개

딥렌즈 아키텍처

구성도

결과

데이터 라벨링 노가다는 이제 그만

Amazon SageMaker Ground Truth

  • 머신러닝과 Amazon SageMaker
  • 데이터와 라벨링 작업
  • Amazon Sagemaker Ground Truth 소개
  • Amazon Sagemaker Ground Truth 속의 데이터과학

머신러닝과 Amazon Sagemaker

Build

  • 사전에 빌드된 Jupyter 노트북 인스턴스
  • Tensorflow, mxnet, Pytorch, Glueon 등 머신러닝을 위한 환경 구성되어 있음
  • 최적화된 머신러닝 알고리즘 제공
  • 자신만의 환경 셋업도 가능

Train

  • 학습을 위한 클러스터 구성 및 관리
  • 여러 인스턴스를 사용할 수 있는 분산 학습 알고리즘
  • 대용량 데이터를 수용할 수 있는 확장성 구조
  • 모델 결과물에 대한 보안

Tune

  • 하이퍼파라미터 최적화 작업 단순화
  • 최적화 작업 병렬처리
  • 기존에 값들을 조정해가며 반복적으로 변경의 효과를 관찰하는 시간과 비용 절감

Deploy

  • 추론을 위한 인스턴스 구성 및 관리
  • 확장성 있는 추론 API
  • 모델 버져닝과 성능추적
  • 엔지니어링 노력이 필요없는 손쉬운 배포

왜 라벨링 작업은 힘들까?

  • 사람이 이미지에서 색상을 분류하는 것은 쉽다.
  • 사람이 수천/수만장의 이미지의 색상을 분류하는 것은 어렵다.
  • AWSKRUG Hands-on Lab 2018 - 색상분류모델 만들기
  • https://github.com/yansonz/2018-handson-data-02

그럼에도 불구하고 왜 라벨링 작업은 중요할까?

좋은 ML모델이 좋은 결과를 이끄는 만큼 좋은 학습 데이터가 좋은 결과를 만든다.

  • Imagenet: 14M 이미지, 22K 카테고리
  • Microsoft COCO: 33K 이미지, 80 카테고리
  • MNIST: 70K 이미지, 10 카테고리
  • Open Images Datasets: 9M URL 이미지, 5K 카테고리
  • CIFAR-10: 60K 이미지, 10 카테고리
  • Fashion-MNIST: 70K 이미지, 10 카테고리

자신의 비지니스 문제를 ML로 해결하기 위해서는 데이터셋을 만드는 때가 온다.

가능한 라벨링 작업

Active Learning 과 Auto Data Labeling

아직 서울 리전에 없습니다.

Labeling Consolidation: Probabilities

정리

SageMaker로 강화학습(RL) 마스터링

목차

  • 강화학습(Reinforcement Learning)
  • SageMaker RL
  • Demo - SageMaker RL & Auto Scaling
  • DeepRacer

Amazon SageMaker

Build

  • 학습 데이터 수집 및 준비
  • 데이터 라벨링 및 일반적인 문제를 위한 기본 노트북
  • 최적화된 머신러닝 알고리즘 제공
  • 모델 및 알고리즘 마켓 플레이스, 고성능 알고리즘 내장

Train

  • 학습을 위한 클러스터 구성 및 관리
  • 고성능 인프라에서 원클릭 학습
  • 모델 학습 및 튜닝
  • 한 번의 학습을 통해 어디서나 실행, 모델 최적화

Deploy

  • 프로덕션 환경에 모델 배포
  • 확장성 있는 추론 API
  • 모델 버져닝과 성능추적
  • 엔지니어링 노려이 필요없는 손쉬운 배포

최신 알고리즘을 사용한 RL 모델 훈련

시뮬레이션 환경 통합

Example: Auto Scaling

목표: 적절한 Scale up & out 을 통해 트랜잭션 손실과 비용낭비를 최소화

  • Environment: 로드프로필 & 인스턴스
  • Action: 인스턴스 추가/제거
  • State: (인스턴스 용량, 실패한 트랜잭션)
  • Reward: R(인스턴스 용량, 실패한 트랜잭션)

보상(Reward)

Observation, Reward

Training

댓글