봉자씨
친절한 봉자씨의 딥러닝 이야기
봉자씨
전체 방문자
오늘
어제
  • 분류 전체보기 (144)
    • 개발 (25)
      • 딥러닝 단어장 (2)
      • MLOps (6)
      • 딥러닝, Computer Vision (3)
      • Pytorch (0)
      • Develop (5)
      • Kubernetes (4)
      • 대학원생의 좌충우돌 GPU 클러스터 구축기 (3)
      • LangChain (1)
    • 경제 (115)
      • 경제 용어 단어장 (0)
      • 경제일기 (113)

인기 글

최근 글

블로그 메뉴

  • 홈
  • 태그
  • Github

공지사항

최근 댓글

태그

  • 위스키
  • 자이언트스탭
  • 중국리오프닝
  • SVB
  • Kubeflow
  • 딥러닝
  • 부동산
  • 경제일기
  • kserve
  • fomc
  • AI
  • kubectl
  • CPI
  • 금리인하
  • SVB파산
  • 주식
  • k8s
  • 경기침체
  • ChatGPT
  • 은행파산
  • 인플레이션
  • 장단기금리차
  • 빅스탭
  • MLOps
  • 대출부실
  • Kubernetes
  • 금리
  • 금리동결
  • 채권
  • 금리인상

티스토리

250x250
hELLO · Designed By 정상우.
봉자씨

친절한 봉자씨의 딥러닝 이야기

개발/딥러닝, Computer Vision

002. 모델 계산량, FLOPs vs MAC, FLOPs vs FLOPS

2021. 2. 2. 22:00
반응형

딥러닝에서 계산량은 파라미터와 함께 모델이 얼마나 큰지, 효율적인지를 나타내는 지표이다.

계산량은 보통 FLOPs(FLoating point OPerations) 혹은 MAC(Multiply–ACcumulate)으로 나타낸다.

 

대부분의 현대 하드웨어는 tensor를 다루는 연산을 할때 FMA라고 하는 명령어 셋을 사용한다.

FMA는 a*x+b를 하나의 연산(operation)으로 처리를 하고 이 연산이 몇번 실행되었는지를 세는 것이 MAC이다.

 

FLOPs는 덧셈, 곱셈을 하나 하나의 연산으로 보기 때문에 일반적으로 MACs : FLOPs = 1 : 2(덧셈 1회, 곱셈 1회)가 된다.

따라서 MAC을 FLOPs로 변환할 때는 2를 곱하면 되고, 반대의 경우엔 2로 나눠주면 된다.

 

100 MACs = 2*100 FLOPs = 200 FLOPs

100 FLOPs = 0.5 * 100 MACs = 50 MACs


FLOPs와 FLOPS도 서로 뜻이 다른데, 각각의 원래 단어를 보면 바로 구분이 된다.

 

FLOPs(FLoating point OPerations)

FLOPS(FLoating point OPerations per Second, flop/s)

 

즉, FLOPs는 실제 계산량을 나타내는 단위이고.

FLOPS는 얼마나 빨리 계산을 처리할수 있는지에 대한 단위이다.

 

 


Focus Only AI | Ocean: GPU 클러스터 관리 솔루션 | AI Ocean 대표 신은섭

Ocean 소개글: https://bongjasee.tistory.com/pages/Ocean

Github:https://github.com/AI-Ocean

 

Ocean - GPU 클러스터 관리 솔루션

Ocean은 2020년 경희대학교에서 딥러닝 연구를 시작하던 때부터 만들어진 GPU 클러스터 관리 솔루션입니다. # 성과 개발을 시작한 이후 지금까지 MLVC 연구실에서는 Ocean을 통해 다양한 연구, 프로젝

bongjasee.tistory.com


반응형
저작자표시 동일조건

'개발 > 딥러닝, Computer Vision' 카테고리의 다른 글

011. Open-cv, cv2: ImportError: libGL.so.1: cannot open shared object file: No such file or directory  (0) 2022.07.08
001. Torchvision 0.8, GPU에서 돌아가는 Scriptable Transforms 사용해서 데이터 로딩 속도 개선하기  (0) 2021.01.28
    '개발/딥러닝, Computer Vision' 카테고리의 다른 글
    • 011. Open-cv, cv2: ImportError: libGL.so.1: cannot open shared object file: No such file or directory
    • 001. Torchvision 0.8, GPU에서 돌아가는 Scriptable Transforms 사용해서 데이터 로딩 속도 개선하기
    봉자씨
    봉자씨
    인공지능, 딥러닝, MLOps 이야기로 여러분을 찾아갑니다!

    티스토리툴바