본문 바로가기

분류 전체보기

(45)

DeepSpeech에서 Kspon 데이터셋 학습을 위한 환경 구성 음성 인식은 인공지능 분야에서 중요한 주제 중 하나로, 음성을 텍스트로 변환하는 기술입니다. 이 기술은 음성 명령 인식, 자동 번역, 음성 검색 등 다양한 응용 분야에서 사용되고 있습니다. DeepSpeech의 초기 버전은 2017년에 처음으로 공개되었습니다. 이후 Mozilla는 지속적으로 DeepSpeech를 업데이트하고 개선해왔으며, 커뮤니티의 참여와 기여를 받아 오픈 소스 프로젝트로 발전시켜 왔습니다. 현재는 오래된 코드로 Benchmark로 구성하거나 과거 모델부터 구현하고 공부하기 위한 분들을 위한 환경 세팅을 공유하고자 작성하게 되었습니다. DeepSpeech는 다양한 데이터셋으로 학습할 수 있으며, 이 중 Kspon 데이터셋은 AI-Hub에서 공개된 한국어 음성 인식에 특화된 데이터셋입니다..

GAN(Generative adversarial network) 이란? 1.1 GAN이란? GAN(Generative adversarial network) 동시에 두 개의 모델을 훈련하는 머신러닝의 한 종류 Generator는 가짜 데이터를 생성하도록 훈련 Discriminator는 실제 샘플과 가짜 샘플을 구분하도록 훈련 Generative(생성적) : 모델의 목적 - 새로운 데이터를 생성 Adversarial(적대적) : generator와 discriminator 사이의 경쟁 구도를 나타냄 1.2 GAN의 동작방식 Generator의 목표는 훈련 데이터와 구별이 안 될 정도로 훈련 데이터셋의 특징이 잘 나타난 샘플을 생성하는 것 Generator의 입력 값은 랜덤한 숫자로 구성된 벡터 생성자는 판별자의 분류 결과에서 피드백을 받아 학습 Discriminator의 목표는..

Numba 설치하기 Compatibility Numba is compatible with Python 3.7–3.10, and Numpy versions 1.18 up to 1.23. Our supported platforms are: Linux x86 (32-bit and 64-bit) Linux ppcle64 (POWER8, POWER9) Windows 7 and later (32-bit and 64-bit) OS X 10.9 and later (64-bit and unofficial support on M1/Arm64) *BSD (unofficial support only) NVIDIA GPUs of compute capability 5.3 and later Compute capabilities 3.5 - 5.2 ar..

NUMA, ccNUMA, hUMA 설명 NUMA(Non-Uniformed Memory Access) 불균일 기억장치 접근 메모리에 접근하는 시간이 CPU와 메모리의 상대적인 위치에 따라 달라지는 컴퓨터 메모리 설계 방법. 각 CPU는 메모리의 일부를 자신의 지역 메모리(Local Memory)로 가지고 있으며 이 지역 메모리에 접근하는 속도는 원격 메모리(Remote Memory)에 접근하는 속도보다 훨씬 빠르다. 간단히 예를 들어 시스템에 CPU 소켓이 네 개 있고, 512GB의 메모리가 설치되어 있다면 물리 주소 0~128G-1번지까지의 메모리는 0번 소켓의, 128G~256G-1번지까지의 메모리는 1번 소켓의 지역 메모리가 되는 방식. 각 소켓에서 지역 메모리에 접근할 때에는 원격 메모리에 접근할 때보다 훨씬 빠르게 데이터를 읽고 쓸 수..

강력한 수준의 경량 프로파일러 Nvprof 강력한 수준의 경량 프로파일러 Nvprof 공헌자(저자/번역자): Mark Harris / NVIDIA Korea CUDA 5의 CUDA 툴킷에 nvprof라는 강력한 새 도구가 추가됐습니다! Nvprof는 진행 상황을 빠르게 검사, 작성 언어와 관계없이 NVIDIA GPU에서 실행되는 모든 CUDA 커널을 프로파일링 등 매우 편리한 도구입니다. Nvprof의 다양한 기능을 개발자 블로그에서 확인가능합니다. 링크: https://developer.nvidia.com/ko-kr/blog/cuda-%EC%A0%84%EB%AC%B8%EA%B0%80-%ED%8C%81-%EC%9C%A0%EC%9A%A9%ED%95%9C-%EB%B2%94%EC%9A%A9-gpu-%ED%94%84%EB%A1%9C%ED%8C%8C%EC..

Top 10 Performance Tuning Practices for Pytorch https://medium.com/naver-shopping-dev/top-10-performance-tuning-practices-for-pytorch-e6c510152f76 Top 10 Performance Tuning Practices for Pytorch Pytorch 모델의 학습 및 추론을 가속화 할 수 있는 10가지 팁을 공유드립니다. 코드 몇 줄만 바꿈으로써 속도를 개선하고 모델의 품질 또한 유지할 수 있습니다. medium.com

CVPR 2022 Tutorial on Neural Fields in Computer Vision https://www.youtube.com/watch?v=PeRRp1cFuH4 Website: https://neuralfields.cs.brown.edu/cvpr22 Slides: https://drive.google.com/drive/folder... Community Website Features (https://neuralfields.cs.brown.edu) Neural Fielder Slack Community (Join Link: https://join.slack.com/t/neuralfields...) Neural Field Techniques: 00:35:38 - Architectures (Techniques) 00:52:35 - Hybrid Representations (Technique..

ImageNet Dataset 압축해제 및 처리 방법 ImageNet Dataset 압축해제 및 처리 방법 #!/bin/bash # # script to extract ImageNet dataset # ILSVRC2012_img_train.tar (about 138 GB) # ILSVRC2012_img_val.tar (about 6.3 GB) # make sure ILSVRC2012_img_train.tar & ILSVRC2012_img_val.tar in your current directory # # https://github.com/facebook/fb.resnet.torch/blob/master/INSTALL.md # # train/ # ├── n01440764 # │ ├── n01440764_10026.JPEG # │ ├── n01440764_10..

이전 1 2 3 4 5 6 다음

티스토리툴바