본문 바로가기

전체 글

(37)
A Visual Guide to Vision Transformers https://blog.mdturp.ch/posts/2024-04-05-visual_guide_to_vision_transformer.html A Visual Guide to Vision Transformers | MDTURPA Visual Guide to Vision Transformers This is a visual guide to Vision Transformers (ViTs), a class of deep learning models that have achieved state-of-the-art performance on image classification tasks. Vision Transformers apply the transformer architecturblog.mdturp.ch
Redis와 MongoDB 비교 (출처 : https://aws.amazon.com/ko/compare/the-difference-between-redis-and-mongodb/ ) Redis와 MongoDB의 차이점? Remote Dictionary Server(Redis)와 MongoDB는 데이터를 비정형 형식으로 저장하는 NoSQL 데이터베이스입니다. NoSQL 데이터베이스는 테이블, 행, 열을 사용하는 관계형 데이터베이스와 데이터를 다르게 저장합니다. Redis는 데이터를 키-값 쌍으로 저장하는 오픈 소스 인 메모리 데이터베이스입니다. 고성능을 위해 RAM에 데이터를 저장하지만 추가 기능으로 온디스크 영구 스토리지를 제공합니다. MongoDB는 데이터를 직렬화된 JSON 형식으로 저장하는 소스 사용 가능 도큐먼트 데이터베이스입니..
이미지 화질 개선 AI 기술 삼성전자 딥러닝 기반 화질 개선 AI 기술 정리 S/W AI-ISP(Image Signal Processor) 출처 : https://r1.community.samsung.com/t5/camcyclopedia/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EA%B8%B0%EB%B0%98-%ED%99%94%EC%A7%88-%EA%B0%9C%EC%84%A0-ai-%EA%B8%B0%EC%88%A0/ba-p/20184604 딥러닝 기반 화질 개선 AI 기술 박상욱김종현 목차 1. 딥러닝 기반 화질 개선 AI 기술 개념 2. 저조도 화질 개선 AI 모델 : AI Nightography 3. 고화소 AI 영상 처리 알고리즘 : AI High-Resolution 딥러닝 기반 화질 개선 AI 기술 개념 딥러닝 r..
[Python] 비동기 프로그래밍에서 asyncio.Event 사용하기 Python의 asyncio 라이브러리는 비동기 프로그래밍을 쉽게 할 수 있도록 여러 가지 도구를 제공합니다. 이 중 asyncio.Event는 여러 비동기 함수가 특정 이벤트에 의존하게 만들 때 유용합니다. asyncio.Event 이해하기 asyncio.Event 객체는 기본적으로 두 가지 메소드를 주로 사용합니다: set() : 이벤트를 설정합니다. 이 메서드가 호출되면, wait()로 대기 중인 모든 코루틴이 실행을 재개합니다. wait() : 이벤트가 설정될 때까지 현재 코루틴의 실행을 중단합니다. clear() : 이벤트를 초기화합니다. 이 메서드가 호출되면, 다음부터 wait()를 호출하는 코루틴은 이벤트가 다시 설정될 때까지 대기합니다. 예제: 두 개의 비동기 함수와 함께 사용하기 아래 예..
[Python] 효과적인 디버깅, 모니터링이 가능한 Python Logging 이 글에서는 Python의 내장 logging 모듈을 효과적으로 사용하여 디버깅 및 모니터링 능력을 향상시키는 방법을 자세히 살펴보겠습니다. 로깅을 이해하는 것은 견고하고 유지보수 가능한 애플리케이션을 구축하기 위해 중요합니다. Why Logging Matter 우리가 파이썬 로깅의 구체적인 내용을 자세히 살펴보기 전에 왜 로깅이 중요한지 먼저 이해해 봅시다. 복잡한 파이썬 프로젝트를 작업할 때 특히 팀으로 작업할 때 로깅은 믿을 수 있는 도구가 됩니다. 로깅은 다음과 같은 데에 도움을 줍니다: Debugging : 코드의 흐름을 쉽게 추적하고 오류와 문제를 식별 Monitoring : 프로덕션 환경에서 애플리케이션의 동작을 모니터링 Auditing : 애플리케이션 내에서 중요한 이벤트와 활동을 기록 T..
[Python] 2개의 Dictionary 합치는 방법 중복된 Key 값이 없을 경우 dict_1 = {'A' : 1, 'B' : 2, 'C' : 3, 'D' : 4} dict_2 = {'E' : 5, 'F' : 6, 'G' : 7, 'H' : 8} result_dict = dict_1 result_dict.update(dict_2) >>> result_dict {'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5, 'F': 6, 'G': 7, 'H': 8} 중복된 Key 값이 있을 경우 중복된 Key값이 있을 때 update를 수행하면, 업데이트할 대상으로 덮어쓰기 발생 dict_1 = {'A' : 1, 'B' : 2, 'C' : 3, 'D' : 4} dict_2 = {'C' : 5, 'D' : 6, 'E' : 7, 'F' : 8} 따라서..
OpenAI - Whisper JAX 수행하기 위한 Anaconda 환경 구성 및 테스트 Whisper란? Whisper는 2022년 9월에 OpenAI에서 공개된 범용 음성 인식 모델(general-purpose speech recognition model)입니다. 다양한 오디오의 대규모 데이터 세트에 대해 학습되며 multilingual speech recognition, speech translation, language identification을 수행할 수 있는 multitasking model이기도 합니다. Transformer sequence-to-sequence 모델은 multilingual speech recognition, speech translation, spoken language identification, voice activity detection를 비롯한 var..
DeepSpeech에서 Kspon 데이터셋 학습을 위한 환경 구성 음성 인식은 인공지능 분야에서 중요한 주제 중 하나로, 음성을 텍스트로 변환하는 기술입니다. 이 기술은 음성 명령 인식, 자동 번역, 음성 검색 등 다양한 응용 분야에서 사용되고 있습니다. DeepSpeech의 초기 버전은 2017년에 처음으로 공개되었습니다. 이후 Mozilla는 지속적으로 DeepSpeech를 업데이트하고 개선해왔으며, 커뮤니티의 참여와 기여를 받아 오픈 소스 프로젝트로 발전시켜 왔습니다. 현재는 오래된 코드로 Benchmark로 구성하거나 과거 모델부터 구현하고 공부하기 위한 분들을 위한 환경 세팅을 공유하고자 작성하게 되었습니다. DeepSpeech는 다양한 데이터셋으로 학습할 수 있으며, 이 중 Kspon 데이터셋은 AI-Hub에서 공개된 한국어 음성 인식에 특화된 데이터셋입니다..