본문 바로가기
728x90
반응형

음성텍스트변환2

🎙 Whisper로 STT(음성 텍스트 변환) 하기 – Windows FFmpeg & GPU 설정 가이드 🎙 Whisper로 STT(음성 텍스트 변환) 하기 – Windows FFmpeg & GPU 설정 가이드Python + Whisper + FFmpeg + Scoop + GPU (선택)까지 완벽 정리!✅ 이 글에서 다루는 것Whisper 설치 및 실행 방법FFmpeg 설치 (PowerShell + Scoop 활용)GPU / CPU 환경 모두 대응Python 가상환경 구성변환된 결과 엑셀로 저장하기📋 준비물항목설명Python 3.10 또는 3.113.12은 호환성 이슈 있으므로 권장하지 않음NVIDIA GPU (선택)GPU 가속을 위한 장치 (예: RTX 4070)FFmpeg오디오 전처리 필수PowerShellScoop 설치에 필요pipPython 패키지 관리자 (기본 포함됨)🧱 STEP 1. Pyth.. 2025. 4. 18.
다글로 - 모든 음성을 다글로 (음성 → 텍스트) | AI 비서, 회의록 작성, 강의 노트 자동완성, 영어 공부 스크립트 ⬛ 다글로 소개 다글로(앱 or 웹 사용 가능)는 사용자 친화적인 받아쓰기 서비스로, 회의록 작성, 강의 녹음 등에 매우 유용하게 활용할 수 있습니다. 사용자가 제공하는 음성 또는 영상 데이터(YouTube URL)를 텍스트로 변환해 주는 서비스입니다. 무료 서비스를 이용하면 하루에 5건, 한 달에 20시간까지의 받아쓰기를 사용할 수 있습니다. 보다 많은 양의 음성/영상 데이터를 받아쓰기하고 싶다면 Pro 플랜을 구독하여 한 달에 최대 50시간까지 제한 없이 받아쓰기를 사용할 수 있습니다. ⬛ 다글로 사용법 다글로의 사용법은 간단합니다(공식 가이드 참고). 먼저 로그인을 한 후, '+ 새로 만들기' 버튼을 클릭하여 받아쓰기를 시작할 수 있습니다. 이때, 음성/영상 파일을 직접 업로드하거나 유튜브 영상의 .. 2024. 3. 7.
728x90
반응형