pyannote-audio 를 이용한 diarization 을 진행하는 과정에서 wav 파일을 다루기 위해 pydub 를 공부한 내용을 정리한다. 1. 설치 pip install pydub 2. 기본사용법 from pydub import AudioSegment # Open file song = AudioSegment.from_mp3('song.mp3') # Slice audio # pydub는 milliseconds 단위를 사용한다 ten_seconds = 10 * 1000 one_min = ten_seconds * 6 first_10_seconds = song[:ten_seconds] last_5_seconds = song[-5000:] # up/down volumn beginning = first_1..
python 에서 엑셀파일을 다루는 툴은 많지만 나는 deeplearning 데이터처리를 위해 쓰는 것이므로 pandas 를 쓰기로 했다. 예시로 들 엑셀은 아래와 같다. name age gender grade score james 22 men 2 88 amy 25 women 4 67 edward 24 men 3 89 1. 엑셀 읽기 import pandas as pd df = pd.read_excel([엑셀파일경로(이름)], sheet_name = [시트이름]) df = pd.read_excel('./data/excel/score1.xlsx') # sheet_name 이 없을 경우 제일 첫 시트저장됨 위의 df 는 DataFrame 형태로 저장된다. 2. 특정 데이터 접근하기 df['칼럼명'] # 열에..
파이썬에는 Dictionary 라는 자료형이 있는데 이는 JSON 과 유사한 형태를 가지고 있다. 프로그래밍을 하다보면 dict to json 으로 변환 후 json 파일 자체를 저장해야 하는 경우가 많다. 위의 경우를 매번 찾아서 쓰기 귀찮아서 정리한다. 1. dict to json import json dict = { "segmentInfo" : segDict, "timeInfo" : { "totalWavLength" : 255343, "totalSegCnt" : 223, "totalSegTime" : 253432, "totalBlankLength" : 334, "segmentCnt" : len(segDict) } } with open('[폴더경로]/[json파일명].json','..
1. np.arange numpy.arange(, , ) start : 시작점(생략시 0으로 설정됨) end : 끝점 stepSize : 다음 점의 간격 2. np.arange 와 np.range 의 차이 np.range 는 정수 step 만 지원. np.arange 는 실수 step 도 지원.