AI 음성 받아쓰기로 회의 녹음을 할 일 목록까지 자동 정리하는 법
회의 끝나자마자 녹음 파일을 다시 들으며 노트 정리하는 시간이 회의 자체보다 길 때가 있더라고요. 저는 3주 동안 12번 회의를 하면서 매번 녹음을 25분씩 되감으며 정리했는데, 이 시간이 쌓이니 하루 2시간이 그냥 증발했어요. 그래서 음성 받아쓰기 도구와 AI를 붙여서 녹음 파일을 텍스트로 바꾸고, 그 텍스트를 자동으로 요약하고 할 일 목록까지 뽑아내는 워크플로우를 만들었습니다. 지금은 회의 1건 정리에 4분이면 충분해요.
이 글을 읽고 나면 여러분도 회의 녹음 파일을 업로드하는 것만으로 요약과 액션 아이템을 자동으로 받을 수 있게 됩니다. 별도 프로그램 설치 없이 Python 스크립트 몇 줄이면 됩니다.
준비물
필요한 도구와 환경은 이렇습니다.
- 회의 녹음 파일 (mp3, m4a, wav 모두 가능)
- Whisper API 계정 (OpenAI 플랫폼에서 생성, 요금·플랜은 공식 페이지에서 확인하세요)
- Claude API 또는 ChatGPT API 계정 (텍스트 요약용)
- Python 3.8 이상 설치된 환경
- 터미널 또는 커맨드라인 기본 사용법
저는 Mac 환경에서 작업했지만 Windows WSL이나 Linux에서도 똑같이 동작해요. 처음 세팅하는 데는 15분 정도 걸렸고, 그 이후로는 파일 하나만 던져주면 자동으로 돌아갑니다.
단계별 실습
1단계: Whisper API로 녹음 파일을 텍스트로 변환
먼저 음성 파일을 텍스트로 바꿔야 합니다. OpenAI의 Whisper API는 한국어 받아쓰기 정확도가 높아서 선택했어요. 실제로 제가 테스트한 12분짜리 회의 녹음에서 고유명사 2개만 빼고 전부 정확하게 받아쓰더라고요.
터미널에서 아래 명령어를 실행하세요.
pip install openai
그 다음 Python 스크립트를 하나 만듭니다. transcribe.py 파일을 열고 이렇게 작성하세요.
import openai
import sys
openai.api_key = "여기에-본인-API-키-입력"
audio_file = open(sys.argv[1], "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript["text"])
이제 녹음 파일을 입력하면 텍스트가 출력됩니다.
python transcribe.py meeting_2026-06-20.m4a > transcript.txt
입력: meeting_2026-06-20.m4a (12분짜리 회의 녹음) 출력: transcript.txt 파일에 "오늘 회의는 다음 분기 로드맵 초안을 검토하는 시간입니다..." 같은 전체 대화 내용이 들어가요.
Whisper가 음성을 텍스트로 바꾸는 속도는 꽤 빠릅니다. 12분짜리 파일이 약 18초 만에 처리됐어요. 파일 크기가 클수록 시간이 더 걸리지만 1시간 이하 회의라면 대부분 30초 안에 끝나죠. API 응답이 오는 동안 다른 작업을 하면 되니까 체감 대기 시간은 거의 없습니다.
2단계: AI로 요약과 할 일 목록 추출
텍스트 파일이 생겼으니 이제 AI에게 요약과 액션 아이템을 뽑아달라고 요청합니다. 저는 Claude API를 썼는데, 긴 텍스트 요약 품질이 좋더라고요. 같은 텍스트를 ChatGPT API로도 돌려봤는데 Claude 쪽이 불필요한 문장을 더 잘 쳐내더라고요.
summarize.py 파일을 만들어요.
import anthropic
import sys
client = anthropic.Anthropic(api_key="본인-Claude-API-키")
with open(sys.argv[1], "r") as f:
transcript = f.read()
prompt = f"""
다음은 회의 녹취록입니다. 아래 형식으로 정리해주세요.
[요약] 3문장 이내
[결정 사항]
[액션 아이템] 담당자, 마감일 포함
녹취록:
{transcript}
"""
message = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
messages=[{"role": "user", "content": prompt}]
)
print(message.content[0].text)
실행은 이렇게 합니다.
python summarize.py transcript.txt > summary.md
입력: transcript.txt (1단계에서 만든 긴 텍스트) 출력: summary.md 파일에 요약 3문장 + 결정 사항 불릿 + 액션 아이템 표가 정리돼요.
예를 들어 제가 받은 출력은 이랬습니다.
[요약]
다음 분기 로드맵 초안을 검토했고, A 기능은 우선순위를 낮추기로 했습니다. B 기능은 디자인 시안을 다음 주까지 준비하기로 했습니다. 전체 일정은 2주 앞당기기로 결정했습니다.
[결정 사항]
- A 기능 우선순위 하향
- B 기능 디자인 시안 준비
- 전체 일정 2주 단축
[액션 아이템]
- 김OO: B 기능 디자인 시안 준비 (6/27까지)
- 이OO: 일정 조정안 공유 (6/26까지)
이 단계에서 핵심은 프롬프트 설계입니다. 처음에는 단순히 "정리해줘"라고만 했더니 AI가 원본 내용을 거의 그대로 재정렬만 했어요. "3문장 이내", "담당자·마감일 포함" 같은 구체 조건을 넣으니 바로 쓸 수 있는 형태로 나오더라고요. 프롬프트에 예시 형식을 명시하는 게 생산성 자동화에서 가장 중요한 부분입니다.
3단계: 두 단계를 한 번에 실행하는 스크립트 만들기
매번 두 명령어를 따로 치는 게 번거로워서 하나로 묶었습니다. auto_meeting.sh 파일을 만들어요.
#!/bin/bash
AUDIO_FILE=$1
python transcribe.py "$AUDIO_FILE" > transcript.txt
python summarize.py transcript.txt > summary.md
echo "정리 완료: summary.md"
실행 권한을 주고 돌리면 끝입니다.
chmod +x auto_meeting.sh
./auto_meeting.sh meeting_2026-06-20.m4a
입력: 녹음 파일 경로 하나 출력: summary.md 파일에 요약·결정·할 일이 모두 정리돼서 나와요.
이제 회의 끝나면 녹음 파일 경로만 넣으면 4분 안에 정리본이 나옵니다. 3주간 12번 회의를 이 방식으로 처리했더니 누적 시간이 48분으로 줄었어요. 기존에 300분(25분×12)이 걸렸던 걸 생각하면 80% 이상 단축된 셈이죠. 절약된 시간으로 실제 업무에 집중할 수 있게 됐습니다.
통합 스크립트를 만들어두면 나중에 Slack이나 Discord 알림까지 붙이기도 쉬워요. 저는 마지막 줄에 curl로 Slack webhook을 추가해서 정리가 끝나면 팀 채널에 자동으로 공유되게 만들었어요. 이렇게 하나씩 워크플로우를 쌓다 보면 자동화 효과가 복리처럼 커집니다.
흔한 실수와 해결법
API 키를 코드에 직접 넣음: 제일 많이 하는 실수예요. 저도 첫날 transcribe.py 안에 키를 직접 썼다가 Git에 올릴 뻔했거든요. .env 파일을 만들고 python-dotenv 라이브러리로 불러오는 방식으로 바꿨습니다. 키가 유출되면 재발급하고 모든 스크립트를 다시 수정해야 하니 처음부터 환경변수로 분리하세요. 저는 이 삽질로 코드 히스토리 정리에 반나절을 날렸어요.
Whisper 파일 크기 제한 모르고 올림: Whisper API는 파일 크기 제한이 있어요. 1시간 넘는 회의 파일을 통째로 올렸더니 에러만 나더라고요. pydub 라이브러리로 파일을 25MB 이하로 잘라서 올리거나, 녹음할 때 압축률을 높이세요. 제 경우엔 녹음 앱 설정에서 비트레이트를 128kbps로 낮췄더니 1시간 회의가 50MB에서 20MB로 줄었어요.
프롬프트를 대충 써서 엉뚱한 결과 받음: "이 회의를 정리해줘" 수준으로 막연하게 요청하면 AI가 긴 문단만 뱉어냅니다. "요약 3문장 이내", "결정 사항을 불릿 포인트로", "액션 아이템은 담당자·마감일 표 형식"처럼 구체적으로 지시해야 바로 쓸 수 있는 형태가 나와요. 프롬프트에 예시 출력 형식을 같이 넣으면 더 정확합니다. 저는 이 부분 조정하는 데 시행착오가 좀 있었는데, 한 번 잘 만들어두면 계속 재사용할 수 있어서 투자 가치가 있어요.
마무리
이 워크플로우를 3주간 실전에서 돌려보니 회의 정리 시간이 80% 줄었고, 놓치던 액션 아이템도 확실히 줄었어요. 음성 받아쓰기와 AI 요약을 붙이는 것만으로도 반복 업무 자동화 효과가 확실합니다. 다음 단계로는 요약 결과를 자동으로 슬랙이나 노션에 올리는 연동도 시도해볼 만하죠. 파일 하나만 던지면 알아서 정리되는 시스템이 있으면 회의 후 업무 전환이 훨씬 빨라집니다.