<Claude로 메가이더 AMA 통역 준비하기>
메가이더 AMA 때 통역 좀 더 잘해볼려고 Bing / Bread가 이야기 하는거 라이브로 받아 적을 툴을 찾아봤습니다. 제가 전문 통역사가 아니니까 둘이 말하는거 다 기억하고 통역하기가 어려울것 같더라고요.
이것저것 찾아 보니까 줌 / 구글 미팅을 라이브로 해주는건 많은데, 트위터 스페이스나 유뷰트 라이브 같은 걸 녹화는 해주지만 라이브로 받아 적어주는 기능은 많이 없었습니다. (몇개 있긴 한데 돈 내야하거나 UX가 별로였음)
그래서 Claude로 만들어볼 수 있을까 하다가 살짝 시도해봤습니다. 결론적으로는 3시간 정도 쓰니까 제가 쓸 수 있을 정도의 수준으로는 나오더라고요.
- 스피커에서 나오는 소리가 아닌 실제 컴퓨터에서 나오는 소리를 탐지해야 하니 관련 설정 및 툴 연결
- Open AI의 Whisper 기능 써야 해서 5초 주기로 API 콜
- Greanloa 처럼 라이브로 나오는 내용들 쭉 받아적음
딸깍 만든거라 좀 버벅이거나 느린 부분이 있는데, 적어도 제가 혼자 사용할 정도로는 만들어진것 같습니다.
생각나는 것들 몇개 더 만들어볼 예정인데, 찐 비개발자 관점에서 후기글도 써보겠습니다.

564
14시간 전