70여 개 언어 자동 인식, 화자 억양·속도까지 거의 실시간 번역
구글 음성-음성 번역 모델 공개… 번역 앱 켜면 바로 사용 가능
[기사 요약]
-구글이 70여 개 언어를 실시간으로 통역하는 음성-음성 번역 모델 ‘제미나이 3.5 실시간 번역(Gemini 3.5 Live Translate)’을 공개했다.
-화자가 말을 끝낼 때까지 기다리지 않고 말하는 도중 연속으로 통역하는 방식으로, 자연스러운 대화에 가까운 경험을 제공한다.
-안드로이드(Android)·iOS 구글 번역 앱에 즉시 적용됐으며, 같은 날 발표된 앤트로픽(Anthropic) ‘클로드 페이블 5(Claude Fable 5)’와 함께 이날 인공지능 업계의 주목을 받았다.
By 박영주 | yjpark@kakao.com | 시카고오늘
JUN 10 2026. WED at 6:25 PM CDT

구글이 실시간 음성 통역 모델 ‘제미나이 3.5 라이브 트랜스레이트’(Gemini 3.5 Live Translate)를 공개했다. 두 사람이 서로 다른 언어로 말해도 거의 실시간으로 통역해주는 기능으로, 구글은 자사 역대 가장 진보한 음성-음성 번역 모델이라고 설명했다.
가장 큰 변화는 통역 방식이다. 기존 번역기는 화자가 한 문장을 끝낼 때까지 기다린 뒤 번역을 시작했다. 반면 제미나이 3.5 실시간 번역은 말하는 도중에도 연속으로 통역 음성을 생성한다. 구글은 몇 초 정도 지연만 두고 통역이 이어지며, 화자의 억양과 말하는 속도, 음높이까지 보존한다고 밝혔다.
언어 설정도 따로 필요 없다. 모델이 70여 개 언어를 자동으로 인식하기 때문에 사전 설정 없이 바로 대화를 시작할 수 있다. 시끄러운 환경에서도 작동하도록 잡음 처리 성능을 강화했다.
배포는 세 갈래로 진행된다. 일반 사용자는 안드로이드와 iOS용 구글 번역 앱에서 별도 가입 절차 없이 즉시 이용할 수 있다. 헤드폰이나 이어폰을 연결하면 번역된 음성을 들을 수 있으며, 아이폰 경우 에어팟은 물론 일반 유선 이어폰을 연결해도 사용할 수 있다.
특히 안드로이드에는 헤드폰 없이도 휴대전화 스피커(수화기)를 통해 통역 내용을 들을 수 있는 ‘듣기 모드'(Listen Mode)가 새롭게 추가됐다.
개발자는 제미나이 라이브 API(Gemini Live API)와 구글 AI 스튜디오(Google AI Studio)를 통한 공개 프리뷰로, 기업 고객은 구글 미트(Google Meet)에서 이번 달 비공개 프리뷰로 접근할 수 있다.
구글 미트 경우 지원 언어가 종전 5개에서 70여 개로 늘면서 한 회의에서 2천여 개 언어 조합이 가능해졌다. 6개월 전만 해도 실시간 번역 베타는 안드로이드 전용에 미국·멕시코·인도로만 제한돼 있었다.
이번 발표는 같은 날 앤트로픽(Anthropic)이 인공지능 모델 ‘클로드 페이블 5’(Claude Fable 5)를 일반에 공개하면서 업계 주목이 분산된 가운데 나왔다. 다만 일상에서 언어 장벽을 직접 허무는 실시간 통역 기술의 파급력이 더 크다는 평가도 적지 않다.
[English Summary]
• Google released Gemini 3.5 Live Translate, its most advanced speech-to-speech translation model, supporting 70+ languages with automatic language detection.
• Unlike turn-by-turn systems, it translates continuously as a person speaks, preserving the speaker’s intonation, pace, and pitch with only a few seconds of delay.
• It is rolling out immediately in the Google Translate app on Android and iOS worldwide, with developer (Gemini Live API) and enterprise (Google Meet) previews launching alongside.
@2026 박영주의 시카고오늘
