구글 제미나이(Gemini)의 전방위적 확산과 기술적 도약, 그리고 사용자의 선택권

구글이 자사의 인공지능 모델인 ‘제미나이(Gemini)’를 구글 독스, 지메일, 드라이브 등 구글 워크스페이스 전반은 물론 안드로이드 어시스턴트에 이르기까지 일상적인 서비스 깊숙이 통합하고 있다. 이는 단순한 기능 추가를 넘어 사용자의 모바일 경험을 근본적으로 변화시키려는 시도로 해석된다. 특히 최근 구글은 음성 상호작용 능력을 대폭 강화한 ‘제미나이 2.5 플래시 네이티브 오디오(Gemini 2.5 Flash Native Audio)’ 모델을 공개하며 기술적 완성도를 높이는 데 주력하고 있다.

진화하는 AI: 제미나이 2.5 플래시 네이티브 오디오의 혁신

이번에 공개된 제미나이 2.5 플래시 네이티브 오디오 업데이트의 핵심은 ‘자연스러움’과 ‘정확성’이다. 기존의 텍스트-음성 변환 모델을 넘어선 이 기술은 라이브 음성 에이전트가 복잡한 워크플로우를 처리하고 사용자 지시를 유연하게 탐색할 수 있도록 돕는다. 현재 구글 AI 스튜디오와 버텍스 AI(Vertex AI)를 통해 제공되고 있으며, ‘서치 라이브(Search Live)’에도 적용되어 사용자는 AI와 실시간으로 아이디어를 논의하거나 기업 수준의 고객 응대 시스템을 구축할 수 있게 되었다.

기술적 지표 또한 괄목할 만하다. 복잡한 다단계 작업을 평가하는 ‘ComplexFuncBench Audio’에서 제미나이 2.5는 71.5%의 높은 점수를 기록하며 외부 기능 호출(Function Calling)의 신뢰성을 입증했다. 대화 도중 실시간 정보를 가져와 흐름을 깨지 않고 자연스럽게 응답에 반영하는 능력이 강화된 것이다. 또한 개발자의 지침을 준수하는 비율이 90%로 상승하여, 쇼피파이(Shopify)나 UWM 같은 기업 현장에서 실질적인 비즈니스 성과를 창출하는 데 기여하고 있다.

언어 장벽을 허무는 실시간 통역 기술

새로운 모델은 글로벌 소통 방식에도 변화를 예고했다. 구글 번역 앱에 베타 버전으로 도입되는 ‘실시간 음성 번역’ 기능은 70개 이상의 언어를 지원하며, 단순히 내용만 번역하는 것이 아니라 화자의 억양, 속도, 피치까지 보존하는 ‘스타일 전이’ 기술을 탑재했다. 이를 통해 사용자는 이어폰을 끼고 상대방의 말을 모국어처럼 자연스럽게 청취할 수 있으며, 이중 언어 대화 모드에서는 화자가 바뀔 때마다 자동으로 출력 언어를 전환하여 끊김 없는 소통을 지원한다.

편의성과 프라이버시 사이의 딜레마

그러나 구글의 이러한 공격적인 AI 통합 행보가 모든 사용자에게 환영받는 것은 아니다. 구글 포토에 도입된 ‘애스크 포토(Ask Photos)’ 기능이 대표적인 예다. 휴가지 일몰 사진이나 자동차 번호판 정보를 찾아주고 심지어 원하는 편집 방향을 제안하는 편리함을 제공하지만, 개인의 사진 데이터가 AI 학습이나 분석에 활용되는 것에 거부감을 느끼는 사용자들도 적지 않다. 구글 크롬 브라우저가 방문 기록을 자연어로 검색할 수 있게 하거나 작문을 돕는 기능 또한 프라이버시 침해 우려를 낳고 있다.

실제로 많은 사용자가 AI가 없는 간결한 사용 환경을 선호하거나, 데이터 공유 자체를 원치 않는 경우가 많다. 검색 결과 상단을 차지하는 ‘AI 오버뷰(AI Overviews)’가 오히려 정보 탐색을 방해한다고 느끼는 사용자들도 존재한다.

사용자를 위한 ‘AI 끄기’ 옵션과 데이터 통제권

다행히 구글은 사용자가 자신의 데이터와 앱 사용 환경을 통제할 수 있는 수동 설정 기능을 제공하고 있다. AI 기능이 부담스러운 사용자는 각 서비스별로 설정을 변경하여 제미나이를 비활성화할 수 있다.

구글 포토의 경우, 앱 설정 내 ‘환경설정’ 메뉴에서 ‘제미나이 기능’ 탭으로 진입해 ‘사진에서 제미나이 사용’ 토글을 끄면 관련 기능이 차단된다. 구글 검색에서 AI 오버뷰를 배제하고 전통적인 검색 결과만을 원한다면 검색어 뒤에 “-ai”를 붙이는 간단한 팁을 활용할 수 있다. 이는 데스크톱과 모바일 모두에서 유효하다.

또한 PC 버전의 구글 크롬 사용자라면 설정 메뉴의 ‘AI 혁신(AI innovations)’ 탭을 통해 ‘방문 기록 검색’이나 ‘글쓰기 도우미’ 기능을 개별적으로 끌 수 있다. 이는 제미나이가 브라우징 데이터를 열람하는 것을 방지하는 효과적인 방법이다. 구글의 기술적 진보가 계속되는 가운데, 편의성을 취할 것인지 프라이버시를 우선할 것인지에 대한 선택은 결국 사용자의 몫으로 남게 되었다.