谷歌在iOS平台上架免费听写应用Google AI Edge Eloquent,主打离线优先,真正离线可用的AI听写系统功能
谷歌在iOS平台悄然上架免费听写应用“Google AI Edge Eloquent”,主打“离线优先”:用户下载基于Gemma的自动语音识别模型后,即可在无网络环境下进行实时听写,暂停后应用会自动滤除“嗯”“啊”等语气词,并将口语润色成通顺的书面表达,底部提供“要点提取”“正式”“简短”“详细”四种改写选项。 应用默认开启云端模式时,会调用Gemini完成文本清理,关闭后则纯本地处理;用户还能从Gmail导入人名、专业术语等关键词或自建词库,系统记录全部听写历史并支持搜索,显示字数和语速等统计信息。
目前Eloquent只在iOS上架,但App Store描述已透露Android规划:未来可被设为系统默认键盘,在任何输入框通过悬浮按钮一键启动语音听写,整体体验与Wispr Flow等Android端AI听写应用类似。 Google尚未回应TechCrunch的置评请求,但在开发者页面上,将Eloquent定位为“打通自然语音与可直接使用文本的边缘AI组件”,与Gemma 4等Edge模型一起构成本地AI应用生态的一部分。
来源:公开信息
ABAB AI 解读
Eloquent真正的看点不在“又多了一个语音输入App”,而在于它把大模型从云端拉回了“系统功能”层:Gemma在本地负责语音识别和基础润色,Gemini只在用户愿意时参与进一步清理,这种架构把AI听写从“云端服务”降格为类似输入法、键盘的基础能力。 对高敏感场景(医疗、法律、内部会议)来说,“所有音频留在设备上”提供了一个比SaaS转录更强的隐私叙事,也为谷歌在“边缘AI”战场上抢占一块原本被第三方应用占据的地盘。
从产品结构看,Eloquent把传统转录链路中的多个环节(录音→转写→人工删语气词→整理要点→调风格)全部自动化,并通过几种预设改写模式(要点、正式、简短、详细)将“写作风格”前置成按钮,而不是让用户再开一个文档或AI聊天窗口去二次加工。 这等于在移动端落地了一个轻量级“语音→结构化文本”流水线:记者、学生、咨询顾问甚至创作者,可以直接用口述产出接近成品的备忘录、邮件草稿或会议纪要,大幅压缩从说话到成文的时间成本。
在更大的生态层面,Eloquent是Gemma“Edge战略”的一个具体样本:通过免费、系统级的听写工具,把本地模型部署到尽可能多的终端,让开发者和用户习惯于“先离线,再上云”的心智。 和OpenAI、Anthropic等纯云路线不同,谷歌试图把自己嵌回操作系统邻近层——先用Eloquent这类实用工具占据输入入口,再用Gemma/Gemini组成的混合栈锁定开发者。长远看,谁掌握了“语音→文本”的默认通路,谁就有机会在个人设备上成为“认知操作系统”,而不只是一个可替换的聊天机器人。