
经常用 Mac 语音输入写代码、写文档、聊工作的朋友应该都懂痛点。市面上主流听写工具分两类,一类是系统自带听写,识别生硬,不会自动排版,专业名词经常认错;另一类像 Wispr Flow,AI 润色效果不错,但全程云端处理,录音、文字全部上传第三方服务器,隐私没有保障,还得按月订阅付费,免费额度根本不够日常使用。
软件格律诗 今天给大家带来 FluidVoice 目前 Mac 平台唯一兼顾极速离线语音转文字、本地 Fluid-1 自定义 AI 增强模型的开源听写工具, 已经在 Github 上获得了4.9k 星标,完全免费无订阅,所有语音、文字数据全部留在本机,断网也能完整使用,不管是开发者、文案还是办公人群,都能直接平替付费云端听写软件。

核心底层架构:双层本地工作流
绝大多数开源听写软件只做到语音转写一步,想要语法修正、语气适配必须联网调用大模型。FluidVoice 拆分两层独立本地模块,全程无需网络交互。
FluidVoice 客户端
开源原生 macOS 程序,全局快捷键唤起悬浮听写面板,支持命令模式、写作模式,转写历史本地存储,代码完全公开可自查。
Fluid-1 本地 AI 模型(可选 3.5GB 离线包)
专属端侧增强模型,自动修正口语填充词、规范大小写、适配不同软件语气、处理日期人名数字,所有推理在 Mac 本地硬件完成,零数据外传。 硬件适配拉满,Apple Silicon 依靠 CoreML、Metal 低延迟推理,长时间听写不发烫;Intel Mac 兼容全套 Whisper 模型,老机型也能流畅运行,系统要求 macOS 15.0 及以上。

主要功能特点
全离线语音识别,40 + 语言无网络限制
内置完整模型矩阵,不用提前上传音频到云端,下载模型后断网正常听写:
- Nemotron Speech 3.5:主推极速多语言版本,约 40 种语言,低延迟实时流式转写,适合日常高频输入;
- Parakeet 系列:低延迟纯英文模型,适合程序员写注释、英文邮件;
- Whisper 全系列兜底:最高支持 99 种语言,Intel Mac 首选兼容方案; 支持数小时长文本连续听写,不会中途截断录音,长访谈、会议记录不用分段操作。

自适应 AI 语气,打开什么软件就匹配对应文风
这是对标 Wispr Flow 的核心优势,而且完全本地运行,不需要上传文本判断场景。软件自动识别当前前台程序,调用预设提示词改写,也能自定义专属规则:
- Slack / 企业聊天:口语简洁风格,精简冗余语气词;
- 邮件客户端:规整正式书面句式,自动分段;
- GitHub / 代码编辑器:结构化 issue、注释格式;
- 备忘录 / 笔记:轻量化短句,保留个人口语习惯。 举个实测例子,随口口述杂乱口语,Fluid-1 会根据窗口自动调整,不会统一生硬模板,完全保留本人表达逻辑,不会出现 AI 套话。

全局系统输入,全软件通用无限制
设置自定义全局快捷键,按下即可唤起听写,文字直接写入任意文本框:VS Code、Cursor、Notion、浏览器、终端、聊天软件、备忘录全部兼容,不存在适配盲区。自带悬浮实时预览条,说话同步显示文字,有错可以立刻暂停修改,不用等全部说完再返工。

双操作模式,办公开发分开适配
- 写作模式:纯文字输入优化,专注转写润色,适合写方案、代码注释、长篇文稿;
- 命令模式:语音操控 Mac 本地操作,不用手动点鼠标,批量提升操作效率; 搭配完整转写历史面板,所有录音、文本本地缓存,随时调取回看,不会自动清理记录。
隐私优先设计,零敏感数据收集
全程本地存储音频与转写文本,不会自动上传任何内容;软件仅提供可选匿名统计开关,关闭后无任何数据流出。不抓取窗口名称、输入内容、剪贴板、文件路径,麦克风录音仅实时处理,不会后台留存音频文件。
永久免费开源,无付费门槛
2026 年 2 月起采用 GPLv3 开源协议,GitHub 完整源码公开,无功能阉割、无月度订阅、无额度限制,5 万 + 开发者实测使用。支持 Homebrew 一键安装,也可手动下载安装包,有能力的用户能自行编译修改源码,不存在商业锁功能。
其他实用配套细节
- 双主题切换,浅色 / 深色适配系统外观;
- 7 小时定时、实时流速调节,平衡速度与识别精准度;
- 自动更新通道,可选内测提前体验新模型;
- 多尺寸模型可选,小模型快速下载,大模型提升识别准确率。

对比 Wispr Flow,FluidVoice 核心优势一目了然
1. 隐私层面:Wispr Flow 纯云端处理,音频文字全部上传服务器;FluidVoice 全本地运算,断网可用,敏感工作内容更安全;
2. 成本层面:Wispr Flow 按月订阅,免费周额度极少;FluidVoice 永久免费开源,无任何付费项;
3. 硬件适配:Wispr 依赖网络,老 Mac 延迟明显;Fluid 针对 M 系列芯片深度优化,Intel 也有兼容方案;
4. 可控性:Wispr 无法自定义底层规则;Fluid 开源可修改,支持自定义 AI 语气提示词;
5. 离线能力:Wispr 无离线模式,无网络完全无法使用;Fluid 全套功能本地运行,出差无网场景不受影响。

安装与使用
1. 首次打开授予麦克风、辅助功能权限,缺少权限无法全局输入;
2. 设置偏好全局唤醒快捷键,挑选适配自己设备的语音模型下载;
3. 按需下载 3.5GB Fluid-1 增强模型,开启本地 AI 润色;
4. 自定义各软件专属文风,切换写作 / 命令模式直接使用。
官方网站
https://github.com/altic-dev/FluidVoice
