FluidVoice – mac 离线语音转文字神器｜免费开源平替 Wispr Flow｜40 + 语言离线听写自带 AI 润色

经常用 Mac 语音输入写代码、写文档、聊工作的朋友应该都懂痛点。市面上主流听写工具分两类，一类是系统自带听写，识别生硬，不会自动排版，专业名词经常认错；另一类像 Wispr Flow，AI 润色效果不错，但全程云端处理，录音、文字全部上传第三方服务器，隐私没有保障，还得按月订阅付费，免费额度根本不够日常使用。

软件格律诗 今天给大家带来 FluidVoice 目前 Mac 平台唯一兼顾极速离线语音转文字、本地 Fluid-1 自定义 AI 增强模型的开源听写工具，已经在 Github 上获得了4.9k 星标，完全免费无订阅，所有语音、文字数据全部留在本机，断网也能完整使用，不管是开发者、文案还是办公人群，都能直接平替付费云端听写软件。

Contents

核心底层架构：双层本地工作流
主要功能特点
对比 Wispr Flow，FluidVoice 核心优势一目了然
安装与使用
官方网站
下载地址

核心底层架构：双层本地工作流

绝大多数开源听写软件只做到语音转写一步，想要语法修正、语气适配必须联网调用大模型。FluidVoice 拆分两层独立本地模块，全程无需网络交互。

FluidVoice 客户端

开源原生 macOS 程序，全局快捷键唤起悬浮听写面板，支持命令模式、写作模式，转写历史本地存储，代码完全公开可自查。

Fluid-1 本地 AI 模型（可选 3.5GB 离线包）

专属端侧增强模型，自动修正口语填充词、规范大小写、适配不同软件语气、处理日期人名数字，所有推理在 Mac 本地硬件完成，零数据外传。硬件适配拉满，Apple Silicon 依靠 CoreML、Metal 低延迟推理，长时间听写不发烫；Intel Mac 兼容全套 Whisper 模型，老机型也能流畅运行，系统要求 macOS 15.0 及以上。

主要功能特点

全离线语音识别，40 + 语言无网络限制

内置完整模型矩阵，不用提前上传音频到云端，下载模型后断网正常听写：

Nemotron Speech 3.5：主推极速多语言版本，约 40 种语言，低延迟实时流式转写，适合日常高频输入；
Parakeet 系列：低延迟纯英文模型，适合程序员写注释、英文邮件；
Whisper 全系列兜底：最高支持 99 种语言，Intel Mac 首选兼容方案；支持数小时长文本连续听写，不会中途截断录音，长访谈、会议记录不用分段操作。

自适应 AI 语气，打开什么软件就匹配对应文风

这是对标 Wispr Flow 的核心优势，而且完全本地运行，不需要上传文本判断场景。软件自动识别当前前台程序，调用预设提示词改写，也能自定义专属规则：

Slack / 企业聊天：口语简洁风格，精简冗余语气词；
邮件客户端：规整正式书面句式，自动分段；
GitHub / 代码编辑器：结构化 issue、注释格式；
备忘录 / 笔记：轻量化短句，保留个人口语习惯。举个实测例子，随口口述杂乱口语，Fluid-1 会根据窗口自动调整，不会统一生硬模板，完全保留本人表达逻辑，不会出现 AI 套话。

全局系统输入，全软件通用无限制

设置自定义全局快捷键，按下即可唤起听写，文字直接写入任意文本框：VS Code、Cursor、Notion、浏览器、终端、聊天软件、备忘录全部兼容，不存在适配盲区。自带悬浮实时预览条，说话同步显示文字，有错可以立刻暂停修改，不用等全部说完再返工。

双操作模式，办公开发分开适配

写作模式：纯文字输入优化，专注转写润色，适合写方案、代码注释、长篇文稿；
命令模式：语音操控 Mac 本地操作，不用手动点鼠标，批量提升操作效率；搭配完整转写历史面板，所有录音、文本本地缓存，随时调取回看，不会自动清理记录。

隐私优先设计，零敏感数据收集

全程本地存储音频与转写文本，不会自动上传任何内容；软件仅提供可选匿名统计开关，关闭后无任何数据流出。不抓取窗口名称、输入内容、剪贴板、文件路径，麦克风录音仅实时处理，不会后台留存音频文件。

永久免费开源，无付费门槛

2026 年 2 月起采用 GPLv3 开源协议，GitHub 完整源码公开，无功能阉割、无月度订阅、无额度限制，5 万 + 开发者实测使用。支持 Homebrew 一键安装，也可手动下载安装包，有能力的用户能自行编译修改源码，不存在商业锁功能。

其他实用配套细节

双主题切换，浅色 / 深色适配系统外观；
7 小时定时、实时流速调节，平衡速度与识别精准度；
自动更新通道，可选内测提前体验新模型；
多尺寸模型可选，小模型快速下载，大模型提升识别准确率。

对比 Wispr Flow，FluidVoice 核心优势一目了然

1. 隐私层面：Wispr Flow 纯云端处理，音频文字全部上传服务器；FluidVoice 全本地运算，断网可用，敏感工作内容更安全；

2. 成本层面：Wispr Flow 按月订阅，免费周额度极少；FluidVoice 永久免费开源，无任何付费项；

3. 硬件适配：Wispr 依赖网络，老 Mac 延迟明显；Fluid 针对 M 系列芯片深度优化，Intel 也有兼容方案；

4. 可控性：Wispr 无法自定义底层规则；Fluid 开源可修改，支持自定义 AI 语气提示词；

5. 离线能力：Wispr 无离线模式，无网络完全无法使用；Fluid 全套功能本地运行，出差无网场景不受影响。

安装与使用

1. 首次打开授予麦克风、辅助功能权限，缺少权限无法全局输入；

2. 设置偏好全局唤醒快捷键，挑选适配自己设备的语音模型下载；

3. 按需下载 3.5GB Fluid-1 增强模型，开启本地 AI 润色；

4. 自定义各软件专属文风，切换写作 / 命令模式直接使用。

官方网站

https://github.com/altic-dev/FluidVoice

https://altic.dev/fluid

下载地址

https://pan.quark.cn/s/10fd0a1cb26b

支持