Mac 语音转文字快速、私密、多语言

基于 SenseVoice 模型的本地语音识别，70毫秒内将语音转为文字——完全在 Mac 上运行，无需联网。

立即获取

Messages

方便的话把最新的设计稿发我一下？

好的没问题，我这边还有最后几个页面，几分钟后发你。

语音输入中Fn

100%

完全离线，隐私无忧

种语言支持

<1s

转录速度

数据上传到云端

语音转文字的工作流程

三个步骤。无需设置。无需云账号。

按住快捷键

按住键盘快捷键，开始通过麦克风录音。

自然地说话

SenseVoice 语音识别模型在你的 Mac 上实时处理音频。

文字即刻出现

松开按键，转写的文字就会粘贴到光标所在位置——适用于任何应用。

功能

为高频打字者而生

不管是写邮件、发消息、写文档还是写代码注释——说比打快得多。

菜单栏常驻

无需打开窗口，无需切换应用。Just Parley 安静地待在菜单栏，随时一键唤起，用完即隐。

菜单栏常驻

完全离线运行

你的语音永远不会离开你的 Mac。无需联网，无需注册账号，不采集任何数据。语音模型完全在本地运行。

完全离线运行

数据上传到云端

五种语言，自动识别

支持中文、英语、日语、韩语和粤语。可以指定语言，也可以让应用自动判断。

English

中文

日本語

한국어

粵語

Auto

在任何应用中使用

任何能输入文字的地方都能用。邮件、微信、钉钉、飞书、Notion、VS Code——只要能打字，就能用语音。

MailHi team, just wanted to check in on...

SlackSounds good, let's go with option B...

DocsThe quarterly results show a clear...

Just Parley 背后的技术

基于成熟的语音识别研究，专为 macOS 优化。

SenseVoice 语音模型

Just Parley 使用 FunAudioLLM 的 SenseVoice——一个紧凑、高精度的语音转文字模型，基于超过 40 万小时的多语言音频数据训练而成。通过 sherpa-onnx 以优化的 ONNX 格式运行，实现低延迟推理。

70毫秒处理延迟

语音识别完全在 CPU 上运行。Apple Silicon（M1/M2/M3/M4）大约 70 毫秒完成转写。Intel Mac 同样完全支持，处理时间稍长。

不依赖云端

整个模型在设备上运行。没有 API 调用，没有服务器往返，不需要网络连接。语音在采集它的同一个进程中完成处理。

多语言语音识别

支持五种语言并自动识别语种。使用任何支持的语言说话，Just Parley 自动识别。

English

中文

Chinese

日本語

Japanese

한국어

Korean

粵語

Cantonese

自动检测

随时切换语言——无需更改设置

你的声音永远不会离开 Mac

无云端。无账号。无数据收集。

所有语音处理都在 Mac 的 CPU 上本地进行

音频永远不会发送到服务器——即使是匿名化的也不会

无需用户账号或注册

没有遥测、分析或使用追踪

完全离线工作——断开 Wi-Fi 照样运行

Just Parley 与其他方案的对比

Mac 上的语音转文字方案，一目了然。

功能	Just Parley	Apple 听写	云端 STT（Google、Otter.ai）	Whisper（本地）
适用所有应用	是	部分	仅浏览器	命令行/手动
完全离线	是	部分	否	是
隐私	100% 本地	部分云端	云端	100% 本地
延迟	~70ms	~200ms	500ms-2s	1-5s
多语言	5 种语言	多种	多种	99 种
自动语种识别	是	否	部分	是
标点符号	自动	自动	自动	自动
需要设置	无	无	账号 + API 密钥	Python + 命令行
价格	免费	免费	订阅制	免费

适用于所有 Mac 应用

语音转文字，可粘贴到任何输入框——聊天、代码编辑器、浏览器等。

精准语音转文字。就在你的 Mac 上。

免费下载。无订阅。无云端。

Free

no card required

SenseVoice 语音识别模型

100% 离线——无云端、无账号

5 种语言，自动检测

适用于 Mac 上的所有应用

最多可在 3 台 Mac 上使用

终身免费更新

常见问题

语音识别的准确度如何？

Just Parley 使用的 SenseVoice 模型在标准基准测试上达到了与云端服务相当的准确度。对于支持语言的清晰语音，准确率可达 95% 以上。准确度取决于麦克风质量、背景噪音和说话清晰度。

它使用人工智能/机器学习吗？

是的。SenseVoice 模型是一个深度神经网络，基于超过 40 万小时的多语言语音数据训练。它在 Mac 的 CPU 上以优化的 ONNX 格式运行——不需要 GPU，不需要云端推理。

能识别不同的口音吗？

SenseVoice 使用涵盖多种口音和说话方式的数据训练。它能很好地识别大多数英语口音（美式、英式、澳式、印度式等），对中文、日文、韩文和粤语的地区差异也有出色表现。

没有网络能用吗？

完全可以。语音识别模型打包在应用内，完全在 Mac 的 CPU 上运行。你可以完全断开网络，使用效果完全一样。

语音转文字和听写有什么区别？

语音转文字（也叫语音识别或 STT）是将音频转换为文字的底层技术。听写是基于 STT 的使用场景——通过说话来打字。Just Parley 两者兼备：语音转文字引擎和听写工作流。

支持自动标点吗？

支持。SenseVoice 模型包含逆文本规范化（ITN），自动添加标点、大小写和数字格式。不需要说「句号」或「逗号」——模型会根据上下文自动推断。