Mac 音声テキスト変換高速、プライベート、多言語対応

SenseVoice モデルによるローカル音声認識。70ミリ秒以内に音声をテキストに変換 -- 完全に Mac 上で動作、インターネット不要。

Messages
S

最新のデザイン、送ってもらえますか?

はい、もちろんです。あと少しで最後の画面が終わるので、数分後に送りますね。

音声入力中Fn
100%
オフライン&プライベート
5
言語に対応
<1s
文字起こし速度
0
クラウドへの送信データ

音声テキスト変換の仕組み

3つのステップ。設定不要。クラウドアカウント不要。

1

ホットキーを押す

キーボードショートカットを押し続けて、マイクからの録音を開始。

2

自然に話す

SenseVoice 音声認識モデルが Mac 上でリアルタイムに音声を処理。

3

テキストが即座に表示

キーを離すと、変換されたテキストがカーソル位置にペースト -- どのアプリでも。

機能

たくさんタイプする人のために

メール、メッセージ、ドキュメント、コードのコメント——話す方がタイピングより速い。

メニューバー常駐

ウィンドウを開く必要なし。Just Parley はメニューバーに静かに待機し、ホットキー一つですぐ起動。使わないときは邪魔しません。

メニューバー常駐

完全オフライン

音声データが Mac の外に出ることは一切ありません。クラウド不要、アカウント不要、データ収集なし。音声認識モデルは完全にローカルで動作します。

完全オフライン

クラウドへの送信データ

5言語対応、自動検出

英語、中国語、日本語、韓国語、広東語に対応。言語を指定することも、自動判別させることもできます。

English
中文
日本語
한국어
粵語
Auto

どんなアプリでも使える

テキスト入力できる場所ならどこでも。メール、Slack、Google Docs、コードエディタ、検索バー——タイプできる場所なら、声で入力できます。

MailHi team, just wanted to check in on...
SlackSounds good, let's go with option B...
DocsThe quarterly results show a clear...

Just Parley を支える技術

実績ある音声認識研究に基づき、macOS 向けに最適化。

SenseVoice 音声モデル

Just Parley は FunAudioLLM の SenseVoice を使用 -- 40万時間以上の多言語音声データで学習された、コンパクトで高精度な音声テキスト変換モデル。sherpa-onnx 経由で最適化された ONNX モデルとして実行。

70ミリ秒の処理レイテンシ

音声認識は CPU 上でローカルに実行。Apple Silicon(M1/M2/M3/M4)で約70ミリ秒の変換時間。Intel Mac も完全サポート。

クラウド依存なし

モデル全体がデバイス上で動作。API コール、サーバーとの通信、ネットワーク要件は一切なし。音声はキャプチャと同じプロセス内で処理。

多言語音声認識

5つの言語と自動言語検出。対応言語で話すだけで、Just Parley が自動的に識別。

English
English
中文
Chinese
日本語
Japanese
한국어
Korean
粵語
Cantonese
自動検出
セッション中に言語を切り替え可能 -- 設定変更不要

音声は Mac の外に出ません

クラウドなし。アカウントなし。データ収集なし。

すべての音声処理は Mac の CPU 上でローカルに実行
音声がサーバーに送信されることは一切なし -- 匿名化されたものも含め
ユーザーアカウントや登録は不要
テレメトリ、分析、使用状況の追跡なし
完全オフラインで動作 -- Wi-Fi を切っても同じように動く

Just Parley との比較

Mac の音声テキスト変換オプションを並べて比較。

機能Just ParleyApple 音声入力クラウド STT(Google、Otter.ai)Whisper(ローカル)
全アプリ対応対応一部ブラウザのみCLI / 手動
完全オフライン対応一部非対応対応
プライバシー100% ローカル一部クラウドクラウドベース100% ローカル
レイテンシ~70ms~200ms500ms-2s1-5s
多言語5言語多数多数99言語
自動言語検出対応非対応一部対応
句読点自動自動自動自動
セットアップ不要不要アカウント + APIキーPython + CLI
価格$29(買い切り)無料サブスクリプション無料

正確な音声テキスト変換。Mac で。今すぐ。

買い切り。サブスクなし。クラウドなし。

Early pricing
$29
one-time purchase
SenseVoice 音声認識モデル
100% オフライン -- クラウドなし、アカウントなし
自動検出付き5言語対応
Mac のすべてのアプリで動作
最大3台の Mac で使用可能
永久無料アップデート

30-day money-back guarantee.

よくある質問

音声認識の精度はどの程度ですか?

Just Parley が使用する SenseVoice モデルは、標準ベンチマークでクラウドサービスと同等の精度を達成しています。対応言語のクリアな発話で 95% 以上の精度が期待できます。精度はマイク品質、背景ノイズ、発話の明瞭さに依存します。

AI / 機械学習を使っていますか?

はい。SenseVoice モデルは40万時間以上の多言語音声データで学習された深層ニューラルネットワークです。Mac の CPU 上で最適化された ONNX モデルとして動作し、GPU もクラウド推論も不要です。

さまざまなアクセントに対応できますか?

SenseVoice は多様なアクセントと話し方をカバーするデータで学習されています。英語の主要なアクセント(アメリカ、イギリス、オーストラリア、インドなど)に対応し、中国語、日本語、韓国語、広東語の地域差にも強いです。

インターネットなしで使えますか?

はい、完全に。音声認識モデルはアプリに同梱されており、Mac の CPU 上で完全に動作します。インターネットを完全に切断しても、まったく同じように動作します。

音声テキスト変換と音声入力の違いは?

音声テキスト変換(STT)は音声をテキストに変換する基盤技術です。音声入力はSTTの上に構築されたユースケース -- 話してタイピングする行為です。Just Parley は両方を提供します。

自動句読点に対応していますか?

はい。SenseVoice モデルには逆テキスト正規化(ITN)が含まれており、句読点、大文字、数値フォーマットを自動的に付加します。「まる」や「てん」と言う必要はありません。