認識能力の高い点が何よりも「使える」と思わせる点です。
表示される字幕の1ページずつに分解されているので、確認・編集の際に、同じシーンをくり返し見る・聞くのにも便利です。
字幕のみの機能に限定されますが、私の場合はSRTファイルとして保存できれば良いので、それで十分です。
ノイズの多い環境での話し声と、たどたどしいテレサ・テンの日本語の発話で使ってみましたが、とても役に立っています。

このスクリーンショットのように、一つの枠内の上段に音声の基本的な認識結果、下段にそれらを「言葉」として繋げた結果が表示されます。いずれも自分で修正できます。(下段ですでに私が修正をしたもの)
前からこのシーンでは「去年ぶり」と変な日本語をテレサ・テンが言っていると思い続けていましたが、今回このソフトのお陰で「きゅー 年 ぶり」、つまり「9年ぶり」と言っていることが分かりました。
誤認識や、句点(「。」)での分割でないなどの問題はありますが、とにかくタイミングを決めてくれるだけでも十分に役立つと思っています。
だんだんと利用者が多くなって、いろいろな制限(最終的には有料化!)が増えていますが、使用目的やデータ量によっては、有料でも納得のいくものでしょう。
ただ、私としてはテレサ・テンの中国語の話を文字化してくれるといいのですが、今は日本語にしか対応していないのが残念です。