> For the complete documentation index, see [llms.txt](https://docs.workongpt.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.workongpt.com/shi-yong-shuo-ming/yu-yin-zhuan-wen-zi.md).

# 语音转文字

Workongpt.com 同时提供“语音转文字”功能，您可以上传音频文件并将其转化为 Word 文档。借助 OpenAI开发的Whisper和其他AI模型，我们不仅能够转录音频，还可以优化其可读性。另外，您可以提供情景描述及处理要求，让二次处理的结果更进一步。

<mark style="color:blue;">**使用语音转文字**</mark>

* **上传音频文件:**
  * 点击“上传”按钮，并从您的设备中选择所需的音频文件。
  * 确保文件格式受支持。支持的格式包括 flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav和webm。
  * 最多支持100M以内的文件上传。
* **进行二次处理（可选）**
  * 如果您希望 AI 优化转录内容以提高可读性，选择“二次处理”选项。这允许 AI 精细化内容，确保其自然易读。<mark style="color:red;">为了实现更好的转录效果，我们非常建议您启用二次处理。</mark>
  * 如果您决定使用“二次处理”功能，请输入必要的上下文描述，以指导AI理解音频的背景。
* **进行转换:**
  * 文件上传后，完成相应设置后，点击“转换”按钮。
  * 根据音频的长度，转换可能需要一段时间。
* **下载文档:**
  * 转换完成后，将出现一个下载按钮。
  * 点击按钮下载转录内容的 Word 文档格式，以及经过处理的版本（如有）。
  * 注意：经二次处理输出的 Word 文档的格式和结构已经为了可读性而进行了优化。
  * 您也可以在导航栏中，点击您的名字旁边的三角符号，在展开菜单中，点击历史文件进行下载。

<mark style="color:blue;">**计费**</mark>

语音转文字”功能的费用是基于音频文件的持续时间（以分钟为单位，向上取整，每分钟0.04元），以及消耗的二次处理代币来确定的；若您使用ChatGLM模型进行二次处理，则不产生任何费用。费用将从您的账户余额中扣除。开始转换前，请确保您有足够的余额。<mark style="color:red;">本功能暂不支持直接扣除会员的对话额度。</mark>每个模型的计费标准，请看本文的的网站政策部分（[点击跳转定价政策](/wang-zhan-zheng-ce/ding-jia-zheng-ce.md)）。

<mark style="color:blue;">**安全与隐私**</mark>

您上传的音频文件和生成的（包含二次处理后的）转录文档都会受到最高程度的隐私保护。它们最多存储在服务器上 2 小时，之后会自动删除。 考虑用户隐私，通过加密您上传的文件(SHA-256)，我们无法访问您的用户数据，即使是服务器管理员也无法访问。

对于较长的音频文件，在上传过程中确保您有稳定的互联网连接。 如果您在转录质量上遇到任何问题，请确保原始音频文件声音清晰，没有太多背景噪音。