# 语音转文字

Workongpt.com 同时提供“语音转文字”功能，您可以上传音频文件并将其转化为 Word 文档。借助 OpenAI开发的Whisper和其他AI模型，我们不仅能够转录音频，还可以优化其可读性。另外，您可以提供情景描述及处理要求，让二次处理的结果更进一步。

<mark style="color:blue;">**使用语音转文字**</mark>

* **上传音频文件:**
  * 点击“上传”按钮，并从您的设备中选择所需的音频文件。
  * 确保文件格式受支持。支持的格式包括 flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav和webm。
  * 最多支持100M以内的文件上传。
* **进行二次处理（可选）**
  * 如果您希望 AI 优化转录内容以提高可读性，选择“二次处理”选项。这允许 AI 精细化内容，确保其自然易读。<mark style="color:red;">为了实现更好的转录效果，我们非常建议您启用二次处理。</mark>
  * 如果您决定使用“二次处理”功能，请输入必要的上下文描述，以指导AI理解音频的背景。
* **进行转换:**
  * 文件上传后，完成相应设置后，点击“转换”按钮。
  * 根据音频的长度，转换可能需要一段时间。
* **下载文档:**
  * 转换完成后，将出现一个下载按钮。
  * 点击按钮下载转录内容的 Word 文档格式，以及经过处理的版本（如有）。
  * 注意：经二次处理输出的 Word 文档的格式和结构已经为了可读性而进行了优化。
  * 您也可以在导航栏中，点击您的名字旁边的三角符号，在展开菜单中，点击历史文件进行下载。

<mark style="color:blue;">**计费**</mark>

语音转文字”功能的费用是基于音频文件的持续时间（以分钟为单位，向上取整，每分钟0.04元），以及消耗的二次处理代币来确定的；若您使用ChatGLM模型进行二次处理，则不产生任何费用。费用将从您的账户余额中扣除。开始转换前，请确保您有足够的余额。<mark style="color:red;">本功能暂不支持直接扣除会员的对话额度。</mark>每个模型的计费标准，请看本文的的网站政策部分（[点击跳转定价政策](/wang-zhan-zheng-ce/ding-jia-zheng-ce.md)）。

<mark style="color:blue;">**安全与隐私**</mark>

您上传的音频文件和生成的（包含二次处理后的）转录文档都会受到最高程度的隐私保护。它们最多存储在服务器上 2 小时，之后会自动删除。 考虑用户隐私，通过加密您上传的文件(SHA-256)，我们无法访问您的用户数据，即使是服务器管理员也无法访问。

对于较长的音频文件，在上传过程中确保您有稳定的互联网连接。 如果您在转录质量上遇到任何问题，请确保原始音频文件声音清晰，没有太多背景噪音。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.workongpt.com/shi-yong-shuo-ming/yu-yin-zhuan-wen-zi.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
