语音转文字
Workongpt.com 同时提供“语音转文字”功能,您可以上传音频文件并将其转化为 Word 文档。借助 OpenAI开发的Whisper和其他AI模型,我们不仅能够转录音频,还可以优化其可读性。另外,您可以提供情景描述及处理要求,让二次处理的结果更进一步。
使用语音转文字
上传音频文件:
点击“上传”按钮,并从您的设备中选择所需的音频文件。
确保文件格式受支持。支持的格式包括 flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav和webm。
最多支持100M以内的文件上传。
进行二次处理(可选)
如果您希望 AI 优化转录内容以提高可读性,选择“二次处理”选项。这允许 AI 精细化内容,确保其自然易读。为了实现更好的转录效果,我们非常建议您启用二次处理。
如果您决定使用“二次处理”功能,请输入必要的上下文描述,以指导AI理解音频的背景。
进行转换:
文件上传后,完成相应设置后,点击“转换”按钮。
根据音频的长度,转换可能需要一段时间。
下载文档:
转换完成后,将出现一个下载按钮。
点击按钮下载转录内容的 Word 文档格式,以及经过处理的版本(如有)。
注意:经二次处理输出的 Word 文档的格式和结构已经为了可读性而进行了优化。
您也可以在导航栏中,点击您的名字旁边的三角符号,在展开菜单中,点击历史文件进行下载。
计费
语音转文字”功能的费用是基于音频文件的持续时间(以分钟为单位,向上取整,每分钟0.04元),以及消耗的二次处理代币来确定的;若您使用ChatGLM模型进行二次处理,则不产生任何费用。费用将从您的账户余额中扣除。开始转换前,请确保您有足够的余额。本功能暂不支持直接扣除会员的对话额度。每个模型的计费标准,请看本文的的网站政策部分(点击跳转定价政策)。
安全与隐私
您上传的音频文件和生成的(包含二次处理后的)转录文档都会受到最高程度的隐私保护。它们最多存储在服务器上 2 小时,之后会自动删除。 考虑用户隐私,通过加密您上传的文件(SHA-256),我们无法访问您的用户数据,即使是服务器管理员也无法访问。
对于较长的音频文件,在上传过程中确保您有稳定的互联网连接。 如果您在转录质量上遇到任何问题,请确保原始音频文件声音清晰,没有太多背景噪音。
Last updated
Was this helpful?