语音识别提供商
简介
语音识别(STT)是一种将口语转换成书面文字的技术。 STT 提供商允许您的 Casibase 应用程序理解和处理用户口语输入,增强用户体验和您的知识库系统的访问能力。
在 Casisbase中,整合一个 STT 提供商使您的 AI 应用程序能够接收和处理语音查询,创建更多的互动和自然用户交互。
添加一个新的语音识别提供商
语音识别提供商用来将语音识别能力整合到Casisbase中。 您可以按照以下步骤添加它们:
点击主页上的Providers
按钮。
添加语音识别提供商
点击Add
按钮来添加存储提供商。
填写语音识别提供商详细信息
填写模型提供商详情并点击Save & Exit
按钮。
使用语音识别
当您点击 Casibase 应用程序中的语音识别按钮时,将执行以下流程:
- 浏览器将请求访问您麦克风的权限
- 一旦授予,系统将开始收听并自动将您的语音转换为文本
- 在您完成发言后,识别的文本将自动作为消息发送
此功能允许与您的 Casisbase 应用程序进行无操作的互动,使它们更容易访问和使用。
提示
CasiBase目前支持以下语音识别提供商:
- Alibaba Cloud
- paraformer-realtime-v1