实操:数据万象语音转文字

时间:2022-07-23
本文章向大家介绍实操:数据万象语音转文字,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

产品文档: https://cloud.tencent.com/document/product/460/46224

实操开始:

首先到达数据万象控制台,找到对应存储桶开启配置

https://console.cloud.tencent.com/ci/bucket

找到内容识别--语音识别并开启:

开启之后发现出现队列信息:

第二步,提交一个语音识别任务

参考:https://cloud.tencent.com/document/product/460/46228

请求示例参考:

请求体:
<Request>
  <Tag>SpeechRecognition</Tag>
  <Input>
    <Object>mp3/test.mp3</Object>
  </Input>
  <Operation>
    <SpeechRecognition>
    <EngineModelType>8k_zh</EngineModelType>
    <ChannelNum>1</ChannelNum>
    <ResTextFormat>0</ResTextFormat>
	</SpeechRecognition>
    <Output>
      <Region>ap-chengdu</Region>
      <Bucket>bucketname-125666666</Bucket>
      <Object>mp3/test.txt</Object>
    </Output>
  </Operation>
  <QueueId>pf390d4681c61466d860e547998f8aef2</QueueId>
</Request>

具体解释参考文档参数说明即可,不做赘述。

这样就已经把test.mp3音频文件识别为对应文字写入到test.txt

这里识别准确度还需要提高。