聚力API - 开发文档
  1. 音频接口(Audio)
聚力API - 开发文档
  • Welcom to 聚力API
  • 发出请求
  • 模型接口
    • 完成对象
    • 文本/OpenAI 通用接口
      • 聊天接口(Chat)
        • 聊天接口(通用)
        • Suno
        • Anthropic Claude(全系列,已更新支持第三代)
        • gpts
        • gemini-pro
        • gpt-4-all(分析图片)
        • gpt-4-all(生成图片)
        • gpt-4-vision-preview
    • 图像接口(Images)
      • Midjourney API文档
        • 补充 - 其他参数以及回调
        • InsightFace任务提交
          • 提交swap_face任务
        • 任务提交
          • 执行动作
          • 提交Blend任务
          • 提交Describe任务
          • 提交Imagine任务
          • 提交Modal
          • 提交Shorten任务
          • 上传文件到discord
        • 任务查询
          • 查询所有任务
          • 根据ID列表查询任务
          • 根据ID列表查询任务-字段displays
          • 分页查询任务
          • 查询任务队列
          • 取消任务
          • 指定ID获取任务
          • 获取任务图片的seed(需设置mj或niji的私信ID)
      • DALL·E 3
      • Stable-Diffusion
    • 模型(Models)
      • 列出模型
    • 自动补全接口(Completions)
      • 内容补全接口
    • 向量生成接口(Embeddings)
      • 创建嵌入
    • 音频接口(Audio)
      • 创建转录
        POST
      • 创建翻译
        POST
      • TTS文本转语音
        POST
    • Suno音乐接口
      • Suno-V3.5
        • 生成音乐
        • 查询任务
    • Midjourney API文档
    • Flux(文生图)
    • Ideogram(绘画)
    • Luma视频接口
      • 聚力API/官方格式接口
        • 任务提交
          • 生成视频
          • 扩展视频
          • 获取视频无水印链接
        • 任务查询
          • 单个查询任务
          • 批量查询任务
    • Runway视频接口
    • 可灵API(官方接口)
  • 帮助中心
    • 常见问题及解决办法
  • 新 - Midjourney API文档
    • 快速教学-完整流程一遍过
    • 任务提交
      • 提交Imagine任务
      • 提交Action任务
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
      • 提交Shorten任务
      • 提交swap_face任务
      • 上传文件到discord
    • 任务查询
      • 指定ID获取任务
      • 根据ID列表查询任务
      • 根据ID列表查询任务-字段displays
      • 获取任务图片的seed
  1. 音频接口(Audio)

创建转录

POST
https://api.getaiai.com/v1/audio/transcriptions
了解如何将音频转换为文本。
相关指南:语音转文本
将音频转录为输入语言。

请求参数

Header 参数
Content-Type
string 
必需
示例值:
multipart/form-data
Accept
string 
必需
示例值:
application/json
Authorization
string 
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数multipart/form-data
file
file 
必需
要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model
string 
必需
要使用的模型的 ID。仅whisper-1当前可用。
示例值:
whisper-1
prompt
string 
可选
可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。
示例值:
eiusmod nulla
response_format
string 
可选
成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。
示例值:
json
temperature
number 
可选
采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高温度,直到达到特定阈值。
示例值:
0
language
string 
可选
输入音频的语言。以ISO-639-1格式提供输入语言将提高准确性和延迟。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.getaiai.com/v1/audio/transcriptions' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: multipart/form-data' \
--form 'file=@""' \
--form 'model="whisper-1"' \
--form 'prompt="eiusmod nulla"' \
--form 'response_format="json"' \
--form 'temperature="0"' \
--form 'language=""'

返回响应

🟢200OK
application/json
Body
text
string 
必需
示例
{
    "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
修改于 2024-07-17 13:21:50
上一页
创建嵌入
下一页
创建翻译
Built with