from openai import OpenAI

client = OpenAI()

speech_file_path = "output/speech.mp3"

response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.write_to_file(speech_file_path)

from pydub import AudioSegment
from pydub.playback import play

audio = AudioSegment.from_file(speech_file_path, format="mp3")
play(audio)

Input #0, wav, from '/var/folders/_2/4yj9mbbn2_zg36jb021hl_gh0000gn/T/tmpi9r_iulj.wav':
  Duration: 00:00:03.53, bitrate: 384 kb/s
  Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 24000 Hz, 1 channels, s16, 384 kb/s
   3.37 M-A:  0.000 fd=   0 aq=    0KB vq=    0KB sq=    0B f=0/0

   3.44 M-A:  0.000 fd=   0 aq=    0KB vq=    0KB sq=    0B f=0/0

# Try in Turkish

from openai import OpenAI

client = OpenAI()

speech_file_path = "output/speech.mp3"

response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Bugün kod yazmak için çok güzel bir gün!",
  response_format="mp3",
  speed=1.0
)

response.write_to_file(speech_file_path)

from pydub import AudioSegment
from pydub.playback import play

audio = AudioSegment.from_file(speech_file_path, format="mp3")
play(audio)

Input #0, wav, from '/var/folders/_2/4yj9mbbn2_zg36jb021hl_gh0000gn/T/tmptq_ga1r5.wav':
  Duration: 00:00:02.62, bitrate: 384 kb/s
  Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 24000 Hz, 1 channels, s16, 384 kb/s
   2.51 M-A:  0.000 fd=   0 aq=    0KB vq=    0KB sq=    0B f=0/0

from openai import OpenAI

client = OpenAI()

# Create text-to-speech audio file
with client.audio.speech.with_streaming_response.create(
    model="tts-1",
    voice="alloy",
    input="Hello world! This is a streaming test."
) as response:
    response.stream_to_file(speech_file_path)

from pydub import AudioSegment
from pydub.playback import play

audio = AudioSegment.from_file(speech_file_path, format="mp3")
play(audio)

Input #0, wav, from '/var/folders/_2/4yj9mbbn2_zg36jb021hl_gh0000gn/T/tmppen1a__6.wav':
  Duration: 00:00:02.30, bitrate: 384 kb/s
  Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 24000 Hz, 1 channels, s16, 384 kb/s
   2.12 M-A:  0.000 fd=   0 aq=    0KB vq=    0KB sq=    0B f=0/0

   2.18 M-A:  0.000 fd=   0 aq=    0KB vq=    0KB sq=    0B f=0/0

Text To Speech¶

Introduction¶

Audio quality¶

Supported output formats¶

Supported languages¶

Streaming real time audio¶