نحوه استفاده از کلاینت‌ها

برای استفاده از سرویس تبدیل گفتار به متن ستون، دو نوع کلاینت در اختیار شما قرار خواهد گرفت. یکی کلاینت cli برای استفاده در کامند لاین و دیگری کلاینت پایتون برای استفاده در کد، که نحوه استفاده از هردو در ادامه توضیح داده شده است. برای این کار باید فولدر sotoon_tts_client که کدهای مربوطه در آن قرار دارد در اختیارتان قرار گرفته باشد.

دقت کنید برای ارسال درخواست به سرویس به دو گونه می‌توان متن را فرستاد. یکی متن فارسی و دیگری استفاده از فونتیک. به طور مثال جمله "به چپ بپیچید." را میتوانید همینطور به صورت فارسی بفرستید یا اینکه با فونتیک به صورت be Cap bepiCid. ارسال کنید. توضیحات بیشتر برای نحوه نوشتار فونتیک در بخش بعدی این مستند آمده است.

ابتدا باید کلاینت را نصب کنید. برای این کار وارد فولدری که فایل setup.py پروژه در آن قرار دارد شده و کد زیر را اجرا کنید.

سپس باید هدر سرویس و توکنی که در بخش قبل گرفتید را تنظیم کنید. برای این کار و همچنین برای تنظیم کردن آدرس پیش‌فرض برای ارسال درخواست، می‌توانید از متغیرهای محلی زیر استفاده کنید:

که در اینجا به جای <your_token> باید توکنی که در بخش قبل دریافت کردید را قرار دهید.

با تنظیم کردن این متغیرها می توانید درخواست به شکل فونتیک را به این صورت ارسال نمایید:

که به جای be Cap bepiCid. می‌توانید جمله مدنظر خود را قرار دهید. خروجی در فایل result.mp3 ذخیره می‌شود.

به عنوان مثال دیگر، می‌توانید بعد از ست کردن متغیر محلی TTS_ADDRESS، برای ارسال درخواست به صورت متن فارسی و پخش صوت خروجی بلافاصله بعد از دریافت جواب، به این صورت درخواست را ارسال کنید:

برای دریافت فایل با کیفیت بالاتر می توانید در مقابل f- به جای mp3 فرمت wav قرار دهید.

برای توضیحات بیشتر درمورد این کلاینت میتوانید دستور زیر را اجرا کنید:

تنظیمات دیگری نیز برای این سرویس وجود دارند که در ادامه به آن‌ها می‌پردازیم:

  • امکان تغییر سرعت خوانش: با استفاده از گزینه‌ی ‎--tempo می‌توانید این امکان را فراهم سازید تا سرعت خوانش متن را تنظیم کنید. عدد ۱ به‌صورت پیش‌فرض با سرعت معمولی می‌خواند. در صورت افزایش این عدد تا ۲، سرعت خوانش سریع‌تر، و در صورت کاهش آن به ۰.۵، سرعت خوانش کندتر می‌شود. معمولا برای اعداد بالای ۱.۴ صدا مبهم‌تر می‌شود. به عنوان مثال برای خواندن سریع‌تر متن «به چپ بپیچید» می‌توانید از دستور زیر استفاده کنید:
  • امکان تغییر نرخ نمونه‌برداری (sample-rate): با استفاده از گزینه‌ی ‎--sample-rate می‌توانید این امکان را فراهم سازید تا نرخ نمونه‌برداری صوت خروجی را تنظیم کنید. به عنوان مثال با استفاده از دستور زیر می‌توانید خروجی خود را با نرخ نمونه‌برداری ۸۰۰۰ هرتز دریافت کنید:

برای استفاده از کلاینت در کد، پس از نصب آن توسط ابزار pip (همانطور که در بخش cli توضیح داده شده است) می‌توانید به صورت زیر از آن در کد خود استفاده کنید:

مانند قبل به جای <your_token> توکنی که در بخش قبل گرفتید را قرار دهید. به جای be Cap bepiCid جمله مدنظر خود را قرار دهید و به جای result.mp3 آدرس فایلی که می‌خواهید خروجی در آن ذخیره شود را قرار دهید. اگر می‌خواهید به جای فونتیک از جمله فارسی استفاده کنید فیلد use_phonemes را برابر False قرار دهید و در فیلد text جمله فارسی مدنظر خود را قرار دهید.

توجه: توجه کنید که برای رعایت کردن قوانین موجود در SLA بایستی میزان timeout برابر ۶۰ (ثانیه) تنظیم شود. در غیر این صورت، مشمول بند استثنائات قرارداده خواهد شد.

آیا این مقاله به شما کمک کرد؟

با نظر دادن به بهبود کیفیت مستندات کمک کنید