- مستندات
- تبدیل متن به صوت
- نحوه استفاده از کلاینتها
نحوه استفاده از کلاینتها
برای استفاده از سرویس تبدیل گفتار به متن ستون، دو نوع کلاینت در اختیار شما قرار خواهد گرفت. یکی کلاینت cli برای استفاده در کامند لاین و دیگری کلاینت پایتون برای استفاده در کد، که نحوه استفاده از هردو در ادامه توضیح داده شده است. برای این کار باید فولدر sotoon_tts_client که کدهای مربوطه در آن قرار دارد در اختیارتان قرار گرفته باشد.
دقت کنید برای ارسال درخواست به سرویس به دو گونه میتوان متن را فرستاد. یکی متن فارسی و دیگری استفاده از فونتیک. به طور مثال جمله "به چپ بپیچید." را میتوانید همینطور به صورت فارسی بفرستید یا اینکه با فونتیک به صورت be Cap bepiCid. ارسال کنید. توضیحات بیشتر برای نحوه نوشتار فونتیک در بخش بعدی این مستند آمده است.
ابتدا باید کلاینت را نصب کنید. برای این کار وارد فولدری که فایل setup.py پروژه در آن قرار دارد شده و کد زیر را اجرا کنید.
سپس باید هدر سرویس و توکنی که در بخش قبل گرفتید را تنظیم کنید. برای این کار و همچنین برای تنظیم کردن آدرس پیشفرض برای ارسال درخواست، میتوانید از متغیرهای محلی زیر استفاده کنید:
که در اینجا به جای <your_token> باید توکنی که در بخش قبل دریافت کردید را قرار دهید.
با تنظیم کردن این متغیرها می توانید درخواست به شکل فونتیک را به این صورت ارسال نمایید:
که به جای be Cap bepiCid. میتوانید جمله مدنظر خود را قرار دهید. خروجی در فایل result.mp3 ذخیره میشود.
به عنوان مثال دیگر، میتوانید بعد از ست کردن متغیر محلی TTS_ADDRESS، برای ارسال درخواست به صورت متن فارسی و پخش صوت خروجی بلافاصله بعد از دریافت جواب، به این صورت درخواست را ارسال کنید:
برای دریافت فایل با کیفیت بالاتر می توانید در مقابل f- به جای mp3 فرمت wav قرار دهید.
برای توضیحات بیشتر درمورد این کلاینت میتوانید دستور زیر را اجرا کنید:
تنظیمات دیگری نیز برای این سرویس وجود دارند که در ادامه به آنها میپردازیم:
- امکان تغییر سرعت خوانش: با استفاده از گزینهی --tempo میتوانید این امکان را فراهم سازید تا سرعت خوانش متن را تنظیم کنید. عدد ۱ بهصورت پیشفرض با سرعت معمولی میخواند. در صورت افزایش این عدد تا ۲، سرعت خوانش سریعتر، و در صورت کاهش آن به ۰.۵، سرعت خوانش کندتر میشود. معمولا برای اعداد بالای ۱.۴ صدا مبهمتر میشود. به عنوان مثال برای خواندن سریعتر متن «به چپ بپیچید» میتوانید از دستور زیر استفاده کنید:
- امکان تغییر نرخ نمونهبرداری (sample-rate): با استفاده از گزینهی --sample-rate میتوانید این امکان را فراهم سازید تا نرخ نمونهبرداری صوت خروجی را تنظیم کنید. به عنوان مثال با استفاده از دستور زیر میتوانید خروجی خود را با نرخ نمونهبرداری ۸۰۰۰ هرتز دریافت کنید:
برای استفاده از کلاینت در کد، پس از نصب آن توسط ابزار pip (همانطور که در بخش cli توضیح داده شده است) میتوانید به صورت زیر از آن در کد خود استفاده کنید:
مانند قبل به جای <your_token> توکنی که در بخش قبل گرفتید را قرار دهید. به جای be Cap bepiCid جمله مدنظر خود را قرار دهید و به جای result.mp3 آدرس فایلی که میخواهید خروجی در آن ذخیره شود را قرار دهید. اگر میخواهید به جای فونتیک از جمله فارسی استفاده کنید فیلد use_phonemes را برابر False قرار دهید و در فیلد text جمله فارسی مدنظر خود را قرار دهید.
توجه: توجه کنید که برای رعایت کردن قوانین موجود در SLA بایستی میزان timeout برابر ۶۰ (ثانیه) تنظیم شود. در غیر این صورت، مشمول بند استثنائات قرارداده خواهد شد.