هل تستخدم أي من مشاريع FLOSS المدخلات البشرية لتركيب الكلام؟[مغلق]

https://stackoverflow.com/questions/8891981

29-10-2019
|

سؤال

هل هناك أي مشاريع مفتوحة المصدر ومحتوى مفتوح تستخدم بيانات الكلام المسجلة لتوليد الكلام المركب؟ (بهدف توليف / محاكاة كلام فرد معين. كملاحظة جانبية ، هل هناك اسم لهذه العملية أو الهدف أو البيانات المستخرجة؟ "التوقيع الصوتي"؟)

أتخيل أن سير العمل سيكون مثل:

تسجيل الكلام من نص قياسي ("الدمية جلس على السجادة")
اختر الصوتيات ("a" للقطط) ، مع مراعاة اللكنة
الحصول على البيانات التي تجعل صوت أليس مختلفًا عن صوت "إيه" لبيتي
تحويل النص إلى كلام باستخدام الأصوات المناسبة للّكنة بالإضافة إلى التوقيع الصوتي

تعد الإجابة عن هذا السؤال خطوة مهمة في تقديم التماس Jack Angel ( تيدي ، وونكرز ) للتبرع بتوقيعه الصوتي المريح إلى المجال العام من أجل الإنسانية.

المحلول

إليك مشروع مفتوح المصدر يُدعى فيستفوكس برعاية جامعة كارنيجي ميلون ويهدف إلىتركيب صوت مبني على مكبر صوت معين.تم وصف المفهوم هنا ويبدو أنه عملية تستغرق وقتًا طويلاً لضبطها بشكل صحيح.توجد قائمة جيدة بمشاريع تحويل النص إلى كلام مفتوحة المصدر على BableFish.org .هناك مناقشة جيدة على Text To Speech Blog حولبناء محرك TTS حول مكبر صوت معين.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow