HealingPoint

ह्यूम ने एआई वॉयस अनुकूलन के लिए इंटरप्रिटेबिलिटी-आधारित वॉयस कंट्रोल फीचर पेश किया

ह्यूम ने एआई वॉयस अनुकूलन के लिए इंटरप्रिटेबिलिटी-आधारित वॉयस कंट्रोल फीचर पेश किया


ह्यूम, न्यूयॉर्क स्थित कृत्रिम होशियारी (एआई) फर्म ने सोमवार को एक नए टूल का अनावरण किया जो उपयोगकर्ताओं को एआई आवाजों को अनुकूलित करने की अनुमति देगा। डब्ड वॉयस कंट्रोल, नई सुविधा का उद्देश्य डेवलपर्स को इन आवाजों को उनके चैटबॉट और अन्य एआई-आधारित अनुप्रयोगों में एकीकृत करने में मदद करना है। आवाज़ों की एक बड़ी श्रृंखला की पेशकश करने के बजाय, कंपनी आवाज़ों के 10 विभिन्न आयामों पर विस्तृत नियंत्रण प्रदान करती है। प्रत्येक आयाम में वांछित पैरामीटर का चयन करके, उपयोगकर्ता अपने ऐप्स के लिए अद्वितीय आवाज़ें उत्पन्न कर सकते हैं।

कंपनी ने नए AI टूल के बारे में विस्तार से बताया ब्लॉग भेजा. ह्यूम ने कहा कि वह अपने ब्रांड की पहचान से मेल खाने के लिए सही एआई आवाज ढूंढने वाले उद्यमों की समस्या को हल करने की कोशिश कर रहा है। इस सुविधा के साथ, उपयोगकर्ता आवाज की धारणा के विभिन्न पहलुओं को अनुकूलित कर सकते हैं और डेवलपर्स को एआई-आधारित अनुप्रयोगों के लिए अधिक मुखर, आरामदायक या उत्साही आवाज बनाने की अनुमति दे सकते हैं।

ह्यूम का वॉयस कंट्रोल फिलहाल बीटा में उपलब्ध है, लेकिन इसे प्लेटफॉर्म पर पंजीकृत कोई भी व्यक्ति एक्सेस कर सकता है। गैजेट्स 360 स्टाफ सदस्य टूल तक पहुंचने और फीचर का परीक्षण करने में सक्षम थे। 10 अलग-अलग आयाम हैं जिन्हें डेवलपर्स समायोजित कर सकते हैं जिनमें लिंग, दृढ़ता, उछाल, आत्मविश्वास, उत्साह, नासिकाता, आराम, सहजता, तीखापन और जकड़न शामिल हैं।

प्रॉम्प्ट-आधारित अनुकूलन जोड़ने के बजाय, कंपनी ने एक स्लाइडर जोड़ा है जो प्रत्येक मेट्रिक्स के लिए -100 से +100 तक जाता है। कंपनी ने कहा कि यह दृष्टिकोण किसी आवाज के पाठ्य विवरण से जुड़ी अस्पष्टता को खत्म करने और भाषाओं पर विस्तृत नियंत्रण प्रदान करने के लिए उठाया गया था।

हमारे परीक्षण में, हमने पाया कि दस आयामों में से किसी एक को बदलने से एआई आवाज में एक श्रव्य अंतर आता है और उपकरण विभिन्न आयामों को सही ढंग से सुलझाने में सक्षम था। एआई फर्म ने दावा किया कि यह एक नया “अपर्यवेक्षित दृष्टिकोण” विकसित करके हासिल किया गया था जो विशिष्ट मापदंडों के भिन्न होने पर प्रत्येक आधार आवाज की अधिकांश विशेषताओं को संरक्षित करता है। विशेष रूप से, ह्यूम ने खरीदे गए डेटा के स्रोत का विवरण नहीं दिया।

विशेष रूप से, एआई वॉयस बनाने के बाद, डेवलपर्स को इसके एम्पैथिक वॉयस इंटरफेस (ईवीआई) एआई मॉडल को कॉन्फ़िगर करके इसे एप्लिकेशन पर तैनात करना होगा। हालाँकि कंपनी ने निर्दिष्ट नहीं किया है, इस प्रायोगिक सुविधा के लिए EVI-2 मॉडल का उपयोग किए जाने की संभावना है।

भविष्य में, ह्यूम ने आधार आवाज़ों की सीमा का विस्तार करने, अतिरिक्त व्याख्या योग्य आयाम पेश करने, अत्यधिक संशोधनों के तहत आवाज विशेषताओं के संरक्षण को बढ़ाने और आवाज विशेषताओं का विश्लेषण और कल्पना करने के लिए उन्नत उपकरण विकसित करने की योजना बनाई है।

Exit mobile version