टेक्स्ट टू स्पीच क्या है?

टेक्स्ट टू स्पीच आपके डिवाइस के बिल्ट-इन स्पीच सिंथेसिस से किसी भी टेक्स्ट को ज़ोर से पढ़ता है। आवाज़ चुनें, गति और पिच समायोजित करें, और हैंड्स-फ्री सुनें। सारी प्रोसेसिंग आपके डिवाइस पर होती है।

आवाज़ें सीधे आपके ऑपरेटिंग सिस्टम के स्पीच इंजन से आती हैं, इसलिए Windows, macOS, Android, iOS या Linux के हिसाब से सूची बदलती रहती है। स्पीड 0.1x से 10x तक और पिच 0 से 2 तक रखी जा सकती है। Chrome और Edge में 'टैब साझा' डायलॉग की मदद से प्लेबैक को WebM या MP4 ऑडियो फ़ाइल के रूप में रिकॉर्ड करके डाउनलोड भी कर सकते हैं।

उपयोग कैसे करें

  1. जो टेक्स्ट आप सुनना चाहते हैं उसे टेक्स्ट एरिया में टाइप करें या पेस्ट करें — एक वाक्य से लेकर पूरे लेख तक कुछ भी।
  2. ड्रॉपडाउन से एक आवाज़ चुनें — उपलब्ध आवाज़ें आपके डिवाइस और ऑपरेटिंग सिस्टम पर निर्भर करती हैं।
  3. गति और पिच स्लाइडर को अपनी पसंद के अनुसार समायोजित करें, फिर सुनने के लिए प्ले दबाएँ। ज़रूरत अनुसार पॉज़ और स्टॉप नियंत्रण का उपयोग करें।

कब उपयोग करें

  • खाना बनाते या सफ़र करते समय कोई लेख या PDF, जिसे पढ़ने का वक़्त नहीं है, सुन लेना।
  • मेल या रिपोर्ट का ड्राफ़्ट भेजने से पहले उसे ज़ोर से सुनकर अटपटे वाक्य पकड़ना।
  • किसी विदेशी भाषा के पैसेज पर 0.75x स्पीड पर सुनकर उच्चारण का अभ्यास करना।

परिणाम

एक भाषा सीखने वाला फ्रेंच में एक पैराग्राफ पेस्ट करता है, फ्रेंच आवाज़ चुनता है, गति 0.75x तक धीमी करता है, और उच्चारण और समझ का अभ्यास करने के लिए ध्यान से सुनता है।

अक्सर पूछे जाने वाले प्रश्न

ड्रॉपडाउन में कोई भी आवाज़ क्यों नहीं दिख रही?
कुछ माहौलों (विशेष रूप से Chrome) में आवाज़ें असिंक्रोनस तरीक़े से लोड होती हैं। पेज खुलने के बाद एक-दो सेकंड रुकिए या एक बार रिफ्रेश कर दीजिए। Linux पर अधिकांश डिस्ट्रो में TTS इंजन डिफ़ॉल्ट से नहीं आता, इसलिए espeak या festival जैसा कोई इंजन इंस्टॉल करना पड़ सकता है।
क्या ऑडियो को MP3 में डाउनलोड कर सकते हैं?
'रिकॉर्ड और डाउनलोड' बटन का इस्तेमाल कीजिए। यह टैब का ऑडियो Chromium पर WebM और Safari पर MP4 के रूप में पकड़ता है। अनुमति पॉपअप में 'टैब का ऑडियो साझा करें' पर टिक करना ज़रूरी है। MP3 चाहिए तो डाउनलोड की हुई फ़ाइल को किसी ऑडियो कन्वर्टर से गुज़ार दीजिए।
वही आवाज़ मेरे दोस्त के कंप्यूटर पर अलग क्यों लगती है?
हर ऑपरेटिंग सिस्टम अपना स्पीच इंजन साथ लाता है। macOS पर Apple की Siri आवाज़ें Windows पर Edge की न्यूरल आवाज़ों से बहुत अलग सुनाई देती हैं। एक ही नाम वाला विकल्प भी संस्करण के हिसाब से थोड़े अलग मॉडल से जुड़ा हो सकता है।
क्या अक्षरों की कोई सीमा है?
कोई सख़्त सीमा नहीं है, मगर ज़्यादातर इंजन अंदर ही अंदर लगभग 32KB के टुकड़ों में बाँट देते हैं। बहुत बड़े इनपुट (एक साथ कई लेख) कभी-कभी बीच में कट जाते हैं — ऐसे में टेक्स्ट को कुछ हिस्सों में बाँटकर पेस्ट कीजिए।
मैंने जो टेक्स्ट पेस्ट किया, वह कहीं भेजा जाता है?
नहीं। स्पीच सिंथेसिस आपके डिवाइस के TTS इंजन से लोकल चलता है और रिकॉर्डिंग लोकल मेमोरी में तब तक रहती है जब तक आप डाउनलोड नहीं करते। टेक्स्ट या ऑडियो किसी सर्वर पर अपलोड नहीं होते।

संबंधित उपकरण