صرف تین سیکنڈ میں آپ کی آواز کی ہوبہو نقل کرنے والا سافٹ ویئر
مائیکرو سافٹ، وال ای اے آئی پروگرام کسی بھی چند سیکنڈ کی انسانی آواز سن کر اس کا لہجہ اور انداز بھی نقل کرسکتا ہے
مائیکرو سافٹ نے مصنوعی ذہانت پر مبنی ایک اے آئی سافٹ ویئر بنایا ہے جو صرف تین سیکنڈ تک کسی کی بھی آواز سن کر اس کی ہوبہو نقل بناتا ہے۔ یہ سافٹ ویئر آواز کی کھرج، جذباتی لہجے اور اتار چڑھاؤ کی بھی نقل کرتا ہے۔
انسانی آواز چرانے والے اس سافٹ ویئر کا نام وال ای، اے آئی رکھا گیا ہے۔ اس سے قبل مائیکرو سافٹ مشہور مصوروں کی پینٹنگ کی نقل کرنے والا ایک اور پروگرام ڈیل ای بنا چکا ہے۔ اب یہ ماڈل ٹیکسٹ ٹو اسپیچ ہے یعنی لکھے الفاظ کو آواز میں بدلتا ہے۔ یہ دنیا میں کسی بھی شخص کی آواز کی نقل کرسکتا ہے جس کے لیے اسے تین سیکنڈ کی آڈیو فائل درکار ہوگی۔ تاہم مزید بہتری کے لیے قدرے طویل آڈیو فائل کی ضرورت ہوسکتی ہے۔ سافٹ ویئر اس حد تک مؤثر ہے کہ یہ آواز کے زیروبم اور آواز کے جذباتی اتارچڑھاؤ کی بھی نقالی کرسکتا ہے۔
اس طرح آپ وال ای سے کسی بھی شخصیت سے وہ الفاظ ادا کرواسکتے ہیں جو اس نے کبھی نہیں کہے۔ اس سے جعلی آڈیوز اور فیک ریکارڈنگ کا ایک نیا سیلاب بھی آسکتا ہے اور طرح طرح کےمسائل جنم لےسکتے ہیں۔ مائیکروسافٹ کےمطابق مصنوعی ذہانت پر مبنی اس کے الگورتھم کو انگریزی زبان کی 60 ہزار گھنٹوں کی آواز پر تربیت فراہم کی گئ ہے۔ ان میں کہانی سنانے والے اور کتاب پڑھنے والوں کی آواز بھی شامل ہیں۔
تاہم ریکارڈ کی گئی آواز کے نمونے یا واٹس ایپ پیغامات پر اس کا معیار کچھ گرسکتا ہے تاہم اگر کوئی وال ای پر براہِ راست اچھے مائیک سے آواز ریکارڈ کرتا ہے تو سافٹ ویئر کےنتائج حقیقت سے قریب تر ہوتے ہیں۔ تاہم آزاد تجزیہ نگاروں نے کہا ہے کہ مائیکروسافٹ کےدعووں کے برعکس سافٹ ویئر نے بہت واجبی صلاحیت دکھائی۔
تاہم مائیکروسافٹ نےکہا ہےکہ اس کے کچھ فوائد بھی ہوسکتے ہیں۔ اگر کوئی فنکار فلم کی ڈبنگ درمیان میں چھوڑ کر کہیں اور مصروف ہوجاتا ہے تو اس کی ڈبنگ سافٹ ویئر سے کی جاسکتی ہے۔ اس طرح کےچھوٹے امور وال ای اے آئی اچھی طرح نبھا سکتا ہے۔
انسانی آواز چرانے والے اس سافٹ ویئر کا نام وال ای، اے آئی رکھا گیا ہے۔ اس سے قبل مائیکرو سافٹ مشہور مصوروں کی پینٹنگ کی نقل کرنے والا ایک اور پروگرام ڈیل ای بنا چکا ہے۔ اب یہ ماڈل ٹیکسٹ ٹو اسپیچ ہے یعنی لکھے الفاظ کو آواز میں بدلتا ہے۔ یہ دنیا میں کسی بھی شخص کی آواز کی نقل کرسکتا ہے جس کے لیے اسے تین سیکنڈ کی آڈیو فائل درکار ہوگی۔ تاہم مزید بہتری کے لیے قدرے طویل آڈیو فائل کی ضرورت ہوسکتی ہے۔ سافٹ ویئر اس حد تک مؤثر ہے کہ یہ آواز کے زیروبم اور آواز کے جذباتی اتارچڑھاؤ کی بھی نقالی کرسکتا ہے۔
اس طرح آپ وال ای سے کسی بھی شخصیت سے وہ الفاظ ادا کرواسکتے ہیں جو اس نے کبھی نہیں کہے۔ اس سے جعلی آڈیوز اور فیک ریکارڈنگ کا ایک نیا سیلاب بھی آسکتا ہے اور طرح طرح کےمسائل جنم لےسکتے ہیں۔ مائیکروسافٹ کےمطابق مصنوعی ذہانت پر مبنی اس کے الگورتھم کو انگریزی زبان کی 60 ہزار گھنٹوں کی آواز پر تربیت فراہم کی گئ ہے۔ ان میں کہانی سنانے والے اور کتاب پڑھنے والوں کی آواز بھی شامل ہیں۔
تاہم ریکارڈ کی گئی آواز کے نمونے یا واٹس ایپ پیغامات پر اس کا معیار کچھ گرسکتا ہے تاہم اگر کوئی وال ای پر براہِ راست اچھے مائیک سے آواز ریکارڈ کرتا ہے تو سافٹ ویئر کےنتائج حقیقت سے قریب تر ہوتے ہیں۔ تاہم آزاد تجزیہ نگاروں نے کہا ہے کہ مائیکروسافٹ کےدعووں کے برعکس سافٹ ویئر نے بہت واجبی صلاحیت دکھائی۔
تاہم مائیکروسافٹ نےکہا ہےکہ اس کے کچھ فوائد بھی ہوسکتے ہیں۔ اگر کوئی فنکار فلم کی ڈبنگ درمیان میں چھوڑ کر کہیں اور مصروف ہوجاتا ہے تو اس کی ڈبنگ سافٹ ویئر سے کی جاسکتی ہے۔ اس طرح کےچھوٹے امور وال ای اے آئی اچھی طرح نبھا سکتا ہے۔