اسی لکھاری کی مزید تحاریر

عشقِ حقیقی

وہ رب کی ذات کی جانب رجوع کر چکا تھا۔ دنیا کی چک و چوند کر دینے والی روشنی اسے اپنی مانند متوجہ کرنے...

زندگی ایک شٹ شو ہے

“ہیں؟ یہ حاجی صاحب ہیں؟ فرینچ کٹ؟ چڈی بنیان میں؟” شاہزیب نے پوچھا۔ “ہاں جی۔۔۔ اپنے زمانے میں سارے چسکے پورے کیے ہیں، ہمیں کہتے ہیں...

آنے والی کتاب “پینچو بہتان” سے اقتباس

کتاب: “پینچو بہتان” مصنف(ہ): پتہ نہیں قیمت: 96 روپیہ سکہ رائج السخت انتساب: محبت کا پہاڑ سر کرنے والے ہر رنگ برنگی کے نام باب: محبت کا پہاڑ گوٹھ...

خوف فروش

جسم فروشی کے بارے میں شنید ہے کہ انسانی معاشی نظام کا قدیم ترین پیشہ ہے۔ پیشہ ھذا مہذب ممالک میں آج بھی مخدوشریاستوں...

دنیا۔۔۔

دبئی میں یہ میرا پہلا رمضان تھا۔ انصاری اور میں نے بہت اہتمام کے ساتھ زمان و مکان کا تعین کیا تھا کہ فلاں...

ڈیپ فیک نہیں ڈیپ فک

بھائیوں اور خواتین

اندھا احمق بننے سے پہلے کچھ باتوں کو مغز میں ٹھونسا لیں۔ مستقبل کے لیے افاقہ ہوگا۔

سافٹ وئیر انڈسٹری میں کوئی بھی پروڈکٹ بنانے کے لیے وسائل لگتے ہیں۔ وسائل سے مراد ڈیویلپرز، سسٹم انجینئیر یا کلاؤڈایکسپرٹس، سیکیورٹی ایکسپرٹس، ہارڈ وئیر یا کلاؤڈ انفراسٹرکچر، کمیونیکیشن لنکس، مینیجمنٹ، مارکیٹنگ ٹیم، سیلز ٹیم وغیرہوغیرہ وغیرہ۔ ان سب کے لیے درکار ہوتا ہے روکھڑا یعنی پیسہ۔ اب یہاں ایک سادہ سا سوال پیدا ہوتا ہے کہ کوئی اپنا پیسہ ان سبمیں کیوں لگائے گا؟ جواب بھی آسان ہے مگر عوام الناس اپنے حماقت بھرے جذبات میں یہ سب حقائق دماغ سے نکال باہر کرتے ہیں۔بھئی کوئی بھی اپنا پیسہ وہاں لگائے گا جہاں اسے بطور سرمایہ کاری استعمال کرتے ہوئے ریوینیو پیدا ہو سکے۔

پیسہ پیسے کو کھینچتا ہے۔ دوسری جانب زکوٰۃ خیرات غریب کو کھینچتی ہے۔

آج کل کچھ اصطلاحات بہت عام ہو چکی ہیں۔ مزیدبرآں میڈیا اور پھر سوشل میڈیا بھی عام ہے لہذا ان اصطلاحات پر سے کسی بھیمتعلقہ مخصوص طبقے کی اجارہ داری بھی کھڈے لائن لگ گئی ہے۔ لیکن اس کا مطلب یہ نہیں کہ یہ اصطلاحات من و عن سب کیسمجھ میں بھی آنے لگی ہوں۔ سمجھ بہرحال متعلقہ طبقے ہی کو آتی ہے۔ آرٹیفیشل انٹیلیجینس، مشین لرننگ، ڈیپ فیک انہیاصطلاحات میں سے چند ہیں۔

مختصراً۔۔۔ ضروری نہیں کہ ایک عام آدمی کے لیے جتنا سادہ سا تصور “ڈیپ فک” کا ہے اتنا ہی آسان “ڈیپ فیک” سمجھنا بھی ہو۔

آسان مثال سے شروع کرتے ہیں۔ آپ سب نے گزشتہ چند برسوں میں نئے سمارٹ فون یا نئے لیپ ٹاپ کی سیل کھولی ہوگی۔ انڈیوائسز کی ابتدائی سیٹنگ کرتے ہوئے آپ سے فنگر پرنٹ یا آئی فون کے معاملے میں فیشل ریکگنشن کی سیٹنگ کروائی جاتی ہے۔ ابذرا ذہن پر زور دے کر یاد کریں، آپ سے کم از کم چار پانچ سیمپل لیے جاتے ہیں، چاہے فنگر پرنٹ کے ہوں یا چہرے کے۔ کبھی سوچاہے ایسا کیوں کیا جاتا ہے؟

میں صبح سو کر اٹھتا ہوں تو میرا چہرا بھی آپ تمام مردوں خصوصا افضل سیٹھار صاحب کے چہرے کی طرح سخت نحوست کاشکار ہوتا ہے۔ میں آئی فون کو لکڑی لگانے کے بعد ان لاک کروں تب بھی آئی فون ان لاک ہوجاتا ہے۔ میں آئی فون کو بخار کی کیفیتمیں آن کروں تب بھی فورا ان لاک ہوجاتا ہے۔ حالانکہ ان تمام حالات میں میرا چہرے کے تاثرات ایک سے نہیں ہوتے۔ اس کے باوجود آئیفون البتہ پوری ذمہ داری سے موبائل اس چہرے کے ساتھ بھی ان لاک کر دیتا ہے۔ اسی طرح آپ انگلی چاہے کہیں بھی استعمال کررہے ہوں، گیلی نہ ہو یا تیل گریس وغیرہ نہ لگی ہو انگلی پر کوئی زخم نہ ہو تو اینڈرائیڈ یا کوئی اور فون یای لیپ ٹاپ ان لاک ہوجاتاہے، بیشک آپ مشت زنی سے فارغ ہوکر (صاف) انگلی سے ان لاک کریں یا پھر کسی کو گھونسا مارنے کے بعد ان لاک کریں۔

اور یہ سب آسانی سے اس لیے ہوتا ہے کہ ڈیوائس آپ سے شروع ہی میں سیمپل لے لیتی ہے اور پھر ان سیمپلز کی بنیاد پر آپ کیبوتھی یا انگل کے مختلف زاویوں کو پہچان پاتی ہے۔

ذہانت یا انٹیلیجینس کیا ہے؟ یہ دستیاب معلومات کی بنیاد پر فیصلے کر کے نئے تجربے کرنا اور پھر نئے تجربات سے حاصل شدہنتائج کی بنیاد پر دستیاب معلومات کو بدل کر یا اس میں نئی معلومات کا اضافہ کر کے دستیاب معلومات، تجربات، مشاہدات اور نتائجکو بتدریج بڑھانے کی صلاحیت ہے۔ آرٹیفیشل انٹیلیجنس یا اے آئی یہی کچھ مصنوعی طریقے سے یا بہ الفاظ دیگر کمپیوٹر سےکروانے کا نام ہے۔

لیکن میرے بھائی، حضرت آدم بھی انسان تھے اور آپ بھی انسان ہیں۔ آج اگر آدم کے دور کا کوئی مبینہ انسان آپ کے سامنے صوفےپر بیٹھ جائے تو آپ اس سے یوٹیوب ویڈیو نہیں سرچ کروا سکیں گے، کیلکولیٹر نہیں چلوا سکیں گے یہاں تک کہ آسان ترین کام جوسبھی کو آتا ہے یعنی پورن سائٹ کھولنا، وہ بھی نہیں آتا ہوگا اگلے کو۔ وجہ؟ وجہ یہ کہ یہ تمام عمل اس دور کے بندے کی دستیابمعلومات کے ذخیرے یا knowledge bank کا حصہ نہیں ہوں گے۔ ایک بچے کی طرح سب کچھ سکھانا پڑے گا ہاں یہ اور بات ہے کہبچے کی نسبت شاید وہ ذرا جلد سیکھ جائے۔

بالکل ایسے ہی آرٹیفیشل انٹیلیجنس سسٹم کی انٹیلیجینس کا فائدہ اٹھانے کے لیے آپ کو درکار ہوتا ہے ڈیٹا۔ اب زبان ہلانا تو بہت ہیآسان ہے۔ کوئی غیر منکوحہ کو یہ بتاتے پکڑا گیا کہ “اوئے ہوئے ہوئے عائلہ تم نے تو میری کاریم ہی نکال دی” تو کہہ دیا کہ یہ ڈیپفک نہیں ڈیپ فیک ہے۔ بھائی جس دور میں SEO نامی مارکیٹنگ کرنے والے اپنے آپ کو “انفارمیشن ٹیکنالوجی ایکسپرٹ” کہیں گے توعمران ریاض جیسے صحافی ہی کھڈ سے باہر نکل کر مورگن فری مین کی آواز کا سہارا لے کر ڈیپ فک کو ڈیپ فیک ثابت کرنے کیکوشش کریں گے۔

چلیے آج چونکہ میں نئی سائیکل لایا ہوں اور مالک مکان نے میرا اے سی بھی ٹھیک کرا دیا ہے سو اسی خوشی میں بس کرنے کیبجائے اس کی تفصیل میں جاتے ہیں۔ کوشش کرتے ہیں بات کھول کر سامنے رکھ سکیں۔

میرا یہ دعوی ہے کہ عمران خان کی حالیہ آڈیو فیک نہیں۔ اس کے مقابلے میں زبیر عمر یا پرویز رشید یا کل عمران خان کی ویڈیو بھیآجائے وہ فیک ہو “سکتی” ہے۔ کیسے؟

عمران ریاض نے اے آئی ایپلیکیشن استعمال کرتے ہوئے مورگن فری مین کی آواز میں وہی الفاظ دوہرائے جو اس نے خود کہے۔ اس آڈیوپر ذرا غور کیجیے۔ اس کے دو حصے ہیں۔ ایک انگریزی والا اور دوسرا پنجابی والا۔ آپ محسوس کریں گے کہ انگریزی کا تلفظ قریبقریب درست ہے سوائے عمران ریاض خان کے نام کے۔ دوسری جانب پنجابی والا مورگن فری مین کے لہجے میں تلفظ نرا گلابی ہے۔ بھلااس کی وجہ کیا ہے؟

اس کی وجہ ہے اردو سپیچ کے ضمن میں ریسرچ کا قحط۔

دیکھیے، زبان فقط لکھنے یا پڑھنے کا نام نہیں۔ زبان جذبات کی ہیجان کی جوش اور ولولے کی عکاس ہوتی ہے۔ دنیا بھر میں سات اربانسان بستے ہیں۔ یہ سات بلین انسان اپنے جذبات کی ترجمانی لکھ کر یا بول کر کرتے ہیں۔ یہ سات کے سات بلین انسان روبوٹ نہیں۔یہ گوشت پوست اور سب سے اہم جذبات رکھنے والے انسان ہیں۔ یہ جب خوش ہوتے ہیں تو ان کی آواز رندھ جاتی ہے۔ یہ غصے میںہوتے ہیں تو چلاتے ہیں کئی الفاظ کو چبا کر بولتے ہیں۔ ان کے لکھنے میں اچھوتا پن ہوتا ہے۔ ان کے بولنے میں اتار چڑھاؤ ہوتا ہے۔ دنیاکی کوئی اے آئی پر مبنی ایپلیکیشن والٹئیر جیسا نہیں لکھ سکتی۔ دنیا کا کوئی سافٹ وئیر ضیاء محی الدین جیسا نہیں بول سکتا۔اس کی وجہ یہ ہے کہ ہم نے کمپیوٹر کو لکھے ہوئے ہر ممکن مواد کو digitize کر کے پڑھنا سکھایا۔ اس کے بعد اسے پڑھنا سکھایا۔لیکن اتنا کافی نہیں۔

ہمیں پڑھے ہوئے متن میں اتار چڑھاؤ لانے کے لیے دو باتوں پر غور کرنا ہوگا۔ ایک، اتار چڑھاؤ کا طریقہ ہر بندے کا الگ ہوتا ہے جسےوائس پروفائل کہا جاتا ہے۔ دوسرا وہ الفاظ جو الگ الگ ادا ہوں تو اتار چڑھاؤ نہیں ہوتا تاہم کسی خاص فقرے یا کسی خاصپیراگراف کے تسلسل میں استعمال ہو تو اتار چڑھاؤ محسوس ہوتا ہے۔ اسے کانٹیکسٹ contact کہا جاتا ہے۔ اے آئی کو صرف وائسپروفائل کے لیے ڈیٹا دستیاب ہو تو وہ ایک ہی فقرے میں موجود الفاظ کو عمران اور نواز دونوں کے ایک جیسے اتار چڑھاؤ ہمیشہ کےساتھ بول پائے گی۔ اگر فقط کانٹیکسٹ کا ڈیٹا دستیاب ہو تو اے آئی ایپ ہمیشہ ہر انسان کی آواز میں “فک آف” اور “فک اٹ” ایکہی طرح بول پائے گی۔

تو وہ نکتہ کیا ہے جس کی بنیاد پر عمران ریاض خان جھوٹا ہے؟

دیکھیے آپ کے پاس لاتعداد موویز پروگرامز ویڈیوز کا انگریزی ٹیکسٹ digitized شکل میں دستیاب ہے جسے پراسیس کر کےKnowledge bank کا حصہ بنانا اور پھر اس کا اینالیسس کر کے اس بنیاد پر کانٹیکسٹ اور وائس پروفائل کے درمیان لاجیکل تعلققائم کرنا ممکن ہے۔ یہ تمام ڈیٹا آرٹیفیشل انٹیلیجنس کے ذریعے مشین لرننگ سے گزارا گیا اور کمپیوٹر کو سمجھایا گیا کہ فلاں الفاظفلاں کانٹیکسٹ میں فلاں لہجے کا سبب بنتے ہیں۔

آپ کے پاس اردو کا digitized data کتنا ہے؟ کتنے TTS: Text to Speech پروگرام استعمال کیے ہیں جو اردو لکھا پڑھ سکیں؟کتنی وائس پروفائلز ہیں جو اردو بولنے والوں کی آوازوں کا تجزیہ کر کے جنریٹ کی گئی ہوں؟ آپ کے پاس انگریزی کے مقابلے میں کتنااردو متن ہے جو digitized شکل میں دستیاب ہے؟

تقریباً نہ ہونے کے برابر۔ یاد رہے، ہر پی ڈی ایف سافٹ وئیر کے لیے پڑھے جانے کے قابل نہیں ہوتی۔ ہاں optical text recognition کے میچیور ہونے کے ساتھ ساتھ یہ ڈیٹا بڑھتا رہے گا مگر OCR جتنی غلطیاں کرتا ہے ایک انسانی نظر ثانی کی ضرورت انگریزی متنکے لیے بھی ہمیشہ رہتی ہے کجا اردو۔

لہذا وائس ریکارڈنگ کو ماسوائے پہلے سے مختلف مقامات پر ادا ہوئے الفاظ یا فقرے الگ الگ مواقع پر ریکارڈ کردہ ڈیٹا سے نکال کریکجا کرنے کے علاوہ کم از کم اردو اور دیگر ایسی زبانوں میں جن کی digitization نہ ہونے کے برابر ہو، ممکن نہیں۔ اور یہdigitization کیسے ممکن ہے؟ اس پر ہم بعد میں بات کرتے ہیں۔

یہاں میں ایک اور تجربہ بھی پیش کرتا چلوں۔

سال ۲۰۱۴ میں میری کمپنی نے دو عدد مہنگے سلوشن خریدے۔ پہلی ایپلیکیشن Speech Analytics سے متعلق تھی جس کا کام کال کرنے والے کسٹمر اور کسٹمر کو سروس فراہم کرنے والے کال سینٹر ایجنٹ کی آواز میں جذباتیت کو دیکھ کر الرٹ جنریٹ کرنا ہوتا تھا تاکہ سپروائزر بیچ میں کود کر معاملات حل کر سکے۔ دوسری ایپلیکیشن Text to Speech کے لیے تھی جس کا کام کال سینٹر کے IVR واسطے Voice Prompts جنریٹ کرنا تھا۔ دونوں کے لیے متعین زبان عربی تھی اور عرب آپ کی میری سوچ سے زیادہ Digital Transformation پر مرکوز ہیں۔ اللہ کا بڑا کرم رہا کہ دونوں ایپلیکیشنز ناکام ثابت ہوئیں۔ عرب لہجہ ایسا ہوتا ہے کہ دو بندے پیاز کا ریٹ پوچھ رہے ہوں تو بھی لڑائی کا گمان ہوتا ہے، اور یوں پہلی پراڈکٹ ناکام رہی۔ دوسری پراڈکٹ الفاظ جوڑ جوڑ کر روبوٹک طریقے سے وائس پرامپٹ جنریٹ کیا کرتی۔ کر لیں آپ پوری کال جنریٹ اے آئی سے۔

اس کے برعکس اے آئی کے ذریعے ویڈیو جنریٹ کرنا نسبتا آسان ہے۔ کیوں؟ وہ اس لیے کہ ویڈیو میں جذبات کی عکاسی اتنی پچیدہنہیں جتنی ایک فقرے میں ہے۔ مثلاً کوئی فرینچ کس کرتا ہے، تو یہ مکمل عمل بذات خود ایک جذبے کی عکاسی ہے۔ اس کے برعکس باتکرتے ہوئے ایک ایک لفظ الگ الگ جذباتیت کا تاثر دیتا ہے۔ ویڈیو جنریٹ کرنے کے لیے ڈیٹا آسانی سے دستیاب ہے۔ آپ کا نہیں معلوملیکن میرے احباب میں سے ایک اچھی خاصی تعداد دیسی کمینوں کی ہے جن کے پاس دیسی پورن ٹوٹوں کا اچھا خاصہ بڑا خزانہہے۔ ویڈیو کے کیس میں آپ کے پاس عمران خان کا ڈیٹا ہی ڈیٹا بھرا پڑا ہے۔ کہیں تقریر کرتے ہوئے کہیں سوتے ہوئے کہیں ہنستے ہوئےکہیں غصہ کرتے ہوئے۔ آپ کے پاس ویڈیو پروفائل جنریٹ کرنے کے لیے ٹھیک ٹھاک ڈیٹا دستیاب ہے۔ ویڈیو کے معاملے میں کانٹیکسٹتخلیق کرنا بھی آسان ہے۔ عمران خان بولتا کیسے ہے یہ سب جانتے ہیں۔ عمران خان کھڑا یا بیٹھتا کیسے ہے اس پر کبھی غور نہیںکیا ہوگا آپ نے۔ اب آپ نے کسی اور کی حرکات سکنات نوٹ کر کے اسے عمران خان کی ویڈیو پروفائل کے ساتھ مکس کر دینا ہے جوبہت کامل تو شاید پھر بھی نہ ہو تاہم آواز کی نسبت اس میں “یار کچھ مِسنگ ہے” محسوس کرنا مشکل ہے۔ وجہ وہی، آپ عمران خانگالیاں کیسے دیتا ہے تو جانتے ہیں تاہم عمران خان گھڑی کیسے دیکھتا ہے یہ نوٹ کر کے ذہن میں نہیں بٹھاتے۔

اب سوال یہ ہے کہ وائس اے آئی کو لے کر ہمارے پاس ریسرچ کیوں نہیں ہوتی؟ اس کا جواب یہ ہے کہ ایسی ریسرچ اگر کوئی کرنابھی چاہے تو کیوں کرے گا؟ ریسرچ میں پروسیسنگ میں ریسورسز لگتے ہیں وسائل لگتے ہیں۔ وسائل دستیاب کرنے کے لیے پیسہ چاہیےہوتا ہے۔ پیسہ لگانے کے لیے وجہ چاہئے ہوتی ہے پیسے کا ریٹرن چاہئے ہوتا ہے۔ ریٹرن کے لیے آئیڈیاز چاہیے ہوتے ہیں۔ آپ کو کیا لگتاہے؟ کوئی اس ضمن میں کروڑوں روپے فقط اس لیے کرے گا کہ عمران خان یا نواز شریف کی جعلی آڈیو تخلیق کر سکیں؟ اس سے ایکدو بار تو آپ شاید فائدہ اٹھا لیں، تواتر کے ساتھ نوٹ کیسے چھاپیں گے؟

آپ کی جامعات میں ریسرچ کو فوت ہوئے جانے کتنی دہائیاں ہو چکی ہیں۔ آپ کے پاس سرمائے کے نام پر کشکول میں پڑے چند پرائےسکے ہیں۔ دنیا آپ کے ساتھ collaboration کرنے سے بھاگتی ہے۔

حضرات گرامی و خواتین اقدس۔۔۔ آپ اپنی تاریخ کے تنزل میں ایسے مقام پر پہنچ چکے ہیں جہاں فکری زرخیزی، ریسرچ اور محنتکے نام پر جمود، جمود اور فقط جمود ہے۔ آپ کے پاس پیسہ بنانے کے لیے نہ آئیڈیاز ہیں نہ منصوبہ بندہ اور نہ سرمایہ۔ تو پیچھے کیابچتا ہے؟

بکواس۔۔۔ بکواس۔۔۔ اور نری بکواس۔

کبھی ٹیکنالوجی کے نام پر، کبھی اے آئی کے نام پر اور کبھی ڈیپ فیک کے نام پر۔

آپ ڈیپلی فکڈ ہوچکے ہیں۔

نوٹ: راقم نے اپنے ۱۵ سالہ کیرئیر کا آغاز کینیڈین کمپنی Nortel Networks سے کیا جو دراصل گراہم بیل، موجد ٹیلی فون کی باقیات کمپنیتھی جسے بعد ازاں امریکی کمپنی Avaya نے خرید لیا۔ راقم کا تعلق VoIP اور Contact Center انڈسٹری سے ہے نیز راقم گزشتہ آٹھ برس سےایک معروف خلیی ریاست کے کانٹیکٹ سینٹر میں Digital Transformation پراجیکٹ لیڈ کرنے کے ساتھ ساتھ گزشتہ دو برس سے ایک عدد آسٹریلین Data Analytics کمپنی کو کنسلٹنسی فراہم کر رہا ہے۔ اس نوٹ کا مقصد اس مضمون کے متعلق اپنی معلومات کے لیے credibility فراہم کرنا ہے۔

پچھلا آرٹیکل
اگلا آرٹیکل
معاذ بن محمود
معاذ بن محمود
مقیم آسٹریلیا، دل ہے پاکستانی۔ کہتے ہیں کہ اپنے رسک پر پڑھا کریں مجھے۔ تو پھر؟
پڑھتے رہا کرو یارو

میرا گھر

دنیا کو بیشک تغیر و تبدیلی سے رغبت ہو، ہمیں تو یکسانیت سے لگاؤ ہے۔ پس اسی لیے آج تیسرے سال کے لیے اسی گھر کا کانٹریکٹشروع ہوچکا ہے۔...

زیادہ بوجھ نہیں ڈالتا

باپ کا آپریشن تھا، بہن طلاق لے کر تین بچوں سمیت گھر آ بیٹھی تھی، بچوں کی سکول کی فیس دینا تھی، اور بیگم کے کالے یرقان کی مفت...

انقلاب مکمل ہو چکا تھا

محمود قریشی نے مہاتما عمران پیازی کے سامنے دو نام بہت ادب سے پیش کیا اور کہا کہ میرے بیٹے کو پنجاب اسمبلی اور بیٹی کو قومی اسمبلی کا...

پراٹھے

ہمارا ایک آفس بوائے بھی نہیں سنتا تھا ہماری۔۔۔ محمد اشتیاق صاحب سینر ڈیٹا بیس آرکیٹیکٹ کے پراٹھے کھا کر انکاری ہوجاتا تھا۔ سال تھا غالبا ۲۰۰۸ کا۔ ایک دن...

وینزویلا، زندہ باد، وینزویلا، زندہ باد

وینزویلا کے جنرل برونو کیارا نے قومی دن کے موقع پر جذبات سے بھری اور بھڑکیلی تقریر کی۔ حب الوطنی سے بھری اس تقریر نے پورے وینزویلا میں جوش...

نویں نکور بارلے

چند اک سوشل میڈیائی احباب کو مغربی ممالک کی شہریت ملی ہے۔ اچھی بات ہے۔ اس شہریت کے بعد ان کے اس معاشرت کے افضل تر ہونے کے بارے...
error: چوری مت کر۔ اپنا کانٹینٹ خود لکھ کمینے۔