যুক্তরাষ্ট্রভিত্তিক কৃত্রিম বুদ্ধিমত্তা (আর্টিফিশিয়াল ইন্টেলিজেন্স) কোম্পানি ওপেন এআইয়ে গবেষক হিসেবে করতেন সুচির বালাজি।
কয়েক মাস আগেই তিনি প্রতিষ্ঠানটির নৈতিকতার বিষয়ে অভিযোগ তুলেছিলেন। এনিয়ে পরবর্তীকালে অনেক জল ঘোলা হয়। সম্প্রতি তাকে সান ফ্রান্সিসকোর নিজ অ্যাপার্টমেন্টে মৃত অবস্থায় পাওয়া গেছে।
বালাজি প্রথম আলোচনায় আসেন জেনারেটিভ এআই এবং এর সুরক্ষিত বিষয়বস্তুর অপব্যবহার নিয়ে উদ্বেগ প্রকাশ করে। তিনি এআই শিল্পের নৈতিক জটিলতা সম্পর্কে সতর্ক করেছিলেন।
সর্বশেষ পাওয়া তথ্য অনুযায়ী, ২৬ বছর বয়সী সুচির বালাজির মরদেহ পরীক্ষা করে প্রধান মেডিকেল পরীক্ষক জানিয়েছেন, ওই ভারতীয়-আমেরিকান যুবক আত্মহত্যা করেছেন। প্রাথমিক তদন্তে পুলিশ এখানে অপরাধমূলক কোন কর্মকাণ্ডের প্রমাণ পায়নি।
তবে তার মৃত্যু স্বাভাবিক মনে হচ্ছে না অনেকের কাছে। কারণ লাশ পাওয়ার এক দিন আগে ২৫ নভেম্বর একটি মামলায় তাকে কপিরাইট লঙ্ঘনের অভিযোগে অভিযুক্ত করা হয়।
এই মামলাটি করা হয়েছিল ওপেনএআইয়ের বিরুদ্ধে।
প্রযুক্তিবিষয়ক মিডিয়া টেকক্রাঞ্চ জানিয়েছে, ওপেনএআই পরে বালাজির নথিপত্র পর্যালোচনা করতে সম্মত হয়, যেখানে কপিরাইট নিয়ে গুরুতর উদ্বেগের বিষয় উল্লেখ ছিল।
কে এই সুচির বালাজি
ভারতীয়-আমেরিকান সুচির বালাজি ২১শ শতকের অন্যতম বৈপ্লবিক প্রযুক্তি চ্যাটজিপিটির প্রধান নির্মাতাদের একজন।
ডিপমাইন্ড নামে একটি স্টার্টআপ এমন এআই তৈরি করেছে যা নিজে নিজে স্পেস ইনভেডারস, পং ও ব্রেকআউটের মতো ক্লাসিক গেম খেলতে পারে। এই সংবাদটি নজর কেড়েছিল বালাজির। সেখান থেকেই এআই প্রীতি শুরু তার।
তিনি নিউ ইয়র্ক টাইমসকে দেওয়া এক সাক্ষাৎকারে বলেন, “আমি ভেবেছিলাম এআই এমন একটি প্রযুক্তি, যা অসাধ্য সমস্যার সমাধান করতে পারে, যেমন রোগ নিরাময় ও বার্ধক্য রোধ। তখন আমি মনে করেছিলাম, আমরা এমন একটি বিজ্ঞানী তৈরি করতে পারি, যা এই সমস্যাগুলোর সমাধানে সহায়ক হবে।”
তখন বালাজি বার্কলেতে ইউনিভার্সিটি অব ক্যালিফোর্নিয়াতে কম্পিউটার সায়েন্সে পড়তেন। সেখানেই তিনি নিউরাল নেটওয়ার্ক নামে একটি গাণিতিক পদ্ধতি নিয়ে কাজ শুরু করেন। এটি ডিজিটাল তথ্য বিশ্লেষণ করে দক্ষতা অর্জন করতে পারে।
বালাজি প্রোগ্রামিং প্রতিযোগিতায় অসাধারণ দক্ষতা দেখিয়েছিলেন। ২০১৮ সালে তিনি এসিএম আইসিপিসি ওয়ার্ল্ড চ্যাম্পিয়নশিপে ৩১তম স্থান অর্জন করেন। ২০১৭ সালে প্যাসিফিক নর্থওয়েস্ট রিজিওনাল ও বার্কলে প্রোগ্রামিং প্রতিযোগিতায় প্রথম স্থান পান। তিনি কাগলের টিএসএ স্পনসর্ড ‘প্যাসেঞ্জার স্ক্রিনিং অ্যালগরিদম চ্যালেঞ্জ’ এ ৭ম স্থান পেয়ে পুরস্কার হিসেবে ১ লাখ ডলার পেয়েছিলেন। তার লিংকডইন প্রোফাইল অনুসারে, তিনি ২০১৬ সালের ইউএস ওপেন ন্যাশনাল চ্যাম্পিয়ন ও ইউএসএসি ফাইনালিস্ট ছিলেন।
ওপেনএআইয়ে যোগ দেওয়ার আগে তিনি স্কেল এআই, হেলিয়া ও কোরাতে সফটওয়্যার ইঞ্জিনিয়ার হিসেবে কাজ করেন।
বালাজি ২০১৮ সালে ওপেনএআইয়ে ইন্টার্নশিপ করেন। পরে ২০২০ সালে তিনি আনুষ্ঠানিকভাবে প্রতিষ্ঠানটিতে যোগ দেন। সেখানে প্রথমদিকে বালাজি ওয়েবজিপিটিতে কাজ করেন। পরে তিনি জিপিটি-ফোর এর প্রিট্রেনিং (মডেল বা সিস্টেম তৈরির প্রাথমিক দল) দলের সঙ্গে কাজ করেন।
টেকক্রাঞ্চের তথ্য মতে, বালাজি একটি নিউরাল নেটওয়ার্ক তৈরিতে গবেষণা করেন। এটি কয়েক মাস ধরে ইন্টারনেটে থাকা প্রায় সমস্ত ইংরেজি ভাষার টেক্সট বিশ্লেষণ করে।
বিষয়টি নিয়ে বালাজি বলেছিলেন, “গবেষণা প্রকল্পে, সাধারণভাবে আপনি যেকোনো ডেটাতে প্রশিক্ষণ দিতে পারেন। তখন এই ছিল আমাদের মনোভাব।”
তারপর ওপেনএআই চ্যাটজিপিটি প্রকাশ করে। প্রথমে এটি জিপিটি-৩.৫ সংস্করণটি বাজারে আনে। রাতারাতি চ্যাটবটটি ব্যাপক জনপ্রিয়তা অর্জন করে। আর অচিরেই প্রতিষ্ঠানটি লাভজনক হয়ে ওঠে।
২০২৪ সালের আগস্টে বালাজি ওপেনএআই ছেড়ে যাওয়ার সিদ্ধান্ত নেন। তার এই সিদ্ধান্তের পেছনে তার উদ্বেগ কাজ করেছিল। তিনি মনে করেছিলেন, যে প্রযুক্তি তৈরিতে তিনি সাহায্য করেছিলেন, তা শেষ পর্যন্ত ভালোর চেয়ে বেশি ক্ষতি করতে পারে।
বালাজির ভাষ্যে, “আমার কথা বিশ্বাস করলে, আপনার পক্ষে কোম্পানির চাকরি ছেড়ে দেওয়া ছাড়া বিকল্প কিছু নেই।” এভাবেই তিনি ওপেন এআই ছেড়ে দেওয়ার পক্ষে যুক্তি দিয়েছিলেন।
কী ছিল বালাজির উদ্বেগ
ওপেন এআইয়ে বালাজি চার বছরেরও বেশি সময় কাজ করেছেন। তার অভিযোগ, এআই প্রতিষ্ঠানটি যথাযথ অনুমতি ছাড়াই কপিরাইটযুক্ত ডেটা ব্যবহার করেছে।
নিউ ইয়র্ক টাইমসকে দেওয়া সাক্ষাৎকারে তিনি ব্যাখ্যা করে বলেন, কীভাবে জিপিটি-ফোরের মতো সিস্টেমগুলো প্রশিক্ষণের জন্য ব্যবহৃত ডেটার সম্পূর্ণ কপি তৈরি করে। একবার ডেটাটি পুনরুদ্ধার হলে, ওপেনএআইয়ের মতো কোম্পানিগুলো সিস্টেমটিকে একে অপরের মত কপি বা সম্পূর্ণ নতুন আউটপুট তৈরি করতে প্রশিক্ষণ দিতে পারে।
বালাজি বলেন, “আউটপুটগুলো ইনপুটগুলোর সঠিক কপি নয়। কিন্তু সেগুলো মৌলিকভাবে নতুনও নয়।”
তিনি সতর্ক করেন যে, চ্যাটজিপিটি এবং একই ধরনের চ্যাটবটগুলো কনটেন্ট ক্রিয়েটর, ব্যবসা ও ইন্টারনেট সেবা প্রদানকারী প্রতিষ্ঠানের জন্য ঝুঁকি সৃষ্টি করতে পারে। এসব প্রতিষ্ঠানই প্রথমে ওই ডেটা তৈরি করেছিল, যা এআই বটের প্রশিক্ষণে ব্যবহার হয়েছে।
বালাজির সতর্কতা আসলে অনেক মানুষের উদ্বেগের প্রতিফলন। তারা ওপেনএআইসহ বিভিন্ন এআই কোম্পানির বিরুদ্ধে মামলা করেছে। তাদের অভিযোগ, এসব কোম্পানি অবৈধভাবে কপিরাইটযুক্ত উপকরণ ব্যবহার করেছে প্রযুক্তি প্রশিক্ষণের জন্য। এতে কম্পিউটার প্রোগ্রামার, শিল্পী, রেকর্ড লেবেল, বইয়ের লেখক এবং সংবাদ সংস্থাগুলি অন্তর্ভুক্ত।
বালাজি আরও একটি বড় সমস্যা উল্লেখ করেন। তিনি বলেন, এআই প্রযুক্তি যত বেশি ইন্টারনেট সেবাগুলোর জায়গা নিচ্ছে, ততই এটি ভুল বা কাল্পনিক তথ্য তৈরি করছে। গবেষকরা একে ‘হ্যালুসিনেশন’ বলে অভিহিত করেন। বালাজির মতে, ইন্টারনেট এখন খারাপ দিকে ধাবিত হচ্ছে।
তবে ওপেনএআই বালাজির অভিযোগ অস্বীকার করেছে। প্রতিষ্ঠানটি এক বিবৃতিতে জানিয়েছে, “আমরা আমাদের এআই মডেল তৈরি করতে সেই পাবলিক ডেটা ব্যবহার করি, যেগুলো ফেয়ার ইউজ নীতির আওতায় সুরক্ষিত। এটি দীর্ঘ সময় ধরে প্রতিষ্ঠিত আইনি সিদ্ধান্তের মাধ্যমে সমর্থিত। আমরা মনে করি, এই নীতিটি কটটেন্ট ক্রিয়েটরদের জন্য ন্যায়সঙ্গত এবং উদ্ভাবকদের জন্য প্রয়োজনীয়।”
নিয়ন্ত্রণের জন্য চাপ
বালাজি গত অক্টোবরে সোশাল মিডিয়া এক্সে এক পোস্টের মাধ্যমে জেনারেটিভ এআই কোম্পানির মাধ্যমে কপিরাইটযুক্ত উপকরণের ব্যবহার নিয়ে তার উদ্বেগ শেয়ার করেন।
I recently participated in a NYT story about fair use and generative AI, and why I'm skeptical "fair use" would be a plausible defense for a lot of generative AI products. I also wrote a blog post (https://t.co/xhiVyCk2Vk) about the nitty-gritty details of fair use and why I…
— Suchir Balaji (@suchirbalaji) October 23, 2024
সেখানে তিনি লেখেন, “প্রথমে আমি কপিরাইট, ফেয়ার ইউজ ইত্যাদি সম্পর্কে বেশি জানতাম না। কিন্তু জেনএআই কোম্পানির বিরুদ্ধে অনেক মামলা হচ্ছে, এমনটা দেখতে পেয়ে আমি আগ্রহী হই।”
বিষয়টি গভীরভাবে অনুসন্ধানের পর বালাজি সিদ্ধান্তে পৌঁছান। তিনি বলেন, “ফেয়ার ইউজ অনেক জেনারেটিভ এআই পণ্যের জন্য কার্যকর প্রতিরক্ষা নয়, কারণ এরা এমন বিকল্প তৈরি করতে পারে যা তাদের প্রশিক্ষণের ডেটার সঙ্গে প্রতিযোগিতা করে।”
ওপেন এআইয়ের অনেক সাবেক কর্মী প্রতিষ্ঠানটির নিরাপত্তা সংস্কৃতি নিয়ে উদ্বেগ প্রকাশ করেছেন। কিন্তু বালাজি ছিলেন তাদের মধ্যে একজন যিনি সরাসরি কোম্পানির মডেল প্রশিক্ষণের জন্য ব্যবহৃত ডেটা চ্যালেঞ্জ করেছিলেন।
তার শেষ টুইট ও ব্লগ পোস্টটি তার মৃত্যুর পর নতুন করে আলোচিত হয়েছে। এতে দ্রুত পরিবর্তনশীল এআই শিল্পে আরও শক্তিশালী নিয়ন্ত্রণ ও বৃহত্তর স্বচ্ছতার দাবি ওঠেছে।
তথ্যসূত্র : ফার্স্টপোস্ট, এনডিটিভি, টেকক্রাঞ্চ ও লিংকডইন