অপারেটর বিভিন্ন কাজ স্বয়ংক্রিয় করার প্রতিশ্রুতি দেয়
OpenAI CEO স্যাম অল্টম্যানের মতে, 2025 AI এজেন্টদের জন্য একটি রূপান্তরকারী বছর হতে চলেছে৷
বছরের শুরুতে একটি ব্লগ পোস্টে, অল্টম্যান এমন সরঞ্জামগুলির একটি বড় লাফের পূর্বাভাস দিয়েছেন যা কাজগুলিকে স্বয়ংক্রিয় করতে পারে এবং ব্যবহারকারীদের পক্ষে স্বাধীনভাবে পদক্ষেপ নিতে পারে।
এখন, OpenAI সেই দৃষ্টিকে বাস্তবে পরিণত করার প্রথম সাহসী প্রচেষ্টা করেছে।
23 জানুয়ারী, 2025-এ, OpenAI অপারেটরের একটি গবেষণা পূর্বরূপ ঘোষণা করেছে, একটি সাধারণ-উদ্দেশ্য AI এজেন্ট যা ওয়েবে নেভিগেট করতে এবং স্বায়ত্তশাসিতভাবে কাজগুলি সম্পাদন করতে সক্ষম।
প্রাথমিকভাবে ChatGPT-এর $200 প্রো সাবস্ক্রিপশন প্ল্যানে মার্কিন ব্যবহারকারীদের জন্য উপলব্ধ, অপারেটরের লক্ষ্য অদূর ভবিষ্যতে OpenAI এর প্লাস, টিম এবং এন্টারপ্রাইজ স্তরগুলিতে প্রসারিত করা।
অল্টম্যান শেয়ার করেছেন যে অপারেটর শীঘ্রই অন্যান্য দেশে উপলব্ধ হবে যদিও ইউরোপের রোলআউট আরও বেশি সময় নিতে পারে।
বৈশিষ্ট্যটি operator.chatgpt.com এর মাধ্যমে অ্যাক্সেসযোগ্য, এবং OpenAI অবশেষে এটিকে সমস্ত ChatGPT ক্লায়েন্টের সাথে একীভূত করার পরিকল্পনা করেছে।
অপারেটর কি করতে পারে

অপারেটর বিভিন্ন কাজ স্বয়ংক্রিয় করার প্রতিশ্রুতি দেয়, ভ্রমণের বাসস্থান বুক করা থেকে শুরু করে রেস্তোরাঁ সংরক্ষণ এবং অনলাইনে কেনাকাটা করা।
এর ইন্টারফেসে শপিং, ডেলিভারি, ডাইনিং এবং ভ্রমণের মতো টাস্ক বিভাগগুলি অন্তর্ভুক্ত রয়েছে, প্রতিটি বিভিন্ন ধরনের অটোমেশনের জন্য তৈরি।
সক্রিয় করা হলে, অপারেটর একটি পপ-আপ উইন্ডোর মধ্যে একটি ডেডিকেটেড ওয়েব ব্রাউজার চালু করে, যা ব্যবহারকারীদের রিয়েল-টাইমে নেওয়া নির্দিষ্ট ক্রিয়াগুলি দেখতে দেয়।
ব্যবহারকারীরা যে কোনো মুহুর্তে দখল নিতে পারে, কারণ অপারেটর ব্যবহারকারীর প্রাথমিক ব্রাউজারের পরিবর্তে তার নিজস্ব ব্রাউজারের মাধ্যমে কাজ করে।
অপারেটরের মূল অংশে রয়েছে OpenAI-এর কম্পিউটার-ব্যবহারকারী এজেন্ট (CUA) মডেল, যা OpenAI-এর GPT-4o মডেলের উন্নত যুক্তির ক্ষমতাকে কম্পিউটার দৃষ্টিশক্তির সাথে একত্রিত করে।
এটি CUA কে একজন মানুষের মতো ওয়েবসাইটগুলির সাথে যোগাযোগ করতে সক্ষম করে — বোতামে ক্লিক করা, মেনুতে নেভিগেট করা এবং ফর্মগুলি পূরণ করা — বিকাশকারী-মুখী APIগুলির প্রয়োজন ছাড়াই৷
সুরক্ষা এবং সীমাবদ্ধতা
অপারেটর নিরাপদে এবং দায়িত্বশীলভাবে কাজ করে তা নিশ্চিত করতে OpenAI বেশ কিছু সতর্কতা অবলম্বন করেছে।
উদাহরণস্বরূপ, CUA মডেলটি বাহ্যিক ফলাফলের সাথে কাজগুলি চূড়ান্ত করার আগে ব্যবহারকারীর নিশ্চিতকরণের জন্য জিজ্ঞাসা করার জন্য ডিজাইন করা হয়েছে, যেমন একটি অর্ডার দেওয়া বা একটি ইমেল পাঠানো।
ওপেনএআই ডোরড্যাশ, ইবে, ইন্সটাকার্ট, প্রাইসলাইন, স্টাবহাব এবং উবারের মতো কোম্পানিগুলির সাথেও সহযোগিতা করেছে যাতে অপারেটর পরিষেবা চুক্তির শর্তাবলীকে সম্মান করে।
যাইহোক, অপারেটর তার সীমাবদ্ধতা ছাড়া নয়।
OpenAI স্বীকার করে যে CUA এখনও জটিল কাজগুলি পরিচালনা করতে পারে না, যেমন বিস্তারিত স্লাইডশো তৈরি করা বা জটিল ক্যালেন্ডার সিস্টেম পরিচালনা করা।
ব্যাঙ্কিং লেনদেনের মতো কিছু ক্রিয়াকলাপের জন্য সক্রিয় ব্যবহারকারীর তত্ত্বাবধানের প্রয়োজন হয় এবং অপারেটর ক্রেডিট কার্ডের বিবরণ ইনপুট করার মতো সংবেদনশীল কাজগুলি পরিচালনা করবে না।
উপরন্তু, ব্যবহারের হার সীমা এবং কিছু নিরাপত্তা সীমাবদ্ধতা আছে। উদাহরণস্বরূপ, অপারেটর তার বর্তমান পুনরাবৃত্তিতে ইমেল পাঠাবে না বা ক্যালেন্ডার ইভেন্টগুলি মুছবে না।
OpenAI উল্লেখ করেছে:
"বর্তমানে, অপারেটর নির্ভরযোগ্যভাবে অনেক জটিল বা বিশেষ কাজ পরিচালনা করতে পারে না।"
এটি যোগ করেছে যে অপারেটর জটিল ইন্টারফেস বা ক্যাপচা চেকগুলিতে "আটকে" যেতে পারে, ব্যবহারকারীদের হস্তক্ষেপ করতে প্ররোচিত করে।
এই সীমাবদ্ধতা থাকা সত্ত্বেও, অপারেটর একটি স্বায়ত্তশাসিত AI এজেন্ট তৈরিতে OpenAI-এর সবচেয়ে সাহসী প্রচেষ্টার প্রতিনিধিত্ব করে।
সন্দেহজনক কার্যকলাপ শনাক্ত হলে নির্বাহকে শনাক্ত করতে এবং বিরতি দেওয়ার জন্য সুরক্ষা ব্যবস্থা রয়েছে এবং ওপেনএআই এই সুরক্ষাগুলি ক্রমাগত আপডেট করার জন্য স্বয়ংক্রিয় এবং মানব-পর্যালোচিত উভয় পাইপলাইন নিয়োগ করে।
বিস্তৃত এআই ল্যান্ডস্কেপ
Google এবং Anthropic সহ অন্যান্য টেক জায়ান্টরাও AI এজেন্টদের সাথে পরীক্ষা করার সময় অপারেটরের মুক্তি আসে।
এই সরঞ্জামগুলি শুধুমাত্র তথ্য প্রক্রিয়াকরণের মাধ্যমে নয় বরং স্বায়ত্তশাসিতভাবে পদক্ষেপ নেওয়ার মাধ্যমে সিরি বা আলেক্সার মতো প্রথাগত ভার্চুয়াল সহকারীর বাইরে যাওয়ার প্রতিশ্রুতি দেয়।
যাইহোক, এই বর্ধিত কার্যকারিতা নিরাপত্তা ঝুঁকি নিয়ে আসে, যেমন ফিশিং স্ক্যাম বা স্বয়ংক্রিয় DDoS আক্রমণের সম্ভাবনা।
ওপেনএআই-এর সতর্কতামূলক অপারেটর রোলআউট প্রযুক্তির সম্ভাবনাগুলি অন্বেষণ করার সময় এই ঝুঁকিগুলি হ্রাস করার উপর তার ফোকাস প্রতিফলিত করে।
অল্টম্যানের উদ্যোগগুলি OpenAI-এর বাইরেও প্রসারিত, প্রকল্পগুলির একটি নেটওয়ার্ক তৈরি করে যা এই AI-কেন্দ্রিক ভবিষ্যতকে সমর্থন করে বলে মনে হয়৷
এরকম একটি উদ্যোগ হল ওয়ার্ল্ড, অল্টম্যান এবং অ্যালেক্স ব্লানিয়ার টুলস ফর হিউম্যানিটির একটি প্রকল্প।
পূর্বে ওয়ার্ল্ডকয়েন নামে পরিচিত, ওয়ার্ল্ডের লক্ষ্য অনলাইন এআই এজেন্টদের থেকে মানুষকে আলাদা করার চ্যালেঞ্জ মোকাবেলা করা।
একটি সিলভার মেটাল অর্ব দিয়ে একজন ব্যক্তির চোখের বল স্ক্যান করে, ওয়ার্ল্ড একটি অনন্য ব্লকচেইন-ভিত্তিক শনাক্তকারী প্রদান করে যে কেউ একজন মানুষ তা যাচাই করতে।
এই "মানুষের প্রমাণ" টুলটি প্রকৃত মানুষের পক্ষে কাজ করছে এমন এআই এজেন্টদেরও যাচাই করতে পারে।
টুলস ফর হিউম্যানিটির প্রধান পণ্য কর্মকর্তা তিয়াগো সাদা বলেছেন:
"আপনার 'ব্যক্তিত্বের প্রমাণ' একজন এজেন্টকে অর্পণ করার এবং এটিকে আপনার পক্ষে কাজ করতে দেওয়ার এই ধারণাটি আসলে অত্যন্ত গুরুত্বপূর্ণ।"
বিশ্বের আইডি প্রযুক্তি এমনকি AI এজেন্টদের লাইসেন্স দিতে পারে ব্যবহারকারীদের পক্ষে কাজ করার জন্য, ব্যবসাগুলিকে তাদের প্ল্যাটফর্মের নিরাপত্তার সাথে আপস না করে যাচাইকৃত এজেন্টদের সাথে যোগাযোগ করতে সক্ষম করে।
AI এর চারপাশে নির্মিত একটি ভবিষ্যত
Uber এবং Instacart-এর মত প্ল্যাটফর্মের সাথে OpenAI-এর অংশীদারিত্ব ব্যবসার ব্যবহারকারীদের সাথে কীভাবে যোগাযোগ করে তাতে পরিবর্তনের ইঙ্গিত দেয়।
যেহেতু এআই এজেন্টরা আরও সক্ষম হয়ে ওঠে, কোম্পানিগুলিকে ভবিষ্যতের সাথে খাপ খাইয়ে নিতে হতে পারে যেখানে ব্যক্তিদের পরিবর্তে যাচাইকৃত এজেন্টদের দ্বারা অনেক মিথস্ক্রিয়া সহজতর হয়।
বিশ্বের "মানুষের প্রমাণ" সিস্টেমের মতো সরঞ্জামগুলি এই মিথস্ক্রিয়াগুলিতে বিশ্বাস এবং নিরাপত্তা নিশ্চিত করতে গুরুত্বপূর্ণ ভূমিকা পালন করতে পারে।
অল্টম্যানের জন্য, এআই-এর এই দৃষ্টিভঙ্গি হেলিয়ন এনার্জি, একটি নিউক্লিয়ার ফিউশন স্টার্টআপ সহ তার অন্যান্য উদ্যোগের সাথে সারিবদ্ধ যা একদিন OpenAI-এর ডেটা সেন্টার এবং রেট্রো বায়োসায়েন্সেস, একটি দীর্ঘায়ু বিজ্ঞান স্টার্টআপ যা ইতিমধ্যেই OpenAI-এর মডেলগুলিকে কাজে লাগাতে পারে।
অপারেটরের লঞ্চের সাথে, OpenAI স্বায়ত্তশাসিত AI এজেন্টের জগতে তার প্রথম বড় পদক্ষেপ নিচ্ছে।
প্রযুক্তির পরিপক্ক হওয়ার সাথে সাথে এটি পুনরায় সংজ্ঞায়িত করতে পারে যে আমরা কীভাবে ইন্টারনেট ব্যবহার করি, শিল্পের আকার পরিবর্তন করি এবং নতুন সম্ভাবনাগুলি আনলক করি।
2025 সাল AI এজেন্টদের জন্য খুব ভালভাবে টিপিং পয়েন্ট হতে পারে, এবং OpenAI-এর অপারেটর চার্জের নেতৃত্ব দিচ্ছে।