ডেটা কী, কেন ডেটাই AI-এর মূল শক্তি, এবং ভালো ডেটার বৈশিষ্ট্য কী কী।
রান্না শিখতে হলে শুধু রেসিপি পড়লে হয় না — বারবার রান্না করতে হয়, ভুল থেকে শিখতে হয়। যত বেশি রান্না করবেন, তত ভালো রাঁধুনি হবেন।
AI-এর জন্য ডেটা হলো সেই “রান্না করার অভিজ্ঞতা”।
ডেটা হলো যেকোনো তথ্য যা রেকর্ড করা হয়েছে:
| কাজ | আনুমানিক ডেটা |
|---|---|
| স্প্যাম ফিল্টার | হাজারো ইমেইল |
| মুখ চিনে নেওয়া | কোটি ছবি |
| ChatGPT-এর মতো AI | কোটি কোটি বাক্য |
১. পরিমাণ (Quantity): বেশি ডেটা মানে ভালো শিক্ষা। কিন্তু শুধু পরিমাণ যথেষ্ট নয়।
২. গুণমান (Quality): ভুল বা পক্ষপাতদুষ্ট ডেটা থেকে ভুল AI তৈরি হয়। “Garbage in, garbage out।”
৩. বৈচিত্র্য (Diversity): শুধু এক ধরনের ডেটা দিলে AI সীমিত হয়। বাংলাদেশি মুখের ছবি দিয়ে ট্রেন না করলে AI বাংলাদেশিদের মুখ ভালো চিনবে না।
ডেটা শক্তিশালী — তাই এটি সংরক্ষণ ও ব্যবহারে সতর্কতা জরুরি। আপনার ফোন, অ্যাপ, সোশ্যাল মিডিয়া — সব জায়গা থেকে ডেটা সংগ্রহ হচ্ছে।
পরের পর্বে আমরা নিউরাল নেটওয়ার্ক নিয়ে জানব।