ভাষা জাদুঘর তৈরি করছে আইসিটি বিভাগ

, টেক

তরিকুল ইসলাম সুমন, সিনিয়র করেসপন্ডেন্ট, বার্তা২৪.কম | 2023-09-01 17:33:05

দেশের বিভিন্ন প্রান্তে ছড়িয়ে ছিটিয়ে থাকা ভাষা গুলোকে একত্রিত করে সংরক্ষণ ও গবেষণার উদ্যোগ গ্রহণ করেছে বাংলাদেশ সরকারের আইসিটি বিভাগ। এ জন্য ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ (ইবিএলআইসিটি)’ প্রকল্প নেওয়া হয়েছে। এ প্রকল্পের আওতায় বাংলাদেশের ৪০টি ভাষার এনোটেটেড নমুনা সংরক্ষিত থাকবে বলে জানিয়েছেন প্রকল্প পরিচালক ইঞ্জিনিয়ার মো. মাহবুব কবির।

তিনি বার্তা২৪.কমকে জানান, ভাষা সংরক্ষণে আইসিটি বিভাগের উদ্যোগ জাতীয় পর্যায়ে  ক্ষুদ্র নৃগোষ্ঠী ভাষাসহ দেশের সবগুলো ভাষা সংরক্ষণে তৈরি হচ্ছে ভাষা বিষয়ক ডিজিটাল রিসোর্স রিপোজিটোরি বা জাদুঘর। যেখানে সব ভাষা সংরক্ষিত থাকবে।

ইবিএলআইসিটির প্রকল্প পরিচালক আরো বলেন, সর্বশেষ জরিপ অনুযায়ী, বাংলাদেশে বাংলাসহ ৪১টি জীবিত ভাষা আছে। এর মধ্যে ১৪টি ভাষা বিপন্নপ্রায়। এই ধারা অব্যাহত থাকলে অল্প কয়েক বছরের মধ্যেই এই ভাষাগুলো হারিয়ে যাবে। এমতাবস্থায়, ভাষাগুলোর বৈজ্ঞানিক ডকুমেন্টেশন ও সংরক্ষণের জন্য এই উদ্যোগ হাতে নেওয়া হয়েছে। এটি বাংলাদেশের ভাষা সম্পর্কে নতুন ও প্রামাণ্য জ্ঞান তৈরি করে দেবে। সংশ্লিষ্ট ভাষাভাষী মানুষেরা তাদের ভাষা সংরক্ষণ করতে পারবেন এবং ভবিষ্যত প্রজন্মের কাছে ভাষার নমুনা হাজির করে ভাষা পুনরুজ্জীবনের উপায় বের করবেন। ভাষা গবেষকরা পাবেন তাদের গবেষণার রিসোর্স ও রিপোর্ট। একইসঙ্গে বিপন্ন ভাষাগুলো প্রযুক্তিতে ব্যবহার উপযোগী হয়ে উঠার রূপরেখা পাবে।

তিনি বলেন, ইবিএলআইসিটি প্রকল্পে ১৬টি কম্পোনেন্ট রয়েছে। এরিএকটি হলো ভাষা সংরক্ষণ । এটি সফলভাবে বাস্তবায়িত হলে ৪০টি ভাষার প্রতিটির জন্য অন্তত ১২০০০ মিনিট স্পিচের আইপিএ উচ্চারণসহ অনুবাদ, প্রতিটি ভাষার জন্য সংক্ষিপ্ত ত্রৈভাষিক শব্দকোষ, নিজস্ব লিপি থাকা ভাষাগুলোর জন্য ইউনিভার্সাল কিবোর্ড, ইউনিকোড ফন্ট, উচ্চারণ সহ ফনোলজিক্যাল চার্ট, ওরাল লিটারেচারের একটি সুবিন্যস্ত সংগ্রহশালা তৈরি  করা হবে।


এ বিষয়ে পরামর্শক প্রতিষ্ঠান ড্রিম৭১ বাংলাদেশ লিমিটেড এর ব্যবস্থাপনা পরিচালক এবং বেসিসের পরিচালক রাশাদ কবির বার্তা২৪.কমকে বলেন, ইতিপূর্বে সরকারি বেসরকারি অনেক ধরণের প্রজেক্টে কাজ করলেও এই প্রকল্পটির মাধ্যমে নতুন ধরণের কাজের অভিজ্ঞতা হচ্ছে। ক্ষুদ্র নৃগোষ্ঠীদের ভাষা নিয়ে কাজ করার সুযোগ হচ্ছে এই কাজের মাধ্যমে। ৪০টি ভাষার উপর প্রতিটির জন্য ১২ হাজার মিনিটের ওডিও এবং ভিডিও ভয়েস করা হবে। এর মধ্যে ৮০০০ মিনিট পূর্বনির্ধারিত (আমাদের গল্প তাদের ভাষায়) এবং ৪০০০ মিনিট স্বতঃস্ফূর্ত (তাদের গল্প তাদের ভষায়) যার অডিও এবং ভিডিও স্পিচ সংগ্রহ করা হবে।

তিনি আরো বলেন, আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউট কর্তৃক বলা হয়েছে ক্ষদ্র নৃগোষ্ঠির  টি ভাষার আক্ষরিত (লিখন পদ্ধতি) রয়েছে। এ জন্য ৬টি ভাষার জন্যে তৈরি হবে ৬টি কিবোর্ড। এছাড়াও যদি নতুন কোনো ভাষার আক্ষরিক বা লিখন পদ্ধতি পাওয়া যায় তার ওকিবোর্ড তৈরি করা হবে।

তিনি বার্তা২৪.কমকে আমরা ইতোমধ্যে আমদের টিমকে মাঠ পর্যায়ে পাঠিয়েছি। কাজ শুরু হয়েছে। আশা করছি  দ্রুত সময়ের মধ্যে আমরা ভালো একটি কাজ দেশবাসীকে উপহার দিতে পারবো।

কর্মপদ্ধতি প্রসঙ্গে ড্রিম৭১ বাংলাদেশ লিমিটেড এর ব্যবস্থাপনা পরিচালক বলেন, পুরো কার্যক্রম বৈজ্ঞানিক পদ্ধতিতে ভাষাভাষী কমিউনিটি ও অংশীজনদের মতামত নিয়ে পরিচালিত হবে। ডেটা সংগ্রহ করা হবে নিজেদের তৈরি সফটওয়্যারের মাধ্যমে। তৈরিকৃত সফটওয়্যারটি পৃথিবীর যেকোনো ভাষা সংরক্ষণের জন্য ব্যবহার করা যাবে। এথনোগ্রাফি বাংলাদেশের ৪০টি ভাষার অডিও ও টেক্সুয়াল ডেটা সংগ্রহের জন্য নৃতাত্ত্বিক-ভাষা বিশেষজ্ঞ, ভাষাবিজ্ঞানী, গবেষক, নেটিভ ভেলিডেটর বা সংশ্লিষ্ট ভাষার যাচাইকারী , সফটওয়্যার প্রকৌশলী, এনকোডিং এক্সপার্ট, টেস্টার বা পরীক্ষক, ডকুমেন্টেশন এক্সপার্ট প্রমুখের সমন্বয়ে গঠিত টিম কাজ করবে।

 


যেসব ভাষার উপভাষার রয়েছে এবং ভিন্ন অঞ্চলে দীর্ঘদিন যাবত স্বতন্ত্র ভাবে ব্যবহৃত সেসব ভাষার পৃথক নমুনা গ্রহণ করা হবে। ভাষা-সম্প্রদায়সমূহের অবস্থান নিরিখে সারাদেশকে ভাষা-জোনে বিভক্ত করা হয়েছে। ভাষা-সম্প্রদায়সমূহের অবস্থান নিরিখে সারাদেশকে ৮ টি ভাষা-জোনে বিভক্ত করা হয়েছে।

ডেটা সংগ্রহের আগে প্রতিটি জোন ধরে সংশ্লিষ্ট ভাষাসমূহের নির্ধারিত প্রতিনিধিবর্গের অংশগ্রহণে কমিউনিটি অ্যাওয়ারনেস সভা করা হবে। যেখানে সংশ্লিষ্ট সম্প্রদায়ের প্রতিনিধি ছাড়াও তাদের নেতৃবৃন্দ, স্থানীয় জনপ্রতিনিধি ও সরকারি-বেসরকারি প্রতিনিধিবৃন্দ থাকবেন। যথাযথ ব্যালেন্সড ও রিপ্রেজেন্টনেস বিবেচনা করে নির্ধারিত স্থান থেকে ডেটা সংগ্রহ করা হবে। যাতে এই সংগৃহীত ডেটা ভাষাটির ঠিকভাবে প্রতিনিধিত্ব করে। সংগৃহীত ডাটা অ্যানোটেশন করে শুদ্ধাশুদ্ধি যাচাইয়ের জন্য ওই স্থানেই সংশ্লিষ্ট ভাষার ব্যক্তিবর্গের মাধ্যমে ভ্যালিডেট করা হবে।

সংশ্লিষ্ট সূত্র জানায়, সর্বশেষ জরিপে ১৪ টি ভাষাকে বিপন্ন হিসেবে চিহ্নিত করা হয়েছে; যথা কন্দ, খারিয়া, কোডা, সাওরিয়া, মুন্ডা, কোল, মালতো, খুমি, পাংখোয়া, রেংমিটচা, চাক, খিয়াং, লুসাই, লালেং। এগুলোর মধ্যে রেংমিটচার মতো এমন ভাষাও আছে যার মাত্র ৬ জন ব্যবহারকারী বেঁচে আছে।

২৬ টি ভাষা বিভিন্ন লিপিতে লেখা হয় । সেগুলো হচ্ছে আবেং, আত্তং, মিগাম, বম, লুসাই, পাংখোয়া, খিয়াং, খুমি, ককবরক, ম্রো, মারমা, রাখাইন, চাক, বিষ্ণুপ্রিয়া মনিপুরী, মৈতৈ মনিপুরী, হাজং, চাকমা, তঞ্চঙ্গা, সাদরি, উর্দু, মাহালি, কোল, কোডা, খাসিয়া, লিংগাম। লিখিত রূপ থাকা ভাষাগুলোর মধ্যে বাংলা বর্ণমালা ব্যবহার করে ৪টি। এগুলো হলো- হাজং, সাদরি, কোডা, বিষ্ণুপ্রিয়া মণিপুরি।৮টি ভাষা নিজস্ব লিপি ব্যবহার করে । এগুলো হলো-মৈতৈ মণিপুরি, চাক, চাকমা, তঞ্চঙ্গা, মারমা, রাখাইন, উর্দু, ও মো।

এবং ১৪ টি ভাষা রোমান লিপি ব্যবহার করে। এগুলো হলো-বম, কোল, ককবরক, খাসিয়া, গারো, লুসাই, মাহালি, পাংখোয়া, আবেং, আত্তং, মিগাম, কোচ, খিয়াং, খুমি।

হিসাবমতে, ২৬ টি ভাষার লিখিত রূপ আছে , অর্থাৎ ১৪ টি ভাষা এখনও লিখিত রূপহীন মৌখিক পর্যায়েই রয়ে গেছে। লিখিতরূপ থাকা চাক, কোডা, কোল ও পাংখোয়ার মতো কিছু ভাষাও হারিয়ে যাওয়ার মুখে রয়েছে।

এ সম্পর্কিত আরও খবর