امروزه یکی از دغدغه های جامعه بشری حفظ محیط زیست این کره خاکی هست تا بدانجا که به یکی ازمهمترین شعارهای رقبای سیاسی تبدیل شده است.
افزایش نگرانیهای زیست محیطی در دههی اخیر به علت افزایش عناصر سنگین در محیـط منجر به پیدا شدن راههای نوین و هر چه دقیقتر در رفع آلاینده ها در خاک یا آب شده است. ورود عناصر فلزات سنگین مانند نیکل یا کادمیوم همراه با پسماندهای جامد شهری و صنعتی باعث آغشته شدن لندفیلدها و در نتیجه خاک به این فلزات میگردد. پیش بینی مهاجرت آلایندهها همراه با انتقال فلزات سنگین در محیط زیست چه به صورت طبیعی و نرمال آن و یا چه در حالت دفع مواد زائد شامل این عناصر و اصلاح آن احتیاج به دانستن پارامترهای زیادی دارد. یکی از کلیدی ترین پارامترها در ارزیابی های محیط زیستی ضریب توزیع خاک-آب (Kd) می باشد. ضریب توزیع خاک-آب به نسبت میان مقدار آلاینده جذب شده به مقدار آن در حالت محلول و در شرایط برقراری تعادل در محیط گفته می شود. با توجه به اهمیت ضریب (Kd)، تخمین صحیح آن، ما را در پیشبینی سرنوشت آلاینده ها در کوتاه مدت و بلند مدت پس از رخ داد آلودگی کمک میکند. پژوهشگران نشان داده اند، انتخاب هر چه دقیق تر مقداری که برای (Kd) در نظر گرفته میشود می تواند از بروز خطای قابل توجهی در پیش بینی اثر مهاجرت آلایندهها در محیط متخلخل جلوگیری و در انتخاب روش پایش محیط آلوده مؤثر باشد.
روشها
در این تحقیق سعی شده است که ضریب توزیع عنصر سنگین کادمیوم با نرم افزار هوش مصنوعی GenExprotools و یا به اختصار GEP بدست آمده و دقت آن با روشهای پیشین که شامل روشهای آزمایشگاهی و یا روابط مبتنی بر مدلهای شبکه عصبی و ریاضی است، مقایسه گردد. این مقاله خلاصهای از دو مقاله ISI می باشد.
از مشکلات گردآوری دادههای محیط زیستی، هزینه بالا، پراکندگی داده، و زمانبر بودن میباشد، چنانچه اعتبارسنجیهای به عمل آمده، ضرایب پایین همبستگی بین نقاط را نشان میدهد که همین امر باعث کاهش ضرایب دقت مدل میگردد.
امروزه برنامه نویسی ژنتیک و یا به اختصار GP به عنوان یک روش بهینهیابی حتی برای مسائل مربوط به محیط زیست نیزشناخته شده است. در اینگونه مسائل حل تحلیلی مسئله به روش های متداول ریاضی غیر ممکن و یا بسیار پیچیده بوده و حصول به جواب های تقریبی کفایت میکند.
نرم افزار Gep از نوع genotype است و برای حل چالشهای بوجود آمده در علوم امروز که دارای پارامترها و توابع بسیار پیچیده و فراوان می باشند، طراحی گردیدهاست مانند کارهای آنالیز داده، داده کاوی و سری پیش بینی های زمانی.نوع طراحی نرم افزارBi-objective بوده و تکنیک آن meta-modeling است. این برنامه اشکال مختلفی از مدل های ریاضی مانند درخت های تصمیمگیری، مدل رگرسیون غیرخطی پیچیده، مدل رگرسیون منطقی، دسته بندی های غیرخطی، چند جملهای های پیچیده و عبارت منطقی را در بر میگیرد. Gep برنامهای توسعه یافته برای کروموزوم های خطی با طول ثابت در اندازهها و شکلهای مختلف کدنویسی شده است و مزیت آن بر دیگر روشهای GP این است که Gepهمیشه عبارات معتبر تولید میکند و از طرف دیگر این برنامه تعدادی زیادی Task وجود دارد که برای کارهای مهندسی پیش بینی شده است. کروموزم های خطی ساده آن راه رسیدن به موفقیت می باشند. زیرا در هر دوباره ساختن می توان بهترین ها را برای تولید مثل انتخاب نمود و همین کار را تا رسیدن به بهترین مدل بی وقفه ادامه داد.
داده ها
در این پژوهش از دادههای منتشر شده توسطEPA 402-R-99-004b Environmental Protection Agency استفاده گردیده است. دادههای جمع آوری شده براساس پارامترهای مختلف مانند CEC ، pH ، کل کربن آلی و غلظت کادمیوم حل نشده می باشند. انتخاب این پارامترها براساس در دسترس بودن اطلاعات آنها، امکانات اندازهگیری آنها و پیش بینی این که مقادیر آنها بر پارامتر کادمیوم اثرگذار باشد، انتخاب شدند و در نهایت به اختصار مهمترین ومؤثرترین و کم هزینه ترین پارامتر برای تخمین ضریب Kd مربوط به کادمیوم پارامتر pH انتخاب گردیده است. جهت مدل سازی 90% از 174 رکورد برای گروه آموزشی و 10% برای گروه آزمایشی انتخاب شدند.
سنجش آماری
براساس تمام دادهها نمودارها و نتایج ترسیم شدند و سنجش آماری براساس پارامترهای ME, RMSE, CD, EF, CRM انجام گردید.
همان طور که می دانیدEF و CRM ميتوانند مقادير منفي داشته باشند. مقدار زياد ME نشان دهنده دقت پایین مدل است، در حالي كه مقدار زياد RMSE نشان ميدهد كه برآورد بيش از حد و يا كمتر از حد مدل در مقايسه با مشاهدات (اندازه گيريها) چقدر است. آماره CD نسبت پراكندگي را بين مقادير پيش بيني شده و اندازهگيري شده نشان ميدهد. آماره EF مقادير پيشبينيها را با ميانگين اندازهگيريها مقايسه ميكند. مقدار منفي EF بيانگر آن است كه ميانگين مقادير اندازهگيري شده، برآوردي بهتر از مقادير پيشبيني شده دارد. آماره CRM نشانگر تمايل مدل براي بيشبرآوردي و يا كمبرآوردي، در مقايسه با اندازهگيريها است. چنانچه تمام مقادير اندازهگيري شده و برآورد شده با هم برابر باشند، مقدار عددي اين آمارها برابر است با: CD=1 ،RMSE=0 ، ME=0 CRM=0 ، EF=1
نتایج:
در پایان مدل بدست آمده به صورت زیر است:



آنچنانکهمشاهدهگرديدRMSEبدستآمدهازروش18.07 GEPمی باشد که اين مقدار با بهترين روش هوش مصنوعی 21.69 باشد و اين در حالی است ضريب همبستگی بدست آمده طبق اين فرمول 0.86 می باشد و تمام پارامترهای آماری ارتقاء کمی پیدا نمودند.
منابع و مراجع:
فلامکی امین، سیف يکتا، تخمین ضريب توزيع خاک-آب “ کادمیوم” با کمک برنامه نويسی ژنتیک- کنفرانس بین المللی دستاوردهای نوين در عمران و معماری.
Falamaki Amin, Seif Yekta, Artificial intelligence for predicting soil distribution coefficient of nickel, International Conference on civil engineering and architecture
Birijesh.K, Giri.J-Applied soft computing 2012.
Carlon, C., Dalla Valle, M. and Marcomini, A. 2004. Regression models to predict water–soil heavy metals partition coefficients in risk assessment studies. Environmental Pollution 127: 109–115.
EPA (1999) 402-R-99-004b Environmental Protection Agency
Falamaki, A. Artificial neural network application for predicting soil distribution coefficient of nickel. Journal of Environmental Radioactivity 115: 6-12.
Ferreira.C Departamento de ciencias agrarias University (2014) dos acores 9701-851 terra—GeneExperession Programming. Anew adaptive algorithm for solving problems.
Gil-García, C., Rigol, A. and Vidal, M. (2011). The use of hard- and soft-modelling to predict radio strontium solid–liquid distribution coefficients in soils. Chemosphere 85: 1400–1405.
SueEllen Haut and Randi L. Haupt (2014) Utah State University. Logan Ut State University -Genetic algorithm and their applications in environmental sciences.
Vandenhove, H., C.GIL-garcia, A. Rigol , M. Vidal(2009) . Belgian Nuclear Research Center Biosphere Impact Studio, Boeretang 200,2400 Mol, Antwerp,Belgian